Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

53
Bioinformatica Bioinformatica Corso di Laurea specialistica in Informatica Corso di Laurea specialistica in Informatica Traduzione e Traduzione e Proteine Proteine 23/04/2011 23/04/2011

Transcript of Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Page 1: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

BioinformaticaBioinformaticaCorso di Laurea specialistica in InformaticaCorso di Laurea specialistica in Informatica

Traduzione e ProteineTraduzione e Proteine23/04/201123/04/2011

Page 2: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cenni sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 3: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cenni sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 4: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Effettuata da alcuni virus a RNA chiamati retrovirus

Il flusso dell’informazione genicaIl flusso dell’informazione genica

Il dogma centrale della biologia•L’informazione genica è contenuta nel DNA

•Questa informazione è perpetuata nelle generazioni future tramite il processo semiconservativo chiamato duplicazione del DNA

•L’espressione della informazione genica è invece un processo che passa attraverso un intermediario transitorio: l’RNA messaggero. Questa molecola è sintetizzata sulla base di uno STAMPO sul DNA e l’informazione in esso contenuta serve per dirigere la sintesi di proteine.

•L’informazione passa (quasi) sempre dal DNA all’RNA e da questo alle proteine.

DNA RNA ProteinaTrascrizione Traduzione

Mantenimento dell’informazione Trasferimento dell’informazione Ruolo funzionale

Informazione contenuta nella sequenza

Informazione contenuta nella sequenza e nella quantità

Informazione contenuta nella struttura e nella quantità

Retrotrascrizione

Page 5: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il flusso dell’informazione genicaIl flusso dell’informazione genica

Il viaggio dell’RNA messaggero•L’RNA messaggero è sintetizzato nel nucleo a partire da uno stampo di DNA. Solo un gene (eucarioti) o pochi geni (procarioti) alla volta vengono copiati su una molecola di RNA

•Negli eucarioti l’RNA messaggero viene processato con

•L’aggiunta del CAP al 5’

•L’aggiunta della coda di poliA al 3’

•L’eliminazione degli introni (splicing)•L’RNA maturo viene trasportato fuori dal nucleo nel citoplasma

•Nel citoplasma interagisci con gli organelli citoplasmatici deputati alla sintesi proteica (i ribosomi)

•I ribosomi sintetizzano una catena proteica lineare aggiungendo uno per uno gli aminoacidi necessari sulla base delle istruzioni contenute nella molecola di mRNA

•Esaurito il suo compito l’mRNA viene degradato rapidamente

Page 6: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cenni sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 7: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Le proteine – Natura ed informazioneLe proteine – Natura ed informazione

• Le proteine sono macromolecole polimeriche. I costituenti delle proteine sono gli aminoacidi.

• Gli aminoacidi sono molecole caratterizzate dalla presenza di un gruppo aminico (basico) ed un gruppo acido che costituiscono la parte costante della molecola e da un “residuo” variabile che conferisce ad ogni aminoacido caratteristiche diverse.

• Il gruppo acido di un aminoacido ed il gruppo basico dell’aminoacido successivo si uniscono tra loro tramite un legame covalente forte chiamato legame peptidico. La ripetizione lineare di questi legami peptidici costituisce lo “scheletro” della catena polipeptidica.

• I “residui”, che costituiscono la parte variabile, possono interagire tra loro. Residui appartenenti ad aminoacidi distanti tra loro possono interagire tramite legami deboli portando ad un “ripiegamento” della catena lineare della proteina. Queste interazioni sono alla base della struttura 3d della proteina.

Page 8: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Le proteine – Natura ed informazioneLe proteine – Natura ed informazione

Gli aminoacidiEsistono 20 diversi aminoacidi

che combinati tra loro costituiscono tutte le proteine contenute negli organismi viventi. Questi aminoacidi hanno struttura chimica e proprietà diverse.

Page 9: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Le proteine – Natura ed informazioneLe proteine – Natura ed informazione

Gli aminoacidiSulla base delle caratteristiche del

loro gruppo R gli aminoacidi possono essere:

• Idrofobici• Polari• Acidi• Basici• Aromatici• PiccoliLe interazioni tra gli aminoacidi, e

quindi la struttura 3d finale della protena, saranno influenzate dalle caratteristiche chimiche degli stessi. Un aminoacido acido ed uno basico tendono ad interagire tra loro, mentre uno polare ed uno idrofobico no.

Page 10: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Le proteine – Natura ed informazioneLe proteine – Natura ed informazione

Page 11: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Le proteine – Natura ed informazioneLe proteine – Natura ed informazione

Le sequenze proteiche. L’informazioneCosì come già visto per le sequenze di DNA o RNA, che vengono

rappresentate come stringhe composte dal susseguirsi di 4 possibili caratteri che corrispondono ai 4 possibili nucleotidi, anche le sequenze proteiche possono essere rappresentate da stringhe. In questo caso i possibili aminoacidi sono 20 e di conseguenza anche l’alfabeto utilizzatò nelle sequenze proteiche è costituito da (almeno) 20 caratteri.

HQVKVQGCWGRWRWQEFENAEGDEYAADLAQGSPATAAQNGPDVYVLPLTEVSLPMAKQPGRSVQLLKSTDVGRHSLLYLKEIGRGWFGKVFLGEVNSGISSAQVVVKELQASASVQEQMQFLEEVQPYRALKHSNLLQCLAQCAEVTPYLLVMEFCPLGDLKGYLRSCRVAESMAPDPRTLQRMACEVACGVLHLHRNNFVHSDLALRNCLLTADLTVKIGDYGLAHCKYREDYFVTADQLWVPLRWIAPELVDEVHSNLLVVDQTKSGNVWSLGVTIWELFELGTQPYPQHSDQQVLAYTVREQQLKLPKPQLQLTLSDRWYEVMQFCWLQPEQRPTAEEVHLLLSYLCAKGATEAEEEFERRWRSLRPGGGGVGPGPGAAGPMLGGVVELAAASSFPLLEQFAGDGFHADGDDVLTVTETSRGLNFEYKWEAGRGAEAFPATLSPGRTARLQELCAPDGAPPGVVPVLSAHSPSLGSEYFIRLEEAAPAAGHDPDCAGCAPSPPATADQDDDSDGSTAASLAMEPLLGHGPPVDVPWGRGDHYPRRSLARDPLCPSRSPSPSAGPLSLAEGGAEDADWGVAAFCPAFFEDPLGTSPLGSSGAPPLPLTGEDELEEVGARRAAQRGHWRSNVSANNNSGSRCPESWDPVSAGCHAEGCPSPKQTPRASPEPGYPGEPLLGLQAASAQEPGCCPGLPHLCSAQGLAPAPCLVTPSWTETASSGGDHPQAEPKLATEAEGTTGPRLPLPSVPSPSQEGAPLPSEEASAPDAPDALPDSPTPATGGEVSAIKLASALNGSSSSPEVEAPSSEDEDTAEATSGIFTDTSSDGLQARRPDVVPAFRSLQKQVGTPDSLDSLDIPSSASDGGYEVFSPSATGPSGGQPRALDSGYDTENYESPEFVLKEAQEGCEPQAFAELASEGEGPGPETRLSTSLSGLNEKNPYRDSAYFSDLEAEAEATSGPEKKCGGDRAPGPELGLPSTGQPSEQVCLRPGVSGEAQGSGPGEVLPPLLQLEGSSPEPSTCPSGLVPEPPEPQGPAKVRPGPSPSCSQFFLLTPVPLRSEGNSSEFQGPPGLLSGPAPQKRMGGPGTPRAPLRLALPGLPAALEGRPEEEEEDSEDSDESDEELRCYSVQEPSEDSEEEAPAVPVVVAESQSARNLRSLLKMPSLLSETFCEDL

Page 12: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cennu sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 13: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il codice geneticoIl codice genetico

La necessità di codificare l’informazione

• L’informazione genica passa del DNA all’RNA. L’informazione contenuta in queste molecole è simile, ed il meccanismo di trasmissione dell’informazione (la complementarietà delle basi) permette di copiare l’informazione del DNA sull’RNA utilizzando lo stesso alfabeto (con l’eccezione dell’utilizzo dell U al posto della T)

• Nel passaggio da RNA a proteina il tipo di informazione cambia notevolmente. Si deve passare da un alfabeto chimico basato su 4 diversi nucleotidi ad un alfabeto chimico basato su 20 diverse aminoacidi.

• L’impossibilità di mantenere una corrispondeza univoca tra nucleotide ed aminoacido impone l’utilizzo di una codifica

AATGTATTCTTACATAAG TTACATAAG

AAUGUAUUC

Page 14: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il codice geneticoIl codice genetico

La necessità di codificare l’informazione

• Se ci fosse una corrispondenza 1 a 1 tra nucleotide ed aminoacido si potrebbero utilizzare soltanto 4 aminoacidi per costruire una proteina.

• Se la corrispondenza fosse 2 ad 1 si potrebbero specificare 16 (4*4) aminoacidi. Sfortunatamente gli aminoacidi sono 20: sono quindi necessari 3 nucleotidi per identificare tutti gli aminoacidi esistenti.

• Le possibili combinazioni di 3 nucleotidi sono 64 (4*4*4). Poichè gli aminoacidi sono solo 20 esiste una surplus informativo di 44 triplette.

• La “tabella” n*m che mette in relazione le 64 possibili triplette di nucleotidi e i 20 aminoacidi è chiamata “codice genetico”.

• Il codice genetico è universale: una tripletta codifica lo stesso aminoacido in (quasi) tutti gli organismi viventi.

• Le triplette di nucleotidi sull’mRNA vengono chiamate CODONI

Page 15: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il codice geneticoIl codice genetico

S E C O N D B A S E

A

GGUGGCGGAGGG

Gly*

AGUAGCAGAAGG

Arg

G

CGUCGCCGACGG

Arg

GUGUUGCUGAUGG

C

GAUGACGAAGAG

AAUAACAAAAAG

Glu

CAUCACCAACAG

AUAUUACUAAUAG

Stop

Tyr

GUUGUCGUAGUG

Val

AUUAUCAUAAUG start

Ile

CUUCUCCUACUG

Leu

UUUUUUCUUAUUG

Leu

Phe

Met/

GCUGCCGCAGCG

Ala

ACUACCACAACG

Thr

CCUCCCCCACCG

Pro

CUCUUCCUCAUCG

Ser

UCAG

U

UCAG

UCAG

UCAG

Gln†

His

Trp

Cys THIRD

BASE

FIRST

BASE

Asp

Lys

Asn†

Stop

Ser

Il fenomeno per il quale esistono diverse triplette che codificano per lo stesso aminoacido è definito come “degenerazione del codice”

La maggior parte degli aminoacidi è codificata da 2 o più triplette. La metionina è codificata solo dal codone AUG che rappresenta anche il codone di inizio della sintesi proteica. I codoni UGA UAA e UAG sono chiamati codoni di STOP. Ad essi con corrisponde nessun aminoacido ma rappresentano i segnali di terminazione per la sintesi proteica.

Page 16: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il codice geneticoIl codice genetico

Le conseguenze della degenerazione del codice•E’ sempre possibile passare dall’informazione contenuta nei nucleotidi alla corrispondente sequenza proteica: ad ogni tripletta può essere associato uno ed un solo aminoacido.

•Non è mai possibile ottenere, in modo univoco, una sequenza nucleotidica a partire dalla sequenza proteica da essa generata

MEFGLKEFLLNPSTPEGKLTPQRQTNPVWYACAWASequenza proteica

AUG

GAA

GAG UUU

UUC

GGA

GGC

GGG

GGU

La retrotraduzione non è risolvibile in maniera esatta e non può essere

dedotta dai sistemi biologici.

Page 17: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il codice geneticoIl codice genetico

Il vacillamento della terza base

I CODONI CHE RAPPRESENTANO LO STESSO A.A., O A.A. CORRELATI, HANNO SEQUENZE SIMILI.

SPESSO LA BASE CHE OCCUPA LA TERZA POSIZIONE DEL CODONE NON E’ SIGNIFICATIVA, COME DIMOSTRA IL FATTO CHE NEI GRUPPI DI 4 CODONI CHE RAPPRESENTANO LO STESSO A.A., SOLO LA TERZA BASE E’ DIFFERENTE.

Page 18: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cennu sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 19: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

La sintesi proteica viene chiamata anche traduzione poiché durante questo processo l’informazione contenuta nell’RNA messaggero viene tradotta utilizzando il codice genetico in una sequenza di aminoacidi.

Durante la traduzione l’mRNA interagisce con i macchinari molecolari deputati alla sintesi delle proteine: i RIBOSOMI.

I ribosomi sono complessi formati da proteine ed RNA ribosomiale. L’RNA ribosomiale ha funzione strutturale ma anche catalitica.

Nel ribosoma delle particolari molecole di RNA chiamate RNA transfer (tRNA) traducono l’informazione dell’RNA messaggero in sequenza aminoacidica. Sono degli accoppiatori molecolari: da una parte hanno le funzioni molecolari per interagire con l’RNA mentre dall’altra parte trasportano aminoacidi specifici.

Page 20: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

I Ribosomi

IL RIBOSOMA E’ UNO DEI TANTI MACCHINARI CELLULARI.

E’ costituito da RNA (rRNA) E PROTEINE (DETTE, PER L’APPUNTO, RIBOSOMALI).

I RIBOSOMI CONSTANO DI DUE “SUBUNITA’”:

•SUBUNITA’ MAGGIORE (IMPLICATA NELLA FORMAZIONE DEI LEGAMI PEPTIDICI);

•SUBUNITA’ MINORE (DOVE I tRNA SI “ADATTANO” AI CODONI DELL’mRNA).

CIASCUNA SUBUNITA’ E’ UN AGGREGATO DI rRNA E PROTEINE RIBOSOMALI.

Page 21: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

I Ribosomi

QUANDO NON STANNO SINTETIZZANDO ATTIVAMENTE PROTEINE, LE DUE SUBUNITA’ DEI RIBOSOMI SONO SEPARATE.ESSE SI UNISCONO INSIEME SU UNA MOLECOLA DI mRNA IN GENERE VICINOALLA SUA ESTREMITA’ 5’ PER INIZIARE LA SINTESI PROTEICA.

Page 22: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

I tRNASono molecole adattatrici che legano e trasportano aminoacidi

specifici.

Due porzioni particolarmente importanti sono:

• ANTICODONE : sequenza di 3 nucleotidi complementari al codone corrispondente all’aminoacido legato al tRNA.• Sito di attacco dell’aa. : sequenza 5’-CCA-3’, uguale in tutti tRNA.

MET

Page 23: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

I tRNAL’anticodone si appaia in maniera specifica al codone sull’mRNA in modo

da permettere al tRNA di trasportare l’aminoacido corrispindente quando questo viene richiesto dalla informazione contenuta sul messaggero

AUG

MET

UUAGCUUCGCGAUAUC

Page 24: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

Quanti sono i tRNA?

UNA LOGICA DEDUZIONE PER QUANTO DETTO FIN’ORA E’ CHE DOVREBBERO ESSERCI 61 tRNA DIVERSI, UNO PER CIASCUN CODONE; CIO’ IMPLICHEREBBE DUE COSE:

1. GRANDE CONSUMO ENERGETICO DA PARTE DELLA CELLULA;

2. tRNA AVENTI ANTICODONI DIFFERENTI DEVONO PORTARE LO STESSO aa.

IN REALTA’ QUESTA CONDIZIONE E’ VERA SOLO PER ALCUNI tRNA, PER LA MAGGIORPARTE (NELL’UOMO ESISTONO INFATTI SOLO 48 ANTICODONI DIFFERENTI A FRONTE DEI TEORICI 61 POSSIBILI), PERO’, SUSSISTE IL FENOMENO DEL “VACILLAMENTO” DELLA TERZA BASE, PER CUI SI POSSONO FORMARE LEGAMI ANCHE “NON ORTODOSSI” FRA IL NUCLEOTIDE IN POSIZIONE 5’ DEL tRNA E IL NUCLEOTIDE IN 3’ DELL’mRNA.

Page 25: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

Le fasi della traduzione

1) Inizio: la subunità minore del ribosoma si lega al messaggero. Il primo tRNA (quello della fMET) con anticodone complementare alla tripletta AUG, che rappresenta il segnale di inizio, si lega in corrispondeza del codone. Questo scatena il legame della subunità maggiore e l’inzio della traduzione.

2) Allungamento: il ribosoma si sposta in direzione 3’ sul mRNA. I tRNA si legano uno dopo l’altro ai codoni che via via vengono incontrati dal ribosoma mentre “legge” il filamento ribonucleotidico. Il ribosoma catalizza di volta in volta il legame tra l’aminoacido già presente all’interno del sito attivo ed il nuovo aminoacido appena entrato nel ribosoma allungando la catena proteica nascente di un aminoacido alla volta.

3) Terminazione: Quando il ribosoma incontra un segnale di stop nessun tRNA si lega al sito attivo del ribosoma. Si lagano invece specifici fattori di terminazione proteici che interrompono la traduzione e facilitano la destabilizzazione del complesso.

Page 26: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

L’inizio della traduzione

AE

Large subunit

P

Small subunit

fMet

UACGAG...CU-AUG--UUC--CUU--AGU--GGU--AGA--GCU--GUA--UGA-AT GCA...TAAAAAA5’mRNA

3’

La traduzione inizia col riconoscimento dell’mRNA da parte della subunità minore.Il legame del tRNA della fMET (con anticodone complementare ad AUG) permette il legame della subunità maggiore.

Page 27: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

La fase di allungamentoUn nuovo aminoacil tRNA (complesso tra tRNA ed il suo aminoacido corrispondente) entra nel sito A del ribosoma. Il suo anticodone è complementare al codone che si trova in corrispondenza del sito A. Il primo aminoacido (la metionina) presente nel sito P si troverà quindi vicino ad un nuovo aminoacido appena trasportato dal suo tRNA. La subunità maggiore del ribosoma catalizza il legame di questo nuovo aminoacodo con la metionina. Il legame della metionina con il suo tRNA viene rotto.

Page 28: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

La fase di allungamentoA questo punto abbiamo un tRNA “scarico” nel sito P, un tRNA legato alla catena nascente (di due aminoacidi, al momento) nel sito A. Il ribosoma si sposta a sinistra sull’mRNA: il tRNA vuoto viene liberato nel citoplasma, il tRNA legato a 2 aminoacidi viene spostato nel sito P ed il sito A è di nuovo disponobile per l’attacco di un nuovo aminoacil-tRNA.

Il processo viene iterato allungando ogni volta la catena nascente di un aminoacido, seguendo le istruzioni scritte sul messaggero.

Page 29: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

La traduzioneLa traduzione

La fine della traduzioneQuando il ribosoma, legato alla catena proteica nascente, raggiunge un codone di stop, invece di un aminoacil-tRNA, nel sito A si lega un fattore di terminazione. La proteina nascente lascia il suo tRNA, il ribosoma si destabilizza e la sintesi della proteina finisce.

Page 30: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cenni sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 31: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

Le strutture delle proteine

Abbiamo visto come le proteine vengono sintetizzate come lunghe catene lineari. La mera sequenza di aminoacidi della proteina viene definita “struttura

primaria”. Ma gli aminoacidi di una proteina possono andare incontro ad interazioni che ne influenzano il ripiegamento nello spazio. La forma di una proteina

ne influenzerà la funzione

Page 32: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

I 4 livelli strutturali delle proteine

• Struttura primaria: sequenza di aminoacidi• Struttura secondaria: formazione di ripiegamenti

regolari locali (alfa elica o foglietto beta)• Struttura terziaria: formazione di una conformazione

tridimensionale definitiva per interazione di più strutture globali

• Struttura quaternaria: interazione tra diversi polipeptidi (subunità) per la formazione di un complesso proteico completo e funzionale.

Page 33: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

SPESSO IN UN PEPTIDE SI TROVANO DUE SCHEMI REGOLARI DI RIPIEGAMENTO:

•L’ α-ELICA E•IL FOGLIETTO β.

ENTRAMBI DERIVANO DALLA FORMAZIONE DI LEGAMI H FRA I GRUPPI N-H E C=O DELL’OSSATURA POLIPEPTIDICA, SENZA COINVOLGERE LE CATENE LATERALI DEGLI aa.

Page 34: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

α-ELICA

SI FORMA QUANDO UNA SIGOLA CATENA POLIPEPTIDICA SI AVVOLGE SU SE STESSA PER FORMARE UN CILINDRO RIGIDO: IN PARTICOLARE SI INSTAURA UN LEGAME H FRA UN LEGAME PEPTIDICO E IL

QUARTO SUCCESSIVO; SI GENERA COSI’ UN’ELICA REGOLARE DI PASSO UGUALE A 3,6 aa (CIOE’ 5,4Å) .

TIPICAMENTE, BREVI REGIONI AD α-ELICA SONO ABBONDANTI IN PROTEINE POSTE NELLE MEMBRANE CELLULARI (ES.: PROTEINE DI TRASPORTO E RECETTORI); IN ALTRE PROTEINE α-ELICHE

SI AVVOLGONO L’UNA INTORNO ALL’ALTRA PER FORMARE STRUTTURE STABILI NOTE COME “COILED-COIL”.

(ES.: α-CHERATINA O MIOSINA).

α-ELICA COILED-COIL

Page 35: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

FOGLIETTO β (O β-SHEET)

SI FORMANO PER LEGAMI H TRA GRUPPI PEPTIDICI ADIACENTI APPARTENENTI A CATENE POLIPETIDICHE DIFFERENTI CHE POSSONO DECORRERE PARALLELE OD ANTI-PARALLELE (PARALLELE SE HANNO LO STESSO ORIENTAMENTO N-TERMINALE / C-TERMINALE; ANTIPARALLELE SE UNA DECORN-TERMINALE / C-TERMINALE IN DIREZIONE NORD-SUD O EST-OVEST E L’ALTRAN-TERMINALE / C-TERMINALE IN DIREZIONE SUD-NORD O OVEST-EST).

I FOGLIETTI BETA COSTITUISCONO IL “CORE” DI MOLTE STRUTTURE PROTEICHE

FOGLIETTO β (O β-SHEET)

Page 36: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

STRUTTURE SUPER SECONDARIE, MOTIVI STRUTTURALISTRUTTURE SUPER SECONDARIE, MOTIVI STRUTTURALI

• a elica - loop - a elica: è presente in molte proteine che legano il Ca (calmodulina e troponina C).

• b-turn: due filamenti b antiparalleli uniti da un breve loop di 2-5 residui. • chiave greca: per formare questo motivo occorrono (minimo) quattro

filamenti b, due brevi loop e un loop più lungo. • b-a-b: è costituito da due filamenti b paralleli, intercalati da un'a-elica.

Page 37: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

La struttura terziaria

Page 38: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

La struttura quaternariaA VOLTE LE PROTEINE CONSTANO DI PIU’ SUBUNITA’ PEPTIDICHE (CIASCUNA GIA’ RIPIEGATA NELLA SUA STRUTTURA 3D) CHE INTERAGISCONO TRA LORO TRAMITE LEGAMI NON COVALENTI (LEGAMI H ED INTERAZIONI IDROFOBICHE PRINCIPALMENTE) A FORMARE UN’UNICA STRUTTURA FUNZIONALE: LA PRO=TEINA AVENTE STRUTTURA QUATERNARIA.Es.:PROTEINA EMOGLOBINA

Page 39: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Il folding delle proteineIl folding delle proteine

I livelli di organizzazione di una proteina

Page 40: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cenni sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 41: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Genotipo e fenotipoGenotipo e fenotipo

Il genotipo di un individuo è dato dal suo corredo genetico, è ciò che è "scritto" nel DNA contenuto nel nucleo di tutte le sue cellule ed è quindi immutabile.

Il fenotipo, invece, è l'insieme dei caratteri che l'individuo manifesta: dipende dal suo genotipo, dalle interazioni fra geni e anche da fattori esterni; dunque può variare.

IL GENOTIPO

È l’informazione genetica

IL FENOTIPO

È il modo in cui questa viene espressa

Page 42: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Genotipo e fenotipoGenotipo e fenotipo

Il padre della genetica è Mendel. Nel tempo libero amava fare esperimenti incrociando diverse varietà della pianta dei piselli. Fu lui a definire per la prima volta i concetti di genotipo e fenotipo.

•Una pianta con seme giallo, incrociata con una pianta con seme giallo dava sempre progenie con seme giallo.

•Una pianta con seme verde, incrociata con una pianta con seme verde dava sempre progenie con seme verde.

•Una pianta con seme giallo, incrociata con una pianta con seme verde dava sempre progenie con seme giallo. Il giallo è DOMINANTE

Page 43: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Genotipo e fenotipoGenotipo e fenotipo

Il bello viene adesso: Se incrociamo le piante a seme giallo originate dai genitori misti (seme giallo e seme verde) non otteniamo più solo piante a seme giallo ma anche

qualche piantina a seme verde!!!.

•Le piante a seme giallo che incrociate tra loro danno sempre seme giallo e le piante a seme giallo che incrociate tra loro danno ANCHE piante a seme verde sono FENOTIPICAMENTE IDENTICHE (hanno seme giallo) ma GENOTIPICAMENTE le seconde hanno l’informazine per esprimere il carattere “seme verde” quindi sono GENOTIPICAMETE DIFFERENTI.

Page 44: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Genotipo e fenotipoGenotipo e fenotipo

I Sintesi:

Il FENOTIPO dipende dal GENOTIPO ma FENOTIPI identici possono avere GENOTIPI diversi!

Page 45: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

OutlineOutline

• Il flusso dell’informazione genica• Le proteine – natura ed informazione• Il codice genetico• La traduzione (sintesi proteica)• Cenni sul folding delle proteine• Genotipo e fenotipo• Mutazioni e polimorfismi

Page 46: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

Come abbiamo detto le mutazioni sono variazioni della sequenza di basi nel DNA.

Le mutazioni possono avere diversi effetti a seconda:

• Della loro natura (tipo di mutazione)• Della loro posizione (dove avvengono)

Page 47: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

Le mutazioni di più piccola entità sono le mutazioni puntiformi:

Sono caratterizzate dalla sostituzione di un nucleotide con un altro

ACTGTTGCTACTGGCGCGTT

ACTGTTGCTAATGGCGCGTT

Mutazioni puntiformi

Sono definite:

transizioni qualora vi è un scambio di una purina con altra purina (A ↔ G) o di una pirimidina con un'altra pirimidina (C ↔ T)

transversioni quando lo scambio è di una purina con un a pirimidina o viceversa (C/T ↔ A/G).

Page 48: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

Le mutazioni più gravi sono le mutazioni indel:Sono caratterizzate dalla inserzione o delezione

di uno o più nucleotidi

ACTGTTGCTACTGGCGCGTT

ACTGTTGCTACATGGCGCGTT

Inserzioni e delezioni (indel)

Possono causare uno “spostamento della fase di lettura” (frameshift):

ACTGTTGCTACTGGCGCGTT ACTGTTGCTACATGGCGCGTT

Tutta la zona a valle della mutazione verrà influenzata. La probabilità di formare codoni di stop prematuri è elevata (proteina troncata)

Page 49: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

Le mutazioni possono cadere:• In una regione genica (compresa tra

l’inizio e la fine di un gene)• In una regione intergenica

La posizione della mutazione

La mutazione in una regione intergenica, di solito, non ha nessun effetto sul fenotipo, e sono quindi maggiormente tollerate dalla selezione naturale. Tuttavia in alcuni rari casi le mutazioni possono interferire con il riconoscimento del DNA da alcune proteine regolatrici ed interferire con alcuni processi cellulari essenziali.

Page 50: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

Se la mutazione avviene in questa regione si possono avere diverse eventualità:

• La mutazione è avvenuta nella regione codificante: l’informazione trascritta nell’mRNA maturo cambia.

• La mutazione è avvenuta in un introne: l’informazione trascritta nell’mRNA maturo non cambia (almeno, non sempre)

• La mutazione è avvenuta in una regione regolatrice (promotore, enhancer, silencer): la regolazione (produzione di mRNA) può essere influenzata.

Mutazioni al’interno della regione genica

Page 51: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

L’mRNA viene alterato.Se si tratta di una mutazione puntiforme un solo codone verrà cambiato in un

altro. Esistono tre tipi di mutazioni puntiformi:• mutazioni sinonime: quando la mutazione determina un codone diverso ma che

codifica per lo stesso amminoacido (questo è possibile grazie alla ridondanza del nostro codice genetico ). Non si avrà alcun cambiamento nel prodotto genico.

• mutazioni di senso errato: quando un codone viene sostituito con uno che codifica per un altro amminoacido. Se quest'ultimo avrà le stesse caratteristiche chimiche (dimensione, carica...) allora la sostituzione sarà conservativa altrimenti non conservativa. E' chiaro che il secondo caso rende più probabile una variazione nella funzionalità del prodotto.

• mutazioni non senso: quando la mutazione determina la formazione di un codone di stop all'interno della sequenza. Questo provoca, se il prodotto è una proteina, un'interruzione precoce della sua sintesi nella traduzione. In generale maggiore sarà il frammento non tradotto maggiore sarà il rischio di una mutazione svantaggiosa.

Se si tratta di una mutazione indel tutti i codoni a valle delle mutazione verranno cambiati.

Mutazioni nella regione codificante

Page 52: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

Gli introni vengono di solito alterati, quindi la mutazione potrebbe non avere alcun effetto però:

• Lo splicing alternativo potrebbe considerare come esone l’introne in cui è avvenuta la mutazione con conseguente possibilità di variazione nel prodotto proteico (vedi caso precedente)

• Se la mutazione avviene in corrispondenza dei siti accettore o donatore di splicing questo processo potrebbe non avvenire correttamente.

Mutazioni in un introne

Page 53: Bioinformatica Corso di Laurea specialistica in Informatica Traduzione e Proteine 23/04/2011.

Mutazioni e polimorfismiMutazioni e polimorfismi

La regolazione del gene potrebbe essere alterata:

- Mancata produzione di mRNA- Ridotta produzione di mRNA- Aumentata produzione di mRNA

Mutazioni in regione regolatrice