lezione 11 4 2012 - GulisanoLab · sintetizzata sulla base di uno STAMPO sul DNA e lʼinformazione...
Transcript of lezione 11 4 2012 - GulisanoLab · sintetizzata sulla base di uno STAMPO sul DNA e lʼinformazione...
Il Codice Gene,co
Il dogma centrale, il flusso dell’informazione genica e la
decifrazione della informazione del DNA
Corso di Laurea in Chimica e Tecnologie Farmaceu,che a.a. 2011-‐2012
Università di Catania
Stefano Forte
Il dogma centrale e le prime ipotesi sul codice gene,co
• Le funzioni del materiale gene,co – Deve potersi replicare – Deve potersi esprimere
• Come avviene l’espressione? • Negli eucario, in DNA non abbandona il nucleo • Il DNA lo stesso in tuJe le cellule di un organismo • Il DNA rimane costante nel tempo • Nel 1945 Beadle: un gene -‐> un enzima • Linearità geni e sequenze proteiche
Effettuata da alcuni virus a RNA chiamati retrovirus
Il flusso dell’informazione genica
• L’informazione genica è contenuta nel DNA
• Questa informazione è perpetuata nelle generazioni future tramite il processo semiconservativo chiamato duplicazione del DNA
• L’espressione della informazione genica è invece un processo che passa attraverso un intermediario transitorio: l’RNA messaggero. Questa molecola è sintetizzata sulla base di uno STAMPO sul DNA e l’informazione in esso contenuta serve per dirigere la sintesi di proteine.
• L’informazione passa (quasi) sempre dal DNA all’RNA e da questo alle proteine.
DNA RNA Proteina Trascrizione Traduzione
Mantenimento dell’informazione Trasferimento dell'informazione Ruolo funzionale
Informazione contenuta nella sequenza
Informazione contenuta nella sequenza e nella quantità
Informazione contenuta nella struttura e nella quantità
Retrotrascrizione
Il contenuto informa,vo del DNA
La struttura del DNA è costante. Il DNA è sempre una doppia elica INDIPENDENTEMENTE dalla sequenza di nucleotidi che lo compone. L’ossatura di zucchero e fosfato è costante. La parte variabile, e quindi più informativa, è rappresentata dalla sequenza di BASI AZOTATE. Per questo motivo è possibile rappresentare l’informazione contenuta nel DNA con una lunga sequenza composta da un alternanza 4 caratteri che rappresentano le basi azotate del DNA. GCGGCGGCGGGCGGGTACTGGCTTCTGGGGCCAGGGGCCAGGGGCGGTGGGCGCCGGGACCGCGGAGCTGAGGAGCGGGGCCCGGCCAGGGCTGGAGACTTTGCGCCCGGGGGCACCGGGGCTGCGCGCGGTCGCACACATCCACCGGCGCGGCTTCCCTCGGCGGCCCGGGCTCCGCTCATCCTGCGGCGGGCGGCGCCGCTCAGGGGCGGGAAGAGGAGGCGGTAGACGCGACCACAGAAGATGTCGGGCCAAACGCTCACGGATCGGATCGCCGCCGCTCAGTACAGCGTTACAGGCTCTGCTGTAGCAAGAGCGGTCTGCAAAGCCACTACTCATGAAGTAATGGGCCCCAAGAAAAAGCACCTGGACTATTTGATCCAGGCTACCAACGAGACCAATGTTAATATTCCTCAGATGGCCGACACTCTCTTTGAGCGGGCAACAAACAGTAGCTGGGTGGTTGTGTTTAAGGCTTTAGTGACAACACATCATCTCATGGTGCATGGAAATGAGAGATTTATTCAATATTTGGCTTCTAGAAATACACTATTCAATCTCAGCAATTTTTTGGACAAAAGTGGATCCCATGGTTATGATATGTCTACCTTCATAA
Le proteine: natura ed informazione • Le proteine sono macromolecole polimeriche. I costituenti delle
proteine sono gli aminoacidi. • Gli aminoacidi sono molecole caratterizzate dalla presenza di
un gruppo aminico (basico) ed un gruppo acido che costituiscono la parte costante della molecola e da un “residuo” variabile che conferisce ad ogni aminoacido caratteristiche diverse.
• Il gruppo acido di un aminoacido ed il gruppo basico dell’aminoacido successivo si uniscono tra loro tramite un legame covalente forte chiamato legame peptidico. La ripetizione lineare di questi legami peptidici costituisce lo “scheletro” della catena polipeptidica.
• I “residui”, che costituiscono la parte variabile, possono interagire tra loro. Residui apprtenenti ad aminoacidi distanti tra loro possono interagire tramite legami deboli portando ad un “ripiegamento” della catena lineare della proteina. Queste interazioni sono alla base della struttura 3d della proteina.
Le proteine: natura ed informazione Gli aminoacidi Esistono 20 diversi aminoacidi che combina, tra loro cos,tuiscono tuJe le proteine contenute negli organismi viven,. Ques, aminoacidi hanno struJura chimica e proprietà diverse.
Le proteine: natura ed informazione
HQVKVQGCWGRWRWQEFENAEGDEYAADLAQGSPATAAQNGPDVYVLPLTEVSLPMAKQPGRSVQLLKSTDVGRHSLLYLKEIGRGWFGKVFLGEVNSGISSAQVVVKELQASASVQEQMQFLEEVQPYRALKHSNLLQCLAQCAEVTPYLLVMEFCPLGDLKGYLRSCRVAESMAPDPRTLQRMACEVACGVLHLHRNNFVHSDLALRNCLLTADLTVKIGDYGLAHCKYREDYFVTADQLWVPLRWIAPELVDEVHSNLLVVDQTKSGNVWSLGVTIWELFELGTQPYPQHSDQQVLAYTVREQQLKLPKPQLQLTLSDRWYEVMQFCWLQPEQRPTAEEVHLLLSYLCAKGATEAEEEFERRWRSLRPGGGGVGPGPGAAGPMLGGVVELAAASSFPLLEQFAGDGFHADGDDVLTVTETSRGLNFEYKWEAGRGAEAFPATLSPGRTARLQELCAPDGAPPGVVPVLSAHSPSLGSEYFIRLEEAAPAAGHDPDCAGCAPSPPATADQDDDSDGSTAASLAMEPLLGHGPPVDVPWGRGDHYPRRSLARDPLCPSRSPSPSAGPLSLAEGGAEDADWGVAAFCPAFFEDPLGTSPLGSSGAPPLPLTGEDELEEVGARRAAQRGHWRSNVSANNNSGSRCPESWDPVSAGCHAEGCPSPKQTPRASPEPGYPGEPLLGLQAASAQEPGCCPGLPHLCSAQGLAPAPCLVTPSWTETASSGGDHPQAEPKLATEAEGTTGPRLPLPSVPSPSQEGAPLPSEEASAPDAPDALPDSPTPATGGEVSAIKLASALNGSSSSPEVEAPSSEDEDTAEATSGIFTDTSSDGLQARRPDVVPAFRSLQKQVGTPDSLDSLDIPSSASDGGYEVFSPSATGPSGGQPRALDSGYDTENYESPEFVLKEAQEGCEPQAFAELASEGEGPGPETRLSTSLSGLNEKNPYRDSAYFSDLEAEAEATSGPEKKCGGDRAPGPELGLPSTGQPSEQVCLRPGVSGEAQGSGPGEVLPPLLQLEGSSPEPSTCPSGLVPEPPEPQGPAKVRPGPSPSCSQFFLLTPVPLRSEGNSSEFQGPPGLLSGPAPQKRMGGPGTPRAPLRLALPGLPAALEGRPEEEEEDSEDSDESDEELRCYSVQEPSEDSEEEAPAVPVVVAESQSARNLRSLLKMPSLLSETFCEDL
Così come già visto per le sequenze di DNA o RNA, che vengono rappresentate come stringhe composte dal susseguirsi di 4 possibili caraJeri che corrispondono ai 4 possibili nucleo,di, anche le sequenze proteiche possono essere rappresentate da stringhe. In questo caso i possibili aminoacidi sono 20 e di conseguenza anche l’alfabeto u,lizzato nelle sequenze proteiche è cos,tuito da (almeno) 20 caraJeri.
• L’informazione genica passa del DNA all’RNA. L’informazione
contenuta in queste molecole è simile, ed il meccanismo di trasmissione dell’informazione (la complementarietà delle basi) permette di copiare l’informazione del DNA sull’RNA utilizzando lo stesso alfabeto (con l’eccezione dell’utilizzo dell’U al posto della T)
• Nel passaggio da RNA a proteina il tipo di informazione cambia notevolmente. Si deve passare da un alfabeto chimico basato su 4 diversi nucleotidi ad un alfabeto chimico basato su 20 diverse aminoacidi.
• L’impossibilità di mantenere una corrispondenza univoca tra nucleotide ed aminoacido impone l’utilizzo di una codifica
AATGTATTC TTACATAAG TTACATAAG
AAUGUAUUC
La necessità di codificare l’informazione
Decifrazione del codice gene,co
• Quan,tà e densità di informazione • Coppie? TripleJe? Quadruple? Tuple?
a. Un gruppo di tre basi codifica per un aminoacido b. Il codice non è sovrapposto c. La sequenza di basi viene leJa a par,re da un
punto di inizio fisso e non c’è par,colare punteggiatura
Decifrazione del codice gene,co Le mutazioni per inserzione o delezione alterano tuJa la sequenza proteica a valle per frameshi\
Decifrazione del codice gene,co Mutan, del gene RII del fago T4 oJenu, mediante traJamento con acrilammide (induzione di inserzioni o delezioni)
StruJura del codice gene,co e sue proprietà
Il fenomeno per il quale esistono diverse triplette che codificano per lo stesso aminoacido è definito come “degenerazione del codice”
La maggior parte degli aminoacidi è codificata da 2 o più triplette. La metionina è codificata solo dal codone AUG che rappresenta anche il codone di inizio della sintesi proteica. I codoni UGG UAA e UAG sono chiamati codoni di STOP. Ad essi con corrisponde nessun aminoacido ma rappresentano i segnali di terminazione per la sintesi proteica.
Il codice genetico Le conseguenze della degenerazione del codice
• E’ sempre possibile passare dall’informazione contenuta nei nucleotidi alla corrispondente sequenza proteica: ad ogni tripletta può essere associato uno ed un solo aminoacido.
• Non è mai possibile ottenere, in modo univoco, una sequenza nucleotidica a partire dalla sequenza proteica da essa generata
MEFGLKEFLLNPSTPEGKLTPQRQTNPVWYACAWA Sequenza proteica
AUG
GAA
GAG UUU
UUC
GGA
GGC
GGG
GGU
La retrotraduzione non è risolvibile in maniera esatta e non può essere dai
sistemi biologici.
Il codice genetico Il vacillamento della terza base
I CODONI CHE RAPPRESENTANO LO STESSO A.A., O A.A. CORRELATI, HANNO SEQUENZE SIMILI.
SPESSO LA BASE CHE OCCUPA LA TERZA POSIZIONE DEL CODONE NON E’ SIGNIFICATIVA, COME DIMOSTRA IL FATTO CHE NEI GRUPPI DI 4 CODONI CHE RAPPRESENTANO LO STESSO A.A., SOLO LA TERZA BASE E’ DIFFERENTE.