lezione 11 4 2012 - GulisanoLab · sintetizzata sulla base di uno STAMPO sul DNA e lʼinformazione...

Il Codice Gene,co

Il dogma centrale, il flusso dell’informazione genica e la

decifrazione della informazione del DNA

Corso di Laurea in Chimica e Tecnologie Farmaceu,che a.a. 2011-‐2012

Università di Catania

Stefano Forte

Il dogma centrale e le prime ipotesi sul codice gene,co

•  Le funzioni del materiale gene,co – Deve potersi replicare – Deve potersi esprimere

•  Come avviene l’espressione? •  Negli eucario, in DNA non abbandona il nucleo •  Il DNA lo stesso in tuJe le cellule di un organismo •  Il DNA rimane costante nel tempo •  Nel 1945 Beadle: un gene -‐> un enzima •  Linearità geni e sequenze proteiche

Il dogma centrale e le prime ipotesi sul codice gene,co

Effettuata da alcuni virus a RNA chiamati retrovirus

Il flusso dell’informazione genica

• L’informazione genica è contenuta nel DNA

• Questa informazione è perpetuata nelle generazioni future tramite il processo semiconservativo chiamato duplicazione del DNA

• L’espressione della informazione genica è invece un processo che passa attraverso un intermediario transitorio: l’RNA messaggero. Questa molecola è sintetizzata sulla base di uno STAMPO sul DNA e l’informazione in esso contenuta serve per dirigere la sintesi di proteine.

• L’informazione passa (quasi) sempre dal DNA all’RNA e da questo alle proteine.

DNA RNA Proteina Trascrizione Traduzione

Mantenimento dell’informazione Trasferimento dell'informazione Ruolo funzionale

Informazione contenuta nella sequenza

Informazione contenuta nella sequenza e nella quantità

Informazione contenuta nella struttura e nella quantità

Retrotrascrizione

Il contenuto informa,vo del DNA

La struttura del DNA è costante. Il DNA è sempre una doppia elica INDIPENDENTEMENTE dalla sequenza di nucleotidi che lo compone. L’ossatura di zucchero e fosfato è costante. La parte variabile, e quindi più informativa, è rappresentata dalla sequenza di BASI AZOTATE. Per questo motivo è possibile rappresentare l’informazione contenuta nel DNA con una lunga sequenza composta da un alternanza 4 caratteri che rappresentano le basi azotate del DNA. GCGGCGGCGGGCGGGTACTGGCTTCTGGGGCCAGGGGCCAGGGGCGGTGGGCGCCGGGACCGCGGAGCTGAGGAGCGGGGCCCGGCCAGGGCTGGAGACTTTGCGCCCGGGGGCACCGGGGCTGCGCGCGGTCGCACACATCCACCGGCGCGGCTTCCCTCGGCGGCCCGGGCTCCGCTCATCCTGCGGCGGGCGGCGCCGCTCAGGGGCGGGAAGAGGAGGCGGTAGACGCGACCACAGAAGATGTCGGGCCAAACGCTCACGGATCGGATCGCCGCCGCTCAGTACAGCGTTACAGGCTCTGCTGTAGCAAGAGCGGTCTGCAAAGCCACTACTCATGAAGTAATGGGCCCCAAGAAAAAGCACCTGGACTATTTGATCCAGGCTACCAACGAGACCAATGTTAATATTCCTCAGATGGCCGACACTCTCTTTGAGCGGGCAACAAACAGTAGCTGGGTGGTTGTGTTTAAGGCTTTAGTGACAACACATCATCTCATGGTGCATGGAAATGAGAGATTTATTCAATATTTGGCTTCTAGAAATACACTATTCAATCTCAGCAATTTTTTGGACAAAAGTGGATCCCATGGTTATGATATGTCTACCTTCATAA

Le proteine: natura ed informazione •  Le proteine sono macromolecole polimeriche. I costituenti delle

proteine sono gli aminoacidi. •  Gli aminoacidi sono molecole caratterizzate dalla presenza di

un gruppo aminico (basico) ed un gruppo acido che costituiscono la parte costante della molecola e da un “residuo” variabile che conferisce ad ogni aminoacido caratteristiche diverse.

•  Il gruppo acido di un aminoacido ed il gruppo basico dell’aminoacido successivo si uniscono tra loro tramite un legame covalente forte chiamato legame peptidico. La ripetizione lineare di questi legami peptidici costituisce lo “scheletro” della catena polipeptidica.

•  I “residui”, che costituiscono la parte variabile, possono interagire tra loro. Residui apprtenenti ad aminoacidi distanti tra loro possono interagire tramite legami deboli portando ad un “ripiegamento” della catena lineare della proteina. Queste interazioni sono alla base della struttura 3d della proteina.

Le proteine: natura ed informazione Gli aminoacidi Esistono 20 diversi aminoacidi che combina, tra loro cos,tuiscono tuJe le proteine contenute negli organismi viven,. Ques, aminoacidi hanno struJura chimica e proprietà diverse.

Le proteine: natura ed informazione

HQVKVQGCWGRWRWQEFENAEGDEYAADLAQGSPATAAQNGPDVYVLPLTEVSLPMAKQPGRSVQLLKSTDVGRHSLLYLKEIGRGWFGKVFLGEVNSGISSAQVVVKELQASASVQEQMQFLEEVQPYRALKHSNLLQCLAQCAEVTPYLLVMEFCPLGDLKGYLRSCRVAESMAPDPRTLQRMACEVACGVLHLHRNNFVHSDLALRNCLLTADLTVKIGDYGLAHCKYREDYFVTADQLWVPLRWIAPELVDEVHSNLLVVDQTKSGNVWSLGVTIWELFELGTQPYPQHSDQQVLAYTVREQQLKLPKPQLQLTLSDRWYEVMQFCWLQPEQRPTAEEVHLLLSYLCAKGATEAEEEFERRWRSLRPGGGGVGPGPGAAGPMLGGVVELAAASSFPLLEQFAGDGFHADGDDVLTVTETSRGLNFEYKWEAGRGAEAFPATLSPGRTARLQELCAPDGAPPGVVPVLSAHSPSLGSEYFIRLEEAAPAAGHDPDCAGCAPSPPATADQDDDSDGSTAASLAMEPLLGHGPPVDVPWGRGDHYPRRSLARDPLCPSRSPSPSAGPLSLAEGGAEDADWGVAAFCPAFFEDPLGTSPLGSSGAPPLPLTGEDELEEVGARRAAQRGHWRSNVSANNNSGSRCPESWDPVSAGCHAEGCPSPKQTPRASPEPGYPGEPLLGLQAASAQEPGCCPGLPHLCSAQGLAPAPCLVTPSWTETASSGGDHPQAEPKLATEAEGTTGPRLPLPSVPSPSQEGAPLPSEEASAPDAPDALPDSPTPATGGEVSAIKLASALNGSSSSPEVEAPSSEDEDTAEATSGIFTDTSSDGLQARRPDVVPAFRSLQKQVGTPDSLDSLDIPSSASDGGYEVFSPSATGPSGGQPRALDSGYDTENYESPEFVLKEAQEGCEPQAFAELASEGEGPGPETRLSTSLSGLNEKNPYRDSAYFSDLEAEAEATSGPEKKCGGDRAPGPELGLPSTGQPSEQVCLRPGVSGEAQGSGPGEVLPPLLQLEGSSPEPSTCPSGLVPEPPEPQGPAKVRPGPSPSCSQFFLLTPVPLRSEGNSSEFQGPPGLLSGPAPQKRMGGPGTPRAPLRLALPGLPAALEGRPEEEEEDSEDSDESDEELRCYSVQEPSEDSEEEAPAVPVVVAESQSARNLRSLLKMPSLLSETFCEDL

Così come già visto per le sequenze di DNA o RNA, che vengono rappresentate come stringhe composte dal susseguirsi di 4 possibili caraJeri che corrispondono ai 4 possibili nucleo,di, anche le sequenze proteiche possono essere rappresentate da stringhe. In questo caso i possibili aminoacidi sono 20 e di conseguenza anche l’alfabeto u,lizzato nelle sequenze proteiche è cos,tuito da (almeno) 20 caraJeri.

•  L’informazione genica passa del DNA all’RNA. L’informazione

contenuta in queste molecole è simile, ed il meccanismo di trasmissione dell’informazione (la complementarietà delle basi) permette di copiare l’informazione del DNA sull’RNA utilizzando lo stesso alfabeto (con l’eccezione dell’utilizzo dell’U al posto della T)

•  Nel passaggio da RNA a proteina il tipo di informazione cambia notevolmente. Si deve passare da un alfabeto chimico basato su 4 diversi nucleotidi ad un alfabeto chimico basato su 20 diverse aminoacidi.

•  L’impossibilità di mantenere una corrispondenza univoca tra nucleotide ed aminoacido impone l’utilizzo di una codifica

AATGTATTC TTACATAAG TTACATAAG

AAUGUAUUC

La necessità di codificare l’informazione

Decifrazione del codice gene,co

•  Quan,tà e densità di informazione •  Coppie? TripleJe? Quadruple? Tuple?

a.  Un gruppo di tre basi codifica per un aminoacido b.  Il codice non è sovrapposto c.  La sequenza di basi viene leJa a par,re da un

punto di inizio fisso e non c’è par,colare punteggiatura

Decifrazione del codice gene,co Le mutazioni per inserzione o delezione alterano tuJa la sequenza proteica a valle per frameshi\

Decifrazione del codice gene,co Mutan, del gene RII del fago T4 oJenu, mediante traJamento con acrilammide (induzione di inserzioni o delezioni)

Decifrazione del codice gene,co

StruJura del codice gene,co e sue proprietà

Il fenomeno per il quale esistono diverse triplette che codificano per lo stesso aminoacido è definito come “degenerazione del codice”

La maggior parte degli aminoacidi è codificata da 2 o più triplette. La metionina è codificata solo dal codone AUG che rappresenta anche il codone di inizio della sintesi proteica. I codoni UGG UAA e UAG sono chiamati codoni di STOP. Ad essi con corrisponde nessun aminoacido ma rappresentano i segnali di terminazione per la sintesi proteica.

La retrotraduzione?

Il codice genetico Le conseguenze della degenerazione del codice

• E’ sempre possibile passare dall’informazione contenuta nei nucleotidi alla corrispondente sequenza proteica: ad ogni tripletta può essere associato uno ed un solo aminoacido.

• Non è mai possibile ottenere, in modo univoco, una sequenza nucleotidica a partire dalla sequenza proteica da essa generata

MEFGLKEFLLNPSTPEGKLTPQRQTNPVWYACAWA Sequenza proteica

AUG

GAA

GAG UUU

UUC

GGA

GGC

GGG

GGU

La retrotraduzione non è risolvibile in maniera esatta e non può essere dai

sistemi biologici.

Il codice genetico Il vacillamento della terza base

I CODONI CHE RAPPRESENTANO LO STESSO A.A., O A.A. CORRELATI, HANNO SEQUENZE SIMILI.

SPESSO LA BASE CHE OCCUPA LA TERZA POSIZIONE DEL CODONE NON E’ SIGNIFICATIVA, COME DIMOSTRA IL FATTO CHE NEI GRUPPI DI 4 CODONI CHE RAPPRESENTANO LO STESSO A.A., SOLO LA TERZA BASE E’ DIFFERENTE.

lezione 11 4 2012 - GulisanoLab · sintetizzata sulla base di uno STAMPO sul DNA e lʼinformazione...

Documents

Transcript of lezione 11 4 2012 - GulisanoLab · sintetizzata sulla base di uno STAMPO sul DNA e lʼinformazione...