lezione 23 4 2015 parte1 - gulisanolab.it · nell'espressione genica (La trascrizione del DNA in...
Transcript of lezione 23 4 2015 parte1 - gulisanolab.it · nell'espressione genica (La trascrizione del DNA in...
La stru(ura del gene
Corso di Laurea in Chimica e Tecnologie Farmaceu6che a.a. 2014-‐2015
Università di Catania
Stefano Forte
I Geni • Il gene è l'unità ereditaria e funzionale degli
organismi viventi. • La maggior parte dei geni codifica proteine, che
sono le macromolecole maggiormente coinvolte nei processi biochimici e metabolici della cellula.
• Altri geni non codificano proteine, ma producono RNA non codificante, che può giocare un ruolo fondamentale nella sintesi delle proteine e nell'espressione genica (La trascrizione del DNA in RNA e la traduzione dell'RNA in proteina).
• Parte del contenuto dei geni non viene trascritto, ma può coordinare la stessa espressione genica.
• Tra queste regioni figurano i promotori, i terminatori e gli introni .
• I geni non sono sequenze casuali ma hanno caratteristiche ben precise.
• Buona parte dell'informazione contenuta in un gene viene "copiata" in una molecola di RNA; il resto del gene è coinvolto comunque nel processo di "copia" (trascrizione).
• Alcuni tipi di RNA vengono utilizzati per la sintesi delle proteine, altri svolgono svariati tipi di funzioni.
• Esistono tre classi di geni, che differiscono in base al tipo di RNA che viene prodotto con la loro espressione: – Geni della I classe
• RNA ribosomiale (rRNA) – Geni della II classe
• RNA messaggero (mRNA) • Piccoli RNA nucleari (snRNA) • Micro RNA (miRNA)
– Geni della III classe • RNA transfer (tRNA) • Piccoli RNA nucleolari (snoRNA) • Piccoli RNA citoplasmatici (scRNA) • Micro RNA (miRNA)
Tre classi di geni
L'RNA messaggero • Gli RNA Messaggeri (mRNA) sono gli unici
tipi di RNA codificante. • Sono i trascritti dei geni che codificano
proteine. • Trasportano l'informazione genica nel
citoplasma, dove tale informazione viene impiegata per la sintesi delle proteine.
• Costituiscono solo il 4% circa degli RNA totali della cellula ed hanno vita breve, in quanto vengono degradati poco dopo la sintesi proteica.
I principali RNA non codificanti
• RNA ribosomiali (rRNA) – Sono i più abbondanti nelle cellule – Sono parte integrante dei ribosomi, le
particelle dove ha luogo la sintesi proteica • RNA transfer (tRNA)
– Sono piccole molecole coinvolte nella sintesi proteica
– Trasportano gli aminoacidi ai ribosomi in modo tale da permettere la loro unione nell'ordine specificato dalla sequenza nucleotidica dell'mRNA
Altri tipi di RNA non codificante
• Piccoli RNA nucleari (snRNA) – Sono coinvolti nella maturazione degli mRNA
• Piccoli RNA nucleolari (snoRNA) – Svolgono un ruolo cruciale nella maturazione
delle molecole di rRNA • Piccoli RNA citoplasmatici (scRNA)
– Gruppo eterogeneo che comprende molecole con una varietà di funzioni diverse, alcune ancora misteriose
• microRNA (miRNA) – Sono piccole molecole che regolano
l'espressione genica a livello post-trascrizionale
Com'è fatto un gene? ATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGGATGACTTTCCTCCAGCTACGTCTCAACTATTCAGCCCAGGAGCGCCTTTAGATGTGCACCCACTTAATCCATCCAATCCAGAGACTGTATTTCATTCACATCTTGGTGCAGTCAAAAAGGCACCCAGTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAGATGAACTTACCCAAGAAAATAAAGACCGAACTGTCACTGGAAACAAAGTCACAAATGAGGAAAGCTTTAGGACTCAAGATTGGCAAAGTCAGTTGCAGTTGCCTGATGAACAAGGCAGTGGGCTGAACTTGAATAGCAACAGTTCACCAGATACCCAGTCATGTCTGTGCTCTCATGATGCTGACTCCAACCAGCTCTCTTCAGAAACACCAAATTCCAATGCCTTACCTGTGGTATTGATATCATCCATGACACCAATGAACCCTGTTACAGAATGTTCTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCTTTGAATGCCAAAAACACAGAATATAATCCAAAGAGGTTTGCTGCAGTCATAATGAGGATCCGAGAGCCAAGGACCACAGCTCTTATATTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGACGAGTCTCGGCTGGCAGCAAGAAAGTATGCTCGCGTGGTGCAGAAGCTGGGGTTCCCCGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGCAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGAGCCTGAACTGTTCCCTGGCCTTATTTATAAGATGGTGAAACCGCAGGTTGTGCTGCTCATCTTTGCATCTGGAAAGGTTGTACTGACAGGTGCCAAAGAGCGTTCTGAGATCTACGAAGCATTTGAAAACATGTATCCTATTCTAGAAAGTTTTAAGAAAGTCTGAATGGAGGAGGACATATACCTGGACCTCTTCCTGGATCCTTATACCATCCAGGATGACTTTCCTCCAGCTATGTCTCAACTGTTCAGCCCAGGAGTGCCTTTAGACATGCACTCACTTCCATCTAATCCAGAGACTGTGTTTCATCCACATCTTGGTGGAGTCAAAAAGGCATCCACTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAGATGAACTTACCCAAGAAAATAGAGACCAAACTGTCACTGGAAACAAGCTGGCAAGTGAGGAAAGCTGTAGGACTCGAGATCGACAAAGTCAGTTGCAGTTGCCCGATGAACATGGCAGTGAGCTGAACTTGAATAGCAACAGTTCACCAGATCCCCAGTCATGCCTGTGCTTTGATGATGCTCACTCCAACCAGCCCTCTCCAGAAACACCAAACTCCAATGCCTTACCTGTGGCATTGATAGCATCCATGATGCCAATGAACCCTGTTCCAGGATTTTCTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCCCTGAATGCCAAAAACACAGAATATAACCCAAAGAGGTTTGCTGCAGTAATAATGAGGATCCGAGAGCCAAGGACAACAGCTCTCATCTTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGAGGAGTCTCGGCTGGCAGCGAGAAAGTATGCTCGTGTGGTGCAGAAGCTCGGGTTCCCTGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGAACCTGAACTTTTCCCCGGCCTTATTTATAAGATGGTAAAACCACAGGTTGTGTTGCTAATCTTTGCATCTGGAAAAGTTGTGTTAACAGGTGCCAAAGAGCGTTCTGAGATCTATGAAGCATTTGAAAACATGTATCCTATTCTAGAAAGTTTTAAGAAAGTCTGAATGGAGCAGGAGGAGACCTACCTGGAGCTCTACCTGGACCAGTGCGCCGCTCAGGATGGCCTTGCCCCACCCAGGTCTCCCCTGTTCAGCCCAGTTGTACCTTATGATATGTACATACTGAATGCATCCAATCCGGATACTGCATTTAATTCGAACCCTGAAGTCAAAGAAACATCTGGTGATTTCTCATCTGTGGATCTTAGCTTCCTACCAGATGAAGTTACCCAGGAAAATAAAGACCAGCCTGTCATTAGCAAACACGAAACTGAAGAAAATTCTGAAAGCCAAAGTCCACAAAGTAGGTTGCCATCACCCAGCGAACAGGACGTTGGGCTGGGCTTAAACAGCAGCAGTTTGTCAAATTCCCATTCACAGCTGCACCCTGGTGATACTGACTCAGTCCAGCCCTCTCCTGAGAAACCAAACTCCGACTCCTTGTCTCTGGCATCCATAACTCCCATGACACCAATGACCCCTATTTCAGAATGTTGTGGAATTGTACCTCAACTACAGAATATAGTTTCCACTGTAAACCTGGCCTGTAAGTTGGATCTGAAGAAAATAGCTTTGCATGCAAAAAATGCAGAATATAACCCAAAGAGGTTTGCTGCTGTCATAATGAGGATCCGAGAGCCCAGGACAACAGCCCTTATATTTAGCTCTGGGAAGATGGTCTGCACGGGAGCCAAAAGTGAAGAGCAGTCTCGACTTGCAGCAAGAAAATATGCTCGTGTGGTGCAGAAGCTTGGGTTCCCTGCCAGATTCCTCGATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAGATTTCCCATCAGGCTGGAAGGTTTGGTGCTAACCCATCAGCAGTTCAGTAGTTACGAGCCTGAACTGTTTCCTGGTCTTATTTATAGAATGGTAAAACCACGAATTGTGTTGCTTATCTTTGTATCTGGAAAAGTTGTGTTGACAGGTGCCAAAGAACGTTCTGAGATCTATGAAGCATTTGAAAACATCTATCCTATTCTAAAAGGTTTTAAAAAAGCCTGAGAAGTCCCCTGGGTAACTTCCAGGCAGCTTCATTTCTGAAGAGTCCAAACTGCAGCATAGAGGACTTATGAAAAACTGTAAAAAATTGGTTTTAAGTGTTCCATTAAACCCAAAGAAAACAGTCACACAACAAAGCCAGACACAGAAAATTAGGGTGACATGTTTCCTGTCATATGTGGAGCCTAGAGAACATAGAGATGATGTGAAAGCAGAAGGAGCTATCAAGAAAAAGGAAAGCAGATGGGGCAGCAGATCCATGGGAATACTGGCAGAACTGTATAATGGAAGAATGTCGTATGCACATATGAACATGTCATAATGAAACCTAGTATTTTGTACAGTTAATATGGACTAGACAATAGCACAAAGAAATTAGAGATTAGTCTAGCTATATGAAGAGGCTACATCAAAGATCACTCCTTTTTGATGGACAAATTTAATTCCTTATAACTGTAGAGCTGAGATATTCACTTGCTTGTCAGACATTAAATGTATCCCACTCTTAGGGTCTAGAAGTTACCCAGACTTCTTGTACCATGGTCCCATCTATCTTCAAAGTCAGCAGTGACGACTCTGCCTTATGACAAGGTCATCTCCTGCTTTCAAATCCCTCCCAAAGAGTGGCCAATTCCTCCTTGGCTGCTCAGTCAGTAAGGGCAGGCTTGGATCCTTTCCCTTTCCTAACAATGGACTTGGAATTTTAATTACATCTTCAAAACCCAAGAGCATTTGGTTTTTTTTAGATAACTGGGAGATACATTTGGAGATAGGGATTTGGGGAGCCACCGAAACATTCTACCTACCATAGGAAATAGTTATAAATCTATTTTACTGGCTGGAGAGATGGCCAAGCAGTTAAGAATACTTTCTGCTTTTTCAAAGGATAGAAATTCTGTTCCTAGCACCCACACTGGGCTTCTTAGTGATTCCAACTCTACAGGACCTGATGCCTCCTTCTCTCTGGCTTCCTTAGATACCAGTTTGTACTGGCACATGCATATGCACAGGAGAAGGCTCTCTCTCTCTCTCTCCCCCCCCCCCCTCTCTCTCTCTCACACACACACACAAGATGGTGAGATATAATTAATAAAATAAAGTAAAATTTGGATCTGTTTTAGTCAGTTTGGGATGCCATAATAAAACACCACAAACTGGGCAGTTTAAACCACAGAAATTTCCTTCATAGTTCTGAAGGCTGGAGATCTAAGATCAAGGTCCCTGCAGATTTGGTCTCTCCTGTAGCAATCCTCCATCTTTCCTTTTAGGTAGCTGCCTTAATGTTGCTCTTTTTACAGCTTTTTCTTTGTATTTCTATGAAAACATCAGACATATTGGATTGGGGCTTCTACACATGATCTTCATGGGATAAGCAATAACCATAGTTACTGATCTGTGAGGCTGGTTCTGAGTGTGCAGCTCAGTAGGCTGTCTCATTTACAGACACTATGACATTACATCACACATCACTATATAAATCCCAGATTTTTCAAAAGGATCCCCCTATTTTTATTGGAATGTCTGACTCTAGTGCAGGTTATCCAAGCTCCATTCTCAGGTTCGTTTTATCCACCAAGACTGAGCAGATGAGCTGGGCACAGAGACATGATGATGAATAATTTAAATTGTTCCTTTTAAACAGTAGAATCAAGTAAGGAAGATTTAAAAATACATTTTGCAATCTCTTACATCAAAGTGTCTTCTTCTAGAACAGTTCAATACAGTTAAGCTAAGACATTTGAATTAAAGCGTTTAAGAAAGAAAAGCTTCTCTGGATATTTGGTTTTACATTAACTTCTTGAGTTGTCTGAACCCTAACTGTGGAATTTGCACAGCTGTAGGCAAATTCTCTGTAATAGGTGAAAATCTACCTGGGGTGTGAAGGTGAAGAATAATTACAGAAATATCACATCTGAATAGATGAGGGGATTCAGCGGGCAAGGGTGCTTGCCACCAAGCCTGACACTCTGGGTTTGATCCTTGTGTTTCTTCCAGAGCTGGAAGGAGAGAACCTACTCCTGAAAATTGTCTTCTGACCATAACATGAGCTCTGCACTGTGCATGTGTCCATGCACACATGCCAATGAAGATAAATCAATATTAGAAATATCACATCTAAGAATCTGGGTATGGTGATGCTCATGCATGTTGTAACCCCAGAACTTAGGAGCTGGAGGATATACAAGTTTGTGGCTAGCCTGGACTACATGAGAAGAGAAGGGGGAAGGGAAAGAGAAGGAAAAGAAGAAAAGAAAAGGAAAAGGATAAGGATAAAGGCAGAAGAGAAAAGCATTCTTTTCTCACTTGCACAATGAGAAAACCTTATCATGCTACTCTACTGGAAGCACTAGTCTCGGCCCTCCTCTTCTTCTGGGTGCCACCAGCTGTGTCTTGCCTGGCTCATCAACTCCTTCTCTGCTTCTCACCTGACTCCTCAGCTCATTCACAGCATCTGTGCAAGGCAGCAGAGCTGGTCCCGCCTCACTGCGTGCTCCCTGAGGCTGATAAAAGGTATCTGCTCCCACAGCCAGACTGGTACTAACAAAGCTTCTTCCACTTGCCTGGACGCTGATTCCTTTGCTTGTCCTCAGCTCTACGATGACTTTCCTCCAGCTATGTCTCAACTGTTCAGCCCAGGAGTGCCTTTAGACATGCACTCACTTCCATCTAATCCAGG
Struttura dei Geni eucariotici codificanti
• I geni codificanti sono quelli che vengono trascritti in mRNA.
• Contengono una parte realmente codificante, che specifica la sequenza degli aminoacidi che costituiranno la proteina, ed una parte non codificante.
• A monte della sequenza che verrà trascritta in mRNA vi sono le sequenze regolatrici.
• La sequenza trascritta è costituita da due tipi di elementi, detti esoni ed introni.
• Solo gli esoni contengono informazioni per la sintesi della proteina.
Struttura del gene
Sequenze regolatrici • Le sequenze regolatrici sono situate a monte del sito
di inizio della trascrizione. • Svolgono un ruolo fondamentale nell'espressione del
gene, permettendo l'avvio e la regolazione della trascrizione.
• Le sequenze regolatrici prossimali, cioè vicine al sito di inizio della trascrizione, sono dette Promotori.
• Elementi Promotori fondamentali sono il TATA box, il CAAT box e il GC box.
• Altri elementi regolatori distali, cioè lontani dal sito di inizio della trascrizione, sono gli enhancers e i silencers (i primi amplificano, i secondi reprimono la trascrizione).
Sequenza trascritta
• La sequenza che viene trascritta in mRNA, contiene le informazioni necessarie per la sintesi proteica (regione codificante tradotta) ed altre sotto-sequenze non tradotte.
• La regione codificante è formata da elementi chiamati Esoni, intervallati da elementi non codificanti chiamati Introni.
• Normalmente gli introni sono più grandi degli esoni.
Com'è fatta una sequenza codificante?
• I geni sono sequenze nucleotidiche, sequenze di 4 tipi diversi di caratteri: A, C, G e T.
• I geni che codificano proteine contengono schemi di lettura aperti, ORF (Open Reading Frames), costituiti da una serie di triplette di nucleotidi dette codoni.
• L'informazione contenuta nel gene specifica la sequenza della proteina che dovrà essere sintetizzata, ovvero la successione degli aminoacidi della proteina, mediante una successione di codoni:
ATGGGACAGCAGGGATTTAATTAA Ogni codone specifica uno ed un solo
aminoacido.
Come sono fatte le ORF? • Le ORF cominciano con un codone di inizio, normalmente
ATG, e finiscono con un codone di stop che può essere TAA, TAG o TGA.
Il DNA è formato da due filamenti complementari che sono avvolti a formare una doppia elica, conformazione a bassa energia che conferisce stabilità alla molecola. Le due estremità sono dette per convenzione 5’ e 3’. Le sequenze vengono lette sempre nell’ordine 5’ -> 3’, su entrambi i filamenti. Gli appaiamenti canonici (di Watson/Crick) sono:
A-T G-C
5’- AGTAGAACGCCAAATCGAGCCTAGCATA – 3’ 3’- TCATCTTGCGGTTTAGCTCGGATCGTAT – 5’
La sequenza di un gene si trova su uno dei due filamenti: solo uno dei due filamenti contiene la sequenza da trascrivere.
Come sono fatte le ORF? (2) • Ogni sequenza di DNA ha 6 possibili schemi di
lettura, tre in una direzione e tre nella direzione opposta sul filamento complementare:
GGT------------------------ TGG------------------------- ATG--------------------------
5’- ATGGTAACGCCAAATCGAGCCTAGCATA – 3’ 3’- TCATCTTGCGGTTTAGCTCGGATCGTAT – 5’
------------------------TAT ----------------------GTA --------------------CGT
• Normalmente la ORF codificante è quella più
lunga.
I codoni • I codoni della ORF corretta
specificano la sequenza di aminoacidi della proteina corrispondente.
• Il primo codone, che è di solito ATG, specifica sia l'inizio della traduzione che un particolare aminoacido, la Metionina (M).
• I tre codoni di stop invece indicano solo la fine della traduzione e non codificano nessun aminoacido.
5’- GTATGAACGCCAAATCGAGCTAGCATA – 3’ 3’- CATACTTGCGGTTTAGCTCGATCGTAT – 5’
Non tutti gli esoni codificano • Gli esoni sono normalmente codificanti, ad
eccezione di quelli alle estremità 5' e 3' del gene. • Tali esoni prendono il nome di UTR (UnTranslated
Region).
• In questo caso il 5' UTR è costituito da tutto il 1° esone e da parte del 2° esone (regione arancione).
• La regione codificante è indicata in blu, inizia nel 2° esone e termina nell'ultimo esone.
• Il 3' UTR è costituito da parte dell'ultimo esone (regione gialla).
Introni
Esoni
Il segnale di poliadenilazione
Segnale di poliadenilazione
Un gene… tante proteine Promotore Alternativo
Un gene… tante proteine Splicing Alternativo
Struttura dei geni procariotici
• La struttura dei geni procariotici è più semplice. • Spesso, nei genomi procariotici, diversi geni vengono
controllati da un'unica regione regolatrice: un tale insieme di geni viene definito operone (Es. operone formato dai geni A, B, C, D, E).
• I geni dell'operone codificano determinate proteine. • Il promotore, a monte dei geni, è necessario all'inizio della
trascrizione. • L'operatore, nella sequenza regolatrice, regola l'espressione
dei geni.
Com'è fatto un promotore?
• La funzione di un promotore non è di essere trascritta e tradotta, ma di farsi riconoscere dalle proteine.
• L'informazione per la funzione del promotore sta direttamente nella sua sequenza, che costituisce il segnale.
• La sequenza di un promotore non deve necessariamente essere contigua e lo spazio tra due elementi distaccati può essere parte stessa del segnale.