Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

28
Teorie sull’origine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica

Transcript of Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Page 1: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Teorie sull’origine degli introni e dei geni

Francesco PivaIstituto di Biologia e Genetica

Page 2: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Semplici mutazioni non costituiscono eventi di ricombinazione molto efficienti

La probabilità che nel DNA si crei una certo motivo di lunghezza N è di 1/4^N,ovvero occorrono 4^N mutazioni puntiformi diverse per creare una parola di lunghezza N

Es: ACCGT comparirebbe dopo in media 1024 mutazioni puntiformi casuali

Se consideriamo un esone lungo 120 basi, questo dovrebbe essere comparso dopo circa 1,7^72 mutazioni

Considerando che il tasso di mutazione nell’uomo è di 10^-8 per sito per generazione, si deve ammettere che o gli esoni erano preesistenti nelle prime specie o la ricombinazione non si è basata solamente sulle mutazioni puntiformi.

Page 3: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

La presenza degli introni migliorerebbe la ricombinazione

Se non ci fossero introni, il massimo effetto di una mutazione singola sarebbe quello di sostituire un amminoacido.

In presenza di introni, mutazioni che cadono nei siti di splicing possono alterare lo schema dello splicing, aggiungendo, sostituendo o eliminando molti amminoacidi alla volta.

In questo modo, a parità di eventi di mutazione, si genererebbero nuove proteine con più rapidità.

(Gilbert W. Why genes in pieces? NATURE 1978 271:501)

Page 4: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Ulteriori vantaggi della presenza degli introni

A parità di eventi di crossing over durante la meiosi, se un gene non avesse introni esso avrebbe un’occupazione cromosomica molto limitata. Solo se il crossing over avvenisse in modo da tagliare il gene genererebbe variabilità. Se il gene fosse diviso in esoni e quindi questi si trovassero distribuiti lungo il cromosoma, aumenterebbe la probabilità di scambio fra gli esoni.

Consideriamo un evento di crossing over che coinvolga un tratto di 30Kb su un tratto di 100Kb

Se il gene senza introni, si trovasse all’interno della zona scambiata, non ci sarebbe ricombinazione tra parti interne del gene.

Page 5: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Se il gene avesse una struttura interrotta, ci sarebbe maggior probabilità di avere ricombinazioni tra gli esoni.

Page 6: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Ricombinazione e splicing alternativo

In presenza di una struttura interrotta, mutazioni neutre possono originare nuove forme di alternative splicing senza distruggere le forme funzionali già esistenti. Questa rappresenta un’opportunità per l’evoluzione di esplorare nuovi schemi aggiungendoli eventualmente a quelli precedenti.(Pagani F, Raponi M, Baralle FE. Synonymous mutations in CFTR exon 12 affect splicing and are not neutral in evolution Proc Natl Acad Sci U S A. 2005 May 3;102(18):6368-72.)

Page 7: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Ricombinazione in Drosophila

Ricordiamo che il centiMorgan o unità di mappa è l’unità di misura in base alla quale viene espressa la distanza di due geni su un cromosoma e la lunghezza dei cromosomi nelle mappe genetiche. Un'unità di mappa corrisponde alla distanza di due geni che presentano una frequenza di crossing over dell'1%, e, quindi, ad un tratto di cromosoma nel quale in media si verifica un crossing-over ogni 50 meiosi.Assumiamo che la selezione naturale sia meno efficace in zone a basso tasso di ricombinazione.Analizzando la relazione tra le dimensioni degli introni in Drosophila e il tasso di ricombinazione delle zone in cui si trovano, si è evidenziata una correlazione. In generale si osserva che introni di dimensioni maggiori si trovano in zone di minor tasso di ricombinazione. Questo è spiegato con il fatto che introni lunghi hanno una maggior difficoltà nel subire splicing. Successivamente gli introni sono stati divisi in tre classi a seconda delle dimensioni, precisamente quelli aventi lunghezza minore di 60bp, quelli compresi tra 60 bp e 80 bp e quelli maggiori di 80bp. Si evidenzia che la classe di dimensioni intermedie si trova in zone ad alto tasso di ricombinazione e nella classe di sequenze di minor dimensione, la lunghezza degli introni e il tasso di ricombinazione sono proporzionali. Quindi anche introni molto corti si trovano in zone a bassa ricombinazione. (è meglio non toccare gli introni molto corti e quelli molto lunghi)Questi risultati sono in accordo con l’osservazione che in Drosophila introni di dimensioni minori di 60 bp e maggiori di 80 bp, non hanno una buona efficienza di splicing.

(ANTONIO BERNARDO CARVALHO, ANDREW G. CLARK Genetic recombination: Intron size and natural selection Nature 1999 - 401, 344)

Page 8: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Secondo questa osservazione, geni che si trovano in zone a basso tasso di ricombinazione dovrebbero essere penalizzati dal punto di vista dell’evoluzione, ma questo è compensato dalla presenza di introni più lunghi, che rendono il gene più sparso e ristabiliscono un buon tasso di ricombinazione.

Questi risultati sono in accordo con l’osservazione che in Drosophila introni di dimensioni minori di 60 bp e maggiori di 80 bp, non hanno una buona efficienza di splicing.

Page 9: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Teoria degli introni antichi (intron early)Originariamente esistevano piccole porzioni di genoma codificanti per altrettanto piccoli peptidi aventi funzioni semplici. Queste sequenze erano gli esoni e si trovavano molto lontane tra loro e all’interno di sequenze introniche. Eventi di ricombinazione non omologa a carico degli introni, avrebbero portato con se gli esoni, avrebbero avvicinato più esoni portandoli sotto il controllo dello stesso promotore.Questi eventi di rimescolamento (exon shuffling) avrebbero originato proteine più lunghe e complesse unendo i domini codificati dai singoli esoni.

Evidenze a favore della teoriaIl primo esempio di rimescolamento esonico è quello del gene che codifica per il recettore delle lipoproteine a bassa densità (LDL). La natura multifunzionale di questa proteina corrispondeva alla presenza di domini multipli, infatti dei 18 esoni che compongono questo gene, molti sono omologhi a sequenze di altre proteine. Precisamente 5 esoni codificano per domini simili a quelli della proteina del complemento C9, 3 producono domini simili a quelli del gene del precursore per il fattore di crescita dell’epidermide (EGF), 3 generano domini simili alle proteine di coagulazione del sangue (fattore IX, X e proteina C). La proteina di questo recettore sembra essere generata da un mosaico di esoni condivisi con diverse proteine quindi appartiene a molte famiglie supergeniche.(Südhof, T C; Goldstein, J L; Brown, M S; Russell, D W The LDL receptor gene: a mosaic of exons shared with different proteins Science Vol 228, Issue 4701, 1985)

Conservazione tra gli amminoacidi in tre specie nel gene LR11, le percentuali indicano le identità tra i vari domini(Sonja Mörwald; Hiroyuki Yamazaki; Hideaki Bujo; Jun Kusunoki; Tatsuro Kanaki; Kouichi Seimiya; Nobuhiro Morisaki; Johannes Nimpf; Wolfgang Johann Schneider; Yasushi Saito. A Novel Mosaic Protein Containing LDL Receptor Elements Is Highly Conserved in Humans and Chickens. Arteriosclerosis, Thrombosis, and

Vascular Biology. 1997;17:996-1002)

Page 10: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Sono state individuate altre proteine di struttura modulare che hanno sostenuto l’ipotesi dell’exon shuffling. Precisamente tra tutte le proteine di una specie, sono state selezionate quelle i cui esoni corrispondevano a singoli e ben definiti domini proteici, inoltre tali esoni dovevano essere fiancheggiati da introni che non interrompevano la fase. Infatti solo questi introni potevano partecipare al rimescolamento degli esoni. I gruppi di proteine che corrispondevano a questi criteri erano principalmente: le selettine, il recettore dell’interleuchina 2, una subunità del fattore di coagulazione XIIIb, follistatina e alcune proteine inibitrici della coagulazione

Page 11: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Evidenze che minano la teoriaConfrontando i geni di proteine modulari tra specie diverse, si nota che l’uomo rispetto a Drosophila e Caenorhabditis, ha un maggior numero di introni. In questi casi, gli autori, pur attribuendo ancora all’exon shuffling l’origine di tali proteine, giustificano la mancanza di introni delle specie non umane con la perdita dovuta a pressione selettiva durante l’evoluzione

I blocchi colorati costituiscono i domini proteici e non gli esoni, la barra nera verticale corrisponde al dominio transmembrana. I numeri indicano la fase degli introni presenti nel gene. (László Patthy Genome evolution and the evolution of exon-shuffling — a review GENE vol 238, 1999)

Page 12: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Diffusione tra i Phyla dei resti dei possibili eventi di exon shufflingAnalizzando le proteine modulari (definite come quelle aventi almeno un esone coincidente con un modulo proteico fiancheggiato da almeno un altro modulo, e il cui esone nel gene si trova tra introni inseriti in fase 1) tra tutti i genomi possibili, si nota che queste sono presenti in differenti phyla tra cui: le spugne, gli idrozoi, i nematodi, i molluschi, gli artropodi e gli echinodermi. Questo indica che il meccanismo dell’exon shuffling era funzionante prima della divergenza del phylum dei metazoi. Inoltre la maggior frequenza di exon shuffling coincide con l’aumento del numero di specie che si è avuto al tempo della radiazione dei metazoi, attribuendo ad accelerare l’evoluzione dei metazoi.Al contrario esistono proteine a struttura modulare presenti solamente nella linea dei cordati, ma anche in questo caso buona parte dei domini corrispondono agli esoni, e tali domini sono ritrovati in proteine di specie più antiche. Queste osservazioni sono ben giustificate dall’exon shuffling.

Page 13: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

La maggior parte delle proteine modulari che sarebbero state prodotte dall’exon shuffling, sono legate a funzioni essenziali alla multicellularità dei metazoi, come ad esempio alcuni costituenti della matrice extracellulare, mediatori e recettori per la comunicazione tra cellule, proteine per l’interazione matrice-cellula. Quindi l’exon shuffling avrebbe permesso e accelerato l’evoluzione dei metazoi multicellulari.

Page 14: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Una più ampia valenzaEventi di exon shuffling si possono osservare anche in alcune piante, così da assegnargli una valenza generale tra le specie per la creazione di nuovi geni.

Come sarebbe avvenuto l’exon shufflingSono stati proposti due meccanismi per spiegare come possa avvenire l’exon shuffling. Uno consiste nella ricombinazione illegittima, cioè nella ricombinazione di sequenze di DNA sia omologhe che non omologhe o meglio nella saldatura, a seguito di rotture, di lembi di DNA che non erano originariamente uniti insieme. L’altro consiste in una ricombinazione mediata dalle LINE-1, questi elementi, molto abbondanti nei genomi dei mammiferi, sono in grado di duplicarsi con un meccanismo copia e incolla. E’ stato dimostrato che tali elementi possono trascrivere oltre a se stessi anche una zona genomica a valle di essi, portandola con se anche nella retrotrasposizione. Esso sarebbe responsabile del rimescolamento di parti del genoma e quindi anche di esoni.

Page 15: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Un esempio di origine di un gene per retroposizione è dato dal gene BC200 del cromosoma 2 che si trova espresso nel cervello dei primati. In questo gene si possono riconoscere tre parti: quella in 5’ corrisponde ad un ALU, la parte centrale è una ripetizione di molte A e la parte in 3’ coincide con parte di una sequenza LINE.

ALU FLAM-C1 Poly A LINE L1

5’ 3’

(Tiedge H, Chen W, Brosius J Primary structure, neural-specific expression, and dendritic location of human BC200 RNA J Neurosci. 1993 Jun;13(6))

Page 16: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Tracce caratteristiche di eventi di retroposizione sono la perdita di introni, la presenza di tratti di poly A e la presenza di ripetizioni corte. Riportiamo un esempio relativo a un evento di retroposizione che ha duplicato un intero gene conservando la struttura introni-esoni. E’ il caso del gene PMCHL1 che corrisponde come posizione ad un introne del gene AROM (antisense-RNA-overlapping-MCH) ma si trova nel filamento opposto.

Mostriamo la locazione originale del gene PMCHL1 (cromosoma 5 posizione 22.170.113 – 22.195.445), si nota che nell’altro filamento è presente un introne di un altro gene.

mostriamo la retroposizione nello stesso cromosoma ma alla posizione 70.699.719 – 70.730.470

Page 17: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

In generale riportiamo uno schema che riassume il meccanismo di retroposizione, mediante retrotrascrizione, per cui un gene viene copiato e incollato in un’altra posizione portando con se un altro gene che conserva ancora la struttura introni-esoni.

Meccanismo generale di retroposizione che conserva la struttura introni-esoni mediante retrotrascrizione. Le frecce e le bandierine ovali indicano rispettivamente l’inizio e la fine della trascrizione

Page 18: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

La teoria dell’intron late

Secondo la teoria dell’intron late, geni piuttosto lunghi esistevano già nel passato, gli introni si sarebbero inseriti successivamente, il loro inserimento sarebbe avvenuto in fasi e posizioni casuali quindi tali da non definire moduli proteici, ovvero non si dovrebbe trovare una corrispondenza tra esone e dominio proteico (o tra introni e confini dei moduli proteici).

Al contrario l’exon shuffling produce geni più complessi se il rimescolamento avviene aggiungendo un esone avente la stessa fase dei fiancheggianti e lunghezza multipla di tre. Questo significa trovare esoni fiancheggiati da introni di fase identica. Se l’inserimento di un esone alterasse il frame di lettura proprio o dei successivi esoni, si potrebbero produrre codoni di STOP prematuri e originare proteine tronche anziché allungate e presumibilmente più complesse.

Page 19: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

E1 E2

2 2 E1 + E2 + E3

E1 E2

2 0STOP E1 + E2 tronco

E3

E3

2

E1 E3

2 2

E1 + E3

Situazione originale prima che lo shuffling inserisca l’esone 2

2

nn

Caso in cui l’esone 2 ha la stessa fase degli esoni tra i quali si inserisce

Caso in cui l’esone 2 ha fase diversa rispetto agli esoni tra i quali si inserisce

La prima situazione si riferisce ad un gene composto dagli esoni E1 e E3. Si suppone che tramite exon shuffling avvenga l’inserzione di un esone (E2) tra i due esoni preesistenti.Nel caso in cui l’esone inserito, abbia la stessa fase del punto in cui avviene l’inserimento, esso contribuirà a creare un prodotto proteico più lungo e presumibilmente più complesso.Nel caso in cui l’esone inserito abbia fase diversa rispetto all’inserzione, poiché cambierebbe il frame di lettura dell’esone 2, questo potrebbe manifestare un codone di STOP prematuro e troncare la proteina anziché allungarla. In aggiunta, se la lunghezza dell’esone 2 è tale per cui viene cambiata anche il frame di lettura degli esoni a valle dell’inserzione, aumenta la probabilità di trovare un codone di STOP prematuro. Questo spiega perché esoni fiancheggiati da introni di fase identica, sono più probabilmente dovuti all’exon shuffling.

Page 20: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Un’altra prova a sostegno dell’exon shufflingIn un lavoro che ha utilizzato tecniche bioinformatiche, sono stati raccolti molti geni antichi, definendo come antichi quelli condivisi tra più specie. Viene osservata la fase di tutti gli introni ottenendo che la percentuale di introni in fase 0 era il 48%, quelli in fase 1 del 30% e quelli in fase 2 del 22%.Applicando la formula dell’abbondanza relativa alle associazioni tra due fasi introniche, si riesce ad evidenziare se certe associazioni di fasi introniche sono favorite o sfavorite.Precisamente definiamo ad esempio R(12) come l’abbondanza relativa di introni fiancheggianti lo stesso esone, rispettivamente in fase 1 e 2

)2(*)1(

)12()12(

FF

FR

dove F(1) è la frequenza osservata di tutti gli introni in fase 1 nel campione di geni analizzati, F(12) è la frequenza osservata della coppia di introni (fiancheggianti lo stesso esone) in fase 1 e 2.Questa formula presenta a numeratore la frequenza osservata e a denominatore quella attesa. Ci aspettiamo valori di R tanto più diversi da 1 quanto più esistono associazioni non casuali tra due introni vicini. Applicando questa formula a tutte le 6 possibili combinazioni di fase intronica gli autori osservano una prevalenza di coppie di introni di fase identica rispetto a quella aspettata.Inoltre si osserva che l’associazione in cui entrambi gli introni si trovano in fase 1 è quella favorita su tutte.Tale studio rafforzerebbe la validità dell’exon shuffling, affermando che le coppie di introni con la stessa fase sarebbero i residui dell’exon shuffling mentre le altre sarebbero derivate da eventi di inserzione intronica.(Long M, Rosenberg C, Gilbert W. Intron phase correlations and the evolution of the intron/exon structure of genes Proc Natl Acad Sci U S A. 1995 Dec 19;92(26))

Page 21: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Proviamo a mettere in discussione quello appena detto

Una spiegazione alternativa a queste osservazioni è che i siti di proto-splice, cioè quei siti nei quali gli introni si possono inserire, si trovino già essi stessi distribuiti nelle tre fasi con diversa probabilità. Quindi se gli introni avessero una distribuzione casuale tra i siti di proto-splice, la loro distribuzione seguirebbe quella dei siti di proto-splice. Definendo la tripletta AG|G come sito di proto splice, è stata indagata la distribuzione degli introni su tutti i possibili siti AG|G. Si è osservato che gli introni non sono equamente distribuiti tra i siti di proto-splice, rendendo così ancora valida l’ipotesi dell’exon shuffling.

(N.J. Dibb and A.J. Newman , Evidence that introns arose at proto-splice sites. EMBO J 8 (1989))(N.J. Dibb , Proto-splice site model of intron origin. J Theor Biol 151 (1991))(J.M. Logsdon, Jr , The recent origins of spliceosomal introns revisited. Curr Opin Genet Dev 8 (1998))(J.M. Logsdon, Jr, A. Stoltzfus and W.F. Doolittle , Molecular evolution: recent cases of spliceosomal intron gain?. Curr Biol 8 (1998))(M. Long, S.J. de Souza, C. Rosenberg and W. Gilbert , Relationship between ‘proto-splice sites’ and intron phases: evidence from dicodon analysis. Proc Natl Acad Sci USA 95 (1998))(M. Long and C. Rosenberg , Testing the ‘proto-splice sites’ model of intron origin: evidence from analysis of intron phase correlations. Mol Biol Evol 17 (2000))

Page 22: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Pseudo geni come punti di partenza per esplorare nuove proteine

Il modello classico per spiegare l’origine di nuove strutture proteiche prevede che da un gene si possano originare delle copie così mentre una copia mantiene la funzione originale, l’altra è libera di accumulare mutazioni e poter evolvere. Naturalmente la copia di un gene potrebbe subire vari destini: perdere funzionalità e diventare uno pseudo-gene, rimanere immutata e quindi costituire la ridondanza del gene originale oppure evolvere verso nuove e più complesse funzioni. Gli pseudo-geni si dividono in processati e non processati. Quelli processati si trovano su diversi cromosomi rispetto alla copia originale, non hanno introni, terminano spesso con delle adenine, sono fiancheggiati da ripetizioni e si trovano solo nei mammiferi. Quelli non processati, si trovano sullo stesso cromosoma del gene originale, hanno introni, hanno delle mutazioni che fanno comparire dei codoni di STOP prematuri o eliminare codone di inizio della traduzione originale, possono produrre un mRNA tronco o intero e si possono trovare in varie specie.Un esempio di nuovi geni funzionali evoluti da un gene originale è quello dell’emoglobina umana, infatti ne esistono varie copie ma espresse in diversi stadi dello sviluppo.

(L. J. Gibson PSEUDOGENES AND ORIGINS Origins 21(2):91-108 (1994)

Page 23: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Fattore di trascrizione dell’RNA polimerasi II, gene originale che si trova nel cromosoma X.

P.J. Wang, D.C. Page, Functional substitution for TAFII250 by a retroposed homolog that is expressed in human spermatogenesis. Human Molecular Genetics, 2002, Vol.11, No.19, 2341-2346

Questo gene viene detto ‘TAF I like’ e può sostituire TAF I durante la meiosi maschile quando i cromosomi sessuali sono trascrizionalmete silenti. Si trova nel cromosoma 9.

Page 24: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Critiche all’exon shufflingAltrettanti geni antichi come quelli dell’alcool deidrogenasi, globine, piruvato chinasi non mostrano una coincideza tra gli esoni e i moduli della struttura delle proteine.(Stoltzfus A, Spencer DF, Zuker M, Logsdon JM Jr, Doolittle WF - Testing the exon theory of genes: the evidence from protein structure Science. 1994 Jul 8;265(5169))

fugu ATGTGTGACGACGACGAGACCACTGCCCTTGTGTGTGATAATGGCTCTGGCCTGGTCAAGcanis ATGGATGACGA------TATCGCTGCGCTTGTGGTCGACAACGGCTCCGGCATGTGCAAGrat ATGTGTGACGAGGACGAGACCACCGCTCTTGTGTGTGACAACGGCTCTGGCCTGGTGAAAhuman ATGTGTGAAGAAGAGGACAGCACTGCCTTGGTGTGTGACAATGGCTCTGGGCTCTGTAAGmouse ATGTGTGAAGAGGAAGACAGCACAGCCCTGGTGTGCGACAATGGCTCTGGGCTCTGTAAGgallus ATGTGTGAGGAGGAGGACAGCACTGCCCTTGTTTGTGACAATGGCTCAGGGCTCTGTAAAXenopus ATGTGTGACGATGAAGAGACTACCGCACTTGTGTGTGACAATGGCTCCGGACTTGTAAAAdanio ATGTGTGACGACGACGAGACTACCGCCCTTGTGTGCGACAACGGTTCCGGCCTGGTGAAGanopheles ATGTG---CGACGAAGAGGTTGCTGCGCTGGTTGTCGACAACGGATCCGGTATGTGCAAGdrosophila ATGTGT---GACGAAGAAGTTGCTGCTCTGGTTGTCGACAACGGCTCTGGCATGTGCAAGscerevisiae ATGTGT---GACGACGATGTTGCCGCTCTCGTAGTTGACAATGGATCCGGAATGTGCAAAcelegans ATGTGT---GACGACGATGTTGCCGCTCTCGTAGTTGACAATGGATCCGGAATGTGCAAA

fugu GCTGGCTTTGCAGGCGATGATGCCCCCAGGGCTGTGTTCCCCTCCATTGTGGGACGCCCCcanis GCCGGCTTCGCAGGCGACGACGCCCCCCGGGCCGTCTTCCCCTCCATCGTGGGGCGCCCCrat GCTGGCTTTGCCGGGGATGATGCCCCCAGGGCTGTGTTCCCATCCATCGTGGGTCGGCCChuman GCCGGCTTTGCTGGGGACGATGCTCCCAGGGCTGTTTTCCCATCCATTGTGGGACGTCCCmouse GCCGGCTTCGCTGGTGATGATGCTCCCAGGGCTGTTTTCCCATCCATCGTGGGACGTCCCgallus GCTGGCTTCGCCGGGGATGATGCTCCAAGAGCAGTTTTCCCTTCCATCGTGGGTCGTCCCXenopus GCTGGGTTCGCTGGAGATGATGCTCCAAGAGCAGTGTTTCCATCTATTGTTGGACGCCCCdanio GCTGGCTTTGCTGGTGATGACGCCCCCAGAGCCGTCTTCCCCTCCATCGTTGGTCGCCCCanopheles GCCGGCTTTGCTGGGGATGACGCACCACGTGCCGTCTTCCCGTCCATCGTTGGACGCCCCdrosophila GCCGGATTTGCCGGAGACGATGCTCCCCGCGCCGTCTTCCCATCGATTGTGGGACGTCCCscerevisiae GCTGGATTCGCTGGAGACGACGCTCCACGCGCCGTGTTCCCATCCATTGTCGGAAGACCTcelegans GCTGGATTCGCTGGAGACGACGCTCCACGCGCCGTGTTCCCATCCATTGTCGGAAGACCT

Page 25: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

fugu CGTCACCAG-X-GGTGTAATGGTCGGCATGGGCCAGAAAGATTCCTATGTGGGCGACGAGcanis CGGCACCAG-X-GGCGTGATGGTGGGCATGGGCCAGAAGGACTCCTACGTGGGCGATGAGrat CGTCACCAG-X-GGTGTCATGGTCGGTATGGGTCAGAAGGATTCCTACGTGGGCGACGAGhuman AGACATCAG-X-GGGGTGATGGTGGGAATGGGACAAAAAGACAGCTACGTGGGTGACGAAmouse AGACATCAG-X-GGAGTAATGGTTGGAATGGGCCAAAAAGACAGCTATGTGGGGGATGAAgallus AGGCACCAG-X-GGTGTGATGGTTGGTATGGGTCAAAAAGACAGCTATGTAGGTGATGAGXenopus CGCCACCAG-X-GGTGTCATGGTTGGTATGGGTCAAAAGGACTCCTATGTAGGTGATGAAdanio CGTCACCAG---GGTGTCATGGTGGGTATGGGTCAGAAGGACTCATACGTAGGAGATGAAanopheles CGCCACCAG---GGTGTGATGGTCGGCATGGGCCAGAAGGACTCGTACGTCGGCGACGAGdrosophila CGTCACCAG---GGTGTGATGGTCGGCATGGGCCAGAAGGACTCGTACGTGGGTGATGAGscerevisiae CGTCATCAA---GGAGTCATGGTCGGTATGGGACAGAAAGACTCGTACGTCGGAGACGAGcelegans CGTCATCAA---GGAGTCATGGTCGGTATGGGACAGAAAGACTCGTACGTCGGAGACGAG

fugu GCCCAGAGCAAAAGGG---GTATCCTGACCCTGAAATACCCCATTGAGCATGGCATCATCcanis GCCCAGAGCAAGAGGG---GCATCCTGACCCTGAAGTACCCCATTGAGCACGGCATCGTCrat GCCCAGAGCAAGCGAG---GTATCCTGACCCTGAAGTACCCCATTGAACACGGCATTATChuman GCACAGAGCAAAAGAG---GAATCCTGACCCTGAAGTACCCGATAGAACATGGCATCATCmouse GCCCAGAGCAAGAGAG---GGATCCTGACGCTGAAGTATCCGATAGAACACGGCATCATCgallus GCTCAAAGCAAGAGAG---GAATCCTGACCTTGAAATACCCCATAGAACATGGCATCATTXenopus GCACAGAGCAAGAGAG---GTATTCTTACACTAAAGTATCCAATTGAACATGGTATTATCdanio GCTCAGAGCAAGAGGG---GTATCCTCACTCTGAAATATCCCATCGAGCACGGCATCATTanopheles GCCCAGAGCAAACGTG---GTATCCTCACGCTGAAATACCCGATCGAGCACGGTATCGTCdrosophila GCGCAGAGCAAGCGTG---GTATCCTCACCCTGAAGTACCCCATTGAGCACGGTATCGTGscerevisiae GCCCAATCCAAGAGAG---GTATCCTTACCCTTAAGTACCCAATTGAGCATGGTATCGTTcelegans GCCCAATCCAAGAGAG-X-GTATCCTTACCCTTAAGTACCCAATTGAGCATGGTATCGTT

Page 26: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

fugu ACCAACTGGGATGACATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTACGTcanis ACCAACTGGGACGACATGGAGAAG---ATCTGGCACCACACCTTCTACAACGAGCTGCGCrat ACCAACTGGGACGACATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTGCGThuman ACCAACTGGGACGACATGGAAAAG-X-ATCTGGCACCACTCTTTCTACAATGAGCTTCGTmouse ACCAACTGGGACGACATGGAAAAG-X-ATCTGGCACCACTCTTTCTATAACGAGCTTCGTgallus ACCAACTGGGATGACATGGAGAAG-X-ATCTGGCATCACTCCTTCTATAATGAGCTCCGTXenopus ACTAACTGGGATGATATGGAGAAG---ATTTGGCATCACACCTTCTACAATGAACTGCGTdanio ACCAACTGGGACGACATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTCCGTanopheles ACAAACTGGGACGACATGGAGAAA---ATCTGGCACCACACGTTCTACAACGAGCTGCGAdrosophila ACCAACTGGGACGATATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTGCGTscerevisiae ACCAACTGGGACGACATGGAAAAA---ATCTGGCATCACACTTTCTACAACGAGCTTCGCcelegans ACCAACTGGGACGACATGGAAAAA---ATCTGGCATCACACTTTCTACAACGAGCTTCGC

fugu GTGGCCCCTGAGGAACACCCCACCCTGCTGACGGAGGCCCCACTCAACCCCAAAGCCAACcanis GTGGCCCCCGAGGAGCACCCGGTGCTGCTGACCGAGGCCCCCCTGAACCCCAAGGCCAACrat GTGGCCCCCGAGGAGCACCCGACCCTGCTCACTGAGGCCCCTTTGAACCCCAAAGCTAAChuman GTTGCCCCTGAAGAGCATCCCACCCTGCTCACGGAGGCACCCCTGAACCCCAAGGCCAACmouse GTGGCCCCTGAAGAGCATCCGACACTGCTGACAGAGGCACCACTGAACCCTAAGGCCAACgallus GTTGCACCTGAGGAGCACCCAACTCTGCTGACTGAAGCACCACTGAATCCCAAAGCCAATXenopus GTAGCCCCTGAAGAGCATCCCACCCTGCTTACTGAGGCTCCACTGAACCCTAAAGCTAACdanio GTTGCCCCTGAAGAGCACCCAACTCTGCTGACTGAGGCCCCTCTGAACCCCAAGGCTAACanopheles GTCGCGCCAGAAGAGCACCCGGTCCTGCTGACGGAGGCCCCGCTCAACCCGAAGGCTAACdrosophila GTGGCACCCGAGGAGCACCCCGTGCTGCTGACCGAGGCCCCGCTGAACCCCAAGGCCAACscerevisiae GTTGCCCCAGAAGAGCACCCAGTACTTCTCACTGAAGCCCCACTCAATCCAAAGGCTAACcelegans GTTGCCCCAGAAGAGCACCCAGTACTTCTCACTGAAGCCCCACTCAATCCAAAGGCTAAC

Page 27: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

fugu AGGGAGAAGATGACCCAG---ATAATGTTTGAGACCTTCAATGTACCCGCCATGTATGTGcanis CGTGAGAAGATGACCCAG-X-ATCATGTTCGAGACTTTCAACACCCCAGCCATGTACGTGrat CGGGAGAAGATGACTCAA---ATCATGTTTGAGACCTTCAACGTGCCTGCTATGTATGTGhuman CGGGAGAAAATGACTCAA-X-ATTATGTTTGAGACTTTCAATGTCCCAGCCATGTATGTGmouse CGGGAGAAAATGACCCAG-X-ATTATGTTTGAGACCTTCAATGTCCCCGCCATGTATGTGgallus CGAGAGAAAATGACCCAG-X-ATTATGTTTGAGACTTTCAATGTGCCAGCCATGTATGTAXenopus CGTGAAAAGATGACTCAA---ATAATGTTTGAGACTTTCAACGTCCCAGCTATGTATGTTdanio CGTGAGAAGATGACCCAG---ATCATGTTTGAGACCTTCAACGTCCCAGCCATGTATGTGanopheles CGCGAGAAGATGACACAG---ATCATGTTCGAGACGTTCAACACACCGGCAATGTACGTCdrosophila CGTGAGAAGATGACCCAG---ATCATGTTCGAGACCTTCAACACACCCGCCATGTATGTGscerevisiae CGTGAAAAGATGACCCAA---ATCATGTTCGAGACCTTCAATACCCCAGCCATGTATGTCcelegans CGTGAAAAGATGACCCAA---ATCATGTTCGAGACCTTCAATACCCCAGCCATGTATGTC

fugu GCCATTCAGGCCGTACTGTCCCTCTATGCCTCTGGTCGTACCACTG-X-GTATTGTGTTGcanis GCCATCCAGGCTGTGCTGTCCCTGTACGCCTCTGGCCGCACCACTG---GCATCGTGATGrat GCTATTCAGGCGGTGCTGTCTCTCTATGCCTCCGGCCGTACCACCG-X-GCATCGTGTTGhuman GCTATCCAGGCGGTGCTGTCTCTCTATGCCTCTGGACGCACAACTG-X-GCATCGTGCTGmouse GCTATTCAGGCTGTGCTGTCCCTCTATGCCTCTGGACGTACAACTG-X-GTATTGTGCTGgallus GCTATTCAAGCTGTTCTGTCCCTGTATGCTTCTGGGCGTACTACAG-X-GGATTGTGCTTXenopus GCAATCCAGGCAGTGCTTTCTCTATACGCCTCTGGCCGTACAACTG-X-GGATTGTGCTCdanio GCCATTCAGGCTGTGCTGTCCCTCTACGCTTCTGGCCGTACCACTG---GTATCGTGCTGanopheles GCCATCCAGGCCGTGCTGTCGCTGTACGCCTCCGGTCGCACCACCG---GTATCGTGCTGdrosophila GCCATCCAGGCTGTGCTCTCGCTGTACGCCTCCGGTCGTACCACCG---GTATCGTTCTGscerevisiae GCCATCCAAGCTGTCCTCTCCCTCTACGCTTCCGGACGTACCACCG---GAATCGTCCTCcelegans GCCATCCAAGCTGTCCTCTCCCTCTACGCTTCCGGACGTACCACCG---GAATCGTCCTC

Page 28: Teorie sullorigine degli introni e dei geni Francesco Piva Istituto di Biologia e Genetica.

Pan troglodytes

average nucleotide divergence of just 1.2%