Evoluzione Molecolare

Post on 12-Jan-2016

47 views 0 download

description

Evoluzione Molecolare. Studia le velocità e il tipo di sostituzioni che avvengono nel materiale genetico e nei suoi prodotti. EVOLUZIONE MOLECOLARE. DIMENSIONE TEMPO. pura descrizione. meccanismi evolutivi. DINAMICA. CINEMATICA. OBIETTIVI. individuazione delle costrizioni funzionali - PowerPoint PPT Presentation

Transcript of Evoluzione Molecolare

Studia le velocità e il tipo di sostituzioni che

avvengono nel materiale genetico e nei suoi prodotti.

Evoluzione Molecolare

DIMENSIONE

TEMPO

CINEMATICA DINAMICA

OBIETTIVI

individuazione delle costrizioni funzionali

comprensione dei processi evolutivi

studi filogenetici, relazioni tassonomiche

pura descrizione meccanismi evolutivi

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

Geni

Genomi

Organismi

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

Livelli di analisi

inter taxa

inter phyla

inter specie

intra specie

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

Scelta delle sequenze

geni ortologhi

geni paraloghi

altre regioni (non codificanti, regolatorie)

genomi completi

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

speciazione

duplicazione genica

specie 1

specie 2

gene β 1

gene α 1 gene α 2 gene β 2

speciazione

ort

olo

gia

e p

ara

log

ia

Evoluzione della famiglia genica della beta-globina umana

Evoluzione della famiglia genica della beta-globina umana

5’ 3’

1 2

Embrionale Fetale Pseudogene Adulta

0

100

200Myaduplicazione genica

MutazioniMutazioni

sostituzioni nucleotidiche

delezioni

inserzioni

inversioni

A

G

C

T

- transizioni

- transversioni

Zuckerkandl and Pauling (1962)

IPOTESI DELL’ OROLOGIO MOLECOLAREIPOTESI DELL’ OROLOGIO MOLECOLARE

tempo

sostituzioni/sito

OROLOGIO MOLECOLAREOROLOGIO MOLECOLARE

Alcuni geni (o gruppi di geni) possono evolvere sotto distinte pressioni evolutive dettate da costrizioni funzionali peculiari di un particolare lineage

Geni provenienti da compartimenti distinti (es. mitocondrio, nucleo) possono evolvere secondo differenti pressioni evolutive

I geni possono mostrare un “bias” composizionale in alcuni lineage

A C T G A A C G T A A C G C

A C T G A A C G T A A C G C

A C T G A A C G T A A C G C

T AT

G G

T A

Confronto delle sequenze attuali

sostituzione singolasostituzione multipla

sostituzione convergente

sostituzioni coincidenti

A a T G g A C G T A a C G C

t C T G g A C G T A A C G C

Sequenza ancestraleSequenza ancestrale

tempo

Sequenze discendenti

Tipi di sostituzioni nucleotidicheTipi di sostituzioni nucleotidiche

sostituzione singola1 cambio, 1 differenza

A C

A C

A

T A

A CA

C TG C

A C

A

A G

C C

A C

A

A C

T T

A T

A

C TA C

A A

A CA

C A

sostituzione multipla2 cambi, 1 differenza

sostituzione coincidente2 cambi, 1 differenza

sostituzione parallela2 cambi, 0 differenze

sostituzione convergente3 cambi, 0 differenze

retro-sostituzione2 cambi, 0 differenze

Modelli

deterministici: basati sulla osservazione dei

caratteri

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

stocastici (probabilistici

dipendenti dal tempo): basati sulla misura

delle diversità

p53a.msf MSF: 422 Type: P September 20, 1995 11:41 Check: 5970 ..

Name: mouse Len: 422 Check: 3385 Weight: 1.00 Name: rat Len: 422 Check: 877 Weight: 1.00 Name: hamster Len: 422 Check: 2423 Weight: 1.00 Name: g_monkey Len: 422 Check: 6876 Weight: 1.00 Name: r_monkey Len: 422 Check: 7388 Weight: 1.00 Name: human Len: 422 Check: 6515 Weight: 1.00 Name: cow Len: 422 Check: 4340 Weight: 1.00 Name: sheep Len: 422 Check: 9625 Weight: 1.00 Name: cat Len: 422 Check: 496 Weight: 1.00 Name: chicken Len: 422 Check: 6526 Weight: 1.00 Name: xenopus Len: 422 Check: 9659 Weight: 1.00 Name: trout Len: 422 Check: 7860 Weight: 1.00

351 400 mouse GEYFTLKIRG RKRFEMFREL NEALELKDA. HATEESGDSR AHSSYLKTKK rat GEYFTLKIRG RERFEMFREL NEALELKDA. RAAEESGDSR AHSSYPKTKK hamster GEYFTLKIRG QERFKMFQEL NEALELKDA. QALKASEDSG AHSSYLKSKKg_monkey GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPAGSR AHSSHLKSKKr_monkey GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPAGSR AHSSHLKSKK human GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPGGSR AHSSHLKSKK cow GEYFTLQIRG FKRYEMFREL NDALELKDA. LDGREPGESR AHSSHLKSKK sheep GEYFTLQIRG RKRFEMFREL NEALELMDA. QAGREPGESR AHSSHLKSKK cat GEYFTLQIRG RERFEMFREL NEALELKDA. QSGKEPGGSR AHSSHLKAKK chicken NEIFYLQVRG RRRYEMLKEI NEALQL.... ....AEGGSA PRPSKGRRVK xenopus EEIFTLRIKG RSRYEMIKKL NDALELQESL DQQKVTIKCR KCRDEIKPKK trout DEIYTLQIRG KEKYEMLKKF NDSLELSELV PVADADKYRQ KCLTKRVAKR

1 50 mouse MTAMEESQSD ISLELPLSQ. ETFSGLWKLL PPEDILP... ..SPHCMDDL rat ...MEDSQSD MSIELPLSQ. ETFSCLWKLL PPDDILPTTA TGSPNSMEDL hamster ...MEEPQSD LSIELPLSQ. ETFSDLWKLL PPNNVLSTLP ..SSDSIEELg_monkey ...MEEPQSD PSIEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAVDDLr_monkey ...MEEPQSD PSIEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAVDDL human ...MEEPQSD PSVEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAMDDL cow ...MEESQAE LNVEPPLSQ. ETFSDLWNLL PENNLLSSEL ...SAPVDDL sheep ...MEESQAE LGVEPPLSQ. ETFSDLWNLL PENNLLSSEL ...SAPVDDL cat ...MQEPPLE LTIEPPLSQ. ETFSELWNLL PENNVLSSEL ...SSAMNE. chicken ...MAEE... ..MEPLLEPT EVFMDLWSML PY........ .....SMQQ. xenopus ...M.EPSSE TGMDPPLSQ. ETFEDLWSLL PD..PLQTVT ....CRLDNL trout ...MAD.LAE .NVSLPLSQ. ESFEDLWKM. ..NLNLVAVQ .......PPE

////////////////////////////////////////////////////////////////

401 422 mouse ..GQSTSRHK KTMVKKVGPD SD rat ..GQSTSRHK KPMIKKVGPD SD hamster ..GQSASRLK KLMIKREGPD SDg_monkey ..GQSTSRHK KFMFKTEGPD SDr_monkey ..GQSTSRHK KFMFKTEGPD SD human ..GQSTSRHK KLMFKTEGPD SD cow ..RPSPSCHK KPMLKREGPD SD sheep ..GPSPSCHK KPMLKREGPD SD cat ..GQSTSRHK KPMLKREGLD SD chicken VEgPQPSCGK KLLQK....G SD xenopus ........GK KLLVKDEQPD SE trout DFGVGPKKRK KLLVKEEKSD SD

Modelli StocasticiModelli Stocastici

Markov

Jukes Cantor

Kimura

ˆ d 3

4 ln 1 43 p

Jukes Cantor t t + 1

qt1-

1-

B

C

1-qt 1-

1-

t t + 1

B

C

tt qq 211

2

tt qq 13/2113/2

Kimura

d ̂ QQP 2121ln21

dove P e Q rappresentano rispettivamente la frequenza osservata delle transizioni e delle transversioni

Proprietà

Nessuna assunzione “a priori” sulla matrice delle distanze ma semplice verifica della condizione di stazionarietà

Misura accurata delle fluttuazioni statistiche(Simulazione con il metodo del Bootstrap)(Simulazione con il metodo del Bootstrap)

C. Saccone, C. Lanave, G. Pesole and G. PreparataMethods in Enzymology (1990). Vol. 183, pp. 570 - 583

Modello Stazionario di Markov

=

i,j = A, C, G, T

Modello Stazionario di Markov

test

di

sta

zion

ari

età

CCAA

GG TT

Algoritmo Modello stocastico basato su una Modello stocastico basato su una catena di Markov che attraverso catena di Markov che attraverso l’equazione differenziale di l’equazione differenziale di Kolmogorov:Kolmogorov:

ddT

Pik(T) = 44

r = iPir (T)Rrk

calcola la matrice delle velocità 4x4 calcola la matrice delle velocità 4x4 R, indipendente dal tempo, che R, indipendente dal tempo, che descrive il processo di sostituzione descrive il processo di sostituzione nucleotidicanucleotidica

C. Saccone, C. Lanave, G. Pesole and G. PreparataMethods in Enzymology (1990). Vol. 183, pp. 570 - 583

Modello Stazionario di Markov

Alberi filogeneticiAlberi filogenetici

Albero <==> GrafoTopologia: nodi + ramiUn albero descrive le relazioni fra

ancestore e discendentiI nodi sono le unità tassonomicheNodo ancestrale e Nodi Intermedi (UT

o TU)Nodi Terminali (UTO o OTU): specie,

geni, popolazioni o individui

Alberi con radice o rooted

’ ancestore ==> percorso univoco

da ancestore a OTU

Alberi senza radice o unrooted

La radice è localizzata all’ interno di

un ramo che congiunge le specie in

esame con l’outgroup

Alberi filogeneticiAlberi filogenetici

UOMO MUCCA TOPO

Esempio di albero Rooted (con radice)Esempio di albero Rooted (con radice)

Alberi con radice o rooted:

Alberi quantitativi

La lunghezza dei rami è

direttamente proporzionale

ai tempi di divergenza fra le

UT

» Orologio Molecolare

Alberi filogeneticiAlberi filogenetici

A

B

C

D

E1

2

3

Esempio di albero Unrooted (senza radice)Esempio di albero Unrooted (senza radice)

1-3: Nodi dell’alberoA-E: OTU

Alberi senza radice o

unrooted: Alberi qualitativi

Descrivono

semplicemente le relazioni

evolutive fra le UT

Alberi filogeneticiAlberi filogenetici

Alberi basati sullo stato dei caratteri

- Massima Parsimonia

Alberi basati sulla misura delle distanze

- UPGMA

- Massima Verosimiglianza

- Neighbor - Joining

Alberi filogeneticiAlberi filogenetici

Metodi basati sulla Misura delle distanze

- UPGMA (albero con radice applicabile solo se rispettato l’orologio molecolare)

» Lunghezza dei rami proporzionale ai tempi di divergenza

- Neighbor Joining (albero senza radice quando non è rispettato l’orologio molecolare)

» Differente velocità nei diversi rami

Alberi filogeneticiAlberi filogenetici

T2

T1

A B C

T1=KAC + KBC

4r

T2=KAB

2r

Tempo di divergenza fra due specie = tempo impiegato nel processo di speciazione, ovvero tempo dell’isolamento riproduttivo

Metodi DeterministiciMetodi Deterministici Massima Parsimonia

Sito

Sequenza1234

Sito 2

Sito 3

Sito 5

Sito7

Sito 9

Alberi fenetici (fenogrammi): descrivono le relazioni fra le specie sulla base delle diversità o somiglianze morfologiche, molecolari e anatomiche

Alberi cladistici (cladogrammi): descrivono le relazioni di discendenza tra un gruppo di specie

Se l’orologio molecolare è rispettatoAlberi cladistici<==> Alberi fenetici

Alberi filogeneticiAlberi filogenetici

Alberi con radice o rooted

NR= (2n-3)!/2 (n-2) (n-2)!

Alberi senza radice o unrooted

NV= (2n-5)!/2 (n-3) (n-3)!

Alberi filogeneticiAlberi filogenetici

I dati per la costruzione degli alberi filogenetici: un solo gene puo essere sufficiente?

Quasi maiQuasi mai

Soluzione: – Analizzare piu’ di un gene

– Effettuare una stima della significatività statistica degli alberi ottenuti

Alberi filogeneticiAlberi filogenetici

Perche’ ?

– Per ricostruire la storia evolutiva delle specie o delle popolazioni in esame

– Tempo di divergenza fra 2 specie = tempo impiegato nel processo di speciazione ovvero dell’isolamento riproduttivo

Alberi filogeneticiAlberi filogenetici

I dati per la costruzione degli alberi filogenetici: un solo gene può essere sufficiente?

Quasi maiQuasi mai

Perche’? – Paralogia e ortologia dei geni– Evoluzione concertata (famiglie geniche) – Pressione mutazionale direzionata – Trasferimento orizzontale di un gene (dai batteri alle piante)– Polimorfismo – Fluttuazioni statistiche

Alberi filogeneticiAlberi filogenetici

Congruenza

metodologie

tipologie di dati

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

Congruenzametodologica

approcci molecolari

approcci molecolari/non molecolari

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

molecolari

nucleari

mitocondriali

morfologici

resti fossili

Congruenzasul tipo di dati

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

Genomi completi

Regioni regolatorie/codificanti

Congruenza

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

Limiti

sequenziamento

analisi

EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE

Assenza (o scarsa presenza) di sequenze relative a specie rilevanti per gli studi filogenetici

Studi incentrati su specie ampiamente studiate

Sequenziamento: limitiSequenziamento: limiti

Analisi: limiti Analisi: limiti

Omoplasia: “rumori di fondo” causati da sostituzioni multiple, processi di sostituzione condizionati (perdita della condizione di stazionarietà), processi selettivi, ecc.

Geni diversi possono seguire differenti storie evolutive nello stesso gruppo di specie

Mancanza di riconoscimento di geni paraloghi nel campione in esame

“A gene tree can be accepted or rejected only in its entirety as an estimate of the species tree, and it is not legitimate to dissect out pieces or a cladogram as support for a favored hypothesis while rejecting the phylogenetic implication of the rest of the tree.”Ruvolo and Koh, Mol. Phyl. Evol 5: 439-440 (1996)

bootstrap bootstrap

+---------HUMAN +100.0 ! ! +----RHESUS ! +100.0 +-91.0 +----G MONKEY ! ! ! ! +----COW ! ! +100.0 ! +-40.0 +----SHEEP +100.0 ! ! ! +---------CAT ! ! ! ! +----MOUSE +-43.0 ! +100.0 ! ! +------69.0 +----RAT ! ! ! +-66.0 ! +---------HAMSTER ! ! ! ! ! +------------------------CHICKEN ! ! ! +-----------------------------XENOPUS ! +----------------------------------TROUT