I MARCATORI UNIPARENTALI: PERCHÉ E COME USARLI
-
Upload
kaden-beach -
Category
Documents
-
view
51 -
download
0
description
Transcript of I MARCATORI UNIPARENTALI: PERCHÉ E COME USARLI
I MARCATORI UNIPARENTALI:
PERCHÉ E COME USARLI
ricostruire l’evoluzione umana
individuare popolamenti ed eventi migratori antichi o recenti a livello globale, continentale, inter- ed intraregionale
stimare il mescolamento tra due e più popolazioni
I MARCATORI MOLECOLARI CONSENTONO DI:
MARCATORI DI LINEAMARCATORI DI LINEA
LOCI NON-RICOMBINANTI:1. mtDNA - linea materna2. Crom. Y - linea paterna
(aploidi)
AUTOSOMICIAUTOSOMICI
LOCI RICOMBINANTI(diploidi)
padre madre
Ancestor of Y chromosome
Ancestor of mtDNA
DNA MITOCONDRIALE
- Genoma aploide
- Molecola circolare di 16.5 kb con sequenza interamente nota
- Alta densità di geni
- Tasso di sostituzione nucleotidica circa 10 volte maggiore di quello nucleare
- Alta diversità nucleotidica all’interno della specie umana
- Trasmissione solo per via materna
CROMOSOMA Y - Genoma aploide
- Molecola lineare di circa 60 kb
- Bassa densità di geni
- Scarsa diversità nucleotidica all’interno della specie umana
- Costituito prevalentemente da sequenze altamente e moderatamente ripetute
- Trasmissione solo per via paterna
DNA MITOCONDRIALE
D-LOOP
OL
1100 bp
16569 bp
16024 16365 73 340
P
H
P
L
OH
Polimorfismi nei marcatori uniparentali
mtDNA
cromosoma Y
SNPs (Single Nucleotide Polymorphism)
sequenza HVR
RFLPs regione codificante
SNPs (Single Nucleotide Polymorphism)
STRs (Short Tandem Repeats)
Tipo di marcatore
Tipo di mutazione
ProprietàTasso di mutazio
ne
SNP TransizioniTrasversioni
Stato ancestrale definito da confronto
con outgroup
Eventi unici o <10-9
INDEL
Inserzione/Delezione di
elementi ripetitivi del genoma
Stato ancestrale
noto
Eventi unici
MICROSATELLITI SEMPLICI
(STR)
Inserzione/Delezione di moduli omogenei ripetuti in
tandem
RicorrentiComposti da blocchi di repeats di 2-5 bp
10-3
MINISATELLITI Inserzione/
Delezione di moduli ripetuti in tandem
RicorrentiComposti da blocchi di repeats
>10 bp
10-2
MARCATORI DEL DNA
evoluzione lenta
evoluzione rapida
SNP e STR hanno diversi pattern mutazionali
Marcatori ad evoluzione lenta: SNP e ins/del per i quali si può escludere una produzione ricorrente di alleli (omoplasia) modello di mutazione a siti infiniti
Marcatori ad evoluzione veloce: micro- e minisatelliti per i quali non si può escludere una produzione ricorrente di alleli modello di mutazione stepwise
- Definizioni “utili”
• aplotipo• aplogruppo• filogenia• filogeografia
Aplotipo:
combinazione di diversi stati allelici di un set di marcatori polimorfici che si trovano fisicamente associati sulla stessa molecola di DNA, per esempio un cromosoma o una regione cromosomica
Aplogruppo:
gruppo di aplotipi di cui si ipotizza un’origine comune, grazie alla condivisione di mutazioni caratteristiche (generalmente ad evoluzione lenta)
Aplotipo
Aplotipo DYS19 DYS389-1 DYS389-2 DYS390 DYS391
1 15 8 25 21 10
2 15 10 28 21 10
3 17 10 27 21 10
4 16 10 27 21 10
Aplotipo 1603
8
1612
6
1618
7
1618
9
1622
3
1626
4
1627
0
1627
8
1629
3
1630
0
1631
1
rif. A T C T C C C C A A T
1 G C T C T T T T G T C
2 C T C T T T T G C
3 C T C T T T T C
4 C T C T T T T C
Siti polimorfici
Loci STR
Aplotipo mtDNAla somma dei siti delle variazioni della sequenza nucleotidica
Aplotipo cromosoma Yla somma della variabilità di polimorfismi microsatelliti di lunghezza (Short Tandem Repeats)
Aplogruppo
Aplotipo 1603
8
1612
6
1618
7
1618
9
1622
3
1626
4
1627
0
1627
8
1629
3
1630
0
1631
1
rif. A T C T C C C C A A T Aplog.
1 G C T C T T T T G T C L1b1
2 C T C T T T T G C L1b1
3 C T C T T T T C L1b
4 C T C T T T T C L1b
Aplogruppo mtDNASi definisce sulla base della condivisione di mutazioni specifiche in posizioni con un basso tasso di mutazione (stabili)
Aplotipi non identici possono appartenere allo stesso aplogruppo
Aplogruppo YSi definisce sulla base della condivisione di mutazioni specifiche per marcatori biallelici (SNPs), e non per i microsatelliti (tasso di mutazione troppo alto)
L1b
haplotypes
haplogroups
sub-haplogroups
♀
♂♀
♀♀
♂♂
♂♀
♀♀
♀
♀♀
♀
♀
♂♂
♂
♂
♂
♀♀
♀
♂ ♀♀ ♂
♀♀♀
♂
♀♀♂
♂ ♂
♀♀
♀♀
♀
♀♂
♂
♂
♀
♂♀ ♀
♀♀
♂
♀
♀
♀
♀♀
♀
♀
♂
♂
♂
♂
♂
♂ ♀
♀♀♀
♀
♀
♂
♂
♀
♀♀♂
♀
♀♀
♂ ♀♀♂
♀♀♂
♂ ♂
♂
♂
♀
♂♀
♀♀
♂♂
♂
♀
♀
♀♀
♂
♀
♀
♀
♀♀
♀
♀
♂
♂
♂
♂
♂ ♀
♀♀♀
♀
♀♂
♂
♂
♀♀♂
♀
♀♀♂
♀♀♂
♂ ♂
♀
♂♀
♀♀
♂♂
♂
♀
♀
♀♀
♂
♀
♀
♀
♀♀
♀
♀
♂
♂
♂
♂
♂ ♀
♀♀♀
♀
♀♂
♂
♂
♀♀♂
♀
♀♀♂
♀♀♂
♂ ♂
DNA MITOCONDRIALE
D-LOOP
OL
1100 bp
16569 bp
16024 16365 73 340
P
H
P
L
OH
DOPPIA ELICA CIRCOLARE CONTENENTE 16569 COPPIE DI BASIDOPPIA ELICA CIRCOLARE CONTENENTE 16569 COPPIE DI BASI-due filamenti che lo costituiscono sono denominati H (heavy) e L (light) per la differente costituzione nucleotidica: H contiene in prevalenza basi puriniche A e G (di peso molecolare maggiore)L basi pirimidiniche C e T (di peso molecolare minore).
In base alle FUNZIONI SVOLTE, la molecola di mtDNA può essere divisa in due regioni principali: la regione codificante e quella di controllo.
LA REGIONE CODIFICANTELA REGIONE CODIFICANTE •CONTIENE 37 GENI•ENTRAMBI I FILAMENTI SONO CODIFICANTI
Non tutti gli enzimi che intervengono nelle funzioni metaboliche del mitocondrio sono sintetizzati al suo interno; la maggior parte viene codificata da geni nucleari, sintetizzata nel citoplasma cellulare e quindi trasportata nel mitocondrio. Il mitocondrio è quindi un organulo che dipende per la sua formazione e funzione da due distinti genomi.
LA REGIONE DI CONTROLLOLA REGIONE DI CONTROLLO 1100 bp1100 bp
•È LA PRINCIPALE REGIONE NON CODIFICANTE •TRE TRATTI DI SEQUENZA, ipervariabile 1 e 2 e 3 (HvrI e HvrII, HvrIII), di cui I e II caratterizzati da un elevato tasso di mutazione
•FUNZIONE REGOLATRICE La regione viene anche chiamata D-loop (displacement loop) per la presenza di un tratto di RNA quiescente che impedisce l’accoppiamento dei due filamenti complementari.
APLOGRUPPI- Vengono definiti in base alla presenza o all’assenza di siti di restrizione in determinate posizioni della porzione codificante del genoma mitocondriale
Ogni aplogruppo comprende più APLOTIPI definiti sulla base della presenza di posizioni mutanti nella regione d-loop; tali posizioni sono chiamate caratterizzanti quando rappresentano quelle tipiche dell’aplogruppo.
Eteroplasmia= aplotipi multipli nello stesso individuoOmoplasmia= un solo tipo di mtDNA nello stesso individuo
1981 Anderson e collaboratori presso il MRC Laboratory of Molecular Biology di Cambridge ottengono da un soggetto di nazionalità inglese la sequenza completa del DNA mitocondriale umano
sequenza di riferimento (CRS - Cambridge Reference
Sequence).
METODI di STUDIO
1. Regione codificante: analisi di RFLPs (high resolution restriction fragment length polymorphism) Identificazione di linee monofiletiche (APLOGRUPPI)
2. Regione d-loop: sequenziamento diretto. Solitamente limitato alla regione di controllo “ipervariabile”
ed in particolare al segmento I (HVS I)
Gli SNPs rappresentano la maggior parte delle mutazioni presenti nel mtDNA dove hanno un tasso 10 volte maggiore rispetto al DNA nucleare, per questo il mtDNA presenta maggiore variabilità fra le popolazioni umane. La sua porzione codificante ha tassi relativamente bassi, mentre la regione di controllo (HVSI e HVSII) li ha così alti da poter essere osservati nei pedigree (è infatti la regione più utilizzata per gli studi popolazionistici) perché i mitocondri sono ricchi di radicali liberi, il loro DNA passa molto tempo come singolo filamento e quindi più vulnerabile, non è protetto da istoni, i sistemi di riparazione sono meno efficienti che nel nucleo.Nonostante questo alto tasso ci sono sequenze che sembrano mutare più lentamente, ma potrebbe essere che il tasso di mutazione è così alto che le reversioni oscurano il reale numero di mutazioni avvenute, così che l’analisi filogenetica opera una sottostima.Il tasso di mutazione è espresso come base subsitution x sito x milione di anni (0.025-0.26) oppure 5 x 10-7 x base x generazione, con un tempo di generazione di 20 anni.Eteroplasmia = più di una variante di mtDNA presente in una singola cellula, in realtà è sempre così, ma è rilevabile solo quando un particolare tipo di mutanti raggiunge % superiori all’1%.Omoplasmia = tutte le molecole di mtDNA in una cellula sono identiche.
Omoplasia = mutazioni ricorrenti e ricombinazione possono avere effetti simili nel generare la variabilità a partire da patterns paralleli di evoluzione
L’unico cromosoma nucleare aploide
Molecola lineare di 60 Mb
Il 95% è costituito da una lunga regione non ricombinante NRPY con sequenze altamente ripetitive
All’estremità ci sono due piccole regioni pseudosomiali PAR1 e PAR2 in cui avviene la ricombinazione col cromosoma X durante la meiosi
L’assenza di ricombinazione lungo la NRPY fa si che l’unica fonte di cambiamento lungo le linee siano le mutazioni casuali che si accumulano sequenzialmente
Bassa densità di geni: geni con funzioni simili a quelle degli omologhi legati al cromosoma X e geni o famiglie di geni specifici del sesso maschile come il gene SRY “Sex Determining Region Y” che determina la comparsa dei caratteri maschili
CROMOSOMA Y
PRINCIPALI MARCATORI UTILIZZATI PRINCIPALI MARCATORI UTILIZZATI (NRY(NRY))
1. SNPs e INDELs: marcatori ad evoluzione “lenta” (eventi unici o tasso di mutazione < 10-9)
Il set di alleli per i diversi loci SNP lungo il cromosoma definisce un aplogruppo (alberi filogenetici)
2. Microsatelliti (STR) e Minisatelliti: marcatori ad evoluzione “rapida” (tasso di mutazione 10-2-10-3)
Il set di alleli per i diversi loci STR lungo il cromosoma definisce un aplotipo (networks)
NRY: Non ricombina e mantiene quindi inalterati gli effetti di eventi mutazionali avvenuti durante le meiosi maschili delle generazioni precedenti
Effective population size Ne (individui in età riproduttiva)
Più basso Ne del cromosoma Y rispetto agli autosomi porta ad una più rapida divergenza tra le popolazioni ; tale divergenza può coincidere con eventi di collo di bottiglia associati con l’origine delle popolazioni.
L’effetto della deriva genetica sarà maggiore dal momento che essa agisce in modo inversamente proporzionale alle dimensioni della popolazione, aumentandone la divergenza nel tempo e nello spazioIl grafico mostra come la distanza genetica aumenti in relazione alla distanza geografica in modo più marcato per il cromosoma Y: perché Ne del cromosoma Y è minore di quello di mtDNA per:
• alta mortalità maschile prima della riproduzione
• selezione locale sul cromosoma Y
• pratica della poliginia
•patrilocalità
Filogenia:
Struttura ad albero che rappresenta le relazioni evolutive tra un insieme di taxa (dove per taxon si intende un’unità evolutiva, quindi dall’aplotipo… alla specie!)
Filogenia del DNA mitocondriale
HVR-1 e HVR-2 (10.000 sequenze!) Regione altamente variabile Mutazioni parallele e ricorrenti
SNPs selezionati (RFLPs)nella regione codificante meno variabile e più stabile
Sequenze complete dell’intera molecola di mtDNA (3.4x10-7) lunga circa 16.500 bp (500 seq. complete pubblicate)
Studi “gerarchici”: prima vengono individuati gli aplogruppi e dopo si analizza la variabilità al loro interno con gli aplotipi
APLOGRUPPO (HG) combinazione allelica degli SNPs
Filogenesi divisa in 18 HG principali indicati con lettere A-R, suddivisi da altre mutazioni in subclusterMicrosatelliti:
•per indagare una variabilità più recente. Le combinazioni degli stati allelici di STRs sono dette APLOTIPI
•Per datare i nodi dell’albero: noti la durata di ogni generazione (25 anni) e il tasso di mutazione è possibile risalire all’età del Most Recent Common Ancestor dei cromosomi considerati
The Y Chromosome Consortium, 2002
Africani
Out of Africa
E3a (M2)
Aplotipo: combinazione di stati allelici
Filogeografia:
Analisi della distribuzione geografica di diversi cladi all’interno di una filogenia. La filogenia fornisce una dimensione temporale ed evolutiva che è combinata con la dimensione spaziale della geografia
Filogeografia del DNA mitocondriale
Filogeografia del cromosoma Y
PRO E CONTRO
PRO CONTRO
mtDNA
Eredità uniparentale materna
Assenza di ricombinazione
SNPs:- HVR (evol veloce)- regione codificante (evol lenta)
Piccole dimensioni
Molte copie per cellula
Strutturazione geografica
Cromosoma Y
Eredità uniparentale paterna
NRY
Diversi tipi di polimorfismi:-SNPs (evol lenta)-STRs (evol veloce)
Forte strutturazione geografica
Taglia effettiva bassa
Soggetto a deriva
Eredità uniparentale
AUTOSOMI
mtDNA
EP
TPTG
EP
TPTG
EP
TP
TG
DIFFERENZE TRA POPOLAZIONI MISURATE IN BASE ALLE DIVERSE PORZIONI GENOMICHE
Y
PRODUZIONE DI ALLELI SPECIFICI IN CONDIZIONI DI RADIAZIONE MOLECOLARE E SUDDIVISIONE DELLA POPOLAZIONE
1. Suddivisione di una popolazione nel corso del tempo
2. Se il tasso di mutazione è basso nelle popolazioni derivate si troveranno gli stessi alleli della popolazione parentale (v. colori) ma con frequenze diverse
3. Se il tasso di mutazione è intermedio, nelle popolazioni derivate si troverannonuovi alleli, che difficilmente saranno uguali fra le due popolazioni (v. tonalita’ del rosso e del verde).
4. Se il tasso di mutazione è altonelle popolazioni derivate si troveràun gran numero di nuovi alleli, alcuni uguali fra le due popolazioni (v. tonalita’ del rosso e del verde).
LA QUANTITA’ DI VARIAZIONE AI LOCI AD EVOLUZIONE RAPIDA PUO’ MISURARE L’ANTICHITA’ DELLE LINEE EVOLUTIVE DEFINITE DA SNP
METODI DI ANALISI DEI DATI
Population-orientedPopulation-oriented: scopo di descrivere similarità e dissimilarità tra interi pool genici, es. per ricostruire l’etnogenesi
Lineage-orientedLineage-oriented: scopo di fare inferenza sulla diffusione e sui tempi dei singoli rami di un dato albero
PRINCIPALI CONTRIBUTO DELL’ANALISI DEGLI SNP DEL CROMOSOMA Y:
1. Conferma dell’ipotesi Out-of-Africa
2. Stima del TMRCA tra 50 e 120 kya
3. Linee evolutive continente-specifiche
4. Forte strutturamento delle popolazioni
5. Dati sul popolamento europeo principalmente da Oriente
•La ricombinazione non riassortisce gli alleli ai loci del cromosoma Y
•Aplogruppi ed aplotipi sono trasmessi come blocco unico da padre in figlio e possono essere cambiati solo dalle mutazioni.
•Diversa utilizzazione per studi evolutivi secondo la scala temporale che interessa
•A partire da un certo campionario di tipi molecolari osservati è possibile ricostruire differenti linee evolutive definite dai diversi eventi mutazionali che contribuiscono alla variabilità osservata (principio della coalescenza)
PRINCIPIO DELLA COALESCENZA- GENEALOGIA DI UN GENEPRINCIPIO DELLA COALESCENZA- GENEALOGIA DI UN GENE
•RISALIRE ALL'ANTENATO COMUNE PIÙ RECENTE (MRCA)
•STIMARE IL NUMERO DI GENERAZIONI CHE SEPARA QUESTO INDIVIDUO ANCESTRALE DAL PRESENTE (TMRCA)
T11= MRCA