Gen Pop6genefl
-
Upload
genetica-ferrara-university-italy -
Category
Education
-
view
4.206 -
download
0
description
Transcript of Gen Pop6genefl
Genetica di popolazioni 6
Programma del corso
1. Diversità genetica
2. Equilibrio di Hardy-Weinberg
3. Unione assortativa
4. Linkage disequilibrium
5. Mutazione
6. Deriva genetica
7. Flusso genico e varianze genetiche
8. Selezione
9. Mantenimento dei polimorfismi e teoria neutrale
10. Introduzione al coalescente
11. Evidenze genetiche sull’evoluzione umana
Popolazioni strutturate
Perché ci sia flusso genico la popolazione deve essere suddivisa in demi o sottopopolazioni
Disponiamo di vari modelli per descrivere i rapporti migrazionali fra popolazioni
1. Migrazione unidirezionale
2. Modello a isole
3. Modello a stepping-stone
4. Modello a isolamento per distanza
Migrazione unidirezionale
pc = frequency of A1 allele on the Continent pi = frequency of A1 allele on the island p1’ = the frequency of the A1 allele in the next generation on the island each generation (1 – m) of the individuals on the island were already on the island and m individuals migrated from the continent to the island. p1’ = the A1 allele frequency originally on the island plus any A1 alleles that came in with the migrants
p1’ = (1 – m)p1 + mpc
Attraverso le generazioni, la migrazione porta le due popolazioni ad assomigliarsi
pc p1
migrazione m (1-m) non migrazione
alleli immigrati alleli trasmessi dalla
generazione precedente
p1’ = (1 – m)p1 + mpc
http://darwin.eeb.uconn.edu/simulations/simulations.html
Migrazione unidirezionale
p1’ = (1 – m)p1 + mpc
e ∆p = p1’ – p1 = = (1-m)p1 + mpc –p1 == p1 – mp1 + mpc – p1 ∆p = m(pc – p1)
PerciòSe pc > p1 ∆p è positivo e la F(A1) sull’isola aumenta
Se pc < p1 ∆p è negativo e la F(A1) sull’isola diminuisce
Solo quando pc = pi la frequenza allelica non cambia
Modello ad isole
mm
m
m
N costante, migrazione simmetrica e indipendentedalla posizione nello spazio
Modello ad isole
pt
migrazione m (1-m) non migrazione
pmed pt-1
pt = pt-1 (1-m) + pmed m
Δp = pt - pt-1 = pt-1 (1-m) + pmed m – pt-1 =
= pt-1 (1 – m – 1) + pmed m = m (pmed – pt-1)
Δp = 0 quando pt-1 = pmed
Sewall Wright
Vediamo se ci siamo capiti
Se alla migrazione non si oppongono altri processi evolutivi, il risultato sarà:1.Una omogeneizzazione delle frequenze alleliche nelle sottopopolazioni2. Un aumento dell’omozigosi nelle sottopopolazioni3.La perdita di alleli in ciascuna sottopopolazione4.Un aumento dell’inbreeding
Se misuriamo le differenze genetiche fra sottopopolazioni in tempi differenti, mentre avviene flusso genico, le differenze maggiori si osserveranno:1.All’inizio 2.Nella fase centrale3.Alla fine
Quali di queste affermazioni sono vere in una popolazione di 100 individui, all’arrivo di 50 migranti da una località lontana?1.La popolazione sarà in equilibrio di Hardy Weinberg2.Ci sarà probabilmente un deficit di eterozigoti3.Ci sarà probabilmente un eccesso di eterozigoti4.Ci sarà un aumento del linkage disequilibrium5.Ci sarà un aumento della diversità nucleotidica
Il flusso genico introduce nuovi alleli nelle sottopopolazioni e riduce le differenze fra sottopopolazioni
Flusso genico
deriva
Flusso genico e deriva hanno effetti opposti
Modello a stepping-stone
N costante, migrazione simmetrica da e verso le sottopopolazioni adiacenti
•Decremento esponenziale della somiglianza genetica in funzione del numero di passi che separano due popolazioni
•Decremento più rapido in una che in due dimensioni, in due che in tre
Motoo Kimura
Modello a isolamento per distanza
N costante, migrazione simmetrica in funzione della distanza geografica fra popolazioni, deriva
Decremento esponenziale della somiglianza genetica (kinship) in funzione della distanza geografica
Kinship = φij = (pi-pmed) (pj-pmed)
φ(d) = a + e-bd + L (Malécot-Morton)
d
ln φ
Distanze genetiche
Misure quantitative della divergenza genetica fra individui, popolazioni o specie
Forniscono stime del tempo trascorso da quando le popolazioni o specie hanno cominciato a esistere come entità indipendenti dal punto di vista riproduttivo
1. Distanza di Nei [mutazione e deriva]2. Distanza di Edwards e Cavalli-Sforza [deriva]3. Fst fra coppie di popolazioni4. …
5. N di sostituzioni a coppie6. Fst fra coppie di individui7. …
Se le frequenze alleliche nelle popolazioni X e Y
sono x1, x2,…xN e y1, y2,…yN
D = -ln I [I: gene identity]
dove I = Σxiyi /√ (Σxi2 Σyi
2)
Se xi = yi , Σxiyi =√ (Σxi2 Σyi
2) I=1 -ln I = 0
• Per più loci, si calcola la media aritmetica su tutti i loci
• Può essere interpretata come numero medio di sostituzioni di codon per locus
• Assunzioni: Alleli infiniti, equilibrio mutazione-deriva
Distanza di Nei
I = (0.2 x 0.7) + (0.8 x 0.3) = 0.14 + 0.24 = 0.605
√ (0.22 x 0.72) (0.82 x 0.32) √ 0.68 x 0.58
D = - ln 0.605 = 0.503
Distanza di Nei – Un locus, due alleli
Popolazione X Y
Fr (a1) 0.2 0.7
Fr (a2) 0.8 0.3
X
Y
P
Distanza di Edwards e Cavalli-Sforza
Equazione del cerchio: X2 + Y2 = r2
r
√ p
√ 1-pX1
X2
ϕ
Si possono immaginare le popolazioniX1 e X2 come punti su una circonferenza, determinati dalle loro frequenze alleliche p1 , q1 e p2 , q2
r = 1
√ p
√ qX1
X2
ϕ
Distanza di Edwards e Cavalli-Sforza
La distanza fra X1 e X2 è la lunghezza della corda, √ 2 d, dove d = √ 1 – cos ϕ
Si può dimostrare che d2 = 1 – √p1 p2 - √ q1 q2
d
Per più loci, si combinano le misure col teorema di Pitagora
Nessuna assunzione su equilibrio mutazione-deriva
Distanza genetica di Edwards e Cavalli-Sforza
WOb3 WSp3 WCal WOoc WSp2
WOb3 0
WSp3 0.0332 0
WCal 0.0492 0.0488 0
WOoc 0.0428 0.0645 0.0617 0
WSp2 0.0466 0.0449 0.0533 0.058 0
Distanze fra popolazioni di ghiandaie Aphelocoma californica
N di sostituzioni a coppie
CA02 CA14 PE15 PE20
AL07 1 2 3 1
CA02 1 2 0
CA14 3 1
PE15 2
DRUZ BDN PAL AJA GRK ITN ADY SPN BAS IRISH GERM EEUR RUS SWED ORC SARD
BDN 0.0072
PAL 0.0064 0.0056
AJA 0.0088 0.0108 0.0093
GRK 0.0052 0.0064 0.0057 0.0042
ITN 0.0057 0.0079 0.0064 0.0040 0.0001
ADY 0.0092 0.0123 0.0108 0.0107 0.0054 0.0067
SPN 0.0096 0.0103 0.0101 0.0056 0.0035 0.0010 0.0090
BAS 0.0186 0.0204 0.0199 0.0144 0.0098 0.0084 0.0180 0.0060
IRISH 0.0154 0.0187 0.0170 0.0109 0.0067 0.0048 0.0110 0.0037 0.0086
GERM 0.0121 0.0147 0.0136 0.0072 0.0039 0.0029 0.0089 0.0015 0.0079 0.0010
EEUR 0.0128 0.0149 0.0133 0.0068 0.0049 0.0040 0.0086 0.0033 0.0091 0.0034 0.0014
RUS 0.0194 0.0211 0.0202 0.0137 0.0108 0.0088 0.0120 0.0079 0.0126 0.0038 0.0037 0.0029
SWED 0.0167 0.0204 0.0191 0.0120 0.0084 0.0064 0.0117 0.0055 0.0100 0.0020 0.0007 0.0025 0.0036
ORC 0.0194 0.0212 0.0201 0.0146 0.0103 0.0080 0.0136 0.0063 0.0124 0.0039 0.0048 0.0055 0.0092 0.0046
SARD 0.0163 0.0183 0.0166 0.0131 0.0088 0.0072 0.0204 0.0071 0.0133 0.0140 0.0117 0.0132 0.0210 0.0155 0.0162
TUSC 0.0086 0.0102 0.0096 0.0066 0.0005 0.0004 0.0094 0.0023 0.0084 0.0055 0.0032 0.0045 0.0108 0.0061 0.0098 0.0083
Tian et al. (2009) Molecular Medicine. Paired Fst values from three nonoverlapping sets of 3,500 SNPs using the Weir and Cockerham algorithm; Druze, Bedouin (BDN), Palestinian (PAL), Ashkenazi Jewish American (AJA), Greek (GRK), Italian (ITN), Adygei (ADY), Spanish (SPN), Basque (BAS), IRISH, German (GERM), Eastern European (EEUR), Russian (RUS), Swedish (SWED), Orcadian (ORC), Sardinian (SARD), and Tuscan (TUSC).
FST fra coppie di popolazioni
One-dimensional stepping stone model of gene flow in the Mediterranean killifish Aphanius fasciatus
Ferruccio Maltagliati, Serena Como, Serena Corti, Alberto Castelli Dipartimento di Scienze dell’Uomo e dell’Ambiente, University of Pisa, Italy
Un’applicazione
http://www.discat.unipi.it/BiolMar/people/maltagli/posters/EMBS2003.htm
Un altro esempio: isolamento per distanza in senso lato nelle anguille danesi
Un altro esempio: isolamento per distanza in senso stretto in Arabidopsis thaliana
Equilibrio di HWP=0.23 Equilibrio di HW
P=0.90Deficit di eterozigotiP=0.00
Deficit di eterozigoti nelle popolazioni di merluzzoStudio delle emoglobine (Sick 1965)
Effetto Wahlund• Che una popolazione sia suddivisa non è sempre
evidente. Cosa succede se non ce ne accorgiamo?
Genotipo A B A + B attese
AA 4 49 53 40.5
Aa 32 42 74 99
aa 64 9 75 60.5
p 0.2 0.7 0.45
q 0.8 0.3 0.55
Totale 100 100 200 200
La suddivisione provoca un deficit di eterozigoti, proporzionale alla varianza di frequenze alleliche fra sottopopolazioni
Nota beneLa variabilità interna di una popolazione è solo uno degli
aspetti della variabilità genetica:
Variabilità tra individui della stessa popolazione
Variabilità tra individui di popolazioni diverse
Variabilità tra individui di gruppi di popolazioni diverse
eccetera
Varianze genetiche
• Fit = varianza di ciascun individuo rispetto alla media
totale della popolazione
• Fis = varianza di ciascun individuo rispetto alla media
della sua sottopopolazione
• Fst = varianza di ciascuna sottopopolazione rispetto alla
media totale della popolazione
(1 – Fit) = (1 – Fis) (1- Fst)
Varianze genetiche
(1 – x)Manca, rispetto alle attese di HW, una certa quota x di eterozigoti
In parte, per una quota y, a causa dell’inbreeding
= (1 – y)In parte, per una quota z, a causa dellasuddivisione: deriva indipendente nelle sottopopolazioni
(1- z)
y è interno alle sottopopolazioni e corrisponde all’F di inbreeding
z è la varianza standardizzata delle frequenze alleliche fra sottopopolazioni
(1 – Fit) = (1 – Fis) (1- Fst)
Varianze genetiche
(1 – Fit) = (1 – Fis) (1- Fst)Il deficit totale di eterozigotiin una popolazione dipende
Dal deficit interno dellesottopopolazioni: inbreeding
E dal deficit dovuto allasuddivisione: deriva indipendente nelle sottopopolazioni
Fst
• Fst = σ2p/pmedqmed
• pmedqmed = max (σ2p)
• Fst è la frazione espressa della varianza
genetica teorica
σ2p=0, Fst=0 σ2
p=pmedqmed, Fst=1
pi= 1,0, 0, 1, 0. pmed = 0.4, qmed=0.6
σ 2p= [2 (0.6)2 + 3 (0.4)2] / 5 =
= (0.72 + 0.48) / 5 =
= 1.20 / 5 = 0.24
pmed qmed= 0.4 x 0.6 = 0.24
Fst = σ2p/pmedqmed = 0.24 / 0.24 = 1
Mescolanza o admixture
Mescolanza o admixture
Se p1=0.8, p2=0.4 e pB=0.6, m1=m2=0.5
Se p1=0.8, p2=0.4 e pB=0.7, m1=0.75, m2=0.25
ecc.
Un’applicazione: Relazioni evolutive degli Etruschi
Etruscans 30
Medieval Tuscan 27(Guimaraes, S. et al 2009)
Modern communities: Casentino 122
Murlo 86Volterra 114
(Achilli et al. 2005)
FST Contemporary Samples– Etruscan Sample
Allele Sharing
MDSItalian Samples
Per capirci qualcosa di più: Tassi di mescolanza
Un’applicazione: Tasso di admixture in Europa
Dupanloup et al. (2003); dati di Semino et al. (2000)
Un’applicazione: l’origine degli Europei
Fig. 1. The first principal component of gene frequencies from 38 independent alleles at the human loci: ABO, Rh, MNS, Le, Fy, Hp, PGMi, HLA-A, and HLA-B. Shades indicate different intensities of the first principal component, which accounts for 27 percent of the total variation
It all began from this
(P. Menozzi, A. Piazza & L.L. Cavalli-Sforza, Science, 1978)
Continentwide genetic gradients in Europe
(Cavalli-Sforza et al. 1994)
Diffusion of Neolithic artifacts in Europe
(Balaresque et al. 2010; interpolated from data by Pinhasi et al. 2005)
Rationale for the proposal of a Neolithic demic diffusion
European genetic diversity distributed in gradients. Only gene flow can generate such patterns on the continental scale
No documented migration in historical times spanning the area from the Levant to the Atlantic coasts
Neolithic technologies may have spread by cultural contact or by migration (most likely, by a combination thereof)
Parallelism between genetic gradients and diffusion of Neolithic artifacts cannot be the product of cultural exchanges only
Demic diffusion: expanding Neolithic people carried in Europe their know-how, their genes, and perhaps their languages too.
Conditions for the origin of genetic gradients by demic diffusion
1. Demographic growth of farmers
2. Diffusion, incomplete admixture
3. Farmers continue to grow in numbers, hunter-gatherers don’t
(Ammerman & Cavalli-Sforza 1984) But…
0. Low population density
In the first DNA studies (mtDNA) very old ages are estimated for the main European mutations
“Each cluster can be assigned, in its entirety, to one of the proposed migration phases; the age of each cluster approximates very closely the timing of the migratory event”
“The main mitochondrial variants in Europe predate the Neolithic expansion”
(Richards et al. 1996, 2000)
Estimated ages of mitochondrial haplogroups (x 1000)
Richards Sykes Richards et al. 1996 1999 et al. 2000
H 23.5 11.0-14.0 15.0 - 17.2
J 23.5 8.5 6.9 - 10.9
T 35.5 11.0-14.0 9.6 - 17.7
IWX 50.5 11.0-14.0
X: 20.0 I: 19.9 - 32.7
K 17.5 11.0-14.0 10.0 - 15.5
U 36.5 5: 50.0 44.6 - 54.4
Neolithic contribution overestimated in preDNA studies? Hans Bandelt
Haplogroup H, “the signature of the Paleolithic expansion in Europe”
Two basic models
Palaeolithic model Neolithic model (Cultural diffusion of food- (Demic diffusion of food- production technologies production technologies
(Barbujani 2012)
Ok folks, all those with haplogroup H come with me, let’s do the Paleolithic
migration. No way Steve, not you. You’re a J, damn it, a J! Wait until the Neolithic!
“Each cluster can be assigned, in its entirety,to one of the proposed migration phases; the age of each cluster
approximates very closely the timing of the migratory event”
It is people who migrate, not haplogroupsHaplogroup ages are not estimates of migration times
But inconsistencies in the arguments claimed to support the Palaeolithic model do not prove that the alternative model is correct
Is a demic diffusion from the Near East the only explanation available for that pattern?
2. Dispersal and founder effect
3. Drift
No. And this may have happened both in Palaeolithic and Neolithic times
0. Low population density
1. Dispersal without founder effect
No spatial autocorrelation of mtDNA molecular differences (AIDA)
E-W cline of mtDNA molecular differences (AIDA)
Maybe a single migration process is too much of an oversimplification?
Mitochondrial haplogroups in
ancient and modern
European populations
1. Modern European mtDNAs resemble Neolithic, not Paleolithic mtDNAs
Some answers from ancient DNA
2. Differences between modern and Neolithic mtDNAs form a cline with a minimum in Anatolia
3. (Perhaps) Increase in the population size of H hg carriers 9,000 to 7,000 years BP
Post Pr (Model B): 1,655 to 2,691 folds as high as Post Pr (Model A)
4. Genetic continuity since Paleolithic times very unlikely in ABC analyses of mtDNA
2 individuals from the Upper Paleolithic, 43 from the Mesolithic (including the two La Braña specimens) and 121 from the Neolithic
Some questions to be addressed:
1.Are the two main models different enough to be distinguished in analyses of modern DNAs?
Some questions to be addressed:
2. While we wait for sufficiently large ancient DNA nuclear datasets to be assembled, how much can we trust inferences from mtDNA data?
3. Do we have sufficiently detailed archaeological information to construct a mixed model, incorporating the possibility of cultural and demic change at various locations?
All in all, perhaps something of this kind happened
Paleolithic Mesolithic Neolithic Modern times
Robert R. Sokal(1927 – 2012)
Sintesi
1. Lo scambio di geni fra popolazioni prende il nome di flusso genico, in molti casi sinonimo di migrazione
2. Disponiamo di vari modelli per descrivere i rapporti migrazionali fra popolazioni: unidirezionale; isole; stepping-stone; isolamento per distanza
3. Tutti questi modelli predicono che il flusso genico aumenti la variabilità genetica interna e riduca la variabilità fra popolazioni
4. L’effettivo livello di diversità genetica fra popolazioni dipende perciò dal peso relativo di isolamento e flusso genico
Sintesi
5. Si possono quantificare le differenze genetiche fra popolazioni per mezzo di misure di distanza genetica
6. La formazione di un nuovo pool genico a partire da popolazioni separate prende il nome di mescolanza o admixture
7. In generale la suddivisione provoca un apparente deficit di eterozigoti (effetto Wahlund)
8. Le varianze genetiche permettono di attribuire il deficit osservato di eterozigoti agli effetti dell’inbreeding e della suddivisione