Gen pop7geneflow

74
Genetica di popolazioni 7: Flusso genico

description

Gene flow

Transcript of Gen pop7geneflow

Page 1: Gen pop7geneflow

Genetica di popolazioni 7:Flusso genico

Page 2: Gen pop7geneflow

Programma del corso

1. Diversità genetica

2. Equilibrio di Hardy-Weinberg

3. Inbreeding

4. Linkage disequilibrium

5. Mutazione

6. Deriva genetica

7. Flusso genico e varianze genetiche

8. Selezione

9. Mantenimento dei polimorfismi e teoria neutrale

10. Introduzione alla teoria coalescente

11. Struttura e storia della popolazione umana

+ Lettura critica di articoli

Page 3: Gen pop7geneflow

Popolazioni strutturate

Perché ci sia flusso genico la popolazione deve essere suddivisa in demi o sottopopolazioni

Disponiamo di vari modelli per descrivere i rapporti migrazionali fra popolazioni

Page 4: Gen pop7geneflow

1. Migrazione unidirezionale

Page 5: Gen pop7geneflow

2. Modello a isole

Page 6: Gen pop7geneflow

3. Modello a stepping-stone

Page 7: Gen pop7geneflow

4. Modello a isolamento per distanza

Page 8: Gen pop7geneflow

Migrazione unidirezionale

P = frequency of A1 allele on the Continent p0 = frequency of A1 allele on the island p1 = the frequency of the A1 allele in the next generation on the island each generation (1 – m) of the individuals on the island were already on the island and m individuals migrated from the continent to the island. p1’ = the A1 allele frequency originally on the island plus any A1 alleles that came in with the migrants

p1 = (1 – m)p0 + mP

Page 9: Gen pop7geneflow

Attraverso le generazioni, la migrazione porta le due popolazioni ad assomigliarsi

P p0

m [migrazione] (1-m) [non migrazione]

alleli immigrati alleli trasmessi dalla generazione precedente

p1 = (1 – m)p0 + mP

p2 = (1 – m)p1 + mP = (1-m) [(1-m) p0 + mP] + mP

Page 10: Gen pop7geneflow
Page 11: Gen pop7geneflow

http://darwin.eeb.uconn.edu/simulations/simulations.html

Page 12: Gen pop7geneflow

Migrazione unidirezionale

p2 = (1 – m)p1 + mpc

e p = p2 – p1 = = (1-m)p1 + mpc –p1 == p1 – mp1 + mpc – p1 p = m(pc – p1)PerciòSe pc > p1 p è positivo e la F(A1) sull’isola aumentaSe pc < p1 p è negativo e la F(A1) sull’isola diminuisce

Solo quando pc = pi la frequenza allelica non cambia

Page 13: Gen pop7geneflow

Modello ad isole

mmm

m

N costante, migrazione simmetrica e indipendentedalla posizione nello spazio

Page 14: Gen pop7geneflow

Modello ad isole

pt

migrazione m (1-m) non migrazione

pmed pt-1

pt = pt-1 (1-m) + pmed m

Δp = pt - pt-1 = pt-1 (1-m) + pmed m – pt-1 =

= pt-1 (1 – m – 1) + pmed m = m (pmed – pt-1)

Δp = 0 quando pt-1 = pmed

Sewall Wright

Page 15: Gen pop7geneflow

Vediamo se ci siamo capiti

Se alla migrazione non si oppongono altri processi evolutivi, il risultato sarà:1.Una omogeneizzazione delle frequenze alleliche nelle sottopopolazioni2. Un aumento dell’omozigosi nelle sottopopolazioni3.La perdita di alleli in ciascuna sottopopolazione4.Un aumento dell’inbreeding

Se misuriamo le differenze genetiche fra sottopopolazioni in tempi differenti, mentre avviene flusso genico, le differenze maggiori si osserveranno:1.All’inizio 2.Nella fase centrale3.Alla fine

Quali di queste affermazioni sono vere in una popolazione di 100 individui, all’arrivo di 50 migranti da una località lontana?1.La popolazione sarà in equilibrio di Hardy Weinberg2.Ci sarà probabilmente un deficit di eterozigoti3.Ci sarà probabilmente un eccesso di eterozigoti4.Ci sarà un aumento del linkage disequilibrium5.Ci sarà un aumento della diversità nucleotidica

Page 16: Gen pop7geneflow

Il flusso genico introduce nuovi alleli nelle sottopopolazioni e riduce le differenze fra sottopopolazioni

Flusso genico

deriva

Flusso genico e deriva hanno effetti opposti

Page 17: Gen pop7geneflow

Modello a stepping-stone

N costante, migrazione simmetrica da e verso le sottopopolazioni adiacenti

•Decremento esponenziale della somiglianza genetica in funzione del numero di passi che separano due popolazioni

•Decremento più rapido in una che in due dimensioni, in due che in tre

Motoo Kimura

Page 18: Gen pop7geneflow

Modello a isolamento per distanza

N costante, migrazione simmetrica in funzione della distanza geografica fra popolazioni, deriva

Decremento esponenziale della somiglianza genetica (kinship) in funzione della distanza geografica

Kinship = φij = (pi-pmed) (pj-pmed)

φ(d) = a + e-bd + L (Malécot-Morton)

d

ln φ

Page 19: Gen pop7geneflow

Distanze genetiche

Misure quantitative della divergenza genetica fra individui, popolazioni o specie

Forniscono stime del tempo trascorso da quando le popolazioni o specie hanno cominciato a esistere come entità indipendenti dal punto di vista riproduttivo

1. Distanza di Nei [mutazione e deriva]2. Distanza di Edwards e Cavalli-Sforza [deriva]3. Fst fra coppie di popolazioni4. …

5. N di sostituzioni a coppie6. Fst fra coppie di individui7. …

Page 20: Gen pop7geneflow

Se le frequenze alleliche nelle popolazioni X e Y sono x1, x2,…xN e y1, y2,…yN

D = -ln I [I: gene identity]

dove I = Σxiyi / (Σxi2 Σyi

2)

Se xi = yi , Σxiyi = (Σxi2 Σyi

2) I=1 -ln I = 0

• Per più loci, si calcola la media aritmetica su tutti i loci• Può essere interpretata come numero medio di sostituzioni di codon

per locus• Assunzioni: Alleli infiniti, equilibrio mutazione-deriva

Distanza di Nei

Page 21: Gen pop7geneflow

I = (0.2 x 0.7) + (0.8 x 0.3) = 0.14 + 0.24 = 0.605 (0.22 x 0.72) (0.82 x 0.32) 0.68 x 0.58

D = - ln 0.605 = 0.503

Distanza di Nei – Un locus, due alleli

Popolazione X Y

Fr (a1) 0.2 0.7

Fr (a2) 0.8 0.3

Page 22: Gen pop7geneflow

X

Y

P

Distanza di Edwards e Cavalli-Sforza

Equazione del cerchio: X2 + Y2 = r2

r

p

1-pX1

X2

Si possono immaginare le popolazioniX1 e X2 come punti su una circonferenza, determinati dalle loro frequenze alleliche p1 , q1 e p2 , q2

r = 1

Page 23: Gen pop7geneflow

p

qX1

X2

Distanza di Edwards e Cavalli-Sforza

La distanza fra X1 e X2 è la lunghezza della corda, 2 d, dove d = 1 – cos

Si può dimostrare che d2 = 1 – p1 p2 - q1 q2

d

Per più loci, si combinano le misure col teorema di Pitagora

Nessuna assunzione su equilibrio mutazione-deriva

Page 24: Gen pop7geneflow

Distanza genetica di Edwards e Cavalli-Sforza

WOb3 WSp3 WCal WOoc WSp2

WOb3 0

WSp3 0.0332 0

WCal 0.0492 0.0488 0

WOoc 0.0428 0.0645 0.0617 0

WSp2 0.0466 0.0449 0.0533 0.058 0

Distanze fra popolazioni di ghiandaie Aphelocoma californica

Page 25: Gen pop7geneflow

N di sostituzioni a coppie

CA02 CA14 PE15 PE20

AL07 1 2 3 1

CA02 1 2 0

CA14 3 1

PE15 2

Page 26: Gen pop7geneflow

DRUZ BDN PAL AJA GRK ITN ADY SPN BAS IRISH GERM EEUR RUS SWED ORC SARD

BDN 0.0072

PAL 0.0064 0.0056

AJA 0.0088 0.0108 0.0093

GRK 0.0052 0.0064 0.0057 0.0042

ITN 0.0057 0.0079 0.0064 0.0040 0.0001

ADY 0.0092 0.0123 0.0108 0.0107 0.0054 0.0067

SPN 0.0096 0.0103 0.0101 0.0056 0.0035 0.0010 0.0090

BAS 0.0186 0.0204 0.0199 0.0144 0.0098 0.0084 0.0180 0.0060

IRISH 0.0154 0.0187 0.0170 0.0109 0.0067 0.0048 0.0110 0.0037 0.0086

GERM

0.0121 0.0147 0.0136 0.0072 0.0039 0.0029 0.0089 0.0015 0.0079 0.0010

EEUR 0.0128 0.0149 0.0133 0.0068 0.0049 0.0040 0.0086 0.0033 0.0091 0.0034 0.0014

RUS 0.0194 0.0211 0.0202 0.0137 0.0108 0.0088 0.0120 0.0079 0.0126 0.0038 0.0037 0.0029

SWED

0.0167 0.0204 0.0191 0.0120 0.0084 0.0064 0.0117 0.0055 0.0100 0.0020 0.0007 0.0025 0.0036

ORC 0.0194 0.0212 0.0201 0.0146 0.0103 0.0080 0.0136 0.0063 0.0124 0.0039 0.0048 0.0055 0.0092 0.0046

SARD 0.0163 0.0183 0.0166 0.0131 0.0088 0.0072 0.0204 0.0071 0.0133 0.0140 0.0117 0.0132 0.0210 0.0155 0.0162

TUSC 0.0086 0.0102 0.0096 0.0066 0.0005 0.0004 0.0094 0.0023 0.0084 0.0055 0.0032 0.0045 0.0108 0.0061 0.0098 0.0083

Tian et al. (2009) Molecular Medicine. Paired Fst values from three nonoverlapping sets of 3,500 SNPs using the Weir and Cockerham algorithm; Druze, Bedouin (BDN), Palestinian (PAL), Ashkenazi Jewish American (AJA), Greek (GRK), Italian (ITN), Adygei (ADY), Spanish (SPN), Basque (BAS), IRISH, German (GERM), Eastern European (EEUR), Russian (RUS), Swedish (SWED), Orcadian (ORC), Sardinian (SARD), and Tuscan (TUSC).

FST fra coppie di popolazioni

Page 27: Gen pop7geneflow
Page 28: Gen pop7geneflow

One-dimensional stepping stone model of gene flow in the Mediterranean killifish Aphanius fasciatus

Ferruccio Maltagliati, Serena Como, Serena Corti, Alberto Castelli Dipartimento di Scienze dell’Uomo e dell’Ambiente, University of Pisa, Italy

Un’applicazionehttp://www.discat.unipi.it/BiolMar/people/maltagli/posters/EMBS2003.htm

Page 29: Gen pop7geneflow
Page 30: Gen pop7geneflow
Page 31: Gen pop7geneflow
Page 32: Gen pop7geneflow
Page 33: Gen pop7geneflow

Un altro esempio: isolamento per distanza in senso lato nelle anguille danesi

Page 34: Gen pop7geneflow

Un altro esempio: isolamento per distanza in senso stretto in Arabidopsis thaliana

Page 35: Gen pop7geneflow

Equilibrio di HWP=0.23 Equilibrio di HW

P=0.90Deficit di eterozigotiP=0.00

Deficit di eterozigoti nelle popolazioni di merluzzoStudio delle emoglobine (Sick 1965)

Page 36: Gen pop7geneflow

Effetto Wahlund• Che una popolazione sia suddivisa non è sempre evidente.

Cosa succede se non ce ne accorgiamo?

Genotipo A B A + B attese

AA 4 49 53 40.5

Aa 32 42 74 99

aa 64 9 75 60.5

p 0.2 0.7 0.45

q 0.8 0.3 0.55

Totale 100 100 200 200

La suddivisione provoca un deficit di eterozigoti, proporzionale alla varianza di frequenze alleliche fra sottopopolazioni

Page 37: Gen pop7geneflow

Nota beneLa variabilità interna di una popolazione è solo uno degli

aspetti della variabilità genetica:Variabilità tra individui della stessa popolazioneVariabilità tra individui di popolazioni diverseVariabilità tra individui di gruppi di popolazioni diverse eccetera

Page 38: Gen pop7geneflow

Varianze genetiche• Fit = varianza di ciascun individuo rispetto alla media totale

della popolazione• Fis = varianza di ciascun individuo rispetto alla media della sua

sottopopolazione• Fst = varianza di ciascuna sottopopolazione rispetto alla media

totale della popolazione

(1 – Fit) = (1 – Fis) (1- Fst)

Page 39: Gen pop7geneflow

Varianze genetiche

(1 – x)Manca, rispetto alle attese di HW, una certa quota x di eterozigoti

In parte, per una quota y, a causa dell’inbreeding

= (1 – y)In parte, per una quota z, a causa dellasuddivisione: deriva indipendente nelle sottopopolazioni

(1- z)

y è interno alle sottopopolazioni e corrisponde all’F di inbreeding

z è la varianza standardizzata delle frequenze alleliche fra sottopopolazioni

(1 – Fit) = (1 – Fis) (1- Fst)

Page 40: Gen pop7geneflow

Varianze genetiche

(1 – Fit) = (1 – Fis) (1- Fst)

Il deficit totale di eterozigotiin una popolazione dipende

Dal deficit interno dellesottopopolazioni: inbreeding

E dal deficit dovuto allasuddivisione: deriva indipendente nelle sottopopolazioni

Page 41: Gen pop7geneflow

Fst• Fst = σ2

p/pmedqmed

• pmedqmed = max (σ2p)

• Fst è la frazione espressa della varianza genetica

teorica

σ2p=0, Fst=0 σ2

p=pmedqmed, Fst=1

Page 42: Gen pop7geneflow

pi= 1,0, 0, 1, 0. pmed = 0.4, qmed=0.6

σ 2p= [2 (0.6)2 + 3 (0.4)2] / 5 =

= (0.72 + 0.48) / 5 =

= 1.20 / 5 = 0.24

pmed qmed= 0.4 x 0.6 = 0.24

Fst = σ2p/pmedqmed = 0.24 / 0.24 = 1

Page 43: Gen pop7geneflow

Mescolanza o admixture

Page 44: Gen pop7geneflow

Mescolanza o admixture

Se p1=0.8, p2=0.4 e pB=0.6, m1=m2=0.5

Se p1=0.8, p2=0.4 e pB=0.7, m1=0.75, m2=0.25

ecc.

Page 45: Gen pop7geneflow

Un’applicazione: Relazioni evolutive degli Etruschi

Etruscans 30

Medieval Tuscan 27(Guimaraes, S. et al 2009)

Modern communities: Casentino 122

Murlo 86Volterra 114

(Achilli et al. 2005)

Page 46: Gen pop7geneflow

FST Contemporary Samples– Etruscan Sample

Page 47: Gen pop7geneflow

Allele Sharing

Page 48: Gen pop7geneflow

MDSItalian Samples

Page 49: Gen pop7geneflow

Per capirci qualcosa di più: Tassi di mescolanza

Page 50: Gen pop7geneflow

Un’applicazione: Tasso di admixture in Europa

Dupanloup et al. (2003); dati di Semino et al. (2000)

Page 51: Gen pop7geneflow

Un’applicazione: l’origine degli Europei

Page 52: Gen pop7geneflow

Fig. 1. The first principal component of gene frequencies from 38 independent alleles at the human loci: ABO, Rh, MNS, Le, Fy, Hp, PGMi, HLA-A, and HLA-B. Shades indicate different intensities of the first principal component, which accounts for 27 percent of the total variation

It all began from this

(P. Menozzi, A. Piazza & L.L. Cavalli-Sforza, Science, 1978)

Page 53: Gen pop7geneflow

Continentwide genetic gradients in Europe

(Cavalli-Sforza et al. 1994)

Page 54: Gen pop7geneflow

Diffusion of Neolithic artifacts in Europe

(Balaresque et al. 2010; interpolated from data by Pinhasi et al. 2005)

Page 55: Gen pop7geneflow

Rationale for the proposal of a Neolithic demic diffusion

European genetic diversity distributed in gradients. Only gene flow can generate such patterns on the continental scale

No documented migration in historical times spanning the area from the Levant to the Atlantic coasts

Neolithic technologies may have spread by cultural contact or by migration (most likely, by a combination thereof)

Parallelism between genetic gradients and diffusion of Neolithic artifacts cannot be the product of cultural exchanges only

Demic diffusion: expanding Neolithic people carried in Europe their know-how, their genes, and perhaps their languages too.

Page 56: Gen pop7geneflow

Conditions for the origin of genetic gradients by demic diffusion

1. Demographic growth of farmers

2. Diffusion, incomplete admixture

3. Farmers continue to grow in numbers, hunter-gatherers don’t

(Ammerman & Cavalli-Sforza 1984) But…

0. Low population density

Page 57: Gen pop7geneflow

In the first DNA studies (mtDNA) very old ages are estimated for the main European mutations

“Each cluster can be assigned, in its entirety, to one of the proposed migration phases; the age of each cluster approximates very closely the timing of the migratory event”

“The main mitochondrial variants in Europe predate the Neolithic expansion”

(Richards et al. 1996, 2000)

Page 58: Gen pop7geneflow

Estimated ages of mitochondrial haplogroups (x 1000)

Richards Sykes Richards et al. 1996 1999 et al. 2000

H 23.5 11.0-14.0 15.0 - 17.2 J 23.5 8.5 6.9 - 10.9 T 35.5 11.0-14.0 9.6 - 17.7 IWX 50.5 11.0-14.0

X: 20.0 I: 19.9 - 32.7 K 17.5 11.0-14.0 10.0 - 15.5 U 36.5 5: 50.0 44.6 - 54.4

Neolithic contribution overestimated in preDNA studies? Hans Bandelt

Haplogroup H, “the signature of the Paleolithic expansion in Europe”

Page 59: Gen pop7geneflow

Two basic models

Palaeolithic model Neolithic model (Cultural diffusion of food- (Demic diffusion of food- production technologies production technologies

(Barbujani 2012)

Page 60: Gen pop7geneflow

Ok folks, all those with haplogroup H come with me, let’s do the Paleolithic

migration. No way Steve, not you. You’re a J, damn it, a J! Wait until the Neolithic!

“Each cluster can be assigned, in its entirety,to one of the proposed migration phases; the age of each cluster

approximates very closely the timing of the migratory event”

Page 61: Gen pop7geneflow

It is people who migrate, not haplogroupsHaplogroup ages are not estimates of migration times

But inconsistencies in the arguments claimed to support the Palaeolithic model do not prove that the alternative model is correct

Page 62: Gen pop7geneflow

Is a demic diffusion from the Near East the only explanation available for that pattern?

2. Dispersal and founder effect

3. Drift

No. And this may have happened both in Palaeolithic and Neolithic times

0. Low population density

1. Dispersal without founder effect

Page 63: Gen pop7geneflow

No spatial autocorrelation of mtDNA molecular differences (AIDA)

E-W cline of mtDNA molecular differences (AIDA)

Maybe a single migration process is too much of an oversimplification?

Page 64: Gen pop7geneflow

Mitochondrial haplogroups in

ancient and modern

European populations

1. Modern European mtDNAs resemble Neolithic, not Paleolithic mtDNAs

Some answers from ancient DNA

Page 65: Gen pop7geneflow

2. Differences between modern and Neolithic mtDNAs form a cline with a minimum in Anatolia

Page 66: Gen pop7geneflow

3. (Perhaps) Increase in the population size of H hg carriers 9,000 to 7,000 years BP

Page 67: Gen pop7geneflow

Post Pr (Model B): 1,655 to 2,691 folds as high as Post Pr (Model A)

4. Genetic continuity since Paleolithic times very unlikely in ABC analyses of mtDNA

2 individuals from the Upper Paleolithic, 43 from the Mesolithic (including the two La Braña specimens) and 121 from the Neolithic

Page 68: Gen pop7geneflow

Some questions to be addressed:

1.Are the two main models different enough to be distinguished in analyses of modern DNAs?

Page 69: Gen pop7geneflow

Some questions to be addressed:

2. While we wait for sufficiently large ancient DNA nuclear datasets to be assembled, how much can we trust inferences from mtDNA data?

3. Do we have sufficiently detailed archaeological information to construct a mixed model, incorporating the possibility of cultural and demic change at various locations?

Page 70: Gen pop7geneflow

All in all, perhaps something of this kind happened

Paleolithic Mesolithic Neolithic Modern times

Page 71: Gen pop7geneflow
Page 72: Gen pop7geneflow

Robert R. Sokal(1927 – 2012)

Page 73: Gen pop7geneflow

Sintesi 1

1. Lo scambio di geni fra popolazioni prende il nome di flusso genico, in molti casi sinonimo di migrazione

2. Disponiamo di vari modelli per descrivere i rapporti migrazionali fra popolazioni: unidirezionale; isole; stepping-stone; isolamento per distanza

3. Tutti questi modelli predicono che il flusso genico aumenti la variabilità genetica interna e riduca la variabilità fra popolazioni

4. L’effettivo livello di diversità genetica fra popolazioni dipende perciò dal peso relativo di isolamento e flusso genico

Page 74: Gen pop7geneflow

Sintesi 2

5. Si possono quantificare le differenze genetiche fra popolazioni per mezzo di misure di distanza genetica

6. La formazione di un nuovo pool genico a partire da popolazioni separate prende il nome di mescolanza o admixture

7. In generale la suddivisione provoca un apparente deficit di eterozigoti (effetto Wahlund)

8. Le varianze genetiche permettono di attribuire il deficit osservato di eterozigoti agli effetti dell’inbreeding e della suddivisione