Gen pop1var

77
Genetica di popolazioni Guido Barbujani Dip. Scienze della Vita e Biotecnologie, Università di Ferrara [email protected]

Transcript of Gen pop1var

Page 1: Gen pop1var

Genetica di popolazioni

Guido BarbujaniDip. Scienze della Vita e Biotecnologie, Università di Ferrara [email protected]

Page 2: Gen pop1var

Obiettivi del corso:

Capire le basi genetiche dell’evoluzione

Arrivare a porsi domande scientificamente corrette

Arrivare a poter leggere criticamente un articolo

ESERCIZI: http://darwin.eeb.uconn.edu/simulations/simulations.html

Page 3: Gen pop1var
Page 4: Gen pop1var

Dipartimento di Scienze della Vita e Biotecnologie [email protected]

Ricevimento: stanza 12, lunedì 14.30 – 16.00

Page 5: Gen pop1var

TESTO ADOTTATOJ.H. Relethford (2013) Genetica delle popolazioni umane. Ambrosiana, 36 Euro.

ESERCIZI: http://www.evolution.unibas.ch/teaching/evol_genetics/index.htm

Page 6: Gen pop1var

Conner & Hartl. Elementi di Genetica ecologica, Piccin

Frankham, Ballou, Briscoe. Fondamenti di Genetica della

conservazione, Zanichelli

Hartl & Clark. Principles of poplation genetics. Sinauer

Page 7: Gen pop1var

ALCUNE DOMANDE IMPORTANTI

• Con che frequenza troviamo unioni consanguinee nelle popolazioni, e quali effetti hanno?

• Cosa ci dice la diversità genetica riguardo alla storia delle diverse specie?

• Come possiamo utilizzare dati genetici per ricostruire la storia delle migrazioni?

• Perché alcune popolazioni presentano frequenze elevate di alleli patologici?

• Perché alcune piccole popolazioni sono così diverse da quelle vicine?

• Quali sono state le relazioni genealogiche fra forme viventi comparse in momenti diversi dell’evoluzione?

• Cosa possiamo fare per preservare la biodiversità?

Page 8: Gen pop1var

Cose da ricordare, per cominciare

1. Cos’è un gene, un allele, un aplotipo2. Com’è fatto il DNA3. Com’è fatto un gene Eucariote4. Com’è fatto un gene procariote5. Com’è la struttura dei geni (siti codificanti, siti di

regolazione, introni, esoni)6. Come funzionano i geni

Page 9: Gen pop1var

Cosa vuol dire che due geni sono associati?

Se le coppie A,a e B,b sono associate che gameti produce il genotipo AaBb e il genotipo Aa BB?

Se AaBb si incrocia con AaBb che tipi di figli può avere?

Se AaBb si incrocia con aabb che tipi di figli può avere?

Cosa si intende per locus genico?

Cosa si intende per allele?

Cosa vuol dire che due geni sono indipendenti?

Se le coppie A,a e B,b sono indipendenti che gameti produce il genotipo AaBb? E il genotipo Aa BB?

Page 10: Gen pop1var

Che cos’è il crossing-over?

Se c’è crossing-over tra due geni associati, gli effetti del crossing-over sono evidenziabili nei gameti?

In che modo i geni codificano le proteine?

Cosa significa dire che i gameti sono aploidi?

Qual è la differenza tra meiosi e mitosi?

Che differenza c’è tra popolazione e specie?

Quanti alleli di un dato locus ci sono in una popolazione?

Specie diverse con lo stesso numero di cromosomi si possono incrociare?

Page 11: Gen pop1var

Programma del corso

1. Diversità genetica

2. Equilibrio di Hardy-Weinberg

3. Inbreeding

4. Linkage disequilibrium

5. Mutazione

6. Deriva genetica

7. Flusso genico e varianze genetiche

8. Selezione

9. Mantenimento dei polimorfismi e teoria neutrale

10. Introduzione alla teoria coalescente

11. Struttura e storia della popolazione umana

+ Lettura critica di articoli

Page 12: Gen pop1var

Programma del corso

1. Diversità genetica

2. Equilibrio di Hardy-Weinberg

3. Inbreeding

4. Linkage disequilibrium

5. Mutazione

6. Deriva genetica

7. Flusso genico e varianze genetiche

8. Selezione

9. Mantenimento dei polimorfismi e teoria neutrale

10. Introduzione alla teoria coalescente

11. Struttura e storia della popolazione umana

+ Lettura critica di articoli

Page 13: Gen pop1var
Page 14: Gen pop1var

Conosciamo 1,6 milioni di specie, stimiamo che ne esistano >10 milioni

Page 15: Gen pop1var

Prima di tutto: non c’è genetica senza variabilità

Variabilità morfologica

Page 16: Gen pop1var

1. Variabilità morfologica2. Variabilità serologica3. Variabilità proteica4. Variabilità del DNA

4.1. Varianti di singolo nucleotide: Single-Nucleotide Polymorphisms (SNP)4.2. Varianti di lunghezza: Inserzioni/delezioni (Indel), Variable Number of Tandem Repeats (VNTR), Short Tandem Repeats (STR)4.3. Varianti strutturali: Copy-Number Variation (CNV)

Page 17: Gen pop1var

1. Variabilità morfologica

Page 18: Gen pop1var

2. Variabilità serologica 3. Variabilità proteica

Page 19: Gen pop1var

Variabilità genetica: Proteine, Test serologici

J.B.S. Haldane: Frequenza dell’allele AB0*B in Europa

Page 20: Gen pop1var

Quanto DNA in una cellula?

Nell’uomo: 6 miliardi di paia di basi nei 46 cromosomi1 base ≈ 0,8 mμ6 miliardi di basi ≈ 5 m di DNA in 5-20 μ

5-20 μ

Page 21: Gen pop1var

Quanto DNA in una cellula?

6 miliardi di paia di basi1 base ≈ 0,8 mμ6 miliardi di basi ≈ 5 m di DNA in 5-20 μ

Foglio A4, 60 battute per riga. 30 righe = 1800 basi su ogni foglio, due facciate ≈ 2000 basi

Se 100 fogli = 1 cm6 miliardi di paia di basi ≈ 15000 cm = 150 m

Page 22: Gen pop1var

Variabilità genetica: Sequenze di DNA

Page 23: Gen pop1var

Applicazioni: Confronti fra sequenze in casi forensi

Page 24: Gen pop1var

Applicazioni: Genetic variation in Arabidopsis thaliana: SNPsNordborg et al., 2005 PLoS Biology

Page 25: Gen pop1var

Some human genome statisticsTotal size 3 190 491 286 bp (male, haploid) [was 3 283 984 159 in Dec. 2011]N of protein-coding genes 21 224 [were 20 442]N of RNA genes 15 952N of pseudogenes 14 427N of gene exons 679 045N of gene transcripts 194 015N of short variants 52 126 039 (+ 13.4 million: Lachance et al. 2012)N of structural variants 6 303 392

From Ensembl Release 68, July 2012

Nucleotide differences with chimp 1.5 %Structural differences with chimp 4%Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes)

From Wu et al. (2011) PLoS Genet

Page 26: Gen pop1var

Some human genome statistics

Total size 3 241 953 429 bp (male, haploid) [was 3 545 835 014 in June 2015] N of protein-coding genes 19 034 [were 20 296]N of pseudogenes 13 151 [were 14 424]N of non-coding genes 25 173 (7 703 small, 14 889 long + 2 307 unclassified)N of gene transcripts 198 634N of short variants 148 892 479 [were 52 million]N of structural variants 4 363 564 [were 6 million]N of proteins 79 086

Human Genome Assembly GRCh38.p10, January 2017

Nucleotide differences with chimp 1.5 %Structural differences with chimp 4%Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes)

From Wu et al. (2011) PLoS Genet

Page 27: Gen pop1var

Some human genome statistics

Page 28: Gen pop1var

I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il 10% del genoma

Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra parte contiene importanti siti di regolazione

Page 29: Gen pop1var

Human-mouse alignment

Human-chimp alignment

Page 30: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. Single Nucleotide Polymorphism: SNP2. Inserzione/delezione3. Variazione del numero di copie: Indel, STR, VNTR, 4. Variazione strutturale: CNV

Page 31: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. SNP

2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)2017: Almeno 148 milioni di SNPs nel genoma umano

Page 32: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. SNP: Restrizione

Page 33: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. SNP: Fasi preparatorie al sequenziamento

Page 34: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. SNP: Sequenziamento

Qual è il vantaggio del sequenziamento rispetto alla restrizione?

Page 35: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. SNP: Costruzione di aplotipi

Page 36: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. SNP: Effetti fenotipici

Cioè in regioni: introniche codificanti regolatrici intergeniche

Con sostituzioni: nonsinonime sinonime

Page 37: Gen pop1var

Tipi di polimorfismo studiati nel DNA

1. SNP: Effetti fenotipici

Page 38: Gen pop1var

Tipi di polimorfismo studiati nel DNA

2. Inserzione/delezione: Indel

Page 39: Gen pop1var

Tipi di polimorfismo studiati nel DNA

2. Inserzione/delezione: Indel

Pereira et al. Genet. Mol. Res. 5 (1): 63-71 (2006)

Page 40: Gen pop1var

Tipi di polimorfismo studiati nel DNA

2. Inserzione/delezione: Indel, inserzione di un retrovirus

Page 41: Gen pop1var

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR

Page 42: Gen pop1var

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR

Page 43: Gen pop1var

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR

Page 44: Gen pop1var

Tipi di polimorfismo studiati nel DNA3. Variazione del numero di copie: I loci STR del CODIS

Page 45: Gen pop1var

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR & VNTR

Page 46: Gen pop1var

Tipi di polimorfismo studiati nel DNA

4. Variazione strutturale: CNV

Page 47: Gen pop1var

Tipi di polimorfismo studiati nel DNA

4. Variazione strutturale: CNV

An ~11kb deletion on chromosome 8 revealed by ultra-high resolution CGH. Blue lines: individuals with two copies. Red line: individual with zero copies.

Page 48: Gen pop1var

Tipi di polimorfismo studiati nel DNA

4. Variazione strutturale: CNV

La CGH (Comparative Genomic Hybridization) rileva variazioni del numero di copie di geni.

Competizione per il legame su cromosomi in metafase di due DNA genomici marcati con fluorocromi diversi. Un DNA è estratto dal paziente in esame mentre l’altro DNA è un pool di DNA genomico di riferimento.

Si legherà in proporzione più DNA se maggiore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo. Viceversa se ne legherà meno se minore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo.

Page 49: Gen pop1var

4. Variazione strutturale: CNV

Marques-Bonet et al. (2009) Trends in Genetics 25:443-454

Page 50: Gen pop1var
Page 51: Gen pop1var

Average mutation rates for different polymorphisms(per locus per generation)

VNTR 10-1 – 10-2

STR 10-2 – 10-4

SNPs 10-6 – 10-8

Indel (retrovirus) 10-10 – 10-11

CNV ?

In the mitochondrial DNA hypervariable region, up to 5 x 10-5 per site per generation

Page 52: Gen pop1var

Quand’è che una popolazione può dirsi variabile?

A B

Page 53: Gen pop1var

Misure di diversità genetica

• N di alleli• Eterozigosi osservata:

Ho = N genotipi eteroz./N genotipi totali

• Eterozigosi attesa:

H = 1 –Σ pi2

(la frazione di individui che ci si aspetta siano eterozigoti a un gene sconosciuto)

Page 54: Gen pop1var

Quand’è che una popolazione può dirsi variabile?

A BN alleli = 5 N alleli = 2HO = 0.4 HO = 0.6H = 0.35 H = 0.5

Quando il genotipo individuale è difficile da prevedere

Page 55: Gen pop1var

Quand’è che una popolazione può dirsi variabile?

• Quando molti siti del DNA sono variabili

diversità nucleotidica:

π = N siti polimorfici / N totale siti• Quando ci sono grandi differenze molecolari fra I suoi membri

mismatch medio:

k = Σ dij / [N (N-1) / 2]

Page 56: Gen pop1var

Il mismatch è il numero di sostituzioni fra coppie di individui

TCTAGA

CCTAGA CCTAGG

CTTAGA CTTAAA

1 2

3

1

1

2 31

2 2

Σ dij = 18 k = 1.8

Page 57: Gen pop1var

Si può calcolare il mismatch sia all’interno delle popolazioni, sia fra di loro

k (rosa) = 2.0 k (fra) = 4.3 k (verde) 2.8

La distanza dAB di Nei è il rapporto fra il mismatch fra popolazioni e la media dei mismatch interni

dAB = k (fra) / [(k (rosa) + k (verde) / 2] = 4.3 / [(2.0 + 2.8) / 2] = 4.3 / 2.4 = 1.79

Page 58: Gen pop1var
Page 59: Gen pop1var
Page 60: Gen pop1var
Page 61: Gen pop1var
Page 62: Gen pop1var

Quanto polimorfismo c’è nel DNA della nostra specie?

Goldman et al. (1987) PNAS

Page 63: Gen pop1var

Livelli di diversità fra

uomo e scimpanzè

Tempi di dissociazione indicano una

differenza pari all’1.76%

(Sibley & Ahlquist, 1984)

Page 64: Gen pop1var

Livelli di polimorfismo nell’uomo: SNP

35 milioni di SNP fra uomo e scimpanzè. Su un totale di 3 miliardi di basi (genoma aploide) 1.23% (Chimpanzee Genome Sequencing Consortium, 2005)

Di questi SNP, 1.06% fissati fra specie 0.17% polimorfici nell’uomo

Kaessmann et al. (2001)

Page 65: Gen pop1var

Livelli di polimorfismo nell’uomo: Indel

Origine della duplicazione

Siti di inserzione

Marquès-Bonet et al. (2009)

Page 66: Gen pop1var

Livelli di polimorfismo nell’uomo: genomi completi

Nel 2010 erano 14 i genomi interamente sequenziati (6

miliardi di paia di basi)

Oggi

1-20 giorni

1 tecnico

< 1000 euro

60 x

1

1

Page 67: Gen pop1var

Africa del sud

Americani bianchi

Yoruba

Asiatici

Polimorfici almeno lo 0.13% dei siti

Nel 2010 erano 14 i genomi interamente sequenziati (6 miliardi di paia di basi)

Page 68: Gen pop1var

Nel 2017 i genomi umani interamente sequenziati sono migliaia

PopulationNumber of

Individual DNA SamplesAfrican Caribbean in Barbados [ACB] 79

African Ancestry in SW USA [ASW] 62

British From England and Scotland [GBR] 100

Chinese Dai in Xishuangbanna, China [CDX] 100

Colombian in Medellín, Colombia [CLM] 105

Finnish in Finland [FIN] 100

Han Chinese in Beijing, China [CHB] 120Han Chinese South [CHS] 150Iberian Populations in Spain [IBS] 150Japanese in Tokyo, Japan [JPT] 120

Kinh in Ho Chi Minh City, Vietnam [KHV] 100

Luhya in Webuye, Kenya [LWK] 120

Mexican Ancestry in Los Angeles [MXL] 71

Peruvian in Lima Peru [PEL] 105Puerto Rican in Puerto Rico [PUR] 105Toscani in Italia [TSI] 114

Yoruba in Ibadan, Nigeria [YRI] 62

Page 69: Gen pop1var

1000Genomes Project Consortium (2015) Nature 526: 68-74

Page 70: Gen pop1var

Livelli di polimorfismo nell’uomo: genomi completi

Page 71: Gen pop1var

N of markers

Samples FST Reference

599,356 SNPs

209 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.13 Weir et al. 2005

1,034,741 SNPs

71 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.10 Weir et al. 2005

1,007,329 SNPs

269 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.12 International HapMap Consortium 2005

443,434 SNPs

3845 worldwide distributed individuals 0.052 Auton et al. 2009

2,841,354 SNPs

210 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.11 Barreiro et al. 2008

243,855 SNPs

554 individuals from 27 worldwide populations 0.123 Xing et al. 2009

100 Alu insertions

710 individuals from 23 worldwide populations 0.095 Watkins et al. 2008

67 CNVs 270 individuals from 4 populations with ancestry in Europe, Africa or Asia

0.11 Redon et al. 2006

Le stime genomiche di FST per la popolazione umana globale sono ∼ 0.12

Le popolazioni umane esprimono ∼ 12% della varianza massima possibile, date le loro frequenze alleliche

Page 72: Gen pop1var

100%

100%100%

I membri della nostra comunità sono solo un po’ più simili a noi dei membri di comunità molto lontane

88%88%

88%

Cosa vuol dire?

Page 73: Gen pop1var

Due persone dello stesso continente possono essere

geneticamente più distanti di persone di

continenti diversi.

Page 74: Gen pop1var

In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an

average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010)

In media, ci sono differenze più grandi fra due africani che fra europei e asiatici

Page 75: Gen pop1var

Nota beneLa variabilità interna di una popolazione è solo uno degli

aspetti della variabilità genetica:

Variabilità tra individui della stessa popolazione

Variabilità tra individui di popolazioni diverse

Variabilità tra individui di gruppi di popolazioni diverse

eccetera

Page 76: Gen pop1var

PS: Cos’è una popolazione?

Hendrick: un gruppo di individui che si accoppiano e coesistono nel tempo e nello spazio

In pratica, si usano come unità operative di analisi gruppi di individui localizzati nello spazio, che spesso hanno in comune vari tratti culturali, come mezzi di sussistenza, lingua, casta (in India), religione.

La scelta dell’unità operativa di analisi dipende spesso (a) dalla domanda scientifica che ci si pone e (b) dalla effettiva disponibilità di dati

Page 77: Gen pop1var

Riassunto• La genetica di popolazioni è un ramo della genetica, e quindi si

occupa di studiare la variabilità.• Si può descrivere la variabilità o diversità genetica a partire dal

fenotipo (morfologia o proteina) o dal genotipo (DNA).• La diversità del DNA è dovuta a polimorfismi di singolo nucleotide

(SNP), alla presenza di elementi ripetuti (STR e VNTR) e alla presenza di delezioni, inserzioni o duplicazioni (CNV).

• Per quantificare la diversità genetica all’interno di una popolazione si ricorre a statistiche, fra cui: (1) numero di alleli; (2) eterozigosi osservata; (3) eterozigosi attesa; (4) polimorfismo nucleotidico; (5) differenza media a coppie o mismatch.

• Il mismatch medio può essere calcolato sia all’interno delle singole popolazione, sia fra popolazioni differenti, il che porta a una semplice statistica, la distanza dAB di Nei, che quantifica la differenza genetica fra popolazioni.