Capitolo 22 autori visione in finale

36
CONTENUTI DEL CAPITOLO Capitolo [ 22 ] Genetica di popolazioni Popolazione mendeliana di riferimento Legge di Hardy-Weinberg Mutazione Variabilità genetica Flusso genico Selezione Deriva genetica Inbreeding e “F statisticsVersione finale in visione autori

Transcript of Capitolo 22 autori visione in finale

Page 1: Capitolo 22 autori visione in finale

CONTENUTI DEL CAPITOLO

Capitolo

[22]Genetica di popolazioni

• Popolazione mendeliana di riferimento

• Legge di Hardy-Weinberg

• Mutazione

• Variabilità genetica

• Flusso genico

• Selezione

• Deriva genetica

• Inbreeding e “F statistics”

Vers

ione

finale

in vi

sione

aut

ori

Page 2: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 602 ] Capitolo 22

INTRODUZIONE

Nei primi capitoli abbiamo visto come la genetica formale costituisca un perfetto costrutto logico per spiegare la trasmissione dei caratteri eredita-

ri – a prescindere dalla conoscenza del materiale eredi-tario! Non c’è bisogno di sapere come è fatto il DNA per ricostruire le modalità con le quali un dato gene viene trasmesso di generazione in generazione.

Sotto questo punto di vista, la genetica di popolazioni è assai simile, in quanto consente di spiegare i meccani-smi di azione dei fattori che agiscono sulle popolazioni naturali senza preoccuparsi di conoscere la struttura del DNA, anche se noi, che ormai giochiamo a carte scoper-te sotto questo aspetto, utilizzeremo le conoscenze sul DNA per meglio chiarire molti dei punti trattati in que-sto capitolo. La vera differenza con la genetica formale è che, mentre in quel caso si studiano i genotipi per singoli geni in singoli individui, qui si studieranno singoli geni in grandi gruppi di individui. Il campo della genetica di popolazioni è assai vasto, quindi gli argomenti presentati in questo capitolo non coprono tutti gli aspetti; abbiamo cercato di esplicitare quelli maggiormente di base per una comprensione delle linee generali, lasciando a testi specializzati gli approfondimenti.

La genetica di popolazioni è basata essenzialmente sull’uso di modelli teorici per descrivere e spiegare lo sta-to, la struttura e l’evoluzione delle popolazioni. In questi termini, non sembra una cosa molto eccitante, ma i mo-delli di questa branca della Genetica sono serviti a dimo-strare l’esistenza dell’evoluzione, quindi a trasformarla da “teoria” a “legge”, anche se per ragioni storiche si con-tinua a parlare di “teoria dell’evoluzione”, così come del resto si parla anche di “teoria atomica” anche se nessuno dubita dell’esistenza degli atomi...

“L’Evoluzione non ha senso se non alla luce del-la Genetica...”, disse Theodosius Dobzhansky, un gran-de biologo evoluzionista della seconda metà del secolo scorso, e potremmo aggiungere a corollario “... delle po-polazioni”!

[ 22.1 ] GENETICA DI POPOLAZIONILa nascita della genetica di popolazioni è strettamen-te legata all’eredità di Darwin. Negli anni ’20 del seco-lo scorso, infatti, la Genetica era ormai divenuta una scienza matura, pronta per affrontare, con gli stru-menti a disposizione, il discorso lasciato in sospeso dal grande naturalista: Darwin aveva compreso esat-tamente l’essenza dell’evoluzione ma, a maggior suo credito, senza sapere in che modo i caratteri venissero trasmessi da una generazione all’altra. I meccanismi relativi stavano venendo elucidati pressoché in con-temporanea dall’altro genio della Biologia dell’800: Darwin non ebbe modo di leggere i lavori di Mendel, ma Mendel lesse Darwin e, in una lettera scritta pochi mesi prima della sua morte, predisse: “i miei lavori serviranno a spiegare i suoi”. Grandissima visione, in quanto fu proprio così. Toccò a Sir Ronald Aylmer Fi-

sher applicare le leggi della genetica mendeliana alle ipotesi evoluzionistiche di Darwin e scrivere uno dei libri più importanti della storia della biologia evoluti-va moderna, Genetical Theory of Natural Selection, dove la selezione naturale veniva ricondotta nell’alveo del mendelismo, il che consentì di spiegarla, valutarne gli effetti e infine dimostrarla (sintesi “neo-darwiniana”), e a John B. S. Haldane dimostrare che, qualunque cosa siano i geni (eravamo negli anni ’30 del secolo scorso), purché obbediscano alle leggi di Mendel e controllino i caratteri dell’organismo, la selezione naturale è in grado di produrre evoluzione a partire dalla variabi-lità genetica presente nelle popolazioni. La genetica di popolazioni moderna era nata.

Abbiamo appena introdotto una serie di termini, quali “selezione naturale” e “variabilità genetica”, che spiegheremo nel dettaglio nei prossimi paragrafi, ma conviene a questo punto anticiparne altri e definire una sorta di “piano di lavoro” che servirà a orientarsi in ma-niera semplice e immediata circa cosa stiamo studiando, per evitare che una serie di termini, quali “mutazione”, “migrazione”, “selezione” e “deriva”, sembrino scollega-ti gli uni dagli altri e che la genetica di popolazioni sia “quella cosa in cui tutte le parole finiscono in -zione”... Per non appesantire il testo, si veda allora il diagramma di Fig. 22.1 con la relativa didascalia.

Si veda l’animazione “Meccanismi dell’evoluzione” accessibile dalla versione e-book.

FIGURA 22.1 c Relazioni tra i fattori e le forze coinvol-ti nei processi evolutivi. La mutazione è l’unico fattore in grado di creare variabilità a livello del DNA, quindi nuovi alleli nel caso di geni, nuove sequenze nelle regioni non codifi can-ti, varianti alleliche nel caso dei marcatori (SSR, SNP, ecc.) e quant’altro. Tuttavia, la mutazione ha tassi troppo modesti per infl uenzare direttamente i livelli di variabilità genetica delle popolazioni. La variabilità genetica è invece prodotta dalla ricombinazione e dalla migrazione, a partire dal mate-riale grezzo fornito dalla mutazione. La presenza di variabilità è il prerequisito essenziale perché ci possa essere evoluzione, quindi variazione delle frequenze alleliche nel tempo. L’evolu-zione è data dalle due forze evolutive della selezione naturale e della deriva genetica casuale, che modifi cano le frequenze alleliche partendo dalla variabilità genetica presente nelle po-polazioni.

Evoluzione

Mutazione

Ricombinazione Migrazione

Variabilitàgenetica

Selezionenaturale

Derivagenetica

Vers

ione

finale

in vi

sione

aut

ori

Page 3: Capitolo 22 autori visione in finale

[ 22.1 ] Genetica di popolazioni [ 603 ]

[ 22.1.1 ] Popolazioni e loro caratteristicheCos’è una popolazione? Il concetto di popolazione è ab-bastanza vago e, per chi sarà interessato ad approfon-dire, se ne possono dare molte definizioni diverse. Per gli scopi di questo capitolo, definiamo una popolazione sulla base della sua caratteristica principale: un grande gruppo di individui in grado di riprodursi per via ses-suale. Inevitabilmente, spesso si tende a pensare a una popolazione umana, ma bisogna sforzarsi di pensare anche a popolazioni di animali e di piante, a cui spesso faremo riferimento in quanto presentano caratteristi-che di interesse che le popolazioni umane non presen-tano.

Come abbiamo già detto, la genetica di popolazioni si basa su modelli e un modello non è nient’altro che una caricatura della realtà, in cui una delle caratteristi-che viene evidenziata al fine di meglio comprenderla – non deve stupirci allora che, per meglio capire i fattori che agiscono sulle popolazioni naturali, si utilizzi come popolazione di riferimento una popolazione modello, che viene detta popolazione mendeliana.

Quali sono le caratteristiche della popolazione men-deliana, il nostro riferimento per lo sviluppo dei modelli successivi?1)  La popolazione è infinita (questo è veramente un

modello, nella realtà nessuna popolazione è costitu-ita da un numero infinito di individui).

2)  Gli individui della popolazione si incrociano in ma-niera casuale (popolazione panmittica).

3)  La capacità riproduttiva di tutti gli individui è la stessa.

4)  Gli alleli sono del tutto stabili.5)  Non c’è migrazione, né verso l’interno né verso l’e-

sterno.

Per capire la dinamica genetica delle popolazioni, andremo allora a vedere, mediante semplici modelli, cosa accade alla popolazione di riferimento quando uno di questi assunti non è rispettato.

22.1.1.1 Descrizione delle popolazioniNella genetica formale, per descrivere l’assetto gene-tico di un individuo per un dato gene, basta fornire il genotipo dell’individuo, ad esempio Aa. Ma per descri-vere l’assetto di una popolazione? La cosa più semplice sarebbe scrivere un lungo elenco, dove per ogni indivi-duo si scriverebbe il genotipo al locus in esame; questa soluzione sarebbe precisissima, ma non convoglierebbe molta informazione agli interessati, in quanto non sa-rebbe in grado di descrivere in modo efficace la popola-zione nel suo complesso.

Dobbiamo allora introdurre un nuovo concetto, quello di pool genico della popolazione. Così come un genotipo a singolo locus indica l’insieme di tutti gli alle-li di un dato individuo, il termine pool genico indica, per ogni locus, l’insieme di tutti gli alleli posseduti da tutti i componenti della popolazione e, anche ai fini dei cal-coli che utilizzeremo in seguito, si può immaginare la popolazione come un sacchetto al cui interno si trovi-no, alla rinfusa, tutti gli alleli presenti in quel momento (Fig. 22.2). Quindi, possiamo descrivere precisamente una popolazione attraverso il suo pool genico. A questo proposito si usano due indici: le frequenze genotipiche e le frequenze alleliche. Come dice il nome, si tratta di indici semplicissimi: delle frequenze, appunto. Definia-moli e facciamo un esempio.

La frequenza genotipica è il numero di individui con un determinato genotipo sul totale degli individui della popolazione. Esempio:

Genotipo AA Aa aa Totale

N° individui 100 600 300 1.000

Frequenza 101.000

6001.000

3001.000

Frequenza genotipica

P = 0,1 H = 0,6 Q = 0,3

Per convenzione, la frequenza genotipica degli omo-zigoti per il primo allele si chiama P, quella degli etero-zigoti H, quella degli omozigoti per il secondo allele Q.

Ma più interessante, e la base sulla quale si costrui-ranno i modelli successivi, è il concetto di frequenza al-lelica (detta anche frequenza genica, ma riteniamo che il termine “allelica” sia più chiaro): anche qui, come dice il nome, si tratta del numero di alleli di un certo tipo sul totale di tutti gli alleli della popolazione. Ancora per convenzione, p è la frequenza allelica del primo allele, q quella del secondo. Facciamo un esempio con gli stessi dati di prima:

Genotipo AA Aa aa Totale individui Totale alleli

N° individui 100 600 300 1.000 2.000

Frequenza allele A [ ]( )=

× +100 2 6002.000

p

Frequenza allele a q = 1 – p

Frequenza allelica p = 0,4 q = 0,6

A AA

AA

A A Aa

a

a

a a

FIGURA 22.2 c Pool genico di una popolazione. Si indica come pool genico l’insieme di tutti gli alleli di tutti gli indi-vidui della popolazione. In questo schema è rappresentato il caso più semplice, quello di un locus con due alleli. A sinistra gli alleli effettivi, a destra una rappresentazione in cui i diversi alleli a un locus sono indicati da palline colorate – forse più efficace graficamente per quello che riguarda le analisi suc-cessive.

Vers

ione

finale

in vi

sione

aut

ori

Page 4: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 604 ] Capitolo 22

Dato che si lavora su individui diploidi, il numero di alleli di un tipo sarà pari al doppio del numero di omo-zigoti per quell’allele (ogni omozigote ne porta due copie) sommato al numero degli eterozigoti (che ne hanno una sola copia). Quindi anche il numero totale di alleli è il doppio del numero degli individui e per ve-rificare la correttezza dei calcoli basta controllare che la somma delle frequenze sia uguale a uno (come per ogni somma di frequenze). Infatti, avremmo potuto calcolare q = [(300 3 2) + 600]/2.000 = 0,6, ma è più comodo q = 1 – p. Si noti anche che p = P + H/2 = 0,1 + (0,6/2) = 0,4, ma il sistema della conta degli alleli è più preciso, in quanto prevede meno approssimazioni ed è più facile da applicare nel caso in cui al locus studiato ci siano più di due alleli.

Il concetto di frequenza allelica e/o genotipica è applicabile, ed è applicato, al caso in cui si stiano studiando loci caratterizzati da serie alleliche anche molto numerose, come è il caso dei marcatori genetici molecolari (es. microsatelliti) che vengono al giorno d’oggi utilizzati nella ricerca in genetica di popola-zioni. Come abbiamo visto, basta contare il numero degli alleli di un dato tipo per trovare la frequenza allelica. Grazie a questo semplice concetto, è possibile utilizzare facilmente il metodo anche per geni legati al sesso: basta, infatti, ricordarsi che le femmine por-tano due alleli, mentre i maschi solo uno, e aggiustare i conti di conseguenza (questo vale quando il maschio è eterogametico, ma va ricordato che in diverse spe-cie è la femmina a essere eterogametica; vedi Cap. 5). Entrambi questi casi sono trattati in dettaglio nel BOX 22.1.

[ 22.1.2 ] Legge di Hardy-WeinbergSappiamo ora descrivere il pool genico di una popola-zione qualunque mediante le sue frequenze alleliche al locus (o ai loci) studiato. Possiamo dunque procedere a valutare gli effetti dei vari fattori sull’assetto delle popolazioni e, per fare questo, conviene ritornare alla popolazione mendeliana di riferimento descritta in pre-cedenza. Agli inizi del XX secolo venne dimostrata per questa popolazione la legge di Hardy-Weinberg, archi-trave della genetica di popolazioni.

? CURIOSITÀ

La nascita di questa legge rappresenta un caso emblemati-co e divertente di come ai biologi serva anche un’adeguata preparazione matematica e la storia di come Godfrey Ha-rold Hardy, grande matematico del Trinity College di Cam-bridge, abbia dato una mano al povero Punnett (sì, lui) si può trovare raccontata in svariati modi. L’articolo su Science (Science 28:49-50) “Mendelian proportions in a mixed popu-lation” del 10 luglio 1908 ha un incipit famoso: “To the Editor of Science: I am reluctant to intrude in a discussion concerning matters of which I have no expert knowledge, and I should have expected the very simple point which I wish to make to have been familiar to biologists. However, some remarks of Mr. Udny Yule, to which Mr. R. C. Punnett has called my attention, suggest that it may still be worth making”. La legge porta

anche il nome di August Weinberg, un medico di Colonia, che la derivò in modo indipendente all’incirca nello stes-so periodo di Hardy (attenzione alla pronuncia, il nome di Weinberg viene spesso pronunciato come se fosse inglese, mentre deve suonare “vainberg”).

La legge di Hardy-Weinberg dice che, data la popo-lazione mendeliana di riferimento e nel caso di un locus con due alleli A e a:1)  dopo una generazione di incrocio casuale, le fre-

quenze alleliche si stabilizzano e non variano più nel tempo;

2)  le frequenze genotipiche e le frequenze alleliche sono legate dalla relazione P = p2, H = 2pq, Q = q2.

Questi due punti possono essere facilmente dimo-strati; ancora per non appesantire il testo, una semplice dimostrazione è riportata nel BOX 22.2.

Una popolazione per cui valgano questi due punti vie-ne anche detta popolazione all’equilibrio di Hardy- Weinberg. Tutto qui? Tutto qui, ma da qui si è partiti per dimostrare che l’evoluzione esiste! Vediamo di com-mentare i due punti della legge di Hardy-Weinberg alla luce di quanto abbiamo già visto. Il punto 1 dice che in una popolazione mendeliana le frequenze alleliche non variano nel tempo, ma, dato che sulla popolazione men-deliana non agiscono le forze evolutive, questo vuol dire che se le frequenze alleliche di un locus non variano, quel locus non si evolve. Dal punto di vista genetico (e del resto della Biologia), dunque, l’evoluzione è la varia-zione nel tempo delle frequenze alleliche. Tenendo que-sto punto fermo, è possibile vedere l’evoluzione come un fenomeno omogeneo e capire come micro-evoluzio-ne, macro-evoluzione e gli altri termini usati per defi-nire fenomeni specifici possano rientrare sotto questo concetto fondamentale.

Il punto 2 è di solito meno considerato, ma sareb-be difficile sottovalutare l’importanza di quelle sempli-ci relazioni: semplicemente, è l’unico sistema a nostra disposizione per mettere in relazione le frequenze al-leliche con le frequenze genotipiche. Senza di esso, ci risulterebbe impossibile sviluppare modelli ulteriori. Vedremo nei prossimi paragrafi come, partendo da que-sta semplice legge, si possa costruire un edificio monu-mentale di conoscenze genetiche.

Una difficoltà che spesso si riscontra tra i non ad-detti ai lavori è quella relativa agli assunti della legge di Hardy-Weinberg, cioè alle caratteristiche della po-polazione di riferimento. Infatti, mentre è abbastanza semplice immaginare una situazione in cui le mutazioni siano pressoché inesistenti, la popolazione sia chiusa rispetto ai flussi migratori e tutti gli individui abbiano più o meno la stessa capacità riproduttiva (assenza di selezione), la numerosità infinita e l’incrocio casuale possono sembrare situazioni troppo distanti dalla real-tà per essere accettabili. Le risposte a queste obiezioni sono però molto semplici: una popolazione di poche centinaia di individui è pressoché indistinguibile da una popolazione infinita per quanto riguarda lo sviluppo dei modelli – parleremo di questo in modo più approfondi-to nel paragrafo dedicato alla deriva genetica. Per l’altro

Vers

ione

finale

in vi

sione

aut

ori

Page 5: Capitolo 22 autori visione in finale

[ 22.1 ] Genetica di popolazioni [ 605 ]

I modelli per la stima delle frequenze alleliche sono utilizzati anche in casi reali, in cui i loci studiati presentano più di due alleli, come è la regola, più che l’eccezione, o sono localizzati sui cromosomi sessuali. Il sistema di calcolo delle frequenze alleliche è co-munque esattamente lo stesso, solo che diventa un pochino più laborioso (nella realtà, per queste stime si utilizzano dei comodi software per l’analisi genetica di popolazioni). Vediamo un esempio, dove a un ipotetico locus D esistono quattro alleli: D1, D2, D3 e D4. I genotipi possibili diventano dieci – i quattro omozigoti e i sei possibili eterozigoti. Immaginiamo di aver genotipizzato per questo locus 1.000 individui:

Genotipo D1D1 D2D2 D3D3 D4D4 D1D2 D1D3 D1D4 D2D3 D2D4 D3D4 Totale

N° individui 100 80 140 60 160 220 80 100 40 20 1.000

N° alleli D1 200 160 220 80 660

N° alleli D2 160 160 100 40 460

N° alleli D3 280 220 100 20 620

N° alleli D4 120 80 40 20 260

Frequenze alleliche p = 0,33 q = 0,23 r = 0,31 s = 0,13

Come abbiamo già visto nel caso più semplice di due soli alleli al locus, basta anche in questo caso contare il numero degli alleli di un dato tipo per trovare le frequenze alleliche:

= = =660

2.0000,331f pD

= = =460

2.0000,232f qD

= = =620

2.0000,313f rD

= = =260

2.0000,134f sD

Con lo stesso sistema si calcolano anche le frequenze alleliche per geni legati al sesso; basta, infatti, ricordarsi che il sesso omo-gametico porta due alleli, mentre il sesso eterogametico solo uno. Facciamo un esempio nel caso dell’uomo, per un locus sul cromosoma X con due alleli, A e a; in questo caso, il genotipo dei maschi potrà essere solo A o a, in quanto emizigoti per i geni sul cromosoma X.

Genotipo ♀ AA Aa aa Totale N° alleli

N° ♀ 100 600 300 1.000 2.000

Genotipo ♂ A a Totale N° alleli

N° ♂ 200 800 1.000 1.000

Ricordiamo che nelle femmine sono presenti due alleli al locus, mentre nei maschi uno soltanto, quindi il totale degli alleli è [(1.000 3 2) + 1.000] = 3.000. Abbiamo allora:

[ ]( )= =

× + +=

100 2 600 2003.000

0,33f pA

[ ]( )= =

× + += − =

300 2 600 8003.000

1 0, 67f q pa

BOX 22.1 Stima delle frequenze alleliche per loci con più di due alleli

punto, è vero che in molte popolazioni, tra cui quelle umane, l’incrocio non è casuale, ma dipende da nume-rosi fattori, fra i quali nella nostra specie hanno partico-lare rilevanza quelli culturali, ma basterà ricordare qui l’indicazione già data per la genetica formale: quando si studia la Genetica, si consideri un gene per volta! Quin-

di, la legge di Hardy-Weinberg vale, purché la si conside-ri per ogni singolo locus: tornando alla specie umana, la scelta del partner viene fatta considerando molti fattori, ma nessuno usa come criterio il genotipo al locus della scichimato deidrogenasi del proprio partner (o di qua-lunque altro enzima, se è per questo).

Vers

ione

finale

in vi

sione

aut

ori

Page 6: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 606 ] Capitolo 22

La legge di Hardy-Weinberg consta di due importanti punti, entrambi derivati a partire dalla popolazione mendeliana di riferi-mento. La loro dimostrazione è semplice e la proponiamo rapidamente, partendo come al solito da un locus con due alleli, A e a.

1. Le frequenze genotipiche e le frequenze alleliche sono legate dalla relazione P = p2, H = 2pq, Q = q2. Ricordiamo che, come abbiamo già fatto nel testo, possiamo immaginare il pool genico di una popolazione come un sacchetto al cui interno si trovino, alla rinfusa, tutti gli alleli presenti in quel momento. Nel caso più semplice, saranno presenti due alleli A e a, con frequenza p e q, rispet-tivamente. Immaginiamo di voler produrre un nuovo individuo da questa popolazione: ci occorrono un allele (gamete) maschile e uno femminile, che, per l’assunto della legge di Hardy-Weinberg, saranno estratti a caso (per migliorare la vostra autostima, vestite i panni di un Demiurgo e create un nuovo individuo in� lando la mano sinistra e quella destra nel sacchetto del pool genico, estraendo poi un allele con ciascuna mano). Con che probabilità avrete estratto un gamete che porta un allele A? Con che probabilità un ga-mete che porta un allele a? La probabilità per ciascun allele sarà pari alla sua frequenza in quel momento: infatti, con 80 alleli A e 20 a, quindi p = 0,8 e q = 0,2, la probabilità di estrarre un allele A sarà 80/100 = 0,8. Quindi, la probabilità di ottenere uno qualunque dei tre genotipi possibili – AA, Aa e aa – sarà data dalla seconda legge delle probabilità, come negli specchietti seguenti.

Gameti A a

A p 3 p = p2 p 3 q

a q 3 p q 3 q = q2

AA

A

Aa

Aa

a

aa

p q

aq

Ap p2

q2

pq

pq

Ripetendo la procedura un numero elevato (in� nito) di volte, in totale abbiamo AA = p2, Aa = 2pq, aa = q2 e, dato che AA = P, Aa = H, aa = Q, abbiamo � nalmente P = p2, H = 2pq, Q = q2. Le frequenze genotipiche e quelle alleliche risultano legate fra loro da una relazione ben precisa.

2. Dopo una generazione di incrocio casuale, le frequenze alleliche si stabilizzano e non variano più nel tempo. Immagi-niamo una popolazione di partenza con frequenze alleliche iniziali p e q, pertanto con la presenza di tre genotipi – AA, Aa e aa – con frequenze genotipiche, rispettivamente, P, H e Q, pari a p2, 2pq e q2. Adesso e� ettuiamo una generazione di incroci casuali: tutti gli incroci possibili e le rispettive probabilità sono riportati di seguito.

Incrocio Probabilità dell’incrocio

AA 3AA p2 3 p2 = p4

AA 3 Aa 2 3 p2 3 2pq = 4p3q

AA 3 aa 2 3 p2 3 q2 = 2p2q2

Aa 3 Aa 2pq 3 2pq = 4p2q2

Aa 3 aa 2 3 2pq 3 q2 = 4pq3

aa 3 aa q2 3 q2 = q4

(Il fattore 2 che appare negli incroci in cui i genitori hanno genotipo diverso tiene conto della possibilità che uno sia maschio e l’altro femmina e viceversa). Adesso aggiungiamo alla tabella le possibili progenie per ciascun incrocio, con le probabilità relative ottenute dalla genetica formale (es. nell’incrocio AA 3 Aa, metà della progenie sarà AA e metà Aa).

IncrocioProbabilità

dell’incrocioProgenie

AAProgenie

AaProgenie

aa

AA 3 AA p4 p4 – –

AA 3 Aa 4p3q 2p3q 2p3q –

AA 3 aa 2p2q2 – 2p2q2 –

Aa 3 Aa 4p2q2 p2q2 2p2q2 p2q2

Aa 3 aa 4pq3 – 2pq3 2pq3

aa 3 aa q4 – – q4

Totale progenie p2 2pq q2

BOX 22.2 Dimostrazione della legge di Hardy-Weinberg

continua cc

Vers

ione

finale

in vi

sione

aut

ori

Page 7: Capitolo 22 autori visione in finale

[ 22.2 ] Mutazione [ 607 ]

Andiamo a veri�care la frequenza allelica di A dopo una generazione e lo facciamo per via indiretta, attraverso le frequenze genotipiche:- la frequenza di AA (P) è data dalla somma di tutti gli individui AA, quindi p4 + 2p3q + p2q2 = p2(p2 + 2pq + q2) = p2;- la frequenza di Aa (H) è data da 2p3q + 2p2q2 + 2p2q2 + 2pq3 = 2pq (p2 + 2pq + q2) = 2pq;- la frequenza di aa (Q) è data da p2q2 + 2pq3 + q4 = q2 (p2 + 2pq + q2) = q2;- la frequenza allelica di A è ricavabile come p = P + H/2 = p2 + 2pq/2 = p2 + p (1 – p) = p2 + p – p2 = p, dunque non è cambiata, così

come quella di a (q).

[ 22.1.3 ] Veri�ca dell’equilibrio di Hardy-Weinberg

Per determinare se un locus di una popolazione natura-le sia all’equilibrio, occorre dunque verificare che P = p2, H = 2pq, Q = q2, o, come si dice comunemente, che le fre-quenze genotipiche osservate corrispondano a quelle attese secondo la legge di Hardy-Weinberg. Come abbia-mo già visto nei capitoli dedicati alla genetica formale, il metodo di elezione per verificare se un dato osservato equivalga a un dato atteso è il test del χ2. Lo svolgimento del test è riportato nel BOX 22.3.

[ 22.1.4 ] Stima delle frequenze alleliche per marcatori dominanti

In tutti gli esempi riportati finora il numero di eterozi-goti era noto, perché abbiamo sempre assunto di utiliz-zare marcatori genetici a eredità co-dominante, in cui il rapporto genotipo-fenotipo è univoco. In effetti, nella moderna genetica di popolazioni e anche nelle sue appli-cazioni, come la genetica forense, si utilizzano solo mar-catori a eredità co-dominante; il motivo è che, con mar-catori a eredità dominante, gli omozigoti per l’allele do-minante e gli eterozigoti presentano lo stesso fenotipo, rendendo impossibile una stima esatta delle frequenze alleliche. In alcuni casi, però, non esiste altra scelta: im-maginiamo infatti di voler stimare la frequenza dell’al-lele responsabile di una malattia genetica recessiva per l’uomo in una data popolazione e che l’unica informazio-ne a nostra disposizione sia che la frequenza di persone malate è dell’1,6 per mille. Per definizione, se la malat-tia è autosomica recessiva, le persone malate saranno di genotipo aa, quindi questa è la frequenza genotipica Q: sfruttiamo allora la legge di Hardy-Weinberg e assu-miamo che la popolazione sia all’equilibrio di Hardy- Weinberg per questo locus. Sempre per definizione, al-lora Q = 0,0016 = q2, ricordando che questa equivalenza vale solo in una situazione di equilibrio. Avendo q2, ri-sulta facile trovare q = √–

q2 = 0,04 e dunque p = (1 – q) = 0,96. Possiamo dunque stimare che nella popolazione ci siano p2 = (0,96)2 = 0,922 (omozigoti AA) e 2pq = 0,077 (eterozigoti Aa), quindi che poco meno dell’8% delle

persone siano portatori sani dell’allele sfavorevole (si noti, peraltro, che gli eterozigoti Aa sono quasi 50 volte gli affetti, a indicare come la maggior parte degli alleli a si trovi allo stato eterozigote).

Praticamente, se stiamo studiando un carattere dominante, la migliore stima della frequenza allelica dell’allele recessivo sarà la radice quadrata della fre-quenza di individui che presentano il carattere – at-tenzione però, perché per questa stima abbiamo fatto l’assunzione piuttosto forte che la popolazione fosse in equilibrio a quel locus e questo potrebbe benissimo non essere vero, ad esempio nel caso di una malattia molto seria, dove il carattere sarebbe sottoposto a se-lezione. Peraltro, non abbiamo scelta: o non stimiamo q o ci accontentiamo di una stima distorta, che potrà essere eventualmente migliorata con l’analisi di altri campioni. Si nota quindi l’importanza della legge di Hardy-Weinberg: senza di essa, non avremmo saputo neanche da dove partire per cominciare l’analisi o per fare previsioni quali, ad esempio, la frequenza di ete-rozigoti attesi o la probabilità di incrocio tra due geno-tipi. (Se si sono stimate p e q mediante questo sistema, cioè assumendo l’equilibrio di Hardy-Weinberg, non ha senso andare a verificare se la popolazione sia all’e-quilibrio, sarebbe un ragionamento circolare – inoltre, non ci sarebbero gradi di libertà a disposizione per un test statistico!).

[ 22.2 ] MUTAZIONECominciamo adesso a passare in rassegna gli effetti sul pool genico dei fattori principali descritti nel diagram-ma di Fig. 22.1 – il che corrisponde, come abbiamo detto, a vedere cosa succede se gli assunti della legge di Hardy-Weinberg non vengono rispettati. La prima forza che studieremo sarà la mutazione, in quanto unica re-sponsabile della produzione di nuovi alleli, quindi pri-mo motore dell’evoluzione, ma non la sua responsabile.

I meccanismi molecolari della mutazione genica e la descrizione delle conseguenze delle varie classi di mu-tazioni sul fenotipo sono stati oggetto dettagliato del Cap. 12. Partiremo da questo per formulare dei semplici modelli che spieghino le conseguenze sul pool genico dell’esistenza di mutazione e retromutazione.

Vers

ione

finale

in vi

sione

aut

ori

Page 8: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 608 ] Capitolo 22

Abbiamo appena genotipizzato, mediante un marcatore co-dominante, un campione di mille animali da una popolazione di una specie di rana che non è in grado di saltare ed è per questo chiamata Rana rimanae. Siamo in grado di compilare una tabella con i risultati della genotipizzazione a questo locus, detto B:

Genotipo BB Bb bb Totale

Numero di rane 140 620 240 1.000

La prima cosa da fare è stimare le frequenze alleliche, che rappresentano comunque il punto di partenza per ogni tipo di analisi che si voglia condurre in genetica di popolazioni.

[ ]( )= =

× +=( )

140 2 6202.000

0, 45f B p

f(b) = q = 1 – p = 0,55

Ricordiamo che la legge di Hardy-Weinberg dice che un locus si trova all’equilibrio se le frequenze genotipiche osservate corri-spondono a quelle attese nel caso in cui nella popolazione gli incroci avvengano in maniera casuale. Le frequenze genotipiche attese in questo caso sono in relazione con le frequenze alleliche secondo la relazione P = p2, H = 2pq, Q = q2; quindi, non resta che stimarle per il nostro campione. Ad esempio, il numero di individui attesi per la classe BB è (p2 3 1.000) = (0,452 3 1.000) = 202,5 – non dobbiamo preoccuparci che l’atteso non sia un numero intero, in quanto siamo all’interno di un modello statistico. Riassu-mendo per le altre due classi e aggiornando la tabella:

attesi Bb = 2 3 0,45 3 0,55 3 1.000 = 495attesi bb = 0,552 3 1.000 = 302,5

Genotipo BB Bb bb Totale

Numero osservato 140 620 240 1.000

Numero atteso 202,5 495 302,5 1.000

Esiste una notevole discrepanza tra il numero di rane osservato e quello atteso; dobbiamo, però, veri�care con quale probabilità un tale scostamento sia potuto avvenire per e�etto del caso (in questa situazione, per e�etto del campionamento), quindi e�et-tuare un test statistico. Il metodo di elezione per veri�care se un dato osservato equivalga a uno atteso è il test del χ2. Ricordiamo la formula per il test:

∑χ( )

=−

2

2f f

foss att

att

Nel nostro caso possiamo dunque scrivere:

χ( ) ( )( )

=−

+

+−

=

140 202,5202,5

620 495495

240 302,5302,5

63,7722 2 2

Dobbiamo veri�care sulle tavole se questo valore supera il valore soglia che corrisponde a una probabilità del 5% - ma ricordiamo che le distribuzioni del χ2 sono tante quanti sono i gradi di libertà. Quanti gradi di libertà possiede il “nostro” χ2? La risposta im-mediata è due, in quanto stiamo lavorando su tre classi (i tre genotipi), ma in questo caso è anche la risposta sbagliata! Infatti, le frequenze attese sono stimate a partire dalle frequenze alleliche, che sono legate tra loro dalla relazione (p + q) = 1: questo signi-�ca che basta stimare p (o q) per avere stimato entrambe e ciò fa perdere un grado di libertà. Dobbiamo, dunque, utilizzare la distribuzione di χ2 per un grado di libertà, dove il valore soglia per il 5% è 3,84. Dato che 63,77 è maggiore della soglia, ri�utiamo l’ipotesi che la popolazione di Rana rimanae sia all’equilibrio di Hardy-Weinberg per il locus B.

BOX 22.3 Esempio di verifica dell’equilibrio di Hardy-Weinberg

La mutazione è un evento casuale e raro; per il no-stro modello immaginiamo che avvenga a un tasso u per generazione, secondo:

A → a

Immaginiamo, inoltre, per non complicare il modello con fattori legati alla selezione, che la mutazione che stiamo considerando sia neutra, ad esempio una mu-tazione sinonima, o in una regione non codificante. A

ogni generazione, dunque, un certo numero di alleli A diventa a e possiamo stimarlo come p (la frequenza al-lelica di A) moltiplicato u, il tasso di mutazione. Quindi, partendo dalla generazione zero, dopo una generazione la frequenza allelica di A diventa:

p1 = p0 – p0u = p0 (1 – u)

(il pedice indica il numero della generazione). Lo stes-so ragionamento si applica alle generazioni successive,

Vers

ione

finale

in vi

sione

aut

ori

Page 9: Capitolo 22 autori visione in finale

[ 22.3 ] Variabilità genetica [ 609 ]

dove vale sempre pn = pn – 1(1 – u). Ad esempio, alla se-conda generazione si avrà:

p2 = p1 – p1u

ma, dato che abbiamo appena ottenuto che p1 = p0 (1 – u), sostituendo si ottiene:

p2 = p0 (1 – u) – u p0 (1 – u)

Raccogliendo (1 – u) rimane:

p2 = (1 – u) (p0 – u p0) = p0 (1 – u)2

Procedendo in questo modo anche per le generazio-ni successive, la formula può essere generalizzata a dare:

pn = p0 (1 – u)n

che dice di quanto sarà variata p dopo n generazioni, ammettendo che il tasso u rimanga costante. Da questo semplice modello si evidenzia come la variazione delle frequenze alleliche dovuta alla sola mutazione sia incre-dibilmente lenta, a un tasso u tra 10–5 e 10–6 tipico negli eucarioti. Ammettendo, ad esempio, di partire da p = 1, ci vorrebbero circa 70.000 generazioni per giungere a p = 0,5, come mostrato in Fig. 22.3. Con questi tempi, la mutazione non può dunque essere ritenuta responsabi-le di una variazione significativa delle frequenze alleli-che e quindi dell’evoluzione delle popolazioni. L’impor-tanza della mutazione risiede nel produrre nuovi alleli, quindi il materiale grezzo per l’azione delle altre forze evolutive.

[ 22.2.1 ] Retromutazione – un nuovo equilibrio per le frequenze alleliche

Dalla genetica molecolare sappiamo però che non esiste solo la mutazione tout court, o in avanti, ma che esistono diverse forme di retromutazione, cioè mutazioni dall’al-lele mutato all’allele selvatico. Possiamo così provare a complicare un poco il modello del paragrafo preceden-te, immaginando che, dette ancora p e q le frequenze alleliche rispettivamente di A e a, a ogni generazione non esista solo un tasso di mutazione u per (A → a), ma

anche un tasso di retromutazione v per (a → A). A ogni generazione, quindi, un numero pari a pu di alleli A di-venta a, mentre un numero pari a qν di alleli a diventa A. Se questa situazione si protraesse per un gran numero di generazioni e in assenza di altri fattori, si potrebbe raggiungere una situazione di equilibrio, nel caso in cui le due quantità si eguagliassero, quindi quando:

pu = qν

Sostituendo q = (1 – p), si ottiene: pu = (1 – p) v = ν – pν. Risolvendo per p (e usando la stessa procedura per q), si trova che le frequenze alleliche all’equilibrio (per convenzione indicate con p̂ e q̂) sono:

p̂ = v / (u + v)  e  q̂ = u / (u + v)

Questo caso molto particolare rappresenta un modo di raggiungere un equilibrio per le frequenze alleliche che non sia quello previsto da Hardy-Weinberg. Per conclu-dere, dato che in media il tasso di retromutazione è di un ordine di grandezza inferiore a quello di mutazione (valori ragionevoli possono essere u = 10–5 e ν = 10–6), se mai si raggiungesse l’equilibrio basato sulla mutazione, nel caso di due alleli si avrebbero p̂ ≈ 0,09 e q̂ ≈ 0,91. Si tenga presente che i tempi richiesti sono però lunghis-simi – più di 60.000 generazioni per giungere a metà del valore di equilibrio – dimostrando ancora una volta la scarsa capacità della mutazione da sola di influire sul pool genico delle popolazioni.

Si veda la simulazione “Mutazione” accessibile dalla versione e-book.

[ 22.3 ] VARIABILITÀ GENETICASempre tenendo d’occhio il diagramma di Fig. 22.1, è giunto il momento di occuparsi delle forze che creano variabilità genetica nelle popolazioni, ma diventa a que-sto punto essenziale definire cosa sia la variabilità (o di-versità) genetica e come sia possibile misurarla. Sareb-be difficile sottostimare l’importanza di questo concet-to, che è alla base dell’evoluzione e ha anche raggiunto un livello di fama notevole, anche al di là degli ambienti scientifici, nel campo della divulgazione; infatti, la va-

1,00,90,80,70,60,50,40,30,20,10,0

p

50.000 100.000 150.000 200.000

Numero di generazioni

µ = 10–5

FIGURA 22.3 c Variazione della frequenza di un allele A in funzione del numero di generazioni per un tasso di muta-zione pari a 10–5.

Vers

ione

finale

in vi

sione

aut

ori

Page 10: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 610 ] Capitolo 22

riabilità genetica è una delle tre componenti classiche della biodiversità:

■ diversità degli ecosistemi; ■ diversità specifica (le diverse specie che occupano

un sistema); ■ diversità genetica (i genotipi diversi degli individui

di una specie).

Quindi, occuparsi di variabilità genetica non è im-portante solo per motivi teorici, ma anche per questioni pratiche legate alla conservazione delle risorse naturali. Nella Fig. 22.4 sono riportati alcuni degli aspetti e dei problemi relativi a ciascuna componente della biodiver-sità.

Per avere genotipi diversi, pertanto diversità gene-tica, il requisito essenziale è che a un locus siano pre-senti almeno due alleli. Diamo un’importante defini-zione a proposito: un locus è polimorfico se presenta almeno due alleli, ciascuno con frequenza superiore a 0,05. Questa definizione è stata aggiornata, nel tempo, quando si sono avuti a disposizione i marcatori mole-colari per lo studio delle popolazioni naturali; infatti, utilizzando questi ultimi, specialmente quelli basati sul DNA, è molto frequente il caso in cui si abbiano ben più di due alleli, ma con frequenze più basse del 5%. Dato che, comunque, la somma delle frequenze di questi alle-li rappresenta una quota significativa del pool genico, si ritiene polimorfico un locus con almeno due alleli, cia-scuno con frequenza superiore a 0,01.

Da questa definizione discende il primo indice di mi-sura della variabilità genetica, il polimorfismo, indica-to con P: per polimorfismo si intende semplicemente la frequenza di loci polimorfici in una popolazione. Se, ad esempio, si stesse studiando una popolazione usando 10 marcatori e si trovasse che otto di essi sono polimor-fici, P sarebbe pari a 0,8.

Un altro indice della variabilità genetica è l’eterozi-gosità, H. Per eterozigosità si intende la frequenza di

eterozigoti a un dato locus; quindi, se la popolazione fosse all’equilibrio di H-W, sarebbe H = 2pq. H è un in-dice versatile, infatti consente di avere stime a livello di popolazione e di specie, confrontabili tra loro. Immagi-niamo di aver studiato tre popolazioni di una data spe-cie per quattro loci e di aver ottenuto i risultati seguenti, dove nel corpo della tabella è riportata H per ogni locus e ogni popolazione:

PopolazioneLocus

ALocus

BLocus

CLocus

DH

media

1 0,2 0,4 0,5 0,1 0,3

2 0,4 0,6 0,7 0,3 0,5

3 0,7 0,5 0,4 0,8 0,6

È possibile ottenere una H media per popolazione, mediando le H a singolo locus, ma anche una H me-dia per tutte le popolazioni studiate come (0,3 + 0,5 + 0,6)/3 = 0,47. Questo indice è largamente usato nella letteratura scientifica, ma lo è ancora di più un suo de-rivato, che possiamo ben definire la più importante sti-ma della variabilità genetica, l’eterozigosità attesa He, detta anche eterozigosità di Nei, dal nome del popola-zionista giapponese Masatoshi Nei, che la propose per primo. L’importanza di He deriva dal fatto che nella sti-ma comprende le frequenze alleliche del locus studiato:

He = 1 – Σxi2

dove con xi si intende ciascuna delle frequenze degli al-leli al locus. Ad esempio, se si trovassero tre alleli a un locus A, con frequenze 0,2, 0,3 e 0,5, He risulterebbe:

He = 1 – (0,22 + 0,32 + 0,52) = 1 – 0,38 = 0,62

Anche per He si riportano comunemente i valori medi per locus e per popolazione. Come mai He si chiama ete-rozigosità “attesa” (“expected”)? Immaginiamo di avere una popolazione all’equilibrio di Hardy-Weinberg per

Componentidella

biodiversità

StrutturaleModelli territorialiStruttura degli habitatStruttura delle popolazioniStruttura genetica

FunzionaleProcessi geneticiProcessi demogra�ciInterazioni interspeci�cheFattori a carico del territorio

ComposizionaleGeniSpecie - PopolazioniComunità - EcosistemiTipi di territorio

FIGURA 22.4 c Componenti della biodiversità. Il grafi co mostra le diverse componenti della biodiversità, a vari livelli di orga-nizzazione e in relazione alla composizione, alla funzione e alla struttura delle componenti stesse. Generalmente, quando si parla di biodiversità, ci si riferisce a quella “composizionale”, tradizionalmente suddivisa in diversità genetica, diversità specifi ca e diver-sità di ecosistemi e territori. Nella fi gura sono riportati anche i fattori che defi niscono la biodiversità a livello strutturale (in alto) e quelli che infl uenzano a livello funzionale gli aspetti composizionali (a destra). Per una corretta gestione ambientale sarebbe opportuno tenere conto di tutti questi aspetti, ma ciò avviene raramente e, soprattutto, in questi casi si fa riferimento solo agli aspetti più “spettacolari” relativi alla parte composizionale – specie, vedi i grandi mammiferi “carismatici”, come leoni, panda e balene. (Adattata dal rapporto GTOS – FAO 2002/2003).

Vers

ione

finale

in vi

sione

aut

ori

Page 11: Capitolo 22 autori visione in finale

[ 22.4 ] Migrazione o � usso genico [ 611 ]

un locus con due alleli, in cui quindi le frequenze geno-tipiche siano esattamente ai valori p2, 2pq e q2, con p e q le frequenze alleliche. Proviamo a stimare He per questa popolazione:

He = 1 – (p2 + q2) = 1 – p2 – q2

ma ricordando che deve essere

p2 + 2pq + q2 = 1

risulta He = 2pq.Ecco perché “attesa”: He è il valore atteso per la fre-

quenza degli eterozigoti se la popolazione è all’equili-brio di Hardy-Weinberg; pertanto, in questo caso, He = H. Per evitare confusione, stabiliamo dunque che d’ora in poi, per indicare H, useremo Ho, che sta per eterozi-gosità osservata (observed), a indicare quella effetti-vamente misurata per quel locus. In effetti, la maggior parte dei software utilizzati in genetica di popolazioni usa l’entità dello scostamento di He da Ho per verificare se un locus sia all’equilibrio di Hardy-Weinberg, ma ve-dremo più avanti come lo scostamento tra He e Ho venga utilizzato per altre importantissime stime.

[ 22.3.1 ] Teorema di FisherStrettamente legato ai concetti di variabilità genetica e di evoluzione è un importante teorema della genetica di popolazioni, formulato ancora una volta da Sir Ronald A. Fisher. In termini accessibili, anche se semplificati, il teorema dice che “la capacità adattativa di una popola-zione (fitness, vedi dopo) è direttamente proporzionale alla sua variabilità genetica (additiva, vedi Cap. 23) in un dato momento”. Quindi, a livelli più elevati di varia-bilità corrisponde una maggiore capacità della popo-lazione di adattarsi a mutate condizioni ambientali. Si pensi semplicemente a un caso estremo, in cui un locus importante per la sopravvivenza sia monomorfico nella popolazione A, quindi tutti gli individui abbiano lo stes-so genotipo, mentre nella popolazione B sono presenti due alleli e quindi tre genotipi; se le condizioni ambien-tali mutassero, la popolazione B sarebbe avvantaggiata, in quanto avrebbe maggiori probabilità che uno dei suoi genotipi sia adattato anche alle nuove condizioni.

[ 22.4 ] MIGRAZIONE O FLUSSO GENICOMediante la migrazione una popolazione può acquisire nuovi alleli, derivanti dal fatto che gli individui immi-grati provengono da un’altra popolazione. Più corretto è parlare di flusso genico, in quanto, ad esempio nelle specie vegetali, il trasferimento degli alleli da una popo-lazione all’altra può avvenire senza che vi sia un movi-mento di individui (del resto, sembra che solo la Foresta di Birnam fosse in grado di muoversi – Macbeth, Atto V, Scena V), ma semplicemente perché gli alleli sono tra-sportati dal polline. Il movimento degli alleli fa sì che le frequenze degli alleli nella popolazione ricevente vari-no. Quindi, a rigor di termine, anche la migrazione do-vrebbe essere considerata una forza evolutiva; tuttavia,

dato che il flusso genico è solitamente limitato nel tem-po e di entità molto variabile, si preferisce riconoscere alla migrazione il ruolo preminente di forza che crea va-riabilità genetica nelle popolazioni. Sotto questo aspet-to, essa rappresenta dunque un potente fattore legato all’evoluzione e vedremo come problemi di differenzia-mento e di evoluzione divergente tra popolazioni pos-sano essere spiegati da semplici modelli che illustrano cosa avvenga al pool genico di popolazioni indipendenti o legate da flussi migratori.

Diamoci dunque alla modellizzazione: il flusso ge-nico è espresso di solito come tasso m di migrazione, definito come la proporzione di alleli che sono di origi-ne migrante per generazione in una popolazione. Nel-la realtà è molto difficile stimare direttamente il flusso genico, che viene dedotto di solito dalla distribuzione spaziale dei genotipi, mentre la stima spesso è relativa a Nm, il tasso di migrazione per la numerosità N della popolazione, interpretato come il numero effettivo di migranti.

Fattori importanti nella determinazione dell’entità del flusso genico sono:

■ la vagilità, ovvero la mobilità degli individui; ■ la filopatria, ovvero la fedeltà al sito di origine; ■ la scala di dispersione, ovvero a quali distanze geo-

grafiche gli organismi animali percepiscono l’am-biente come uniforme.

Dato che la migrazione è un fenomeno che ha effetti così importanti sulla storia evolutiva delle popolazioni, i modelli che considereremo hanno preso un nome geo-grafico, a indicare appunto la loro applicabilità a situa-zioni reali sul territorio.

Modello dell’arcipelagoConsideriamo il flusso genico tra un certo numero di po-polazioni, fino a un certo momento isolate fra loro, pro-prio come isole in un arcipelago (Fig. 22.5), per un locus con due alleli. Le tre popolazioni, per semplicità consi-derate delle stesse dimensioni, hanno frequenze q mol-

FIGURA 22.5 c Modello dell’arcipelago per il fl usso ge-nico. Tre popolazioni, collegate da movimento di individui o di geni, tendono, dopo un certo periodo di tempo (indicato dalla freccia rossa), a ridurre le differenze tra le rispettive fre-quenze alleliche. Questo può comportare un aumento della variabilità genetica entro le popolazioni.

q = 0,8 q = 0,3

q = 0,7

m

q = 0,6 q = 0,6

q = 0,6

mVers

ione

finale

in vi

sione

aut

ori

Page 12: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 612 ] Capitolo 22

to diverse, con media 0,6, e con valori di He (He = 1 – Σxi2)

per ciascuna delle popolazioni pari a 0,32, 0,42 e 0,42, finché non vengono connesse da un flusso migratorio di entità m (frecce nella figura). Se il flusso genico conti-nua per un certo numero di generazioni, tutte le popola-zioni avranno le stesse frequenze alleliche, pari alla me-dia iniziale di tutte le popolazioni, con He = 0,48. Quindi, la variabilità genetica entro le popolazioni sarà aumen-tata, mentre le differenze tra le popolazioni si saranno azzerate. Lo scopo è raggiunto: partendo dalla maggiore variabilità genetica presente, gli effetti della selezione naturale (di cui parleremo nei prossimi paragrafi; vedi anche Fig. 22.1) nei diversi ambienti in cui si trovano le popolazioni saranno più evidenti.

Modello isola-continenteAncora più interessante per le conseguenze che ne deri-vano è il secondo modello, in cui una popolazione resi-dente (“isola”) riceve una frazione m di migranti da una seconda popolazione (“continente”). È già evidente una possibile connotazione ecologico-demografica di que-sto fenomeno: una grossa popolazione stanziale sulla terraferma colonizza un’isola adiacente e poi, per diver-se generazioni, individui (o gameti) dalla popolazione principale continuano a “migrare” sull’isola. Il modello è rappresentato nella Fig. 22.6 per il caso di un locus con due alleli, A e a.

Se indichiamo con p0 la frequenza allelica di A dell’i-sola alla generazione zero e P la stessa frequenza sul continente, possiamo facilmente scrivere un’equazione che ci dirà come varierà p dopo una generazione. Im-maginiamo che dal continente giunga sull’isola una fra-zione m di migranti: dopo una generazione, possiamo dire che la frequenza allelica di A sarà data dalla media pesata delle frequenze dell’isola e dei migranti:

p1 = (1 – m) p0 + mP

La popolazione dell’isola è, infatti, ora composta da una frazione m di migranti e da una frazione (1 – m) di re-sidenti. Dato che siamo interessati alla variazione delle frequenze alleliche dovuta al flusso genico, calcoliamo la variazione della frequenza allelica dopo una genera-zione, Dp = p1 – p0, come:

Dp = (1 – m) p0 + mP – p0 = p0 – mp0 + mP – p0 = m (P – p0)

Questa equazione dimostra per via analitica un paio di aspetti che erano già intuitivi, cioè che la variazione del-

le frequenze alleliche causata da una generazione di mi-grazione è direttamente proporzionale (1) alla numero-sità dei migranti m e (2) alla differenza nelle frequenze alleliche tra le due popolazioni.

Possiamo elaborare ulteriormente il modello, imma-ginando che un fenomeno migratorio non si esaurisca nel breve arco di una generazione, ma che le due popo-lazioni rimangano collegate da un flusso genico unidire-zionale (continente → isola) per un certo numero n di generazioni. Questo è importante perché “sull’isola” la popolazione modificherà le proprie frequenze alleliche rispetto a quelle di partenza. Cominciamo a stabilire la differenza tra la frequenza dell’isola, p1, e quella del continente, P, dopo una generazione:

p1 – P = (1 – m) p0 + mP – P = (1 – m) (p0 – P)Alla seconda generazione, dato che p2 è data da:

p2 = (1 – m) p1 + mPe ricordando che:

p1 = (1 – m) p0 + mPsi ottiene:

p2 = (1 – m)[(1 – m) p0 + mP] + mP

A questo punto, ricalcoliamo la differenza tra la fre-quenza dell’isola e quella del continente, dopo due ge-nerazioni:

(p2 – P) = (1 – m)[(1 – m) p0 + mP] + mP – Pche diventa, raccogliendo:

(p2 – P) = (1 – m) [(1 – m) p0 + mP] – (1 – m) P(p2 – P) = (1 – m) [(1 – m) p0 + mP – P](p2 – P) = (1 – m) [(1 – m) p0 – (1 – m) P](p2 – P) = (1 – m) [(1 – m) (p0 –P)]

e quindi:(p2 – P) = (1 – m)2(p0 – P)

Procedendo allo stesso modo per n generazioni, si può derivare l’equazione più generale:

(pn – P) = (1 – m)n (p0 – P)Questa importante relazione, oltre a fornire un metodo veloce per stimare la divergenza delle frequenze alleli-che, può servire anche a stimare m, nel caso in cui sia noto il numero di generazioni durante le quali è avve-nuto flusso genico. Un esempio di stima dei parametri di questa equazione è riportato nel BOX 22.4.

Riassumendo, il flusso genico è il fattore principale di produzione di variabilità genetica nelle popolazioni naturali e, da un punto di vista evolutivo, la sua entità e le modalità attraverso le quali si svolge hanno un no-tevole impatto sulla capacità colonizzatrice delle specie e/o sulla loro capacità di adattamento a nuove condi-zioni ambientali.

[ 22.5 ] SELEZIONE NATURALESu di una popolazione che presenti variabilità genetica possono agire le due grandi forze evolutive: la selezione naturale e la deriva genetica casuale. Quando su di un

FIGURA 22.6 c Modello isola-continente per il fl usso ge-nico. Una frazione m di migranti giunge nella popolazione “dell’isola”, caratterizzata da una diversa frequenza dell’al-lele A. La popolazione risultante, composta da m migranti e da (1 – m) residenti, avrà una frequenza allelica risultante che sarà la media pesata delle frequenze alleliche prima della mi-grazione (vedi testo).

f(A) = P

f(A) = p0

f(A) = p1

m

1 – m

Vers

ione

finale

in vi

sione

aut

ori

Page 13: Capitolo 22 autori visione in finale

[ 22.5 ] Selezione naturale [ 613 ]

La relazione (pn – P) = (1 – m)n (p0 – P), oltre alla sua importanza teorica, presenta applicazioni pratiche nel campo della genetica della conservazione, grazie al fatto che consente di stimare una qualunque delle incognite conoscende le altre. In modo partico-lare, è di interesse la stima di n, il numero di generazioni, in quanto consente di avere un’idea dei tempi relativi a un dato proces-so. Proviamo a utilizzare la relazione per un problema ipotetico, ma che potrebbe accadere nella realtà. Il cane (Canis familiaris) e il lupo (Canis lupus) sono considerati due specie separate, ma in regioni in cui popolazioni di lupo e di cane si trovino a vivere insieme (simpatricamente) è possibile che incroci fertili tra le due specie avvengano ancora. Immaginiamo una situazione in cui alcuni animali di una popolazione di cani residenti in una pianura vivano al margine delle zone di montagna, abitate dal lupo. In questa regione possono dunque avvenire gli incroci.Per lo studio utilizziamo un marcatore della classe dei microsatelliti, CL, con due alleli, CL1 e CL2; a livello mondiale, l’allele CL1 ha una frequenza di 0,9 nella popolazione di lupi e non è presente nei cani, mentre nei cani “di montagna” ha una frequenza di 0,4. Possiamo allora dire, secondo la convenzione che abbiamo utilizzato, che P = 0,9, p0 = 0 e pn = 0,4 – in altri termini, dalla popolazione del continente (i lupi), a ogni generazione entrano alleli CL1 nella popolazione dell’isola (i cani di montagna); all’ini-zio di questo scambio di materiale genetico, la miglior stima della frequenza allelica nei cani di montagna è l’attuale frequenza dell’allele nel resto del mondo. Quindi:

(pn – P) = (1 – m)n (p0 – P) → (0,4 – 0,9) = (1 – m)n (0,0 – 0,9)

Assumendo che siano passate 20 generazioni da quando cani e lupi sono entrati in contatto e risolvendo:

0,5 = 0,9 (1 – m)20 → (1 – m)20 = 0,556 → (1 – m) = 0,971 → m = 0,03 circa

Questo vuol dire che, a ogni generazione, il �usso genico è del 3% circa: il 3% degli alleli dei cani di questa regione proviene dai lupi.

BOX 22.4 Flusso genico e divergenza tra popolazioni

locus c’è effetto della selezione, si va contro l’assunto di uguale capacità riproduttiva degli individui della popo-lazione mendeliana di riferimento. Cosa significa esat-tamente questo? Come Darwin aveva capito, se alcuni individui di una popolazione si riproducono più effica-cemente di altri, nella progenie si troverà una quota più elevata degli alleli trasmessi da questi individui favoriti, aumentando così la frequenza dei genotipi che danno il fenotipo “favorevole” in quelle date condizioni (anche se Darwin non sospettava l’esistenza dei geni, come ab-biamo già detto all’inizio del capitolo); pertanto, la po-polazione diventa sempre meglio adattata, in termini di fertilità (e quindi di sopravvivenza), all’ambiente in cui vive.

Dobbiamo allora introdurre un indice per la stima dell’efficienza riproduttiva degli individui, per poter procedere con i nostri modelli; questo indice è rappre-sentato dalla fitness, la capacità adattativa, indicata con w.

Gli individui con una fitness maggiore in un dato ambiente contribuiranno in misura maggiore al pool genico della generazione successiva e dunque, come vedremo, la frequenza degli alleli al locus interessato si modificherà. Come abbiamo detto nella definizione, la fitness è in realtà una stima della capacità riprodutti-va; questo perché si ritiene che un organismo in grado di raggiungere la maturità sessuale e di riprodursi sia da considerarsi ben adattato all’ambiente in cui vive. Come misuriamo la fitness? Non esiste una regola fissa,

dipende dall’organismo che stiamo studiando, dalle sue modalità riproduttive e, in genere, da quello che viene detto il life-style, o stile di vita, di quell’organismo. Nel BOX 22.5 sono riportati due esempi di calcolo della fit-ness che potrebbero verificarsi nella realtà.

In sintesi, al genotipo che presenta la migliore ca-pacità riproduttiva viene assegnato il valore arbitrario w = 1, agli altri genotipi un valore di fitness proporzio-nale. Spesso si utilizza anche lo svantaggio selettivo di un genotipo, che viene indicato dal coefficiente di se-lezione s per un dato genotipo, definito come il comple-mento a 1 della fitness relativa. Un genotipo con w = 0,8 avrà s = 0,2. Ricordiamo però un punto importante, cioè che non è il genotipo a essere selezionato dall’ambiente, ma il fenotipo determinato da quel genotipo – la sele-zione agisce sul fenotipo. Così, ad esempio, per un locus dominante, sia gli omozigoti per l’allele dominante che gli eterozigoti hanno la stessa fitness, in quanto presen-tano lo stesso fenotipo, mentre gli omozigoti per l’allele recessivo, se è il caso, hanno un valore di fitness diverso.

La selezione può dunque agire in molti modi diversi, a seconda del fenotipo che viene selezionato, se la sele-zione avviene contro o a favore, se un carattere è con-trollato da più loci, ecc. Per i nostri scopi deriveremo dei modelli relativi solo ai casi più semplici, anche perché lo schema che seguiremo è adattabile con facilità a model-li complessi. Passiamo dunque in rassegna alcuni casi, ponendo enfasi sulle conseguenze di ciascuna forma di selezione sull’evoluzione delle popolazioni.

Vers

ione

finale

in vi

sione

aut

ori

Page 14: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 614 ] Capitolo 22

BOX 22.5 Stima della fitness di un genotipo

Non esiste un algoritmo per la stima della �tness, piuttosto bisogna ragionare in modo euristico allo scopo di trovare il metodo di stima che meglio si adatta all’argomento che si sta studiando. Molto spesso, la stima della �tness è una stima della capacità riproduttiva: ad esempio, potremmo stare studiando una popolazione di una specie di uccelli e aver trovato che al locus K gli individui sono così ripartiti:

Genotipo KK Kk kk

N° individui 200 500 300

Negli uccelli è abbastanza semplice riconoscere la progenie di ciascun individuo, grazie al fatto che le cure parentali sono molto ben sviluppate e i pulcini rimangono nel nido per un certo tempo. Una stima ragionevole della capacità riproduttiva di ciascun genotipo è data dal numero di progenie prodotta per individuo, la progenie media:

Genotipo KK Kk kk

N° progenie 400 500 150

Progenie media =400200

2 =500500

1 =150300

0,5

Possiamo ora stimare la �tness, indicata con w. Per convenzione, si assegna w = 1 al genotipo con la maggiore capacità ripro-duttiva, in questo caso KK. I valori di �tness degli altri genotipi saranno relativi a uno, sulla base del rapporto tra la loro capacità riproduttiva e la capacità riproduttiva del genotipo con �tness più elevata:

Genotipo KK Kk kk

Progenie media 2 1 0,5

Progenie media/Progenie media di KK 22

1=12

0,5=0,52

0,25=

Fitness (w) 1 0,5 0,25

Il coe�ciente di selezione, s, è de�nito come s = 1 – w, quindi:

Genotipo KK Kk kk

w 1 0,5 0,25

s 0 0,5 0,75

Questo è solo un esempio, relativo a un caso, piuttosto raro, in cui si riesca a contare il numero della progenie di un dato geno-tipo. Come già detto, la stima della �tness non segue regole precise, ma dipende dal tipo di organismo, dal suo ciclo vitale, dalle condizioni sperimentali e dagli scopi dello sperimentatore. In un altro esempio, potremmo voler valutare la capacità di soprav-vivenza di una pianta in un ambiente ostile: a questo scopo potremmo seminare un certo numero di semi per ciascun genotipo e andare a contare il numero di piante che raggiungono la maturità. Utilizzando questo valore come stima dell’adattamento all’ambiente per quel genotipo e procedendo in maniera analoga all’esempio precedente, otteniamo:

Genotipo RR Rr rr

N° semi piantati 1.000 1.000 1.000

N° piante adulte 200 800 400

N° piante / N° semi 0,2 0,8 0,4

w 0,20, 8

0,25=0, 80, 8

1=0, 40, 8

0,5=

Se la selezione è, come in questo caso, a carico dei genotipi omozigoti e i coe�cienti di selezione sono diversi, si usa spesso la lettera t a indicare uno dei due coe�cienti di selezione (nell’esempio: s = 0,75; t = 0,5).A parte, dunque, gli aspetti sperimentali relativi alla stima della �tness, l’importante è sottolineare due aspetti fondamentali: 1) i valori di �tness di un genotipo sono sempre relativi a quelli degli altri genotipi; 2) i valori di �tness valgono solo nell’ambiente in cui sono stati misurati (ambienti diversi portano a stime diverse).

Vers

ione

finale

in vi

sione

aut

ori

Page 15: Capitolo 22 autori visione in finale

[ 22.5 ] Selezione naturale [ 615 ]

[ 22.5.1 ] Selezione contro il recessivoPiù o meno inconsciamente, quando ci si riferisce alla selezione naturale, si intende di solito la selezione con-tro un carattere sfavorevole – e, come abbiamo visto nei capitoli precedenti, in particolare quando si parla di malattie ereditarie nell’uomo, spesso un tale carattere è legato a un genotipo omozigote recessivo. Si pensi al caso in cui si perda la funzionalità di un enzima: signifi-ca che entrambi gli alleli sono mutati, quindi il genotipo è aa. Possiamo allora immaginare una situazione in cui, in una popolazione naturale, per un locus con due alleli valgano i seguenti valori di fitness:

Genotipo AA Aa aa

w 1 1 1 – s

s 0 0 s

Quindi, gli individui di genotipo AA e Aa si riprodu-cono con la stessa efficienza (che è quella massima in quel determinato ambiente), mentre la capacità ripro-duttiva degli omozigoti aa è ridotta. Supponiamo ades-so di essere partiti da una popolazione mendeliana in equilibrio, in cui le frequenze genotipiche sono deter-minate dalla legge di H-W:

Genotipo AA Aa aa

Frequenza p2 2pq q2

w 1 1 1 – s

Possiamo ora costruire un modello in cui i valori del-la fitness rappresentano la frazione di individui di quel genotipo in grado di riprodursi – in questo caso, tutti gli AA e gli Aa si riproducono, mentre solo una frazione pari a (1 – s) degli aa lo fa. Introduciamo dunque il concetto di contributo genotipico alla generazione successiva, che ci dice quanti individui di ciascun genotipo contri-buiranno al pool genico tra una generazione. In pratica, basta moltiplicare la frequenza genotipica per il valore della fitness:

Genotipo AA Aa aa

Frequenza p2 2pq q2

w 1 1 1 – s

Contributo genotipico p2 2pq q2 (1 – s)

Il contributo genotipico non è però la frequenza ge-notipica nella prossima generazione, infatti la somma dei contributi non è pari a 1! Per ottenere le frequen-ze, dobbiamo normalizzare i contributi, quindi dividerli ciascuno per la somma dei contributi stessi:

p2 + 2pq + q2 (1 – s) = (p2 + 2pq + q2) – sq2 = 1 – sq2

La somma dei contributi genotipici viene anche detta fitness media della popolazione, w– – nel caso della se-lezione contro il recessivo, w– = 1 – sq2. Si noti come la fitness media della popolazione non sia pari a uno, in quanto esiste una frazione sq2 di individui che non si ri-producono – torneremo tra poco su questo concetto.

Le frequenze genotipiche alla generazione successi-va, G1, sono allora:

Genotipo AA Aa aa

Frequenza in G0 p2 2pq q2

w 1 1 1 – s

Contributo genotipico

p2 2pq q2 (1 – s)

Frequenza in G1

( )−1

2

2

psq ( )−

21 2

pqsq ( )

( )−−

11

2

2

q ssq

Da queste possiamo ricavare le frequenze alleliche in G1 molto facilmente, ricordando che q = Q + H/2 e che p = (1 – q):

11 1

11

1 1

1

2

2 2

2 2

2

2 2 2

2

2

2

q q ssq

pqsq

q sq q qsq

q sq q qsq

q sqsq

( ) ( )( )

( )( )

( )( )( )

( )=

−−

+−

=

− + − −

=

=− + −

−=

−−

Ma, dato che l’evoluzione è la variazione nel tempo delle frequenze alleliche, quello che ci interessa veramente è il Dq = q1 – q0:

D1

– –1

11

2

2

2 3

2

2

2q

q sqsq

qq sq q sq

sqsq q

sq( )( )

( )( )

( )( )=

−−

− =+

−=

− − −

( )= –1–

2

2q spq

sqD

Questa è un’equazione interessantissima, che porta una notevole quantità di informazione. In primo luogo, il segno meno indica che la conseguenza della selezio-ne contro il recessivo è quella di diminuire la frequen-za dell’allele recessivo (per questo motivo la selezione contro il recessivo è anche detta selezione purificante, in quanto tende a eliminare gli alleli dannosi dalle popo-lazioni); in secondo luogo, questa variazione, cioè l’in-tensità della selezione, è direttamente proporzionale al coefficiente di selezione; in terzo luogo, non meno im-portante, l’intensità della selezione è direttamente pro-porzionale al quadrato della frequenza allelica dell’al-lele selezionato. Se mettiamo in grafico l’andamento di q in funzione del tempo passato da quando è iniziata la selezione, otteniamo quanto riportato in Fig. 22.7. Si vede immediatamente che la pendenza della curva di-minuisce, in quanto, man mano che diminuisce la fre-quenza dell’allele a, ci sono sempre meno omozigoti sui quali può agire la selezione! La cosa è evidente anche dal punto di vista della genetica formale; infatti, gli alleli a che si trovano allo stato eterozigote si trovano protetti dagli effetti della selezione, in quanto il fenotipo dell’e-terozigote è dominante. Anzi, la percentuale di alleli re-cessivi presenti allo stato eterozigote è di solito molto più elevata di quella degli alleli recessivi presenti nel genotipo omozigote. Si dice comunemente che la sele-zione contro l’allele recessivo è assai inefficiente quan-do tale allele è raro, ma questo è il caso più comune per un allele deleterio, la cui frequenza nella popolazione non può essere sicuramente elevata; questo semplice fatto confuta in modo definitivo le pretese (che nelle

Vers

ione

finale

in vi

sione

aut

ori

Page 16: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 616 ] Capitolo 22

storie di fantascienza sono abbastanza frequenti, ma che purtroppo di tanto in tanto riemergono anche nel corso della storia reale) di ripulire il pool genico dagli alleli dannosi impedendo la riproduzione delle persone affette. Lo stesso tipo di ragionamento porta a confutare i progetti di tipo eugenetico volti a impedire trattamenti medici a favore di persone affette da gravi disordini re-cessivi, in quanto si deteriorerebbe il pool genico: alle frequenze alle quali sono presenti gli alleli deleteri, le influenze sulle frequenze alleliche sarebbero del tutto trascurabili. Per ridurre in modo efficace la frequenza di un allele deleterio recessivo, occorrerebbe impedire la riproduzione degli eterozigoti, impresa discutibile dal punto di vista sia etico che pratico.

Un altro punto interessante da discutere sulla Fig. 22.7 riguarda il fatto che le curve tendono asintotica-mente a zero, ma non ci arrivano. Immaginiamo una situazione in cui q = 0,001 in una popolazione di 500 in-dividui: questo significa che nella popolazione esiste un solo allele a, che deve essere per forza allo stato etero-zigote. Possiamo allora benissimo immaginare che l’u-nico individuo eterozigote trasmetta alla generazione successiva solo alleli A: questo significa che è inevitabile che gli alleli a scompaiano dalla popolazione?

[ 22.5.2 ] Equilibrio selezione-mutazioneLa risposta alla domanda finale del paragrafo preceden-te è no, in quanto a ogni generazione, come sappiamo, un certo numero di alleli A diventa a per mutazione.

Come discusso, la frequenza di mutazione è così bassa da non influire in modo significativo sulle frequenze al-leliche, ma quando gli alleli a sono pochissimi, anche i rarissimi alleli a prodotti dalla mutazione possono rap-presentare una frazione significativa del totale! Anche in questo caso possiamo ricorrere al modello: in una si-tuazione in cui ci sia selezione contro il recessivo, a ogni generazione si perde una quota di alleli a pari a:

( )=−−1

2

2q spq

sqD

e se ne guadagna, per mutazione, una quota pari a:

Dq = pu

Si raggiungerà una situazione di equilibrio quando queste due quantità si eguaglieranno, vale a dire quando a ogni generazione il numero di alleli persi per selezione sarà pari al numero di alleli prodotti dalla mutazione, quindi:

( )−=

1

2

2

spqsq

pu

che possiamo semplificare approssimando a uno il de-nominatore del termine a sinistra; infatti, se q è molto bassa, q2 sarà notevolmente bassa e, moltiplicata per s ≤ 1, sarà del tutto trascurabile. Resta dunque, dopo aver semplificato anche p:

sq2 = u

a dare un valore di q all’equilibrio pari a:

q̂ =q us

Questa nuova relazione va sotto il nome di equilibrio selezione-mutazione e, ancora una volta, è assai interes-sante. Possiamo facilmente vedere come, anche conside-rando un allele a che allo stato omozigote sia letale (o non consenta il raggiungimento dell’età riproduttiva) e quindi abbia s = 1, la sua frequenza nella popolazione non sarà del tutto trascurabile, infatti sarà pari alla radice quadra-ta del tasso di mutazione. Assumendo u = 10–5, si trova q̂ ≈ 3 3 10–3, quindi circa 3 alleli su mille! È veramente dif-ficile rimuovere gli alleli deleteri dal pool genico.

Per il raggiungimento di questa situazione di equi-librio selezione/mutazione, si tratta comunque di tem-pi assolutamente lunghissimi, tanto che è ragionevole pensare che solo poche volte alcuni loci abbiano rag-giunto questo equilibrio. Si tratta però di un ottimo mo-dello teorico, che risponde a diversi problemi circa gli effetti della selezione.

[ 22.5.3 ] Selezione contro il dominanteNon sarà sfuggito che, con il metodo descritto nel caso della selezione contro il recessivo, si possa andare ve-locemente a stimare il Dq (o Dp) per qualunque forma assuma la selezione, modificando semplicemente i valori di fitness per il calcolo dei contributi genotipici prima e delle frequenze alleliche in G1 poi, passando attraverso

Numero di generazioni

qs = 0

s = 0,1

s = 0,5

s = 1

s = 0,8

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0,0

0 10 20 30 40 50

FIGURA 22.7 c L’efficacia della selezione contro il reces-sivo diminuisce con l’andare del tempo. Nel grafico è ri-portata la variazione della frequenza q di un allele recessivo a nel caso di selezione contro l’omozigote recessivo in funzione del numero di generazioni. Sono riportati i casi per diversi co-efficienti di selezione s. Come si vede, nel caso di assenza di selezione (s = 0) le frequenze alleliche restano stabili, mentre anche in caso di letalità dell’omozigote (s = 1), dopo poche ge-nerazioni la diminuzione di q tende a diventare trascurabile, in quanto la maggior parte degli alleli recessivi si troverà negli individui eterozigoti, il cui fenotipo non viene selezionato a sfavore (vedi anche testo).

Vers

ione

finale

in vi

sione

aut

ori

Page 17: Capitolo 22 autori visione in finale

[ 22.5 ] Selezione naturale [ 617 ]

la fitness media. In Tab. 22.1 sono riportate le formule, derivate secondo il metodo descritto, per la variazione delle frequenze alleliche a seconda del tipo di selezione, e quindi dei diversi valori di fitness dei tre genotipi per un locus con due alleli, indicati come A1 e A2 e con frequenze alleliche rispettivamente p e q. L’uso di s e t come coeffi-cienti di selezione nel caso della selezione a favore dell’e-terozigote indica che i coefficienti di selezione contro le due classi di omozigoti sono di solito diversi. Per una rapida discussione degli altri tipi di selezione, lasciamo le formule del Dq alla Tab. 22.1 e concentriamoci sugli aspetti genetici. Nel caso della selezione contro il fenoti-po dominante, i valori di fitness saranno:

Genotipo AA Aa aa

w 1 – s 1 – s 1

s s s 0

In questo caso, dato che il genotipo eterozigote pre-senta lo stesso fenotipo dell’omozigote AA, la selezione agisce su entrambe le classi con la stessa efficacia: l’alle-le A non può sfuggire alla selezione. Infatti, questo tipo di selezione è assai attivo nell’eliminare gli alleli domi-nanti dalla popolazione. Si immagini il caso estremo in cui l’allele A sia letale, con s = 1: l’unico incrocio possi-bile in una tale situazione sarebbe aa 3 aa, che origine-rebbe solo individui aa. In un’unica generazione l’allele A sparirebbe dal pool genico.

Anche in questo caso potremmo invocare la muta-zione per produrre nuovi alleli A: utilizzando lo stesso metodo adottato per la selezione contro il recessivo per ottenere la variazione delle frequenze alleliche (qui tra-lasciato per semplicità), si giunge a un modello di equi-librio in cui

p̂ = vs

In questo caso v è però il tasso di retromutazione! Quindi, per un allele dominante letale, la sua frequenza all’equili-brio sarebbe pari a v ≈ 10–6–10–7, veramente trascurabile. Ai fini pratici, questo è anche il motivo per cui mutazioni dominanti con grave effetto sulla fitness si trovano nelle popolazioni naturali con frequenza molto bassa, corri-spondente all’incirca a v, proprio perché la selezione na-turale le elimina rapidamente dal pool genico.

In ogni caso, sia per la situazione di equilibrio sele-zione-mutazione che abbiamo delineato per la selezio-

ne contro il recessivo che per quest’ultima, si tratta di tempi assolutamente lunghissimi, tanto che è ragione-vole pensare che solo poche volte alcuni loci abbiano raggiunto questo equilibrio. Si tratta però di un ottimo modello teorico che risponde a diversi problemi circa gli effetti della selezione.

[ 22.5.4 ] Selezione contro l’eterozigoteIn questo caso è l’eterozigote a essere in qualche modo svantaggiato, quindi:

Genotipo AA Aa aa

w 1 1 – s 1

s 0 s 0

Sempre senza ricorrere al modello, possiamo rico-struire per via “intuitiva” cosa succeda alle frequenze alleliche del locus interessato. Il fatto che gli eterozigoti abbiano w < 1 implica che a ogni generazione alcuni in-dividui eterozigoti non si riproducono, il che equivale a dire che dal pool genico viene rimosso un ugual numero di alleli A e a. Quali sono le conseguenze di rimuovere un ugual numero di alleli dei due tipi dal pool genico? Immaginiamo di avere nel sacchetto 10 alleli A e 90 al-leli a: rimuovere un allele A significa rimuovere il 10% degli alleli di quel tipo, mentre rimuovere un allele a eli-mina solo l’1,1% di tutti gli alleli a. Pertanto, sarà la fre-quenza dell’allele già presente con frequenza più bassa a risentirne: come nell’esempio, se p < q, sarà p a dimi-nuire e q ad aumentare e viceversa. Solo nel caso assai improbabile in cui p = q = 0,5 non si verificherà alcuna variazione delle frequenze alleliche. Insomma, questo tipo di selezione tende a rimuovere dal pool genico l’al-lele meno frequente (Fig. 22.8).

Esempi di questo tipo di selezione non sono fre-quenti in natura, ma recentemente, grazie alle possibi-lità offerte dall’analisi genomica di studiare gli effetti di gran parte dei geni di un organismo, si è visto che il fenomeno sembra essere più esteso del previsto. In un recente lavoro sull’uomo, Cassa e colleghi hanno analiz-zato l’esoma di più di 60.000 persone alla ricerca di ete-rozigoti per rare varianti di mutazioni nonsenso, quindi con una sola copia funzionante del gene, per i quali sono stati stimati i coefficienti di selezione. Il risultato è stato

Tabella 22.1 Variazione di q per alcuni tipi di selezione

Selezione

Fitness

ΔqA1A1 A1A2 A2A2

Contro l’omozigote recessivo 1 1 1 – s1

2

2q

spqsq

D ( )=−−

Contro il dominante 1 – s 1 – s 11

2

2q

spqs sq

D ( )=−− −

Contro l’eterozigote 1 1 – s 11 2

qspq q p

spqD

( )( )=

−−

A favore dell’eterozigote 1 – s 1 1 – t1 2 2

qpq sp tq

sp tqD ( )

( )=

−− −

Vers

ione

finale

in vi

sione

aut

ori

Page 18: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 618 ] Capitolo 22

che la frequenza degli eterozigoti è determinata dalla presenza di selezione piuttosto che dalla deriva (vedi oltre) e che, mentre i valori di s “contro” sono in media piuttosto bassi, minori di 0,01, circa 3.000 geni presen-tano valori con s > 0,1 e si tratta specialmente di geni che controllano malattie mendeliane (i valori di s per i geni dominanti sono in media più elevati di quelli per i geni recessivi) e geni regolatori della trascrizione, il che non è sorprendente alla luce delle nostre conoscenze molecolari. Si tratta comunque di dati ancora prelimi-nari, per cui la funzione dei geni coinvolti non è ancora stata pienamente caratterizzata.

Abbiamo dunque incontrato tre meccanismi di se-lezione che tendono a ridurre, in maniera più o meno efficace, la frequenza di uno degli alleli: in termini di variabilità genetica, questo porta a una riduzione del-la stessa, fino ad avere una situazione (teorica) in cui rimane uno solo degli alleli con frequenza pari a uno. In termini genetici, si dice che l’allele è fissato nella po-polazione. Ma esiste un altro tipo di selezione, la cui discussione ci porterà verso lidi più lontani, che ha tra l’altro la caratteristica di mantenere elevati i livelli di variabilità genetica per i loci coinvolti: la selezione a fa-vore dell’eterozigote.

[ 22.5.5 ] Selezione a favore dell’eterozigoteDiamo subito i valori di fitness per i tre genotipi:

Genotipo AA Aa aa

w 1 – s 1 1 – t

s s 0 t

dove sia s che t sono coefficienti di selezione e l’uso di una lettera diversa indica semplicemente che i due co-efficienti possono, come effettivamente accade nella re-altà, non avere lo stesso valore.

Il primo caso verificato, e il più famoso, di selezio-ne a favore dell’eterozigote è quello relativo al locus Hb dell’uomo, che codifica la catena β dell’emoglobi-na. Come abbiamo visto in altri capitoli, a questo lo-cus esistono due alleli, Hb-A e Hb-S: la differenza è che quest’ultimo codifica, come sesto aminoacido della ca-tena polipeptidica, una valina al posto dell’aminoacido selvatico, l’acido glutammico. Questa modifica fa sì che l’emoglobina abbia una ridotta affinità per l’ossigeno,

che nelle persone omozigoti Hb-S/Hb-S causa l’anemia falciforme, o sickle cell anemia (i globuli rossi assumono una caratteristica forma a falce, in quanto al loro inter-no la pressione parziale dell’ossigeno è ridotta – da qui anche il nome dell’allele, in quanto in inglese “falce” si dice sickle), una malattia che in condizioni estreme può portare anche alla morte per insufficiente ossigenazio-ne dei tessuti. Nelle persone eterozigoti Hb-A/Hb-S, in particolari condizioni ambientali, si può manifestare una forma molto più lieve della malattia, detta tratto falcemico.

Ci si attenderebbe, vista la situazione, che a questo lo-cus sia in atto una forte selezione contro il recessivo, visto che evidentemente la fitness degli omozigoti Hb-S/Hb-S è assai ridotta. Nella pratica si osserva invece, per alcu-ne regioni del pianeta, la persistenza di una frequenza assai elevata dell’allele Hb-S. A un esame più attento, si nota che la frequenza dell’allele è più elevata del previ-sto nelle regioni in cui c’era anche un’elevata incidenza della malaria, come mostrato in Fig. 22.9 (studi recenti dimostrano come questa correlazione sia molto forte in Africa e meno in altre regioni, ma questo non cambia gli aspetti generali del discorso). Per ragioni che non han-no ancora trovato una spiegazione soddisfacente a livel-lo molecolare, il Plasmodium falciparum, l’agente ezio-logico della malaria, non riesce a riprodursi in presenza dell’allele Hb-S con la stessa efficacia che in presenza di emoglobina normale. Riassumendo, gli omozigoti Hb-A/Hb-A soffrono di elevata mortalità a causa della malaria, gli omozigoti Hb-S/Hb-S di elevata mortalità a causa dell’anemia falciforme, mentre gli eterozigoti, essendo protetti dalla malaria dall’allele Hb-S e non su-bendo grossi problemi per l’eventuale tratto falcemico, presentano una fitness più elevata di quella di entrambi gli omozigoti.

Questo esempio mette in risalto anche un’altra im-portante caratteristica del concetto di fitness: il valore della fitness per un carattere dipende dall’ambiente in cui lo si misura. Nel caso dell’anemia falciforme, non c’è alcun vantaggio dell’eterozigote se l’ambiente non è malarico; in questo caso ci sarebbe una selezione con-tro l’allele recessivo, come è in effetti. Frequenze eleva-te di Hb-S si riscontrano soltanto nelle regioni in cui è presente (o era presente fino a non molto tempo fa) la malaria.

Torniamo al caso generale: cosa accade alle frequen-ze alleliche di un locus per cui l’eterozigote presenta un vantaggio? Con il solito procedimento otteniamo i valori dei contributi genotipici:

Genotipo AA Aa aa

Frequenza p2 2pq q2

w 1 – s 1 1 – t

Contributo genotipico p2 (1 – s) 2pq q2 (1 – t)

e della fitness media:

p2 (1 – s) + 2pq + q2 (1 – t) → w– = 1 – sp2 – tq2

Procedendo poi a ottenere le frequenze alleliche alla G1 e rielaborando i valori, si giunge all’importante conclu-sione che, se la selezione a favore dell’eterozigote pro-

FIGURA 22.8 c Concetto di selezione contro l’eterozigo-te. La rimozione di un numero uguale di alleli bianchi e neri dal pool genico ha un impatto maggiore sull’allele presente con frequenza minore (in questo caso un allele di ciascun tipo è stato rimosso).

Vers

ione

finale

in vi

sione

aut

ori

Page 19: Capitolo 22 autori visione in finale

[ 22.5 ] Selezione naturale [ 619 ]

segue abbastanza a lungo, si raggiunge una situazione di equilibrio in cui sp2 = tq2; risolvendo per p o per q si ha:

p̂ = ( )+t

s t  e  q̂ = ( )+

ss t

In pratica, la selezione a favore dell’eterozigote tende a mantenere entrambi gli alleli con frequenze abbastanza elevate nella popolazione (in termini finalistici, per es-serci un genotipo eterozigote, devono esistere almeno due alleli!). Questo spiega il mantenimento a frequenze non trascurabili nelle popolazioni, umane e non, di alle-li dannosi e potenzialmente eliminabili dalla selezione purificante. Quindi, al contrario degli altri modelli di se-lezione visti in precedenza, la selezione a favore dell’e-terozigote tende a mantenere livelli elevati di variabilità genetica nelle popolazioni naturali – la situazione per cui più alleli sono mantenuti da questo tipo di selezione è chiamata polimorfismo bilanciato. Un altro punto di notevole interesse è che i valori di equilibrio di p e di q dipendono solamente dai coefficienti di selezione, quin-di vengono raggiunti indipendentemente da quali siano i valori iniziali delle frequenze alleliche.

Il concetto di polimorfismo bilanciato è stato assai importante negli anni ’60 del secolo scorso e lo è tutto-ra, in quanto veniva visto come il meccanismo mediante il quale le popolazioni naturali potevano mantenere i li-velli elevati di variabilità genetica che stavano venendo messi in luce grazie all’utilizzo di marcatori molecolari (all’epoca essenzialmente di tipo biochimico, come gli isoenzimi). Quindi, la selezione a favore dell’eterozigote sembrava il meccanismo perfetto per conciliare il mo-dello darwiniano con l’elevata quota di variabilità ge-netica presente nelle popolazioni naturali. Ma esiste un rovescio della medaglia...

[ 22.5.6 ] Carico geneticoAbbiamo visto come nel caso della selezione la fitness media di una popolazione si discosti dall’optimum, cioè 1, di una quantità pari alla frazione di individui che non si riproducono a una data generazione e che abbiamo visto, ad esempio, essere pari a sq2 per la selezione con-tro il recessivo e a (sp2 + tq2) per la selezione a favore dell’eterozigote. Questi valori rappresentano il carico genetico (genetic load) della popolazione, in quanto da un punto di vista evolutivo sono un “peso” che impe-disce alla popolazione stessa di esprimere tutto il pro-prio potenziale riproduttivo: nel primo caso il carico ge-netico sarà una frazione degli aa, nel secondo una parte degli AA più una parte degli aa. Immaginiamo allora di avere, in una situazione di selezione a favore dell’etero-zigote, una popolazione costituita interamente da indi-vidui Aa – una situazione ideale, evolutivamente parlan-do! Ma quale sarà la situazione dopo una generazione? Dato che l’unico incrocio possibile alla G0 è Aa 3 Aa, in G1 avremo un quarto di individui AA, un quarto di aa e metà di Aa, quindi metà della popolazione sarà costitu-ita da individui che rappresentano un potenziale carico genetico! Possiamo dunque dire che la selezione a favo-re dell’eterozigote ha l’effetto negativo di produrre cari-co genetico segregazionale; quindi, pur avendo l’effetto favorevole di mantenere variabilità genetica (vedi il teo-rema di Fisher), una popolazione sotto questa selezione non raggiungerà mai il massimo della propria fitness.

Se si considera questo aspetto non per un solo lo-cus, ma per tutti i loci di un organismo, si vede che, se la variabilità fosse dovuta al fatto che esiste selezione a favore dell’eterozigote, il carico genetico, moltiplicato

NessunaEpidemicaIpoendemicaMesoendemicaIperendemicaOloendemica

Endemicità della malaria

Frequenza dell’allele Hb-S (%)0 – 0,510,52 – 2,022,03 – 4,044,05 – 6,066,07 – 8,088,09 – 9,609,61 – 11,1111,12 – 12,6312,64 – 14,6514,66 –18,18

FIGURA 22.9 c La distribuzione geografica dell’allele Hb-S coincide con le aree in cui è o era diffusa la malaria. Mappa globale della diffusione dell’allele Hb-S e delle zone in cui la malaria è o era endemica, basata su 41.445 referenze bibliografiche. Nella parte superiore, le zone in cui è presente Hb-S in tonalità di rosso; nella parte inferiore, la prevalenza della malaria in tonalità di verde. [Da: Piel, Frédéric B., et al. “Global Distribution of the Sickle Cell Gene and Geographical Confirmation of the Malaria Hypothesis”. Nature Communications 1:104, 2010. PMC. Web. 4 June 2017].

Vers

ione

finale

in vi

sione

aut

ori

Page 20: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 620 ] Capitolo 22

per tutti i loci, raggiungerebbe valori insostenibili per la vitalità stessa degli individui della popolazione. Da dove viene allora tutta la variabilità che viene misurata?

[ 22.5.7 ] Ipotesi neutralistaAlla fine degli anni ’60 del secolo scorso, il genetista giapponese Motoo Kimura propose l’ipotesi neutrali-sta della variabilità genetica. Secondo questa ipotesi, la maggior parte della variabilità genetica misurata è do-vuta a differenze nel genotipo che però non alterano la fitness di un organismo. Al giorno d’oggi, alla luce delle conoscenze di genetica molecolare immensamente più approfondite rispetto a mezzo secolo fa, non è difficile immaginare come questo possa accadere: esistono po-limorfismi in regioni non codificanti, dagli introni alle regioni intergeniche, mutazioni sinonime e così via. Grazie alle diverse classi di marcatori molecolari e, so-prattutto, grazie alle tecniche di sequenziamento mas-sivo di nuova generazione (NGS), abbiamo la capacità tecnologica di mettere in evidenza tutta questa quota di variabilità “nascosta”. Ad esempio, sembra del tutto ragionevole che la presenza di poche ripetizioni in più o in meno a un locus microsatellite non causi differenze fenotipiche tali da avere effetto sulla capacità riprodut-tiva! All’epoca, però, la prima apparizione di questa ipo-tesi suscitò notevoli polemiche; in realtà, era già nota l’esistenza degli isoenzimi e questi erano comunemente impiegati per le analisi genetiche, quindi l’ipotesi che esistessero mutazioni con effetto scarso o nullo sulla fitness non sarebbe dovuta apparire così sconvolgente. In realtà, come spesso è accaduto nella Genetica, si trat-tava semplicemente di un problema culturale: il mondo scientifico, cresciuto all’ombra di Darwin, quindi della selezione naturale, non era pronto a concepire che la se-lezione non fosse l’unico motore dell’evoluzione.

Se però non esistono differenze adattative, cosa fa variare le frequenze alleliche ai loci coinvolti? Kimura propose che la causa fosse la deriva genetica casuale (random genetic drift).

[ 22.6 ] DERIVA GENETICALa seconda grande forza evolutiva è la deriva genetica (genetic drift), per cui le frequenze alleliche variano da una generazione all’altra per fattori casuali. Cosa si in-tende per fattori casuali? Per comprenderlo sono richie-ste a questo punto alcune formule statistiche e un nuovo concetto, quello di numerosità effettiva della popola-zione, Ne (per la sua stima, vedi BOX 22.6). La numero-sità effettiva è relativa ai soli individui che effettivamente si riproducono a una data generazione – indipendente-mente dalla loro capacità riproduttiva.

Il concetto di deriva genetica è spesso ostico, proprio perché richiede un approccio statistico, quindi vedremo prima di spiegarlo intuitivamente, per passare alle for-mule solo in seguito. Immaginiamo allora di avere i se-guenti dati:

■ una popolazione ha numerosità N alla generazione G0;

■ le frequenze alleliche per il solito locus A, con due alleli, sono p0 e q0;

■ non tutti gli individui di G0 si riproducono, ma non per differenze nella capacità riproduttiva!

Quest’ultimo punto è importante, perché mette in luce la differenza fondamentale tra deriva e selezione: nella selezione le frequenze alleliche variano nel senso di un migliore adattamento della popolazione alle con-dizioni ambientali, nella deriva le frequenze alleliche variano a caso. Pensiamo, come esempio ragionevole, a una popolazione umana, in cui è assai difficile che tutte le persone abbiano dei figli, per i motivi più diversi.

Quindi, le persone che realmente si riproducono rap-presentano un campione dell’intera popolazione (Fig. 22.10); ma noi sappiamo dalla statistica che p e q del campione non saranno esattamente quelle della popo-lazione (a breve le formule per capire quanto diverse), ma saranno un poco diverse, diciamo p1 e q1. Dato che la G1 discende solo dalle persone che si riproducono, per la legge di Hardy-Weinberg le frequenze alleliche di G1 saranno proprio p1 e q1! Rispetto a G0, le frequenze alle-liche saranno variate, senza che sia successo apparente-mente nulla.

Possiamo dedurre un interessante corollario a que-sto: dato che è assai difficile che tutti gli organismi di una popolazione si riproducano, gli individui che lo fa-ranno saranno sempre un sottoinsieme, quindi un cam-pione, della popolazione – per cui la deriva può poten-zialmente agire a ogni generazione. Nella pratica, però, e visto che la probabilità di osservare uno scostamen-to significativo da p e q diminuisce all’aumentare di Ne (vedi BOX 22.7), le variazioni delle frequenze alleliche dovute a deriva genetica sono importanti nella storia evolutiva delle popolazioni solo quando si verificano tre casi principali, che dal punto di vista genetico sono esat-tamente equivalenti, ma rispecchiano potenziali eventi demografici diversi:

■ quando Ne della popolazione rimane piccola per più generazioni;

■ quando una nuova popolazione viene fondata a partire da un numero ristretto di individui di una popolazione già esistente (effetto del fondatore).

G0G1

p0

p1

q0

q1

p1

q1

FIGURA 22.10 c Rappresentazione grafi ca del concetto di deriva genetica. Nella popolazione G0 (ovale verde), di numerosità N, il pool genico è descritto dalle frequenze al-leliche p0 e q0. L’ovale azzurro indica quel sottoinsieme della popolazione che è costituito soltanto dagli Ne individui che effettivamente si riprodurranno. All’interno di questo grup-po, le frequenze alleliche, indicate con p1 e q1, possono essere diverse da quelle del resto della popolazione per motivi stoca-stici (vedi anche BOX 22.7). Dato che la popolazione G1 (ovale rosa) discende soltanto da questi ultimi, per la legge di Hardy-Weinberg le frequenze alleliche di G1 saranno proprio p1 e q1, quindi variate rispetto a quelle di G0.

Vers

ione

finale

in vi

sione

aut

ori

Page 21: Capitolo 22 autori visione in finale

[ 22.6 ] Deriva genetica [ 621 ]

Questo parametro, indicato con Ne, si riferisce al numero degli individui di una generazione (G0) che contribuiranno, riproducen-dosi, alla generazione successiva (G1). Questo valore non è mai uguale alla numerosità reale N per diversi motivi, di cui i principali sono: la �uttuazione delle dimensioni della popolazione da una generazione all’altra, la varianza nelle dimensioni delle famiglie, lo squilibrio tra i sessi. Per quanto riguarda il primo fattore, vale la pena ricordare che nel corso del tempo le popolazioni naturali variano le loro dimensioni da una generazione all’altra per una serie di motivi: caratteristiche del ciclo vitale, disponibilità di cibo, catastro�, condizioni climatiche, ecc., senza dimenticare gli e�etti antropici. Come valutare allora Ne ai �ni popolazionistici? La migliore stima di Ne è la sua media armonica tra le diverse generazioni considerate. Su n generazioni, detta Nei la numerosità e�ettiva di ogni generazione:

1/eei

Nn

N∑( )≈

Si usa la media armonica, perché in questo modo Ne sarà più vicina all’Ne più piccola rilevata in una singola generazione che non usando la media aritmetica. Gli e�etti misurati in natura dovuti a questo motivo causano all’incirca una riduzione pari a Ne ≈ 0,35N.Per quanto riguarda il secondo fattore, la variabilità nella numerosità delle famiglie, intesa come numero di progenie prodotto nel corso della vita da un individuo, la teoria della genetica di popolazioni dice che nella popolazione di riferimento il numero di progenie prodotto in media da un individuo, maschio o femmina, è pari a uno e si distribuisce secondo la distribuzione di Poisson (quindi le famiglie con nessuna progenie saranno il 13,5%, quelle con una il 27,1%, quelle con due il 27,1% e così via), dove la media e la varianza sono uguali e quindi il loro rapporto è uguale a uno. Ma se si va a misurare il rapporto varianza/media nelle popolazioni naturali, si trovano quasi sempre valori molto superiori a uno, dovuti a un eccesso di individui che non producono progenie, il che comporta che Ne < N. Stime e�ettuate su un’ampia gamma di specie diverse ci dicono che la diminuzione della numerosità e�ettiva dovuta a questo motivo è Ne ≈ (½) N.In�ne, se il rapporto tra i sessi non è pari a uno, bisogna tener conto che metà del pool genico di G1 deriverà dagli individui di sesso femminile e metà da quelli di sesso maschile della popolazione G0. Per questo motivo, vale la relazione:

Ne = 4N N

(N + N )che tiene conto della possibilità che i due sessi non contribuiscano in modo uguale a G1. Nel mondo animale esistono numerosi esempi di harem, in cui un unico maschio dominante si accoppia con tutte le femmine in età fertile del branco (cervi, leoni marini, ecc.) e le conseguenze su Ne di uno sbilanciamento dei sessi possono essere anche imponenti. Facciamo un rapido esempio: se una popolazione è costituita da 50 maschi e 50 femmine, Ne = 100; ma se gli stessi 100 individui sono 90 femmine e 10 maschi, allora Ne si riduce a 36, poco più di un terzo. In generale, la variazione della numerosità dovuta a questo fattore è stimata a Ne ≈ 0,65N.Il valore di Ne è importante per comprendere esattamente gli e�etti della deriva genetica. Si tenga presente che le di�erenze tra numerosità e�ettiva e numerosità reale, considerando tutte le cause sovraesposte, possono essere di notevole entità; infatti, dalle stime e�ettuate su popolazioni naturali di piante e animali, Ne risulta essere in media di un ordine di grandezza inferiore a N.

BOX 22.6 Numerosità effettiva di una popolazione

Si può immaginare una situazione in cui un nuovo ambiente venga colonizzato da pionieri di una po-polazione già ben stabilita altrove. La storia umana è ricca di esempi simili, a partire da quello che ha portato all’espansione dell’uomo moderno in tutto il mondo partendo dall’Africa, dove si stima che il nu-mero di persone “uscite” dal continente africano non fosse superiore ad alcune centinaia, poche migliaia al massimo (vedi http://www.dnalc.org/resources/genescreen/population-genetics.html);

■ quando Ne viene drasticamente ridotta a causa di eventi naturali (effetto collo di bottiglia). In que-sto caso si tratta di eventi catastrofici che eliminano gran parte degli individui in breve tempo. L’effetto del caso è ben evidente, in quanto essere portatori di un dato fenotipo non conferisce alcuna maggiore ca-pacità di resistenza a un terremoto, un’inondazione o un’eruzione vulcanica.

Esempi di questi tre eventi sono riportati nel BOX 22.7. In tutti questi casi, per effetto della deriva, le frequenze alleliche possono variare in un senso o nell’altro a caso, ma l’effetto finale sarà quello di fis-sare uno degli alleli. La probabilità che un allele si fissi in futuro in una popolazione soggetta a deriva è pari alla sua frequenza allelica in quel momento, quindi un allele A con p = 0,9 avrà il 90% di probabilità di risul-tare fissato a causa della deriva. Il risultato finale sarà dunque quello di ridurre la variabilità genetica nelle popolazioni naturali. Si può derivare per via empirica la perdita di eterozigosità alla generazione successiva a quella in cui si è verificato, ad esempio, un collo di bottiglia:

1 12

1

0 e

HH N

= −

Vers

ione

finale

in vi

sione

aut

ori

Page 22: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 622 ] Capitolo 22

BOX 22.7 Principio del fondatore ed effetto collo di bottiglia

La deriva genetica agisce spostando le frequenze alleliche a un locus per motivi basati sulla casualità, legati a quali individui di una popolazione si riproducono realmente. Infatti, nella popolazione di riferimento, di dimensioni in�nite, si assume implici-tamente che tutti gli individui contribuiscano con i loro gameti alla generazione successiva. Nella realtà questo non accade, in quanto, per i motivi più diversi, non tutti gli individui si riproducono o la loro progenie non sopravvive. Tuttavia, nella stragrande maggioranza dei casi, la variazione delle frequenze alleliche dovuta a questo fattore sarà non esistente o impercettibile, se il numero degli individui che si riproducono, o numero e�ettivo di individui Ne (vedi BOX 22.6), è abbastanza elevato. Quanto abbastanza? Lo possiamo stabilire per via teorica andando ad analizzare due dei casi in cui la deriva genetica svolge un ruolo importante nell’evoluzione di un locus: il principio del fondatore e l’e�etto collo di bottiglia.Gli e�etti dovuti al principio o e�etto del fondatore (founder’s e�ect) si hanno quando una popolazione viene formata a partire da un gruppo ristretto di individui di una popolazione più grande. Questo accade molto spesso nelle popolazioni naturali; un esempio che riguarda l’attuale composizione della �ora e della fauna dell’Europa è il ripopolamento dopo l’ultima Era Glaciale. Durante la glaciazione, quasi tutte le specie avevano ridotto il proprio habitat a quelle poche zone ancora abitabili poste nelle penisole iberica, italiana e balcanica; al termine della glaciazione, le specie ricominciarono a spostarsi verso Nord, ma a partire da pochi individui per volta. Utilizzando metodi che esulano dagli scopi di questo testo, è possibile vedere ancora oggi nella strut-tura genetica delle popolazioni le impronte genetiche dei numerosi “e�etti del fondatore” avvenuti. Possiamo, però, con alcuni semplici calcoli, dimostrare cosa accada alle frequenze alleliche.Partiamo, come al solito, dal modello più semplice di un locus con due alleli A e a (senza che questo implichi relazioni di domi-nanza o altro, che sono inin�uenti ai �ni della trattazione) che hanno frequenze p e q, rispettivamente. Dal momento che gli alleli al locus possono essere classi�cati in due categorie discrete, la distribuzione delle loro frequenze segue una distribuzione bino-miale. La distribuzione binomiale è la distribuzione di frequenza adatta per descrivere variabili di tipo qualitativo, quindi quelle che vengono espresse in categorie, per le quali viene stimata una frequenza, come nel caso di un locus a cui sono presenti due alleli A e a e per cui sono stimate p e q. Tralasciando una trattazione analitica delle stime dei parametri della distribuzione bino-miale, ricordiamo qui solo i loro valori nel caso in cui stiamo misurando la proporzione dei casi, il che risulta il caso più frequente nelle scienze biologiche. La media e la varianza delle proporzioni sono:

μ = p e σ =2 pqn

In questo caso risulta molto utile anche l’errore standard:

=spqnp

(Ricordiamo che nel caso stessimo misurando il numero di individui per una distribuzione binomiale, le stime sarebbero μ = np e σ2 = npq).Per campioni di dimensioni abbastanza grandi, la di�erenza tra la distribuzione binomiale e quella normale diventa impercet-tibile, come conseguenza del teorema del limite centrale. In questo caso si può dunque assumere che la frequenza allelica p sia normalmente distribuita con media p e varianza pq/n, il che consente di stimare anche l’intervallo di con�denza di p al 95% mediante l’equazione

± 0,025p zpqn

la formula che ci serve per studiare l’e�etto della deriva genetica sulla variazione delle frequenze alleliche. Immaginiamo allora un caso teorico di e�etto del fondatore. Partiamo da una popolazione di numerosità in�nita, con p = 0,6 e q = 0,4. A un certo punto, da questa popolazione si staccano 50 individui che vanno a stabilire una nuova popolazione in un ambiente diverso. Quali saranno le frequenze alleliche in questo gruppetto di 50 individui? Non possiamo dirlo con precisione, ma possiamo stabilire l’intervallo in cui si troveranno, mediante la formula precedente. Infatti, utilizzando

± 0,025p zpqn

e ricordando che n = 100, perché ogni individuo ha due alleli, e che il valore che delimita il 5% della distribuzione normale standardizzata z è 1,96, troviamo:

0,6 ± ( )×1,96 0,6 0, 4100

= 0,6 ± 1,96 3 0,049 = 0,6 ± 0,096

Questo signi�ca che, 95 volte su 100, p in quel gruppo di individui sarà compresa, per solo e�etto del caso, tra 0,504 e 0,696 e questa frequenza allelica sarà, a meno di altri e�etti, anche quella della popolazione fondata in questo modo. Come si vede, lo

continua cc

Vers

ione

finale

in vi

sione

aut

ori

Page 23: Capitolo 22 autori visione in finale

[ 22.6 ] Deriva genetica [ 623 ]

scostamento dalla p della popolazione iniziale può dunque essere molto evidente. Vediamo adesso cosa accadrebbe se il gruppo di individui “fondatori” fosse più grande, diciamo composto da 5.000 individui. Con la stessa formula:

0,6 ± ( )×1,96 0,6 0, 4

10.000 = 0,6 ± 1,96 3 0,049 = 0,6 ± 0,0096

per cui, con la stessa probabilità del caso precedente, in un gruppo di “fondatori” di queste dimensioni le frequenze alleliche si potranno scostare solo da un minimo di 0,59 a un massimo di 0,61.Quindi abbiamo ottenuto (1) la dimostrazione analitica di come la deriva sia una forza evolutiva e�cace solo in popolazioni di piccole dimensioni, (2) lo strumento per valutarne gli e�etti e (3) la spiegazione del termine “deriva”, in quanto i valori di p (e q) possono variare verso l’alto o verso il basso con la stessa probabilità.In�ne, spendiamo due parole sull’e�etto collo di bottiglia, o bottleneck, che si può anche vedere come un caso particolare di e�etto del fondatore, in quanto anche qui una popolazione si forma a partire da un nucleo ristretto di individui. La di�erenza consiste nel fatto che la popolazione originaria, anziché sperimentare una migrazione in uscita, subisce una drastica riduzione della sua numerosità (proprio come la quantità di liquido che esce da una bottiglia è limitata dal fatto che il collo è molto più stretto del resto del recipiente) in seguito a un qualche tipo di evento, perlopiù di tipo catastro�co. Ad esempio, un’eruzione vulcanica su un’isola ha il probabile e�etto di distruggere tutte le piante di Pyrocharpa presenti, tranne alcune che si trovano in una zona riparata. Dato che non esiste alcun gene in grado di proteggere da un bagno di lava, le piante rimaste non hanno un genotipo che conferisca loro un vantaggio evolutivo, quindi la nuova popolazione di Pyrocharpa si formerà a partire da un pool casuale di alleli tra quelli che erano presenti nel pool originario. Alle frequenze alleliche iniziali a ciascun locus si applicherà quindi la formula precedente, per cui a diversi loci le nuove frequenze alleliche potranno essere anche molto diverse da quelle della popolazione pre-catastrofe. L’approssimazione normale vale specialmente quando p ≈ q ≈ 0,5, caso in cui un campione di numerosità n = 30 è su�ciente per procedere con l’approssimazione. Man mano che p (e q) si discostano da 0,5, le dimensioni del campione necessarie per poter approssimare alla distribuzione normale aumentano di conseguenza (esistono tabelle apposite per questo).

Si veda il �lmato “E�etto collo di bottiglia nelle lucertole caraibiche” accessibile dalla versione e-book.

Reiterando nel tempo questa semplice formula, si può stimare la quota Ht di variabilità genetica rimasta a par-tire da H0 in una popolazione che subisca per t genera-zioni gli effetti della deriva:

( )=−

1 120

HH N

t

e

t

Questo dimostra per via analitica come gli effetti della perdita di variabilità siano più gravi in piccole popola-zioni, come indica appunto la presenza del termine Ne al denominatore.

La deriva genetica è dunque una forza evolutiva che può assumere notevole importanza in situazioni parti-colari, ma di solito è resa nulla dalla presenza degli altri fattori in gioco, tanto che vale una regola empirica che dice che gli effetti della deriva sono nulli se 4Nex << 1, dove x può essere uno a scelta tra u, m e s – il tasso di mutazione, la frequenza di migranti e il coefficiente di selezione. Si verifica facilmente che, per popolazioni con Ne > 1000, sia la presenza di migrazione che quella di selezione sono efficacemente in grado di contrastare i possibili effetti sulle frequenze alleliche della deriva, mentre il tasso di mutazione è, come spesso accade, ir-rilevante. Per quanto riguarda la migrazione, in un la-

voro del 2003 di Vilà e colleghi è stato dimostrato che una popolazione di lupi grigi scandinavi, costituita da un unico branco al confine tra Finlandia e Russia, le cui dimensioni erano scese fino a soli 10 esemplari, quindi a un livello in cui gli effetti della deriva genetica e dell’i-nincrocio diventano assai evidenti, è stata “salvata” dall’arrivo di un unico lupo arrivato da una popolazione a Est. Nel giro di due anni sono aumentate l’eterozigo-sità (dieci nuovi alleli a 19 loci) e le dimensioni della popolazione, ora di un centinaio di lupi, mentre è dimi-nuito il tasso di inincrocio.

Per quanto riguarda la selezione, basta un minimo di vantaggio selettivo perché le variazioni delle frequenze alleliche dovute alla selezione nascondano qualunque effetto della deriva. Pertanto, l’ipotesi neutralista acqui-sta un reale significato: per i loci non soggetti a selezio-ne, la forza evolutiva più importante può essere proprio la deriva. Questo apre un’altra interessante questione: quando una mutazione è neutra rispetto a un’altra?

Secondo la teoria neutralista, un allele è considera-to praticamente neutro ai fini della selezione quando il suo coefficiente di selezione risulta essere s < 1/(2Ne). Portando ancora ad esempio gli isoenzimi, dove diventa difficile dire quale sia l’allele “selvatico”, la differenza di fitness tra gli alleli per due isoenzimi diversi è stata in

Vers

ione

finale

in vi

sione

aut

ori

Page 24: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 624 ] Capitolo 22

qualche caso misurata ma, come atteso, è risultata assai piccola. Nel 1996, Kreitman stimò che il coefficiente di selezione tra isoenzimi differisce di meno dello 0,15%, stima che può essere utilizzata per stabilire le dimen-sioni della popolazione sufficienti per rendere gli alleli neutri di fronte alla selezione. Infatti, possiamo scrive-re:

( )<0,0015 12 eN

a dare

12 0,0015

300eN ( )<×

<

Quindi, in una popolazione di poco più di 300 individui, gli effetti della selezione diventano trascurabili. Appare dunque evidente come la deriva sia un attore che va in scena solo quando le popolazioni sono piccole – ma le popolazioni piccole sono popolazioni a rischio e, come abbiamo appena visto, la deriva è una forza che riduce la variabilità genetica proprio in questo tipo di popola-zioni. Torneremo più avanti sul problema delle popola-zioni di piccole dimensioni.

[ 22.7 ] INBREEDINGA questo punto, ci resta da analizzare cosa accada al pool genico di una popolazione quando a non essere rispettato è l’assunto della panmissia, quindi quando gli incroci non si possono dire completamente casuali. Dobbiamo, però, prima fare una piccola digressione per comprendere meglio il motivo principale per cui gli in-croci non sono panmittici.

[ 22.7.1 ] Alleli uguali in stato e per discesaFinora non ci siamo mai occupati di una questione che ha riflessi molto importanti sulla struttura genetica delle popolazioni: quando due alleli sono uguali? Ap-parentemente la risposta è semplice – abbiamo sempre immaginato che in un omozigote lo fossero, ma esistono modi diversi di essere uguali! Introduciamo un’impor-tante definizione:

■ due alleli sono uguali in stato quando non sono co-pie provenienti da un antenato identificabile;

■ due alleli sono uguali per discesa quando sono co-pie dello stesso allele (della stessa molecola di DNA) di un antenato.

Alla luce di quanto conosciamo circa gli aspetti molecolari della Genetica, non è difficile comprende-re questa differente denominazione: immaginiamo di avere un allele che codifica un enzima funzionante e che, dunque, ai nostri occhi sarà considerato un alle-le dominante A. Ora pensiamo che questo allele A su-bisca una mutazione che faccia perdere funzionalità all’enzima codificato, quindi produca un allele a. Ma la

mutazione può essere di tantissimi tipi: nella regione codificante una mutazione missenso, nonsenso o fra-meshift, una mutazione della sequenza del promotore, una mutazione non puntiforme dovuta, ad esempio, all’inserzione di un elemento trasponibile, ecc. Dal punto di vista formale e funzionale, tutti gli alleli deri-vanti da queste mutazioni sono a, ma dal punto di vista molecolare si tratta di alleli diversi, che sono dunque uguali in stato.

Quando invece uno qualunque di questi alleli a (o anche l’allele A) viene trasmesso a più individui della progenie, ciascuno di questi individui possiederà una copia identica della stessa molecola del progenitore, quindi si parla di alleli uguali per discesa (Fig. 22.11). Ne consegue che alleli uguali per discesa lo sono anche in stato, ma non viceversa.

[ 22.7.2 ] ConsanguineitàDa un unico progenitore si ha dunque la diffusione nel-le generazioni successive di una serie di alleli uguali per discesa, che sono dunque, anche da un punto di vi-sta intuitivo, più facili da trovare in individui imparen-tati tra loro, più o meno alla lontana. Per quantificare e poter poi modellizzare questo fatto, introduciamo una nuova importante definizione: due o più individui si dicono consanguinei quando hanno almeno un antenato comune. Torniamo ora al punto di partenza, l’incrocio non casuale. Come abbiamo già discusso a riguardo della legge di Hardy-Weinberg, in nessuna popolazione gli incroci sono mai completamente casuali, ma com-prendono un certo grado di assortatività, che è de-finita come la scelta non casuale del partner per dati caratteri.

Le unioni assortative possono esserlo per assorti-mento positivo, quando individui di un sesso tendono a scegliere individui dell’altro sesso con le stesse caratte-ristiche fenotipiche, o negativo, se invece è il contrario. Nella specie umana è dimostrato assortimento positivo

A

A

A

A

A

A

A

A

A

A

A

A

In stato Per discesa

FIGURA 22.11 c Alleli uguali in stato e per discesa. Sono rappresentati due tipi di alleli A, che sono funzionalmente uguali, ma non lo sono dal punto di vista molecolare (bianco e nero). In basso è indicata la fusione di due gameti a dare un omozigote bianco/nero e un omozigote nero/nero. Nel pri-mo caso, le due copie di A non discendono da una molecola ancestrale comune, a dare un individuo omozigote in stato. Nel secondo caso sono invece copie derivanti da un antenato comune, a dare un omozigote per discesa.

Vers

ione

finale

in vi

sione

aut

ori

Page 25: Capitolo 22 autori visione in finale

[ 22.7 ] Inbreeding [ 625 ]

per diversi caratteri fenotipici, quali ad esempio la sta-tura: donne alte tendono a far coppia con uomini alti, e viceversa (gli esempi contrari che vi saranno sicura-mente venuti alla mente rappresentano delle eccezio-ni!). In genetica di popolazioni, il caso più importante di unione assortativa è dato dalle unioni tra consangui-nei, non basate su caratteristiche fenotipiche, ma sulla consanguineità tra individui. L’incrocio tra consanguinei viene anche detto inincrocio, ma per indicarlo è uni-versalmente usato il termine inglese inbreeding.

A parte l’uomo, in cui gli incroci tra consanguinei sono spesso limitati da fattori culturali, ma comunque presenti, un certo grado di inbreeding è la norma nel-le popolazioni naturali: si pensi agli alberi, ad esempio. Una pianta madre spesso non ha altro metodo di disper-sione dei semi se non la forza di gravità, per cui i semi stessi daranno origine a nuovi alberi a distanze molto ridotte dalla pianta madre, che quindi sarà circonda-ta dalla sua progenie. Quando gli alberi della progenie raggiungeranno la maturità, sarà inevitabile che av-vengano scambi di materiale genetico sia con la madre che con i sibling. Sibling è il termine tecnico che indica fratello e/o sorella in Inglese ed è comodo da utilizzare per la sua concisione. Un altro caso classico di incrocio tra consanguinei è quello praticato dagli allevatori di animali domestici, per fissare nei diversi ceppi quelle qualità desiderabili che sono controllate geneticamen-

te; anche in questo caso il tipo di incrocio più comune è quello tra sibling.

[ 22.7.3 ] Coe�ciente di inbreedingIl coefficiente di consanguineità è la probabilità che due alleli, estratti a caso dallo stesso locus di due indivi-dui diversi della stessa popolazione, siano uguali per discesa. Si noti come questa sia anche la probabilità che dall’incrocio dei due individui nasca un omozigote uguale per discesa, nel caso essi siano di sesso diverso.

Definiamo allora il coefficiente di inbreeding, F, come la probabilità che un dato individuo possieda a un dato locus i due alleli uguali per discesa. Il coefficiente F, come tutte le altre statistiche F che studieremo tra poco, è stato introdotto da Sewall Wright, un’altra grande fi-gura della genetica di popolazioni del XX secolo, a cui si deve anche la trattazione analitica degli effetti della deriva genetica.

F può essere stimato in maniera diretta o indiretta: nel primo caso, è possibile avere una stima diretta e molto precisa di F se abbiamo la possibilità di studiare degli alberi genealogici, mentre il secondo caso è quello che si verifica studiando delle popolazioni ed è basato sul confronto dei valori di Ho e He, come mostrato nel BOX 22.8.

Possiamo sfruttare le diverse frequenze genotipiche attese secondo Hardy-Weinberg o secondo Wright per ottenere molto fa-cilmente una stima di F in qualunque popolazione in studio. Infatti, supponiamo di studiare una popolazione naturale mediante microsatelliti e di avere ottenuto per un dato locus i valori seguenti:

Genotipo AA Aa aa Totale

N° individui 220 140 640 1.000

Abbiamo dunque Ho = 0,14, mentre stimiamo He dopo aver calcolato le frequenze alleliche: p = [(220 x 2) + 140] / 2.000 = 0,29 e q = 0,71, da cui He = 1 – (0,292 + 0,712) = 0,588. Adesso possiamo usare questi due valori per stimare F, secondo il seguente ragio-namento:- nella popolazione naturale, in cui è dunque presente un certo grado di inbreeding, l’eterozigosità misurata è 0,14;- Ho è una stima del valore di H all’equilibrio di Wright;- nella popolazione modello, quindi all’equilibrio di Hardy-Weinberg, l’eterozigosità sarebbe 0,588;- He è una stima del valore di H all’equilibrio di Hardy-Weinberg;- possiamo allora scrivere che Ho = 2pq (1 – F) e He = 2pq. Facendo il rapporto e risolvendo per F, si ottiene:

2 12

1o

e

HH

pq Fpq

F( ) ( )=

−= −

da cui:

= −

1 0FHHe

Nel nostro caso avremmo dunque che F = 1 – (0,14/0,588) = 0,762. Questa stima è relativa a un locus, ma la si può ottenere per tutti i loci studiati usando i valori medi di Ho e di He.Un altro metodo di stima indiretta di F è quello relativo al caso in cui si possa misurare H per la stessa popolazione dopo un nu-mero t di generazioni – cosa che è possibile ritornando al modello isola-continente, dove possiamo immaginare che H al tempo t sia H misurata per l’isola, mentre H al tempo zero sia quella del continente, che assumiamo non vari di molto nel tempo.

BOX 22.8 Stima di F dalle popolazioni naturali

continua cc

Vers

ione

finale

in vi

sione

aut

ori

Page 26: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 626 ] Capitolo 22

22.7.3.1 Stima di F dagli alberi genealogiciQuesto è un caso che si può frequentemente presentare in genetica umana, ma anche nel miglioramento geneti-co di piante e animali. Infatti, conoscere il coefficiente di inbreeding di un dato individuo il cui albero genealogico sia noto consente di stabilire la probabilità che quell’in-dividuo possegga un dato genotipo. Mentre per i casi più complessi si può vedere il BOX 22.9, in cui vengono fornite alcune formule generali per questo tipo di cal-colo di F, di seguito diamo i concetti fondamentali utili per questo scopo. Il caso più semplice è il calcolo di F per le coppie genitori/figli. Nelle figure e nei diagrammi che seguono useremo simboli qualunque (es. i semi del-le carte da gioco francesi) per indicare gli alleli; infatti, non ci interessa se venga trasmesso un allele dominante o recessivo, ma quale sia la probabilità che un individuo porti alleli uguali per discesa, che saranno contrasse-gnati da un simbolo identico.

Immaginiamo di avere dunque due genitori che, a un locus qualunque, hanno genotipo:

♂ ♠♣ 3 ♀ ♥♦

I genotipi possibili della progenie sono quindi:

♠♥ con frequenza ¼♠♦ con frequenza ¼♣♥ con frequenza ¼♣♦ con frequenza ¼

Qual è allora la probabilità p che, prendendo un allele a caso da uno dei figli e un allele da uno dei genitori, que-sti siano identici? Se consideriamo, ad esempio, il geni-tore ♠♣, la probabilità p con il figlio ♠♥ è ½♠ 3 ½♠ = ¼, ma dato che il figlio ♠♥ aveva una probabilità di esse-re generato pari a ¼, la p totale è ¼ 3 ¼ = 1/16. Dato che, però, lo stesso vale per tutti i quattro possibi-

li figli, bisogna ancora moltiplicare 1/16 3 4 = ¼. Il co-efficiente di inincrocio per una coppia genitore/fi-glio è dunque F = 0,25 – lo stesso vale per una coppia fratello/sorella. Quindi, nell’ipotesi di un incrocio tra si-bling, un individuo della progenie ha per ogni locus una probabilità del 25% di avere alleli uguali per discesa. Questa probabilità vale per tutti i loci del genoma, quin-di possiamo anche dire che F è la frazione dei loci a cui un individuo è omozigote per discesa.

[ 22.7.4 ] E�etti dell’inbreedingAbbiamo discusso in precedenza come sia del tutto ra-gionevole pensare che in una popolazione esista un tas-so medio di inbreeding, anche nelle popolazioni umane, dove gli incroci tra consanguinei sono ammessi oltre un certo grado di parentela – ad esempio, per la legge italiana sono celebrabili matrimoni tra cugini primi (F = 1/16 = 0,0625), mentre il tribunale, sentito il pubbli-co ministero, può autorizzare il matrimonio tra zia/o e nipote, il che non rappresenta una distanza troppo ele-vata: se si fa il calcolo, F per tale coppia è 1/8 = 0,125.

Esistendo dunque un certo grado di unioni tra con-sanguinei, aumenterà rispetto all’atteso la frequenza degli omozigoti, in quanto la progenie di consanguinei ha maggiori probabilità di essere omozigote “per disce-sa”. Al contrario di quanto ci si potrebbe attendere, la presenza di un F non fa variare le frequenze alleliche, ma solo quelle genotipiche, in quanto ha l’effetto di au-mentare gli omozigoti e ridurre gli eterozigoti. Abbiamo così visto l’ultima eccezione agli assunti della legge di Hardy-Weinberg, che ci porta a derivare un’altra inte-ressantissima equazione circa la struttura genetica del-le popolazioni naturali.

Allora, ricordiamo che la perdita di variabilità genetica in una piccola popolazione (isola) dovuta alla deriva genetica è, dopo t generazioni:

11

2t

0 e

HH N

t

= −

ma si può anche dimostrare che la perdita di variabilità genetica in una generazione è pari al tasso di inbreeding, cioè:

12 e

DFN( )=

a dare, dopo t generazioni:

11

2te

FN

t

= −

Si nota che il termine [1 – 1/(2Ne)]t compare in entrambe le equazioni e possiamo riarrangiare il tutto a dare:

Ft = 1 – (Ht /H0)

che stima F della popolazione isolana, assumendo che la popolazione del continente sia all’equilibrio di Hardy-Weinberg.

Vers

ione

finale

in vi

sione

aut

ori

Page 27: Capitolo 22 autori visione in finale

[ 22.7 ] Inbreeding [ 627 ]

Questo metodo, proposto da Sewall Wright, è ottimo per capire il vero signi� cato di F. Consideriamo un caso molto semplice, il calcolo di F per i fratelli X e Y in Fig. 1, dove gli alleli sono rappresentati dai semi delle carte da gioco francesi. Ricordiamo che F per due individui si può considerare uguale alla p che dal loro incrocio (indipendentemente dal fatto che avvenga realmente) si generi un omozigote uguale per discesa. Consideriamo il possibile destino delle picche: la p che A trasmetta picche a X o Y è 0,5, quindi che lo trasmetta a entrambi è (½ 3 ½) = ¼. A questo punto, la p che X o Y trasmetta picche a Z è 0,5, quindi la p che lo trasmettano entrambi è (½ 3 ½) = ¼. La p totale che Z sia omozigote per picche è dunque (¼ 3 ¼) = 1/16. Dato che questo vale per ciascuno dei quattro semi iniziali, la p complessiva che Z sia omozigote per discesa sarà (1/16 + 1/16 + 1/16 + 1/16) = ¼ = 0,25. Una volta svolto questo ragionamento, dalla gra� ca notiamo come abbiamo contato i lati del poligono (quattro) che fanno capo a Z partendo dall’antenato comune. Il coe� ciente di inincrocio di Z può allora essere formulato come:

F = 2 12

n

+ 2

12

n

dove n è il numero di lati del poligono, il fattore 2 deriva dal fatto che ciascun antenato (A e B) può fornire due alleli, mentre la ripetizione tiene conto che lo stesso ragionamento si fa per ciascuno dei due antenati (ci sono due poligoni). Possiamo però generalizzare il metodo, per poter studiare anche alberi più complessi. De� nendo linea di parentela la sequenza di passi gene-razionali che uniscono due individui, ogni linea di parentela di lunghezza n contribuisce al coe� ciente di inincrocio con (½)n+1. Basta sommare i contributi di tutte le linee per ottenere F. Nel caso di Fig. 2, dove X e Y sono cugini primi e mezzi cugini secondi, possiamo identi� care tre linee: X-A-Y, X-B-Y e X-E-Y, con n = 4, 4 e 6, rispettivamente. Il coe� ciente di inincrocio di X e Y, che equi-vale al coe� ciente di incrocio di un’ipotetica loro progenie Z, sarà dato da:

12

12

12

132

132

1128

9128

0,07034 1 4 1 6 1

F =

+

+

= + + = =

+ + +

A B

X Y

Z

Figura 1 Calcolo di F. Diagramma per la stima di F nel semplice caso fratello-sorella (o due sorelle o due fratelli).

A

E

F

C

H

B

D

Y

H

G

I

Figura 2 Albero genealogico complesso. Si può stimare F per X e Y in modo semplice utilizzando il metodo dei poligoni.

BOX 22.9 Stima di F dagli alberi genealogici

Vers

ione

finale

in vi

sione

aut

ori

Page 28: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 628 ] Capitolo 22

[ 22.7.5 ] Equilibrio di WrightAndiamo ora a stimare quali saranno le frequenze ge-notipiche di una popolazione, assumendo che esista un F > 0. Sempre con la convenzione di rappresentare gli alleli con simboli, usiamo per un ipotetico allele a i due semi “neri”. In uno dei due sessi, esistono solo alleli ♠, con frequenza q. Per la definizione di F, nell’altro sesso la f(♠) sarà F stesso, in quanto frequenza di alleli uguali per discesa, mentre sarà (1 – F) la frequenza degli alleli non uguali per discesa, f(♣). La progenie potrà allora essere:

♠♠ uguale in stato e per discesa♠♣ uguale in stato

Le frequenze delle due classi di progenie (entrambe aa, ricordate!) sono:

♠♠ q 3 F♠♣ q 3 q (1 – F) = q2 (1 – F)

Il totale degli aa sarà dunque dato da:

qF + q2 (1 – F)

Lo stesso discorso può essere fatto per gli omozigoti AA, a dare:

pF + p2 (1 – F)

e per gli eterozigoti Aa:

2pq (1 – F)

Confrontiamo le frequenze genotipiche ottenute in pre-senza di un F con quelle attese per una popolazione all’equilibrio di Hardy-Weinberg:

Genotipo AA Aa aa

Hardy-Weinberg p2 2pq q2

Wright pF + p2 (1 – F) 2pq (1 – F) qF + q2 (1 – F)

Quindi, in presenza di una quota F di incrocio tra consanguinei, le frequenze genotipiche all’equilibrio diventano quelle appena derivate: si dice che la popo-lazione è all’equilibrio di Wright. La differenza con la popolazione modello è che, in presenza di inbreeding, le popolazioni presentano un difetto di eterozigoti e un eccesso di omozigoti – questa è la più frequente ecce-zione all’equilibrio di Hardy-Weinberg che si può tro-vare nelle popolazioni naturali. Si può notare come l’e-quilibrio di Hardy-Weinberg sia un caso particolare di quello di Wright quando F = 0. Invece, nel caso in cui F = 1, la popolazione sarà composta soltanto da omozigoti, con frequenze genotipiche pari a quelle alleliche, cioè i due alleli si saranno fissati – da questo deriva la lettera F, perché in origine Wright aveva denominato così que-sto indice, in quanto rappresenta l’indice di fissazione di un allele.

Nelle nostre mani F si sta dimostrando un indice molto versatile, in quanto mette in relazione i livelli di variabilità genetica con la discendenza diretta degli alleli stessi. Proprio sfruttando questa caratteristica, possiamo ora andare a vedere come F, o meglio una fa-miglia di indici F, possa essere sfruttato per confrontare

i livelli di variabilità genetica di due o più popolazioni allo scopo di determinare i livelli di differenziamento tra le popolazioni stesse. Conviene, però, prima intro-durre un altro concetto, quello di struttura genetica di una popolazione.

[ 22.7.6 ] Struttura geneticaCon questo termine si indica una situazione per la quale in una popolazione le frequenze genotipiche non sono determinate solo dall’incrocio casuale dei gameti che avviene nella popolazione mendeliana di riferimento. Una popolazione all’equilibrio di Hardy-Weinberg NON è dunque strutturata. I fattori che determinano una strut-tura genetica sono principalmente tre:

■ la selezione; ■ l’inbreeding; ■ la suddivisione in sottopopolazioni.

Degli effetti della selezione abbiamo già parlato ed è chiaro che la riproduzione differenziale dei genoti-pi fa spostare le frequenze genotipiche. L’inbreeding crea una struttura genetica definita dalle equazioni di Wright. Anche la suddivisione di una popolazione in sottopopolazioni fa spostare le frequenze genotipiche dall’atteso di Hardy-Weinberg senza far variare le fre-quenze alleliche; in questo caso si raggiunge un altro tipo di equilibrio, detto di Wahlund, in cui si ha ancora un eccesso di omozigoti (stavolta in stato) e un difetto di eterozigoti. Per la trattazione approfondita di questa situazione rimandiamo a testi più specializzati.

Spesso, nella letteratura scientifica, si parla di “strut-tura genetica” a indicare l’assetto genetico tout court delle popolazioni studiate, quindi dando al termine un significato un pochino diverso, ma basta prestare atten-zione al contesto per non fare confusione.

Comunque, per studiare il livello di differenziamen-to delle popolazioni, ci occuperemo essenzialmente del fattore inbreeding, in quanto ci interessa stabilire quan-to due o più popolazioni abbiano o meno avuto un’ori-gine comune, sulla base del numero di alleli uguali per discesa che condividono.

[ 22.7.7 ] Statistiche FWright derivò tre tipi diversi di indice F per lo studio del differenziamento tra popolazioni, che vanno sotto il nome generale di “F statistics” e sono FIS, FIT e FST. Vedia-mo cosa rappresentano.

Nel modello di Wright, una popolazione può esse-re considerata come l’insieme di più sottopopolazioni (Fig. 22.12). Facilmente possiamo ampliare il concetto a una specie divisa nelle popolazioni che la compongo-no e il discorso che stiamo per fare resta ugualmente valido.

Wright descrisse il grado di differenziamento tra popolazioni scomponendo l’inbreeding totale nelle sue componenti entro e tra popolazioni, nel modo di seguito descritto.

Vers

ione

finale

in vi

sione

aut

ori

Page 29: Capitolo 22 autori visione in finale

[ 22.8 ] Il caso delle piccole popolazioni [ 629 ]

L’inbreeding tra Individui della popolazione Totale (FIT) è composto da due quote: (1) la quota di inbree-ding relativa agli Individui all’interno della loro Sotto-popolazione (FIS) e (2) a quota di inbreeding relativa al differenziamento tra Sottopopolazioni rispetto alla popolazione Totale (FST). In pratica, misurando i livelli di inbreeding a tutti questi livelli, andiamo a stabilire la proporzione di alleli uguali per discesa che rende più o meno vicini gli individui della stessa popolazione ri-spetto agli individui di popolazioni diverse.

Così come F = 1 – Ho/He, possiamo espandere il con-cetto a diverse coppie Hosservata/Hattesa. Definiamo infatti:

■ HI come l’eterozigosità osservata media delle popo-lazioni;

■ HS come l’eterozigosità attesa media delle popolazio-ni;

■ HT come l’eterozigosità attesa sul totale delle popo-lazioni.

Da questo derivano le tre F statistics: ■ FIT = 1 – (HI / HT) ■ FIS = 1 – (HI / HS) ■ FST = 1 – (HS / HT)

Nel BOX 22.10 è riportato un esempio grafico/nu-merico, che consigliamo di seguire con attenzione, in quanto chiarisce assolutamente la situazione. Facciamo qui solo un paio di considerazioni generali.

Dalla definizione e dall’esempio risulta come il coef-ficiente F di cui abbiamo parlato finora non sia altro che FIS, quindi il grado di inbreeding dovuto alla storia natu-rale della specie, cioè a caratteristiche come le modalità riproduttive (es. livelli diversi di autofecondazione nelle piante) e la mobilità dei geni o degli individui.

FST, probabilmente l’indice più usato di tutta la gene-tica di popolazioni, è invece la probabilità che due alleli estratti a caso da sottopopolazioni (o popolazioni) di-verse siano identici per discesa. Dato che la presenza di alleli identici per discesa implica un antenato comu-

ne, FST è un ottimo indice del grado di differenziamento tra popolazioni. Valori bassi di FST indicano bassi livelli di differenziamento, mentre livelli più alti sono tipi-ci di popolazioni che da diverse generazioni non sono più in contatto genetico tra loro. Non esiste una scala universale di valori di FST che possa però permettere di confrontare valori ottenuti in specie diverse, perché ap-punto ogni specie presenta proprie caratteristiche per quanto riguarda la storia naturale della specie stessa. Non è raro trovare che i livelli di FST tra sottopopolazioni nella specie A sono maggiori dei livelli di FST tra popo-lazioni nella specie B. L’interpretazione più semplice, immediata e utile per comprendere i valori di FST otte-nuti in uno studio reale è la seguente: FST esprime quan-ta parte della variabilità genetica presente in una specie sia dovuta a differenze genetiche tra le popolazioni che la compongono. Nella realtà, i valori trovati sperimental-mente per FST sono molto spesso abbastanza bassi – tra 0,05 e 0,1 – come ad esempio nella specie umana. Que-sto vuol dire che di norma esistono molte più differenze genetiche tra gli individui della stessa popolazione che non tra individui di popolazioni differenti.

La presenza di valori anche molto bassi di FST rende necessario l’uso di metodologie statistiche per stabilire se i valori ottenuti siano significativamente diversi da zero; di solito il test si effettua mediante procedure di ricampionamento, che sono disponibili in tutti i pac-chetti software utilizzati per le analisi dei dati ottenu-ti in materia. Per concludere, anche se, come abbiamo detto, risulta molto difficile costruire una scala di valori di FST universale, si possono definire valori bassi di FST quelli minori di 0,1, valori medi quelli compresi tra 0,1 e 0,15-0,2, valori alti quelli superiori a 0,2.

Occorre dire che FST era stato derivato per il caso molto semplice di loci biallelici, per cui nella pratica mo-derna, basata sullo studio di moltissimi loci in cui sono presenti serie alleliche anche di 20-30 alleli, come nel caso degli SSR, non è più un indice adeguato. Nel corso degli anni, il concetto originale di FST è stato ampliato a comprendere questi casi più complessi, per cui, ad esempio, oggi è quasi universalmente usato θ (theta), l’indice di Weir e Cockerham (1984), anche se, a indi-care l’assoluta coincidenza di significato, i valori di θ vengono indicati come FST. In alcuni casi viene anche utilizzato l’indice sviluppato da Nei (GST) che, oltre a es-sere concettualmente uguale, è anche numericamente identico a FST nel caso particolare di due loci con due alleli ciascuno.

[ 22.8 ] IL CASO DELLE PICCOLE POPOLAZIONI

Quando una popolazione è di piccole dimensioni, quin-di ha un valore basso di N e di Ne, è interessante per più motivi. In primo luogo, dato che il numero degli indivi-dui che la compongono è ridotto, significa probabilmen-te che si tratta di una popolazione a rischio di estinzione e diventa di interesse per la conservazione delle risorse genetiche; infatti, la perdita della popolazione rappre-

Sottopopolazione A Sottopopolazione B

Sottopopolazione C

Popolazione X

FIGURA 22.12 c Modello di Wright. Una popolazione (o una specie) X è di solito composta da più sottopopolazioni (o popolazioni). Ciascuna sottopopolazione è composta da più individui e tra le sottopopolazioni è presente un certo gra-do di flusso genico (tra 0 e 1). Da questo modello è possibile ricavare i valori di inbreeding nella popolazione totale (FIT), per ciascuna delle sottopopolazioni (FIS) e tra sottopopolazioni rispetto alla popolazione totale (FST). Si vedano il testo e il BOX 22.10 per il calcolo di ciascun coefficiente.

Vers

ione

finale

in vi

sione

aut

ori

Page 30: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 630 ] Capitolo 22

Anche se accessibili già da un punto di vista intuitivo, le tre statistiche F acquistano pienezza di signi�cato se calcolate a mano anche in un esempio molto semplice. Si raccomanda di prendere carta e matita e seguire passo passo l’esempio seguente.Consideriamo un’ipotetica popolazione di organismi diploidi suddivisa in tre altrettanto ipotetiche sottopopolazioni e immagi-niamo di genotipizzare tutti gli individui per un locus biallelico qualunque (che chiameremo A). Riportiamo nello schema seguen-te le frequenze genotipiche per ciascuna sottopopolazione (Pop) e come prima cosa stimiamo p e q, le frequenze alleliche di A e a, rispettivamente, ricordando che p = P + H/2.

AA Aa aa p Ho He

Pop1 0,25 0,30 0,45 0,4 0,30 0,48

Pop2 0,14 0,12 0,74 0,2 0,12 0,32

Pop3 0,20 0,20 0,60 0,3 0,20 0,42

La cosa più immediata da fare è stimare il valore medio di p nelle tre sottopopolazioni, per ottenere HT, l’eterozigosità attesa sul totale delle sottopopolazioni. Dunque:

p– = 0, 4 0,2 0,3

3( )+ +

= 0,3

q– = 0,7

Per la de�nizione di He, sarà allora:

HT = 1 – (0,32 + 0,72) = 0,42

Per ottenere HI, l’eterozigosità osservata media, occorre stimare Ho per le tre sottopopolazioni, ma questo è molto semplice, in quanto Ho è la frequenza degli eterozigoti Aa! Quindi:

HI = 0,30 0,12 0,20

3( )+ +

= 0,207

In�ne, per ottenere HS, l’eterozigosità attesa media delle popolazioni, basterà stimare He per ciascuna delle sottopopolazioni e fare la media:

He1 = 1 – (0,42 + 0,62) = 0,48He2 = 1 – (0,22 + 0,82) = 0,32He3 = 1 – (0,32 + 0,72) = 0,42

Quindi sarà:

HS = 0, 48 0,32 0, 42

3( )+ +

= 0,407

Abbiamo ottenuto quanto ci occorre per la stima delle tre statistiche F:

FIT = 1 – I

T

HH

= 1 – 0,493 = 0,507

FIS = 1 – I

S

HH

= 1 – 0,509 = 0,491

FST = 1 – S

T

HH

= 1 – 0,969 = 0,031

In questo esempio, le tre sottopopolazioni non presentano grosse di�erenze nell frequenze alleliche, quindi presumibilmente non si stavano di�erenziando da un lungo periodo di tempo, come testimoniato dal basso valore di FST. Si provi adesso a ottenere la stima di FST partendo dalla situazione seguente:

AA Aa aa

Pop1 0,30 0,30 0,40

Pop2 0,04 0,32 0,64

Pop3 0,60 0,34 0,06

La soluzione è FST = 0,203. La di�erenza con l’esempio precedente è dovuta al fatto che le frequenze alleliche di�eriscono in ma-niera più elevata tra popolazioni, che quindi risultano più di�erenziate.

BOX 22.10 Esempio di calcolo delle F statistics

Vers

ione

finale

in vi

sione

aut

ori

Page 31: Capitolo 22 autori visione in finale

[ 22.8 ] Il caso delle piccole popolazioni [ 631 ]

continua cc

Molto spesso FST viene interpretato come la distanza genetica tra popolazioni. Questo non è del tutto corretto perché, come ab-biamo visto, FST è un indice del grado di di�erenziamento basato sulla frequenza di alleli uguali per discesa. Le distanze genetiche rappresentano qualcosa di diverso.Come al solito, immaginiamo di aver studiato n popolazioni mediante un certo numero di marcatori, quindi a un numero m di loci. Dai dati ottenuti ricaviamo allora le frequenze alleliche ai loci: ogni popolazione risulta, a questo punto, identi�cata quantita-tivamente dalle sue frequenze alleliche a tutti i loci considerati ed è quindi rappresentabile da un punto nello spazio. È pertanto possibile rappresentare le n popolazioni come punti più o meno vicini e stimarne le distanze relative. Il problema principale è che la rappresentazione spaziale può essere fatta in uno spazio tridimensionale �no a un limite di tre loci, ciascuno con due alleli, ma appena superato questo limite dobbiamo riferirci a uno spazio m-dimensionale. Se a un locus ci sono più di tre alleli, non è possibile rappresentare gra�camente la popolazione, in quanto essi de�niscono uno spazio a più di tre dimensioni, mentre se ci sono più loci, le popolazioni non sono neanche più punti, ma vettori, il che rende la situazione non più visualizzabile.Com’è possibile riunire in un indice unico l’informazione contenuta nel vettore delle frequenze alleliche che de�niscono ciascuna popolazione? È ancora possibile confrontare le popolazioni?Il problema è stato a�rontato e risolto in due modi: con il metodo delle distanze genetiche e con quello della kinship. Una trattazione completa di questi argomenti richiederebbe un intero libro di testo, per cui ci limitiamo a riassumere alcuni concetti essenziali.La de�nizione di distanza genetica è stata fornita nel 1987 da Nei come: “Genetic distance is the extent of gene di�erences between populations or species that is measured by some numerical quantity”.1

Quindi, la distanza genetica D tra due o più popolazioni è la loro distanza geometrica in uno spazio multidimensionale (euclideo) come de�nita dal totale delle frequenze alleliche stimate a tutti i loci studiati. Si nota immediatamente, a questo punto, la di�e-renza con FST, in quanto il tema dell’identità per discesa è scomparso.Una volta chiara questa distinzione, possiamo dunque dire di avere a disposizione due famiglie di stimatori del grado di distanza tra le popolazioni, quelle basate su FST e quelle basate su D.La di�erenza consiste nel fatto che le distanze basate su stime di FST presentano un valore che è funzione del numero di genera-zioni, quindi del tempo, e di Ne, quindi indipendente dal tasso di mutazione u. Infatti, la nostra attenzione è sugli alleli uguali per discesa, che quindi si ritiene non siano andati incontro a eventi di mutazione. Le vere e proprie distanze genetiche, quelle basate sulla D di Nei, sono invece proporzionali a Tu e indipendenti da Ne, in quanto andiamo a misurare frequenze alleliche diverse, dove nuovi alleli si sono formati per eventi mutazionali. Nel caso in cui Ne sia costante nel tempo, possiamo scrivere D = e–2uT.Nella pratica, dato che prima o poi le mutazioni avvengono, FST e gli stimatori a esso legati sono molto buoni quando il tempo di divergenza tra le popolazioni non è troppo elevato, in modo che possiamo assumere con una certa sicurezza che la mutazione non abbia avuto ancora il tempo di agire. Le distanze genetiche sono invece molto più indicative quando si confrontano popola-zioni che si sono separate da molte generazioni o addirittura appartenenti a specie diverse, anche se vicine da un punto di vista �logenetico.Nel corso degli anni sono stati proposti moltissimi tipi di distanza genetica, di cui proponiamo quella basata sulla circonferenza trigonometrica di Cavalli-Sforza ed Edwards (1963), una delle più semplici, ma che presenta tutte le proprietà di distanze più so�sticate, con il vantaggio di mettere in evidenza in modo più intuitivo la relazione tra frequenze alleliche e distanze euclidee (no, non saremo in uno spazio multidimensionale).Immaginiamo di avere due popolazioni, F e G, e di aver stimato le frequenze alleliche al locus A, dove per semplicità ci sono solo due alleli, e indichiamo come sempre f(A) = p e f(a) = q. Indichiamo con pF e qF le frequenze alleliche di F e con pG e qG quelle di G. Se mettiamo in un sistema di coordinate cartesiane questi valori, le due popolazioni si disporranno su un segmen-to di retta:

F

G

p

q

1 Trad.: “Una distanza genetica è la misura numerica della quota di di�erenze tra i geni di popolazioni o specie diverse”).

BOX 22.11 Distanze genetiche

Vers

ione

finale

in vi

sione

aut

ori

Page 32: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 632 ] Capitolo 22

Se invece trasformiamo i valori delle frequenze alleliche nella loro radice quadrata, possiamo metterci nella situazione di riporta-re le frequenze alleliche in una circonferenza trigonometrica:

F

G

Ricordando un po’ di trigonometria, possiamo rapidamente calcolare il coseno dell’angolo θ sul quale insistono F e G:

cos θ = F G F Gq q p p+

Si può immediatamente veri�care in modo intuitivo l’interesse di questa relazione. Infatti, se nelle due popolazioni si fossero �s-sati i due alleli diversi (pF = 1 e qG = 1), questo valore sarebbe cos 90° = 1, mentre se le due popolazioni avessero le stesse frequen-ze alleliche, sarebbe cos 0° = 0. Sembra dunque utile utilizzare questo metodo per avere una distanza tra popolazioni espressa in un valore euclideo compreso tra 0 e 1. Se utilizziamo i radianti, de�niamo allora la distanza genetica come:

D = 2θ/π

Infatti, nel caso di �ssazione di alleli diversi, cos 90° = cos π/2 = 1. Quindi, se θ = π/2, D = 2(π/2)/π = 1.Il concetto può essere rapidamente esteso a un qualunque numero di alleli. Con tre alleli:

cos θ = F G F G F Gq q p p r r+ + …

e si può ottenere una stima complessiva da n loci indipendenti:

∑=D Dtot n2

Come esempio, esaminiamo un caso molto semplice con due popolazioni genotipizzate a un locus con tre alleli, di cui riportiamo le frequenze p, q e r:

p q r

Pop1 0,6 0,2 0,2

Pop2 0,3 0,6 0,1

Sarà allora:

cos θ = 0,6 0,3 0,2 0, 6 0,2 0,1× + × + × = 0,912θ = 0,422D = 0,269

Se avessimo genotipizzato un altro locus, B:

p q r

Pop1 0,5 0,3 0,2

Pop2 0,4 0,4 0,2

avremmo trovato:

cos θ = 0,5 0, 4 0,3 0, 4 0,2 0,2× + × + × = 0,994θ = 0,113D = 0,072

A questo locus la distanza genetica è minore, perché le di�erenze tra le frequenze alleliche delle due popolazioni sono ridotte rispetto a quelle del locus A.È possibile ottenere una stima complessiva della distanza genetica tra popolazioni basata su entrambi i loci con:

D = 0,269 0,0722 2( )+ = 0,278

Vers

ione

finale

in vi

sione

aut

ori

Page 33: Capitolo 22 autori visione in finale

[ 22.8 ] Il caso delle piccole popolazioni [ 633 ]

senterebbe anche la perdita dei genotipi degli indivi-dui che la compongono. Un genotipo rappresenta una combinazione di alleli unica nel suo genere, quindi la sua scomparsa vuol dire che quella combinazione non si presenterà mai più nella storia dell’evoluzione, sarà persa per sempre. Da un altro punto di vista, in una pic-cola popolazione, alcuni dei meccanismi che abbiamo discusso nel capitolo risultano modificati, dando luogo a situazioni particolari.

La prima conseguenza attesa per una popolazione di piccole dimensioni è la perdita di variabilità geneti-ca, dovuta all’azione congiunta di tre possibili mecca-nismi: la deriva genetica, l’inbreeding e, contrariamente a quanto abbiamo discusso in precedenza, la selezione a favore dell’eterozigote! Andiamo più nel dettaglio, ri-cordando che gli effetti di questi tre fattori sono stretta-mente intrecciati fra loro.

Innanzitutto, dato che Ne è bassa, gli effetti di deri-va possono essere imponenti; sarà più probabile avere grosse fluttuazioni delle frequenze alleliche dovute al caso e quindi, dato che, come abbiamo detto, la probabi-lità di fissazione di un allele è pari alla sua frequenza in quel momento, la deriva fissa gli alleli più rapidamente. Ma occorre tenere presente che, in una piccola popola-zione, saranno più probabili gli incroci tra consangui-nei, con aumento del valore di F, dunque degli omozigo-ti. La conseguente diminuzione della variabilità geneti-ca si sovrappone a quella eventualmente causata dalla deriva. Ma non è finita: in una piccola popolazione, la selezione bilanciante (a favore dell’eterozigote) ha ef-fetti diversi a seconda delle frequenze all’equilibrio e non previene comunque la perdita di diversità genetica. Infatti, Robertson ha dimostrato che nelle piccole popo-lazioni gli effetti della selezione bilanciante sono quelli attesi quando p e q all’equilibrio sono compresi tra 0,2 e 0,8. Al di fuori di questo intervallo, la selezione accelera la fissazione degli alleli.

Questo risultato apparentemente paradossale si spiega perché le frequenze degli alleli che, per effetto della deriva, si scostano dall’equilibrio andando verso valori intermedi, vengono risospinte verso valori pros-simi a 1 dalla selezione, rendendole così soggette alla possibilità di venire fissate dalla deriva. Il risultato è quindi che la selezione “scoraggia” gli alleli rari dall’au-mentare la loro frequenza.

Nella pratica, tutto questo costituisce un grosso problema nel campo della genetica della conservazio-ne, dove l’aumento della frequenza degli omozigoti porta al fenomeno della depressione da inbreeding – una diminuzione della fitness degli organismi con elevato valore di inbreeding, un fenomeno già studiato nelle piante da Darwin nel 1876. Le cause più probabili di questo fenomeno sono presumibilmente la perdita di eterozigosità e l’aumento della probabilità che alleli deleteri si trovino allo stato omozigote. Anche se i mec-

canismi precisi della depressione da inbreeding sono ancora abbastanza oscuri, si tratta di un fenomeno di notevole importanza per il suo possibile ruolo nell’e-voluzione e il suo impatto sulla salute umana e sulla conservazione delle specie in pericolo. La depressione da inbreeding si può osservare in tutti gli organismi, ma è particolarmente evidente negli animali; nelle piante, infatti, dato che l’autofecondazione è un mec-canismo riproduttivo assai frequente, la depressione da inbreeding non ha quasi effetto, in quanto nel corso dell’evoluzione si sono sviluppati dei meccanismi che riducono i rischi dell’omozigosità per alleli deleteri (al contrario, nelle piante è assai evidente il fenome-no opposto, il vantaggio dell’eterozigote, o eterosi; si vedano testi specializzati per una discussione più ap-profondita). Invece, nel caso degli animali, e in parti-colare dei mammiferi, che sono oggetto di progetti di conservazione delle risorse genetiche, il fenomeno può assumere dimensioni preoccupanti, tali da mettere a rischio le popolazioni (solitamente piccole) della specie che si vuole proteggere. La conservazione ex-situ, cioè quella fatta mantenendo la specie in ambiente protet-to, solitamente non il proprio, presenta dei problemi a questo proposito; infatti, se si confrontano le popo-lazioni in cattività con quelle naturali, si riscontrano tassi di mortalità più elevati e tassi riproduttivi più bassi. Tutto questo contribuisce a rendere le piccole popolazioni particolarmente in pericolo di scomparsa – se poi la popolazione è l’ultima di una specie, questa è addirittura a rischio di estinzione. Questo caso non è così infrequente, specie nelle popolazioni vegetali; un esempio nell’areale mediterraneo è l’abete dei Nebro-di (Abies nebrodensis), una specie in pericolo critico di estinzione inserita nella lista delle 50 specie botaniche mediterranee più minacciate, di cui è rimasta un’unica popolazione, con una N di 29 alberi nel 2001.

Si è quindi sviluppata una nuova strategia per la ge-stione delle risorse naturali, il salvataggio genetico (ge-netic rescue). Abbiamo già visto come questo possa ac-cadere naturalmente con l’esempio del lupo grigio scan-dinavo, ma un caso celebre di gestione è rappresentato dal puma della Florida. Intorno agli anni 1980-1990 ne era stata scoperta una popolazione relitta in un conte-sto semi-urbano, tra Miami e Naples, che era ridotta a una ventina di esemplari che mostravano severi effetti di inbreeding a livello fenotipico, tra cui una ridotta ca-pacità di procreare. Quindi, nel 1995 si decise di impor-tare otto femmine di puma dal Texas, sulla base del fatto che tra le popolazioni di queste due regioni c’erano stati scambi storicamente accertati. Nel giro di pochi anni la situazione fu drasticamente migliorata (grazie anche all’emanazione di leggi per la protezione dell’habitat): uno studio del 2010 riportava che la popolazione supe-rava le 500 unità, la variabilità genetica era aumentata e i difetti fisici scomparsi.

Vers

ione

finale

in vi

sione

aut

ori

Page 34: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 634 ] Capitolo 22

Problema 1. Quali sono le caratteristiche della popolazione mendeliana di riferimento?

Soluzione Questa popolazione rappresenta il modello di partenza per svi-luppare tutta la teoria della genetica di popolazioni, quindi è una sorta di “ipotesi zero”, una popolazione ideale non perturbata da alcun fattore. Infatti, è costituita da un numero in�nito di individui (per evitare e�etti di deriva) che si incrociano in maniera assoluta-mente casuale (panmissia, onde evitare, tra l’altro, l’inbreeding) e ciascuno con uguale capacità riproduttiva (il che evita la selezio-ne naturale). Inoltre, si assume che gli alleli ai loci considerati non varino da una generazione all’altra (assenza di mutazione) e che non ci sia movimento di alleli né in entrata né in uscita (nessuna variazione dovuta alla migrazione).

Problema 2. Un campione di 1.200 abitanti dell’Isola di Pasqua viene genotipizzato per il locus della scichimato deidrogenasi, al quale sono presenti due alleli: F e S. Nel campione sono presenti 318 omozigoti FF, 617 eterozigoti FS e 265 omozigoti SS. Stabili-re se la popolazione si trova all’equilibrio di Hardy-Weinberg per questo locus (vedi anche BOX 22.3).

SoluzioneStabilire che un locus sia all’equilibrio di Hardy-Weinberg vuol dire veri�care che le frequenze genotipiche osservate coincidano, a meno di scostamenti casuali, con quelle attese secondo la legge di Hardy-Weinberg. Per prima cosa, dobbiamo dunque stimare le fre-quenze alleliche. Abbiamo f(F) = p = [(318 3 2) + 617]/2.400 = 0,522, quindi f(S) = q = (1 – p) = 0,478. Secondo la legge di H-W, le fre-quenze genotipiche sono legate a quelle alleliche dalla relazione P = p2, H = 2pq, Q = q2; quindi, nel nostro caso (arrotondando):

f(FF) = P = (0,522)2 = 0,272f(FS) = H = 2 (0,522 3 0,478) = 0,500

f(SS) = Q = (0,478)2 = 0,228

Le frequenze assolute consentono di trovare quelle relative alla numerosità del nostro campione moltiplicandole per il numero totale degli individui. Possiamo allora scrivere la tabella seguen-te, dove le frequenze osservate sono riportate insieme a quelle attese:

Genotipo FF FS SS Totale

Frequenza osservata 318 617 265 1.200

Frequenza attesa 326,4 600 273,6 1.200

Le frequenze attese non sono esattamente quelle osservate, ma questo potrebbe essere dovuto a fattori casuali. Per veri�care ef-fettivamente l’equilibrio, dobbiamo e�ettuare un test statistico che ci dica se lo scostamento osservato è di entità tale da poter essere attribuito solamente al caso (equilibrio confermato) o ad altri fattori (equilibrio ri�utato). Il test corretto è in questo caso il test del χ2:

318 326, 4326, 4

617 600600

265 273, 6273, 6

0,968

[1]2

2 2 2

2

f f

foss att

att∑χ

( ) ( )

( )

( )=

=−

+

+

+−

=

Questo valore va confrontato con la distribuzione di χ2 per un gra-do di libertà, dove il valore soglia per il 5% è 3,84. Dato che 0,968 è minore della soglia, accettiamo l’ipotesi che la popolazione sia all’equilibrio di Hardy-Weinberg per questo locus.

Problema 3. Se a un locus K la frequenza di mutazione K → k è pari a 3 3 10–5 e quella k → K è 1,5 3 10–6, trovare le frequenze alleliche all’equilibrio nel caso in cui su questo locus agisca solo la mutazione.

SoluzioneDalla teoria, sappiamo che in questo caso l’equilibrio può essere raggiunto quando a ogni generazione il numero di alleli k creato per mutazione equivale al numero di alleli K creati dalla retromu-tazione. La formula da utilizzare è dunque, detto u il tasso di mu-tazione e v quello di retromutazione (vedi testo):

p ̂ = v

u v( )+ q̂ =

uu v( )+

Nel nostro caso:

p ̂ = 1,5 3 10–6/ (3 3 10–5 + 1,5 3 10–6) = 0,048

q ̂ = 1 – p̂ = 0,952

Problema 4. Una popolazione di 100 topi di campagna è carat-terizzata al locus T da due alleli, T e t, con f(T) = p = 0,6. Un anno vengono accidentalmente liberati nella zona 20 topi provenienti da una popolazione p = 0,2. Quali saranno le frequenze alleliche p e q nella nuova popolazione così formatasi dopo una generazione e ammettendo che l’incrocio sia casuale?

Soluzione Sappiamo che la variazione delle frequenze alleliche dipende sia dalla frazione di alleli migranti che dalla di�erenza tra le frequen-ze alleliche dei residenti e dei migranti, secondo la relazione:

Dp = m (P – p0)

dove p0 è la frequenza allelica dei residenti, P quella dei migranti e m la proporzione di migranti. Nel nostro caso p0 = 0,6, P = 0,2, m = 20/120 = 0,167, quindi Dp = –0,067. Dopo una generazione sarà dunque:

p = 0,6 – 0,067 = 0,533q = 1 – p = 0,467

L’arrivo di un certo numero di individui con una p inferiore a quella dei residenti ha fatto diminuire la p della nuova popolazione tota-le rispetto a quella originale dei residenti.

Problema 5. Data una popolazione qualunque, per un locus bial-lelico vengono trovati i seguenti valori di �tness: AA = Aa = 1, aa = 0,6. Quale tipo di selezione agisce a questo locus? Partendo da fre-quenze alleliche p = 0,2 e q = 0,8, quali valori ci attendiamo dopo una generazione? A quale valore di q la popolazione raggiungerà un equilibrio, assumendo che il tasso di mutazione u per A → a sia pari a 10–5?

SoluzioneIl genotipo con minore �tness è l’omozigote per l’allele recessivo, quindi si tratta di selezione contro il recessivo. Possiamo stimare il coe�ciente di selezione come s = 1 – w = 0,4 e utilizzare questo

PROBLEMI SVOLTI

continua cc

Vers

ione

finale

in vi

sione

aut

ori

Page 35: Capitolo 22 autori visione in finale

Problemi svolti [ 635 ]

coe�ciente per rispondere alla seconda domanda. Ricordando, infatti, che nel caso di selezione di questo tipo la variazione della frequenza allelica di a è Dq = – spq2 / (1 – sq2), sostituiamo i valo-ri richiesti a dare Dq = – (0,4)(0,2)(0,8)2 / [1 – (0,4)(0,8)2] = –0,069, quindi dopo una generazione avremo p = 0,269 e q = 0,731. In�ne, se la selezione contro il recessivo continua per un certo numero di generazioni, si può raggiungere una situazione di equilibrio tra il numero di alleli a persi a causa della selezione e quelli guadagnati a causa della mutazione, secondo la relazione q ̂ = √u

/s.Quindi si potrà raggiungere un equilibrio per:

q̂ = 100, 4

2,5 105

5= ×−

− = 0,005

Problema 6. Si vuole determinare la �tness dei tre genotipi al locus biallelico D per una specie vegetale quando le piante sono trapiantate in un ambiente più freddo. Di seguito è riportata la tabella relativa alla sopravvivenza dei tre genotipi.

Genotipo DD Dd dd

Piante trapiantate 800 600 500

Piante sopravvissute 100 400 250

Da questi dati, stimare i valori della �tness relativa di ciascun ge-notipo e le frequenze alleliche all’equilibrio se sulla popolazione agisce solo la selezione.

SoluzioneQuesto è un caso di stima della �tness leggermente diverso da quelli riportati nel testo. Infatti, non andiamo a stimare la capacità riproduttiva vera e propria, ma la probabile capacità riproduttiva dopo che la pianta è sopravvissuta. Stabiliamo per prima cosa quale genotipo ha la miglior sopravvivenza, con il rapporto so-pravvissute/trapiantate:

100800

0,125DD = =

400600

0, 67Dd = =

250500

0,50dd = =

Il genotipo con la migliore capacità di sopravvivenza è Dd, a cui attribuiamo, come da convenzione, un valore di �tness pari a uno (w = 1). Agli altri due genotipi diamo una w proporzionale secon-do la sopravvivenza mostrata:

0,1250, 67

0,187w DD = =( )

0,500, 67

0,75w dd = =( )

Riassumendo e riportando anche i coe�cienti di selezione:

Genotipo DD Dd dd

w 0,187 1 0,75

s 0,813 0 0,25

Si tratta, dunque, di un caso di selezione a favore dell’eterozigo-te, il che rende possibile stabilire le frequenze alleliche che la po-polazione raggiungerà eventualmente all’equilibrio. Ricordiamo, infatti, che nel caso del vantaggio dell’eterozigote, queste dipen-dono soltanto dai coe�cienti di selezione e non dai valori iniziali. Risulta allora:

p ̂ = 0,25

0, 813 0,25( )

( )+ = 0,24

q̂ = (1 – p̂) = 0,76

Problema 7. In seguito a un incendio, tutti i membri di una spe-cie animale scompaiono da un’isoletta dei mari tropicali. L’isola, però, viene in breve tempo ricolonizzata da 10 animali con rap-porto tra i sessi uguale a 1 che provengono a nuoto da un’isola vicina, dove le frequenze alleliche al locus N sono p = 0,3 e q = 0,7. Qual è la migliore stima delle frequenze alleliche che si instaure-ranno a questo locus nella nuova popolazione ricostituitasi?

Soluzione È qui riportato un esempio di e�etto del fondatore, che si veri�ca quando una nuova popolazione si forma a partire da un ristretto numero di individui della popolazione originaria. Non possiamo sapere esattamente quali saranno le frequenze alleliche, ma pos-siamo stabilire un intervallo di con�denza intorno a quelle della popolazione di partenza:

0,025p zpqn

±

Con i dati a disposizione otteniamo:

0,3 ± 1,96 0,3 0,7

10( )×

= 0,3 ± 1,96 3 0,145 = 0,3 ± 0,28

Nel 95% dei casi avremo che le frequenze alleliche sull’isolet-ta dopo la ricolonizzazione saranno comprese in un intervallo 0,02 ≤ p ≤ 0,58. Come si vede, gli e�etti della deriva genetica pos-sono essere anche imponenti se la popolazione è di dimensioni molto piccole.

Problema 8. Stimare il coe�ciente di inbreeding per una popola-zione naturale in cui i genotipi al locus W sono:

Genotipo WW Ww ww Totale

N° individui 250 400 350 1.000

SoluzioneSappiamo che nelle popolazioni naturali esiste sempre un certo grado di incrocio tra consanguinei, misurato dal coe�ciente F, il che causa uno scostamento delle frequenze genotipiche da quel-le attese secondo l’equilibrio di Hardy-Weinberg. In particolare, l’eterozigosità attesa e quella osservata sono legate a F dalla re-lazione:

1 o

e

FHH

= −

continua cc

Vers

ione

finale

in vi

sione

aut

ori

Page 36: Capitolo 22 autori visione in finale

GENETICA DI POPOLAZIONI[ 636 ] Capitolo 22

Nel nostro caso, Ho = 400/1.000 = 0,4, mentre per la stima di He abbiamo bisogno delle frequenze alleliche:

f(WW) = p = 250 2 400

2.000[ ]( )× +

= 0,45

q = 1 – p = 0,55

Risulta quindi:

He = 1 – (0,452 + 0,552) = 0,495

e a questo punto:

F = 1 – (0,4/0,495) = 0,19

Vers

ione

finale

in vi

sione

aut

ori