9788884537546_preview.pdf
Transcript of 9788884537546_preview.pdf
-
7/25/2019 9788884537546_preview.pdf
1/33
dAVIDcARAMELLI
ANTROPOLOGIA MOLECOLARE
Manuale di base
FIRENZEUNIVERSITY
PRESS
-
7/25/2019 9788884537546_preview.pdf
2/33
MANUALI
SCIENZE
5
-
7/25/2019 9788884537546_preview.pdf
3/33
PIANETAREDI
COMITATOSCIENTIFICO
RENATOFANIDAVIDCARAMELLI
ALESSIOMENGONI
TITOLIGIPUBBLICATI
La PCR e le sue varianti. Quaderno di laboratorio, a cura di Angela Scialpi,Alessio Mengoni, 2008
David Caramelli,Antropologia molecolare. Manuale di base, 2009
-
7/25/2019 9788884537546_preview.pdf
4/33
DAVIDCARAMELLI
Antropologia molecolareManuale di base
Firenze University Press2009
-
7/25/2019 9788884537546_preview.pdf
5/33
Il volume stato realizzato grazie al contributo del progetto UE BioTethedcontract number 017474.
Progetto graco di Alberto Pizarro Fernndez
2009 Firenze University Press
Universit degli Studi di FirenzeFirenze University PressBorgo Albizi, 28, 50122 Firenze, Italyhttp://www.fupress.com/
Printed in Italy
Antropologia molecolare : Manuale di base /David Caramelli. Firenze : Firenze UniversityPress, 2009.(Manuali . Scienze ; 5)
http://digital.casalini.it/9788884537546
ISBN 978-88-8453-696-9 (print)ISBN 978-88-8453-754-6 (online)
-
7/25/2019 9788884537546_preview.pdf
6/33
Sommario
Cap. 1 Il genoma umano 1
1.1 Introduzione 11.2 La struttura degli acidi nucleici 21.3 Caratteristiche dei cromosomi umani 51.4 I geni 71.5 Le sequenze ripetute e intersperse nel genoma 121.6 Le parti non ricombinanti del genoma umano 15
Cap. 2 La variabilit del genoma umano 492.1 Introduzione 492.2 Origine della variabilit genetica 532.3 Polimorsmi a singolo nucleotide: mutazioni geniche
o puntiformi 582.4 Polimorsmi di lunghezza 702.5 Gli elementi trasponibili 76
Cap. 3 Studio della diversit del genoma umano 793.1 Considerazioni generali 793.2 Il database e gli SNPs 803.3 Scoperta e tipizzazione dei microsatelliti 873.4 Scoperta e tipizzazione dei minisatelliti 893.5 Scoperta e tipizzazione dei polimorsmi Alu/LINE 903.6 Scoperta e tipizzazione di satelliti e polimorsmi
strutturali 91
Cap. 4 I meccanismi dellevoluzione 934.1 Introduzione 934.2 La legge di Hardy-Weinberg 934.3 Processi che agiscono sulla variabilit delle popolazioni 94
-
7/25/2019 9788884537546_preview.pdf
7/33
VI SOMMARIO
4.4 La teoria neutrale dellevoluzione molecolaree lipotesi dellorologio molecolare 113
Cap. 5 Evoluzione molecolare 117
5.1 Introduzione 1175.2 Sostituzioni nucleotidiche in una sequenza di DNA 1175.3 Divergenza tra sequenze e stima delle distanze
genetiche fra molecole 1245.4 Misura della variabilit genetica nelle popolazioni
e stima delle distanze genetiche fra popolazioni 127
Cap. 6 Metodi flogenetici 1336.1 Terminologia e topologia degli alberi logenetici 1336.2 Metodi per la costruzione di alberi logenetici 1356.3 Datazione delle ricostruzioni logenetiche e stima
del TMRCA 147
Cap. 7 Lanalisi molecolare 149
7.1 Estrazione del DNA: introduzione 1497.2 La reazione a catena della polimerasi 1647.3 Il clonaggio 1717.4 Il sequenziamento automatico del DNA. Il metodo
di Sanger 179
Cap. 8 Il DNA antico 185
8.1 Introduzione 1858.2 Diagenesi del DNA antico 1868.3 Sopravvivenza del DNA nellambiente naturale 1888.4 Esempi di resti antichi da cui possibile estrarre il DNA 1898.5 Problemi relativi allanalisi del DNA antico 1918.6 Marcatori del DNA antico 2088.7 Importanza della quanticazione 2108.8 Differenza tra sequenziamento diretto
e sequenziamento da cloni 2108.9 Amplicazioni di frammenti lunghi 212
Cap. 9 Come si effettua uno studio sul DNA antico 2139.1 Introduzione 213
9.2 Il recupero 2159.3 La conservazione 2179.4 Il prelievo del campione per lanalisi molecolare
e la preparazione della polvere 2189.5 Analisi della racemizzazione degli amminoacidi 2199.6 Analisi termogravimetrica 2259.7 Estrazione del DNA 225
-
7/25/2019 9788884537546_preview.pdf
8/33
ANTROPOLOGIAMOLECOLARE VII
9.8 I primers 2269.9 La prova inibitori 2279.10 La PCR competitiva 2279.11 Visualizzazione del risultato 230
9.12 La Real Time PCR: levoluzione della PCRcompetitiva 233
9.13 Lamplicazione del DNA 2349.14 Taglio della banda e puricazione 2359.15 Clonaggio del DNA con il TopoTA Cloning 2369.16 Conservazione dellamplicone e creazione
dellArchivio Biologico 2369.17 Reazione di sequenza 2369.18 Ricostruzione al PC della sequenza nucleotidica 237
Cap. 10 Il DNA antico ed il DNA forense 24110.1 Introduzione 24110.2 DNA antico 241
10.3 DNA forense 24210.4 Principali punti dunione tra le analisi 24410.5 Lautenticit dei risultati: valutazioni e metodiche
applicate 244
Cap. 11 Evoluzione umana e popolamento 24711.1 Origine delluomo anatomicamente moderno 249
11.2. Prove di una origine africana dai resti fossili 25011.3 Evidenze genetiche 25211.4 Diffusione extra-africana diHomo sapiens 25811.5 Dispersioni multiple 26411.6 Contributo degli studi sul DNA antico allorigine
delluomo anatomicamente moderno 26611.7 Studio logenetico delle popolazioni
secondo i marcatori classici 279
Bibliografa 295
Indice dei concetti 321
-
7/25/2019 9788884537546_preview.pdf
9/33
Hanno collaborato alla ricerca e alla stesura dei capitoli:
Giulio Catalano e Elena Pilli (Capitolo 1); Elena Pilli (Capitoli 2, 3, 8, 9, 10);Martina Lari (Capitoli 4, 5 e 6); Giulio Catalano e Elena Pilli (Capitolo 7); Lucio
Milani (Capitolo 11)
-
7/25/2019 9788884537546_preview.pdf
10/33
Capitolo 1Il genoma umano
1.1 Introduzione
Ogni organismo vivente, unicellulare o multicellulare, caratterizzatodalla presenza di molecole di acido nucleico (DNA o RNA) in grado di pro-durre copie identiche a se stesse. Esclusi alcuni virus a RNA, linformazionegenetica degli organismi viventi contenuta nelle molecole di DNA. Conil termine genoma si denisce il contenuto completo dellinformazione
genetica. Il contenuto totale di DNA negli eucarioti e quindi la dimensione
del genoma correlata alla complessit dellorganismo (ad es., il genomaumano pi grande di quello degli insetti che a sua volta pi grande diquello funghi). Esistono per diverse eccezioni: es. il genoma diX. laevis grande quanto quello dei mammiferi; altri anbi hanno un genoma circa
50 volte pi grande del genoma umano; tra le piante, il genoma di Zeamais (5000 Mbp) pi grande di quello umano. In genere, per un datoraggruppamento tassonomico, la dimensione minima del genoma ap-prossimativamente proporzionale alla complessit dellorganismo. Comeper il contenuto di DNA, anche il numero e le dimensioni dei cromosomi molto variabile tra gli eucarioti (Tab. 1.1). Il materiale genetico deglieucarioti suddiviso in pi cromosomi lineari. Il numero cromosomico,salvo poche eccezioni, caratteristico per ciascuna specie. Molti eucariotihanno due copie di ciascun tipo di cromosoma presente nel nucleo, e per
questo motivo, il loro assetto detto diploide, vale a dire 2N.Nelluomo il cariotipo, ovvero linsieme completo di tutti i cromo-somi metafasici di una cellula, costituito da 46 cromosomi. Di questi,44 cromosomi, detti autosomi, sono 22 coppie di cromosomi omologhi,identici nei due sessi. Per questo motivo i geni contenuti in ogni autoso-ma sono in duplice copia, una per omologo. Gli altri 2 cromosomi sonoquelli sessuali, rappresentati da due cromosomi X nella femmina e da
-
7/25/2019 9788884537546_preview.pdf
11/33
2 ILGENOMAUMANO
1 cromosoma X e un cromosoma Y nel maschio. La femmina ha quindiuna doppia copia, una per omologo, dei geni localizzati sul cromosomaX, il maschio invece ne ha una sola ed quindi emizigote per i geni delcromosoma X.
Tabella 1.1. Dimensioni e numero di cromosomi in alcuni eucarioti.
TAXON SPECIE GENOMA (Mpb) N CROMOSOMI
Mammalia Homo sapiensPan troglodites
Bos taurusCanis familiarisMus musculus
Rattus norvegicus
320021003000238525002700
232430392021
Aves Gallus gallus 1054 39
Amphibia Xenopus laevisXenopus tropicalis
31001700
1810
Fish Danio rerio
Tetradon nigroviridis
1700
400
25
22Insecta Drosophila melanogaster
Anopheles gambiaeApis mellifera
180278228
4516
Nematoda Caenorhabditis elegans 97 6
Protozoa Leishmania majorPlasmodium falciparum
3426
3614
1.2 La struttura degli acidi nucleici
Sia il DNA sia lRNA sono grandi macromolecole (polimeri) composteda unit costitutive pi piccole (monomeri). Per comprendere meglio laloro struttura, possiamo considerare alcuni livelli di complessit:
1. I nucleotidi sono lunit strutturale ripetitiva degli acidi nucleici.2. I nucleotidi sono legati tra loro a formare un lamento di DNA o
di RNA. La sequenza lineare di nucleotidi di un lamento detta
struttura primaria del DNA o dellRNA.3. Due lamenti di DNA (e talvolta di RNA) possono interagire luno
con laltro per formare una doppia elica (Fig.1.1a). La doppia elica un esempio di struttura secondaria regolare ripetitiva. La doppiaelica del DNA pu adottare differenti strutture secondarie, detteDNA-A, DNA-B e DNA-Z.
4. I vari ordini di ripiegamento delle strutture secondarie formanouna struttura tridimensionale nale che prende il nome di strut-tura terziaria. Allinterno delle cellule viventi il DNA associato
-
7/25/2019 9788884537546_preview.pdf
12/33
ANTROPOLOGIAMOLECOLARE 3
ad unampia variet di proteine che inuenzano la sua struttura
terziaria nale.
Il nucleotide lunit strutturale ripetitiva del DNA e dellRNA. Un
nucleotide ha tre componenti: un gruppo fosfato, uno zucchero pentosioe una base azotata. Come indicato in gura (Fig. 1.1), i nucleotidi possono
differire per quanto riguarda lo zucchero e la base azotata. Vi sono duetipi di zuccheri: ribosio e deossiribosio.
Figura 1.1. Struttura del DNA.
Nel DNA lo zucchero presente sempre il deossiribosio, nellRNA
il ribosio. I due zuccheri differiscono per i gruppi sostituenti legati alcarbonio 2: un gruppo idrossilico (OH) nel ribosio, un gruppo idrogeno(H) nel desossiribosio. Le cinque diverse basi sono distinte in due diversigruppi: purine e pirimidine. Le basi puriniche, ladenina (A) e la guanina(G), contengono una struttura a doppio anello (biciclica); le basi pirimidi-niche, la citosina (C), la timina(T) e luracile (U), presentano invece unastruttura a singolo anello (monociclica). Il DNA e lRNA si distinguono
per alcune importanti caratteristiche chimiche (Figg. 1.2.a, 1.2.b). Infattila base timina non presente nellRNA e al suo posto presente luracile.Ladenina, la guanina e la citosina sono i nucleotidi costituenti sia del DNAsia dellRNA. Nel DNA e nellRNA le basi sono sempre unite al carbonio1 del pentoso da un legame covalente. Le basi puriniche sono legateallazoto 9, mentre le pirimidine si legano allazoto 1. La combinazionedi uno zucchero e di una base detta anche nucleoside. Il nucleoside conun fosfato ad esso legato diventa un nucleotide, o un nucleoside fosfato.Il gruppo fosfato legato al carbonio 5 dello zucchero sia nel DNA chenellRNA. Per la formazione dei polinucleotidi di DNA e di RNA, i nu-cleotidi vengono uniti da un legame covalente tra il gruppo fosfato di unnucleotide ed il carbonio in 3 del pentoso dellaltro nucleotide. Questotipo di legame fosfato 5-3 viene detto legame fosfodiesterico.
-
7/25/2019 9788884537546_preview.pdf
13/33
4 ILGENOMAUMANO
Figura 1.2. a) Struttura del ribosio e del desossiribosio b) Struttura di
un nucleotide.
1.2.1 La doppia elica di Watson e Crick
La scoperta della doppia elica da parte di Watson e Crick nel 1953 fusenza dubbio uno dei momenti pi importanti di tutta la biologia. Per laformulazione del loro modello, Watson e Crick si avvalsero delle scopertecondotte da Erwin Chergaff, riguardanti la composizione in basi del DNA,e da Rosalind Franklin e Maurice H.F. Wilkins nel campo della diffrazioneai raggi X. Chargaff aveva dimostrato che in qualsiasi tipo di DNA a doppiaelica la quantit di purine era uguale a quella di pirimidine. E ancora chela quantit di adenina (A) era pari a quella di timina (T), mentre la quan-tit di guanina (G) era pari a quella di citosina (C). Queste equivalenzesono divenute note come le regole di Chargaff. Nel confronto di DNA daorganismi diversi, i rapporti A/T e G/C erano sempre gli stessi.
Rosalind Franklin, coadiuvata da Maurice Wilkins, aveva studiatobre isolate di DNA mediante la tecnica della diffrazione dei raggi X. Iraggi X diffratti sono registarti su una lastra fotograca: analizzando la
fotograa, Franklin ottenne delle informazioni sulla struttura atomica
della molecola. I suoi studi giunsero alla conclusione che il DNA era unastruttura ad elica che presentava due periodicit riconoscibili di 0,34 nme 34 nm lungo lasse della molecola.
Watson e Crick elaborarono questi risultati e costruirono un modellotridimensionale della struttura del DNA. Il modello proposto da Watsone Crick presenta le seguenti caratteristiche:
1. La molecola di DNA composta da due catene polinucleotidicheavvolte luna intorno allaltra a formare una doppia elica destrorsa,
ovvero in senso orario
-
7/25/2019 9788884537546_preview.pdf
14/33
ANTROPOLOGIAMOLECOLARE 5
2. Le due catene sono antiparallele, cio hanno polarit opposta. Unlamento orientato n direzione 5-3 e laltro in quella 3-5.
3. Lo scheletro, costituito dalle catene di zucchero legate fra lorodallortofosfato, allesterno della struttura, mentre le basi azotate
sono allinterno. Le basi sono disposte perpendicolarmente allasseprincipale della doppia elica.
4. Le basi dei lamenti opposti sono unite da deboli legami idrogeno.
Il diametro della doppia elica di 20 , e le basi sono appaiate inmodo tale da non creare distorsioni nella struttura della molecola: auna purina su unelica corrisponde sempre una pirimidina sullaltraelica. Non c mai appaiamento tra due purine o tra due pirimidine.Inoltre data la struttura chimica delle basi e la possibilit di stabilirelegami idrogeno, gli unici appaiamenti possibili sono tra adenina etimina e tra guanina e citosina.
5. La forma pi comune, assunta dalla doppia elica in condizionisiologiche, detta forma B. In questa forma, un giro completodella doppia elica di 34 , e la distanza fra due coppie di basi di
3,4 , per cui ogni giro dellelica formato da 10 coppie di basi.6. Entrambi i lamenti sono destrorsi, e le ossature esterne di zucche-
ro-ortofosfato formano due solchi di dimensioni diverse, detti solcomaggioree solco minore. Le proteine che interagiscono con il DNA,e che riconoscono una determinata sequenza di basi, normalmenteentrano in contatto con la doppia elica nel solco maggiore.
1.3 Caratteristiche dei cromosomi umani
I cromosomi umani variano in grandezza e morfologia. La morfologiaviene denita dalla posizione del centromero, che per convenzione divide
il cromosoma in un braccio corto, denominatop, e in un braccio lungo,denominato q. I cromosomi si dicono metacentrici quando il rapporto
tra la lunghezza del braccio corto e quella del braccio lungo allincirca1 (il centromenro posizionato al centro del cromosoma); si diconosubmetacentrici quando la lunghezza delle braccia lunghe superiore aquella delle braccia corte (il centromero posizionato a breve distanza dalcentro del cromosoma); si deniscono acrocentrici quando il centromero
si trova terminalzzato verso unestremit del cromosoma. Il cromosoma costituito da due strutture fondamentali: il centromero e il telomero. Il
centromero lega i microtubuli del fuso durante la divisione cellulare ed responsabile della corretta segregazione in fase di mitosi e di meiosi. Iltelomero protegge le estremit dei cromosomi dalla degradazione e dallafusione coda-coda, e assicura un ancoraggio alla DNA polimerasi per laduplicazione delle sequenze pi terminali.
Quando i cromosomi sono a determinata tecniche di bandeggio,come il bandeggio G o il bandeggio R, avviene una denaturazione lungo
-
7/25/2019 9788884537546_preview.pdf
15/33
6 ILGENOMAUMANO
il loro asse, che determina, dopo colorazione con Giemsa, unalternanzadi bande chiare e scure. Il pattern di alternanza di tali bande ricorrentein ogni individuo ed specicodi ogni cromosoma, in quanto riette la
concentrazione relativa, che regione-specica, di AT o CG.
Quando possiamo concretamente osservare nel modo migliore i cro-mosomi, e cio alla metafase, i cromosomi appaiono a forma di X: due
bastoncini attaccati nella loro zona centrale. In questo stadio ogni cromo-soma quindi composto da due parti dette cromatidi (Fig. 1.3). Poich lamolecola di DNA che compone un cromatide di un cromosoma ha la stessasequenza della molecola di DNA che costituisce laltro, i due cromatidi diuno stesso cromosoma sono anche detti cromatidi fratelli. La conden-sazione dei cromosomi ne facilita una ripartizione ordinata, senza pericolodi aggrovigliamento tra molecole di DNA diverse. La cellula quindi primaduplica tutto il DNA nucleare, poi lo divide tra le due cellule glie. Pertanto
solo durante le prime fasi della divisione cellulare il corredo dei cromosomiapparir come un insieme di 46 elementi a forma di X (due cromatidiuniti a livello del centromero, per un totale di 92 cromatidi), mentre alla
anafase i due cromatidi si separeranno e appariranno come due baston-cini singoli a forma di I. Nel periodo che intercorre tra una divisione elaltra il materiale genetico normale in effetti composto, per ogni cellulasomatica, da 46 cromatidi singoli, che tuttavia noi non visualizziamo perchqueste 46 molecole di DNA sono despiralizzate in lamenti sottilissimi a
formare la cromatina. Questa si differenzia in eucromatina che comprendele regioni cromosomiche non condensate, attivamente trascritte e ad altadensit genica (bre 30 nm) e in eterocromatina (facoltativa o costitutiva)che rappresenta una cromatina mediamente o altamente condensata e
Figura 1.3. I 46 cromosomi umani.
-
7/25/2019 9788884537546_preview.pdf
16/33
ANTROPOLOGIAMOLECOLARE 7
generalmente non trascritta, ad alta percentuale di sequenze ripetute econtenuto di geni relativamente basso.
1.3.1 Il bandeggio cromosomico
La denizione corretta del cariotipo deve basarsi su tecniche di ban-deggio. Ne esistono diverse, speciche per le diverse regioni cromosomi-che, di cui riettono la costituzione in basi e sequenze (uniche o ripetute)
e lo stato trascrizionale.Il bandeggio G (Giemsa) o R (Reverse) specico delleucromatina, de-
termina una scomposizione in bande chiare e scure dellasse cromosomico(lalternanza di bande chiare e scure nel bandeggio R quasi complemen-tare rispetto a quella ottenuta con il bandeggio G, da qui il termine riverse)ed quindi indispensabile per la corretta denizione del cariotipo. Anche il
bandeggio Q specico per leucromatina, dando un pattern di bandeggio
del tutto sovrapponibile al bandeggio G, e colora selettivamente anche ilbraccio lungo del cromosoma Y, nella sua larga porzione eterocromatica.
Il bandeggio C specico per leterocromatina centromerica e pericen-tromerica, che con questa tecnica appare intensamente colorata, mentreleucromatina delle braccia corte e lunghe rimane pressoch incolore. Lacolorazione NOR colora specicamente i satelliti dei cromosomi acrocen-trici 13, 14,15,21 e 22, ed esclusiva di queste regioni.
Il pattern di bandeggio delle braccia corte e lunghe di ogni cromosomaviene indicato secondo una nomenclatura internazionale. Ogni banda identicata da un numero, di grandezza crescente procedendo dal centro-mero verso il telomero, e ogni regione cromosomica usualmente denita
da un doppio ordine di numeri:il primo riferito alla banda maggiore e ilsecondo a una delle sue sottobande minori. I numeri che identicano le
regioni cromosomiche, cos come il numero complessivo delle bande, sidiversicano a seconda del grado di condensazione cromosomica.
1.3.2 DNA a sequenze uniche
Le sequenze uniche (a singola copia), sono denite come le sequenze
presenti nel genoma come copie singole. Nelluso corrente, il termine siapplica alle sequenze di cui nel genoma presente una o poche copie. Lamaggior parte dei geni strutturali, rientra nella classe di DNA a sequenza
uniche. Nelluomo si stima che le sequenze uniche rappresentino circa il65 per cento del genoma.
1.4 I geni
Tradizionalmente, il gene denito come un segmento di DNA che
codica per un polipeptide o per una specica molecola di RNA. Signi-
-
7/25/2019 9788884537546_preview.pdf
17/33
8 ILGENOMAUMANO
cativi progressi in campo molecolare hanno tuttavia contribuito a ren-dere il concetto di gene pi ampio. In accordo con questi studi, il gene una specica regione di DNA, la cui trascrizione regolata da uno o pi
promotori e altri elementi di controllo trascrizionale che contiene linfor-
mazione per la sintesi di molecole di RNA tra loro correlate (con un trattodi sequenza in comune) che possono svolgere varie attivit funzionali, edeventualmente dirigere la sintesi di catene polipeptidiche.
Oggi si riconoscono quattro classi di geni: (1) geni che codicano per le
proteine, che sono trascritti in RNA e successivamente tradotti in proteine,(2) geni codicanti per proteine organizzati in famiglie geniche (3) geni
RNA-specici (geni per rRNA, tRNA ed istoni), che sono esclusivamente
trascritti e organizzati per unit ripetute in tandem e (4) geni per ncRNA(Cavalier-Smith 1985; Watson et al. 1987; Lewin 1994). Questultimacategoria di geni include solo sequenze non-trascritte, mentre i geni re-golatori trascritti appartengono essenzialmente ad una delle prime duecategorie. I geni che codicano per le proteine e i geni RNA-specici sono
anche noti come geni strutturali.I geni organizzati in famiglie genichesono tra loro omologhi, e derivano da un evento di duplicazione genica odi retrotrasposizione mediata da RNA. I membri di una famiglia genicaallinterno di uno stesso genoma sono detti paraloghi, e normalmente sispecializzano acquisendo funzioni distinte. Nei batteri la trascrizione ditali geni condotta da un solo tipo di RNA polimerasi e la sintesi avvienenel citoplasma. Nel genoma nucleare degli eucarioti, sono coinvolti tretipi di RNA polimerasi (Watson et al. 1987; Lewin 1994). I geni RNA
ribosomici (rRNA) sono trascritti dalla RNA polimerasi I (Pol I), i genistrutturali dalla RNA polimerasi II (Pol II), e i geni RNA citoplasmatici(scRNA), come i geni codicanti gli RNA di trasporto, dalla RNA polime-rasi III (Pol III).
1.4.1 I geni strutturali
Un gene strutturale tipo che codica per un polipeptide consiste di
una parte trascritta e di una parte non-trascritta. Le parti non trascrittesono denite, in ragione della loro ubicazione allinterno del gene, come
regioni ancheggianti alle estremit 5 e 3. La regione ancheggiante
allestremit 5(o regione del promotore) provvede attraverso numerosisegnali a promuovere lavvio della trascrizione. Negli eucarioti, la sequenza
del promotore pi variabile e spesso pi complessa di quella presentenei procarioti. Di solito costituita da un nucleo del promotore (corepromoter) e da elementi regolativi. Il nucleo del promotore indispen-sabile afnch avvenga la trascrizione; infatti il nucleo del promotore,
la cui funzione simile a quella di un promotore batterico, a fornire ilsito di legame iniziale per i fattori generici di trascrizione e per la RNApolimerasi. Alcune brevi sequenze di DNA, dette elementi o box, sono
-
7/25/2019 9788884537546_preview.pdf
18/33
ANTROPOLOGIAMOLECOLARE 9
importanti afnch i fattori generici di trascrizione e la RNA polimerasi
si assemblino in corrispondenza del promotore. Il nucleo del promotore composto di solito da una sequenza TATAAAA detta TATA box situataa 19-27 paia di basi a monte del punto di inizio della trascrizione. Inoltre
sono presenti altri due elementi del promotore a monte della TATA boxuna sequenza GGCCAATCT, detta CAAT box, e una sequenza GGGCGG,detta GC box. Per il numero e la posizione delle GC box e delle CAAT box
variano notevolmente nei diversi geni strutturali eucariotici. Il ruolo dellaTATA box differisce da quello a della CAAT box e della GC box. La TATA
box importante nel determinare il sito di inizio preciso della trascrizio-ne. Se manca dal nucleo del promotore, il sito di inizio della trascrizionediventa indenito, e la trascrizione pu iniziare in varie posizioni. Invece
la CAAT box e la GC box funzionano da siti di riconoscimento ai qualisi legano i fattori di trascrizione, e inoltre reclutano la RNA polimerasinelle vicinanze della regione del promotore. Negli eucarioti sono presentiparecchi fattori generici di trascrizione. Queste proteine interagiscono perattirare la RNA polimerasi verso la regione del nucleo del promotore e dare
il via al processo della trascrizione. Allestremit 3 gli eucarioti superioricontengono una sequenza AAUAAA. Questa sequenza di poliadenilazione(o coda di poliA) contiene i segnali responsabili della terminazione delprocesso di trascrizione.
Durante la trascrizione viene sintetizzato un RNA corrispondenteallintera sequenza genica; successivamente, le sequenze dellRNA checorrispondono agli introni genici (sequenze non codicanti) vengono
tagliate via, mentre le sequenze di RNA derivanti dagli esoni (sequenzecodicanti) vengono giuntate tra loro. Questo processo prende il nome
di splicing (taglio e saldatura) dellRNA. Oltre allo splicing, le ricerchehanno indicato che esistono svariati meccanismi molecolari che spieganole diverse modicazioni dellRNA. Per esempio, gli rRNA e i tRNA vengono
sintetizzati come lunghi trascritti che sono scissi in segmenti funzionali pi
piccoli. Inoltre, la maggior parte degli mRNA eucariotici ha un cappuccio(cap) attaccato allestremit 5 e una coda di poliA attaccata allestremit3. A livello molecolare sono stati identicati tre differenti meccanismi di
splicing dellRNA. In tutti e tre i casi lo splicing determina la rimozionedellRNA intronino e lunione covalente dellRNA esonico mediante unlegame fosfodiesterico. A differenza dello splicing degli introni del I gruppoe del II gruppo, capaci di auto-splicing, il terzo meccanismo di splicing
(del pre-mRNA) richiede lausilio di una struttura a pi componenti det-ta spliceosoma. Non si conosce limportanza biologica degli introni delgruppo I e del gruppo II, mentre lo splicing del pre-mRNA un fenomenofrequente negli eucarioti superiori.
Per i geni strutturali la sequenza nucleotidica dellmRNA tradotta inuna sequenza di aminoacidi: la traducibilit dellmRNA in una specica
sequenza aminoacidica si basa sul codice genetico. La sequenza delle basi
-
7/25/2019 9788884537546_preview.pdf
19/33
10 ILGENOMAUMANO
di una molecola di mRNA fornisce uninformazione codicata che viene
letta a gruppi di tre nucleotidi. Ogni gruppo di tre nucleotidi si chiamacodone. A seconda della successione delle sue tre basi, un codone puavere due funzioni diverse: nella maggior parte delle combinazioni esso
specica un particolare aminoacido. Per esempio, il codone CCC specicalaminoacido prolina, il codone AUG laminoacido metionina. A volte, per,un codone, denito di arresto, ha il compito di terminare il processo di
traduzione. Poich nellmRNA ci sono quattro tipi di basi (A, U, G e C)e in ogni codone ci sono tre nucleotidi, possono formarsi 43=64 codonidiversi. Tuttavia ci sono soltanto 20 tipi di aminoacidi (Fig. 1.4). Poichi codoni sono pi degli amminoacidi, il codice genetico degenerato;ci signica che pi di un codone specica lo stesso amminoacido. Per
esempio, i codoni GGU, GGC, GGA e GGG specicano tutti laminoacido
glicina. In molti casi la base degenerata la terza che per questo motivoviene denita base oscillante (wobble base). Il termine deriva dallidea che
la base complementare del tRNA possa oscillare leggermente durante ilriconoscimento della terza base del codone dellmRNA.
Figura 1.4. Codice genetico degenerato.
Dallanalisi di molte specie diverse di batteri, protozoi, funghi, piantee animali i ricercatori hanno ricavato che il codice genetico quasi uni-
versale. Esistono, infatti, alcune eccezioni. I mitocondri hanno un propriocodice, con alcune differenze. Per esempio, AUA signica metionina e
UGA signica triptofano
SECONDA BASE DEL CODONE
PRIMA
BA
SEDELCODONE
TERZA
BASE
DE
LCODONE
-
7/25/2019 9788884537546_preview.pdf
20/33
ANTROPOLOGIAMOLECOLARE 11
Afnch la traduzione dellmRNA avvenga a un ritmo efciente allin-terno di una cellula vivente, sono necessari svariati componenti cellulari.Tra di essi vi sono i ribosomi, gli RNA di trasporto (tRNA), certi fattoriproteici e alcune piccole molecole. Speciche sequenze dellmRNA sono
necessarie per garantire che sia sintetizzata la sequenza corretta di aminoa-cidi. Negli eucarioti il ribosoma esplora lmRNA in cerca di un codone diinizio, che sar il punto iniziale della traduzione. Generalmente il codone diinizio AUG, codone che specica il primo aminoacido del polipeptide, la
metionina. La sintesi di un polipeptide comporta interazioni tra lmRNA, ilribosoma e le molecole di tRNA. Il ribosoma scorre lungo lmRNA nella di-rezione 53. Mentre il ribosoma scorre su un codone dellmRNA, un tRNAcon un anticodone complementare si lega al codone; allestremit oppostail tRNA porta un amino acido. Il tRNA ha quindi due funzioni importanti:il suo anticodone si lega in modo specico con un codone dellmRNA e,
inoltre, esso trasporta lamminoacido giusto alla sua estremit opposta. Inquesto modo il tRNA funge da intermediario traduttore durante la sintesidel polipeptide. Il codone di inizio dellmRNA generalmente seguito da
centinaia o anche da migliaia di codoni che specicano la sequenza ammi-noacidica del polipeptide che deve essere sintetizzato. Il ribosoma scorre icodoni uno dopo laltro, in un processo a tappe, mentre le molecole di tRNAsi legano ai codoni tramite gli anticodoni, portando con s lamminoacidocorretto. Nel frattempo, gli amminoacidi vengono staccati dalle molecoledi tRNA e legati luno allaltro a formare una catena polipeptidica. Inne,
si raggiunge un codone di arresto che segnala la ne della traduzione. A
questo punto il ribosoma, lmRNa e il polipeptide si dissociano.
1.4.2 I geni tRNA e rRNA specifici
I singoli geni codicanti per i tRNA sono presenti in copie multiple
nel genoma. Nella sequenza del genoma umano, sono stati individuati 497
geni per tRNA, che rappresentano 49 specie di tRNA sulla base dellan-ticodone. I geni per tRNA sono dispersi nel genoma ma sono organizzatiin cluster: pi del 50% sono localizzati sul cromosoma 6 (140 geni inuna regione di 4Mpb) e sul cromosoma 1. Altri cromosomi hanno menodi 10 geni per tRNA. Il numero di geni per tRNA risulta correlato con ledimensioni degli oociti. I geni codicanti per per gli rRNA 28S, 5,8S e 18S
sono organizzati in ununit trascrizionale ripetuta in tandem. Nel genoma
umano, le ripetizioni sono organizzate in 5 cluster di circa 150-200 copiepresenti sul braccio corto dei cromosomi 13,14,15, 21 e 22. I geni lrRNA5S sono organizzati in unit ripetute che formano un cluster di ~200-300geni in prossimit dellestremit telomerica del cromosoma 1. I genomieucariotici codicano per un gran numero di RNA non codicanti pro-teine (ncRNA). Circa il 30% dei trascritti identicati nel topo risulta non
codicante per proteine.
-
7/25/2019 9788884537546_preview.pdf
21/33
12 ILGENOMAUMANO
1.4.3 Le famiglie geniche
Le famiglie geniche sono componenti comuni di tutti i genomi eucariotici,soprattutto di quelli degli organismi complessi, dove la formazione delle
famiglie geniche considerata una strategia utilizzata dal genoma nucleareper specializzare il ruolo funzionale di alcuni geni, sia per quanto riguardail prolo di espressione che per quanto riguarda il ruolo funzionale delle
proteine espresse. Le famiglie geniche possono andare incontro a contrazionio espansioni (relazioni uno a molti o molti a molti) Le famiglie genichepossono essere generate attraverso diversi meccanismi:poliploidizzazione del
genoma, duplicazione di segmenti genomici (famiglia dei geni omeotici), du-plicazione di un singolo gene (geni per e globine) e retrotrascrizione.
1.4.4 Gli pseudogeni
Talvolta la copia di un gene non funzionale, ovvero non viene tra-scritta in RNA, o viene trascritta in un RNA non funzionale. Le copie
inattive di un gene vengono dette pseudogeni. Gli pseudogeni possonoessere classicati in: 1) non processati; 2) processati. Nel primo caso il
gene inattivo originato dal gene funzionale e contiene la tipica strutturain esoni ed introni. La copia genica pu essere completa o parziale. Glipseudogeni di questo tipo si formano con maggiore probabilit nelle re-gioni pericentromeriche. Gli pseudogeni processati sono privi di introniin quanto derivano dalla retrotrasposizione di mRNA (retropseudogeni).Il numero di copie di retropseudogeni correlato al livello di espressionedel gene da cui derivano. Nel genoma umano sono stati descritti ~8.000pseudogeni (~5.000 nel genoma del topo). Il maggior numero di pseu-dogeni processati deriva da geni per proteine ribosomiali; altri gruppiderivano da geni che codicano per proteine che legano il DNA e lRNA,
per molecole strutturali ed enzimi metabolici. Molti pseudogeni derivano
da geni a cui non stata attribuita una funzione. Oltre al livello di espres-sione dei geni, altri fattori gene-specici sono responsabili delloriginedegli pseudogeni, quali la lunghezza o il loro contenuto in G+C.
1.5 Le sequenze ripetute e intersperse nel genoma
In seguito ad analisi molecolari stato quindi osservato che alcune
sequenze sono presenti una volta nel genoma, mentre altre sequenzesono ripetute. Complessivamente si identicano tre categorie di sequenze:
DNA e sequenze uniche (presenti da una a poche copie per genoma), DNAmoderatamente ripetuto (presenti da poche no a 105nel genoma) e DNAaltamente ripetuto (presenti circa da 105a 107). I genomi eucarioti sono co-stituiti da DNA sia a sequenze uniche sia a sequenze ripetute, queste ultimemolto complesse nel numero di tipi, numero di copie e dislocazione.
-
7/25/2019 9788884537546_preview.pdf
22/33
ANTROPOLOGIAMOLECOLARE 13
1.5.1 DNA a sequenze ripetute
Con il termine di sequenza ripetuta (o ripetitiva) ci si pu riferire adue grandi classi di DNA non codicante. Nella prima classe risiedono le
sequenze distribuite a intervalli regolari (ripetizioni intersperse), nellaseconda invece si trovano sequenze raggruppate insieme (ripetizioni intandem) che verranno trattate nel capitolo 3.
Le ripetizioni intersperse sono anche conosciute con il nome di retro-trasposoni. I retrotrasposoni fanno parte della famiglia dei trasposoni, sonocio frammenti di DNA che si spostano da una parte allaltra del genoma
attraverso un meccanismo noto come trasposizione. Essi copiandosi primain un intermedio a RNA e, successivamente, revertendo in DNA (attraversola trascrittasi inversa) riescono ad integrarsi in una nuova posizione allin-terno del genoma. Questo meccanismo permette ai trasposoni di incremen-tare notevolmente e rapidamente la presenza delle loro copie allinterno delgenoma, aumentando conseguentemente anche la grandezza del genomastesso. I retrotrasposoni ,come altri tipi di elementi trasponibili, possono
indurre mutazioni inserendosi casualmente allinterno di geni funzionali,alterandone o, in alcuni casi, impedendone lespressione.
Si distinguono due sottoclassi di retrotrasposoni: i retrotrasposoniche presentano alle estremit delle lunghe sequenze ripetute terminali(LTR, Long Terminal Repeat, per questo chiamati retrotrasposoni LTR)e i retrotrasposoni che non le presentano (retrotrasposoni non-LTR).Iretrotrasposoni LTR possiedono alle estremit sequenze ripetute, lunghedalle 100 alle 5000 coppie di basi. Sono suddivisi a loro volta in due gruppi,i retrotrasposoni Ty1-copia simili e i retrotrasposoni Ty3-copia simili, in
base alle loro sequenze genomiche e allordine dei geni codicati. Entrambi
i gruppi si ritrovano in gran numero sia nelle piante (dalle pi semplicialgheunicellulari no alle angiosperme) che nei mammiferi, compresoluomo, di cui costituiscono approssimativamente l8% dellintero geno-
ma. A differenza degli LTR, I retrotrasposoni non-LTR non presentanosequenze ripetute alle estremit e vengono suddivisi in due sottotipi, lebrevi sequenze intersperse (SINE, Short Interspersed Nuclear Elemen-ts) e le lunghe sequenze intersperse (LINE,Long Interspersed NuclearElements). Le SINE sono brevi sequenze di DNA (di meno di 500 coppiedi basi). Le SINE raramente sono trascritte, e non codicano per la tra-scrittasi inversa; hanno perci bisogno delle proteine codicate da altre
sequenze (come le LINE) per trasporre. Le SINE pi comuni nei primati(e dunque anche nelluomo) appartengono alla famiglia delle sequenze
Alu. Gli elementi di questa famiglia genica sono lunghi circa 300 coppiedi basi, e possono essere individuate dal fatto che sono capaci di legarelenzima Alu I (da cui il nome). Il genoma umano contiene oltre un milionedi copie di sequenze Alu, parziali o complete, disperse tra i geni allinternodegli introni. Esse infatti costituiscono allincirca l11% del patrimonio
-
7/25/2019 9788884537546_preview.pdf
23/33
14 ILGENOMAUMANO
genetico totale. Le LINE sono lunghe sequenze di DNA (di pi di 5000coppie di basi). Codicano per 2 geni, uno dei quali presenta attivit di
trascrittasi inversa e di integrasi, permettendo la copia e la trasposizionesia di loro stessi, sia di altre sequenze non codicanti (come le SINE).
Poich traspongono replicandosi, le LINE sono in grado di accrescere lagrandezza di un genoma. Il genoma umano, per esempio, contiene oltre900000 LINE, che costituiscono allincirca il 21% dellintero genoma.
Vi sono tre famiglie principali di elementi LINEs: L1, L2 e L3. I genomidei mammiferi possiedono molte copie di una particolare famiglia LINE disequenze ripetute, la famiglia LINE-1. Le LINE inoltre sono spesso utilizza-te dai genetisti per il ngerprinting. Sebbene solitamente classicate comeDNA spazzatura, ricerche recenti hanno suggerito che le LINE e le SINEpossano aver avuto sia un ruolo importante nellevoluzione dei genomi,sia signicativi effetti a livello strutturale e trascrizionale. La trasposizione
di questi elementi stata implicata come causa di alcuni disturbi genetici(come la neurobromatosi) e di alcuni tipi di cancro.Come i retrotrasposoni anche i trasposoni a DNA sono elementi mobili e
fanno parte della famiglia dei trasposoni. Nei trasposoni a DNA per alcontrario dei retrotrasposoni, il meccanismo di trasposizione non utilizzaun intermedio a RNA. I trasposoni a DNA vengono distinti in due cate-gorie: trasposoni a Dna che si spostano replicandosi e trasposoni a DNAche si spostano in maniera conservativa, da un sito allaltro del genomasenza aumentare il numero di copie. Sono meno comuni negli eucariotirispetto ai retrotrasposoni. Mentre si dispone di molte informazioni sul-
lorganizzazione delle sequenze e sulla distribuzione delle SINE e delleLINE (Tabella 1.2), le conoscenze sulla funzione di queste sequenze sonomolto scarse. Una delle ipotesi che la maggior parte di queste sequenze
Tabella 1.2. Sequenze ripetute e intersperse nel genoma.
CLASSE FAMIGLIA DIMENSIONI UNITRIPETUTA N COPIE GENOMA
SINE Alu
MIR
0,3 kb lunghezzacompleta
0,13 kb dimensionemedia
1.200.000 ca
450.000 ca
10,7 % ca
2,5 % ca
LINE LINE-1
(kpn)
LINE-2
0,8 kb dimensione
media
0,25 kb dimensionemedia
2.600.000 ca
370.000 ca
17,3 %
3,3 %
LTR ERV 1,3 kb dimensionemedia
240.000 4,7 %
TRASPOSONIA DNA
MER-1(Charlie)
0,25 kb dimensionemedia
213.000 1,4 %
-
7/25/2019 9788884537546_preview.pdf
24/33
ANTROPOLOGIAMOLECOLARE 15
non abbia alcuna funzione. Unaltra ipotesi che alcune delle sequenzeripetute, o dei loro trascritti, o entrambi, siano in qualche modo coinvoltinei meccanismi di regolazione dellespressione genica.
1.6 Le parti non ricombinanti del genoma umano
Il processo mediante il quale si producono nuove combinazioni dicaratteri rispetto a quelli parentali detto ricombinazione genica. Mentrei cromosomi autosomici omologhi sono sottoposti, durante la meiosi, aricombinazione genica e si mescolano ad ogni generazione in modo tale
che linformazione genetica di ciascun nuovo individuo sia formata permet da quella materna e per met da quella paterna, il cromosoma Y ed ilDNA mitocondriale (mtDNA) invece passano di generazione in generazionesenza subire cambiamenti (se ovviamente si escludono gli eventi mutazio-nali). Per questo motivo costituiscono un valido strumento per lo studiodellevoluzione umana, per la ricostruzione della storia demograca, dei
ussi migratori e del mescolamento delle popolazioni, per la ricostruzione
di relazioni di parentela e vengono considerati dei marcatori lineari (lineagemarkers). Il corredo genetico che si trova nella regione differenziale (regionedi non omologia con il cromosoma X) del cromosoma Y viene ereditato,nella specie umana, soltanto dai maschi e la trasmissione avviene di padrein glio. I geni invece presenti sullmtDNA vengono trasmessi dalla madre
ai suoi gli siano essi maschi o femmine. Nelle ricostruzioni di relazioni
di parentela quindi le informazioni sulla linea parentale materna possonoessere desunte dallanalisi delle sequenze di mtDNA mentre le informazionisulla linea parentale paterna dallanalisi del cromosoma Y (Fig. 1.5).
1.6.1 Il cromosoma Y
Dove si trova e sua struttura.Negli animali ed in molte piante, le
cellule maschili e femminili che contengono il proprio corredo cromo-somico allinterno del nucleo, si distinguono per i cromosomi sessuali,cromosomi che, in molti organismi eucarioti, sono rappresentati diversa-mente nei due sessi. Nelluomo, le femmine possiedono due cromosomiX, submetacentrici e di media lunghezza, mentre i maschi portano uncromosoma X ed un cromosoma Y, acrocentrico di piccole dimensioni(Fig. 1.6). Il cromosoma Y lungo circa un terzo del cromosoma X e perquesto motivo molti geni presenti sul cromosoma X non hanno una con-troparte sul cromosoma Y. Dal punto di vista strutturale il cromosoma Y una molecola lineare di circa 50 Mb.
In un lavoro pubblicato su Nature nel 2003 i ricercatori del WhiteheadInstitute e della Washington University, riportano la sequenza di 23 Mbdelle circa 50 Mb del cromosoma Y umano. La restante porzione del cro-
-
7/25/2019 9788884537546_preview.pdf
25/33
16 ILGENOMAUMANO
mosoma di circa 30 Mb, non riportata nellarticolo una regione costituitada eterocromatina, posizionata sul braccio lungo del cromosoma (Fig. 1.7)che non viene trascritta e composta da DNA altamente ripetuto difcile
da sequenziare con le attuali tecnologie. Il cromosoma Y con le sue 50 Mb il terzo cromosoma pi corto del corredo genetico umano, pi grande
solo del cromosoma 21 (47 Mb) e del cromosoma 22 (49 Mb)
Figura 1.5. Ereditariet dei marcatori autosomici ed uniparentali.
Figura 1.6. Cromosomi sessuali umani.
Figura 1.7. Struttura del cromosoma Y.
-
7/25/2019 9788884537546_preview.pdf
26/33
ANTROPOLOGIAMOLECOLARE 17
Nonostante la dimensione del cromosoma Y sia circa quattromilavolte maggiore di quella dellmtDNA, esso caratterizzato da una bassadensit di geni e dai una bassa frequenza di mutazione.
Il cromosoma Y costituito da unampia regione non omologa (re-
gione differenziale) a quella del cromosoma X, chiamata regione nonricombinante (NRY non-ricombinig region of the human Y chromosome)che comprende pi o meno il 95% di tutto il cromosoma (Fig. 1.8) e dadue piccole regioni posizionate allestremit del cromosoma che sonoconosciute come regioni pseudo-autosomali 1 e 2 (PAR pseudo-autosomalregions) che presentano omologia con una porzione del cromosoma X.Durante la meiosi nei maschi, le regioni pseudo-autosomiche del cromo-soma X e del cromosoma Y si appaiano e si scambiano di materiale genicoattraverso il crossing-over e ci assicura che i due cromosomi migrino poi
verso le estremit opposte della cellula meiotica, si abbia cio una correttasegregazione dei cromosomi X ed Y e la meiosi proceda.
La regione pseudo-autosomale 1 (PAR 1) localizzata allestremitdel braccio corto (Yp) del cromosoma ha una lunghezza di circa 2,5 Mb
mentre PAR 2, posizionata allestremit opposta, quella cio del bracciolungo (Yq) ha dimensioni inferiori ad 1 Mb.Skaletsky et al.nel 2003 hanno dato alla regione non ricombinante
il nome di male specic region (MSY) invece di NRY per sottolineare
lappartenza specica di questa regione ad individui di sesso maschile. In
questa regione sono presenti solo poche dozzine di geni, solo alcuni deiquali hanno il loro corrispondente sul cromosoma X. Tra questi ultimi,
molti sono quelli coinvolti nella differenziazione sessuale maschile, inparticolare il gene SRY (sex-determinig region Y), mentre molti altrigeni specici sono coinvolti nella produzione di spermatozoi. LSRY
posizionato sul braccio corto del cromosoma (Yp11.3) e la sua presenzao assenza determina durante lembriogenesi la possibilit che le gonadi,no a quel momento bipotenziali, si sviluppino in testicoli oppure in
ovaie. Nei maschi quindi, i geni presenti nella regione differenziale sonodetti emizigoti (met zigote). Riassumendo quindi il cromosoma Ydetermina la mascolinit nei mammiferi placentali mediante lazione
Figura 1.8. Frammenti ricombinanti tra il cromosoma X ed Y.
-
7/25/2019 9788884537546_preview.pdf
27/33
18 ILGENOMAUMANO
di uno o pi geni che controllano la transizione verso la differenzia-zione sessuale maschile. Questo prodotto genico chiamato fattore dideterminazione del testicolo determina la differenziazione delle gonadiprimordiali in testicoli piuttosto che in ovari. Questo levento chiave
nella determinazione del sesso in molti mammiferi; tutte le altre diffe-renze fra i sessi sono effetti secondari derivanti dallazione di ormoni odi fattori prodotti dalle gonadi. In poche parole la determinazione delsesso dipende dalla determinazione delle gonadi. A livello della regioneMSY, il cromosoma Y caratterizzato dalla presenza di diverse regioniche non sono altro che copie del cromosoma X oppure regioni duplicatedel cromosoma Y stesso. Tre sono le classi di sequenze che sono statetipizzate sul cromosoma: X-trasposte, X-degenerate ed ampliconic.Due blocchi, posizionati sul braccio corto del cromosoma, con unalunghezza complessiva di 3,4 Mb, formano le sequenze X-trasposte.Queste ultime sono identiche al 99% rispetto a delle sequenze trovate sulcromosoma X in posizione Xq21 che contengono due sequenze genichee che non partecipano al crossing over X-Y durante la meiosi maschile.
Le sequenze X-degenerate si trovano organizzate in otto blocchi subraccio corto e su quello lungo del cromosoma, per una lunghezza di8,6 Mb. Queste sequenze presentano unomologia del 96% con sequenzepresenti sul cromosoma X. I segmenti ampliconic sono costituiti dasette ampi blocchi sparsi sia sul braccio corto che su quello lungo delcromosoma, coprono una lunghezza di circa 10,2 Mb. Il 60% di questesequenze hanno unidentit intracromosomica pari al 99,9% o pi. Inaltre parole, molto difcile distinguere queste sequenze luna dallaltra.Unaltra caratteristica che queste sequenze sono palindromiche, pre-sentano cio una sequenza identica ma invertita. Otto ampie palindromioccupano 5,7 Mb del braccio lungo del cromosoma e per lo meno sei diqueste contengono geni coinvolti nella formazione del testicolo.
Eredit del cromosoma Y
La modalit di trasmissione dei cromosomi X ed Y attraverso legenerazioni molto semplice e chiara. La femmina produce solo gametiportatori dellX mentre il maschio produce sia gameti con lX che gameticon lY. Lunione casuale dei gameti maschili e femminili produce unagenerazione in cui il 50% sar maschio (XY) ed il 50% sar femmina (XX).
Il cromosoma Y in quanto portatore del gene per la determinazione delsesso maschile, si trasmette solo di padre in glio. Per la sua struttura e
per la sua peculiare valenza ereditaria costituisce insieme al DNA mito-condriale un valido strumento per lo studio dellevoluzione umana. Inoltrerisulta essere uno strumento molto utile nella ricostruzione di relazioniparentali per linea paterna. Per queste sue funzioni, il cromosoma Y vieneconsiderato lanalogo al maschile del DNA mitocondriale.
-
7/25/2019 9788884537546_preview.pdf
28/33
ANTROPOLOGIAMOLECOLARE 19
Marcatori del cromosoma Y e loro tasso di mutazione
In generale due sono le categorie di marcatori molecolari usati perlanalisi della diversit del cromosoma Y: loci bi-allelici che producono
solo due alleli possibili e loci multi-allelici.I marcatori bi-allelici comprendono i single nucleotide polymorphisms
(Y-SNPs) e linserzione degli elementi Alu. Questi tipi di polimorsmisono i primi marcatori bi-allelici scoperti sul cromosoma Y. Qualche voltai marcatori bi-allelici riguardano un singolo evento di mutazione (UEPsunique event polymorphisms) dal momento che il loro tasso di mutazione
basso (~108
per generazione). Per lanalisi del cromosoma Y 250 marcatoribi-allelici sono stati caratterizzati. Y-SNPs giocano un ruolo importantenon in genetica forense, dato il basso potere di discriminazione rispettoagli Y-STRs ma negli studi della migrazione umana in quanto consento-no una valutazione effettiva delle maggiori differenze fra i vari gruppi dipopolazioni. Gli alleli degli Y-SNPs vengono indicati come ancestralee derivato e possono essere indicati nella forma binaria di 0 e 1 per la
forma ancestrale e derivata rispettivamente. Lo stato ancestrale dei mar-catori Y-SNP solitamente determinato dal confronto con la sequenza diDNA dello chimpazee per lo stesso marcatore. I marcatori multi-allelicicomprendono invece due minisatelliti e pi di 200 short tandem repeat(Y-STR). Questi loci multi-allelici permettono di differenziare aplotipidiversi con abbastanza alta risoluzione dal momento che presentano unalto tasso di mutazione. I minisatelliti hanno un tasso di mutazione del6-11% per generazione mentre la media del tasso di mutazione per gliSTRs di circa 0,2% per generazione.
Il numero di STRs disponibili per lidenticazione umana aumentato
drasticamente da quando stata disponibile lintera sequenza del genomaumano. Intorno al 1990 infatti solo una manciata di Y-STRs erano staticaratterizzati ed erano disponibili per luso. Agli inizi del 2002, 30 erano
gli STRs a disposizione dei ricercatori ma da allora il numero aumentatoenormemente no ad un numero di circa 200 STRs depositati in GenomeDatabase ad oggi (GDB; ) (Fig. 1.9).
Le basi molecolari della determinazione del sesso
I primi tentativi di determinazione molecolare del sesso si basarono
sullamplicazione, per mezzo della reazione a catena della polimerasi(PCR), di regioni ripetute sul cromosoma Y. La presenza di regioni di DNAesclusive di ciascuno dei cromosomi sessuali port alla messa a puntodi metodi basati soprattutto sullamplicazione di sequenze ripetute,
appartenenti alla famiglia del DNA satellite. Questi metodi risultaronoper inadeguati per il DNA antico perch, in alcuni casi, i frammentiamplicati presentavano una lunghezza decisamente superiore alle poche
-
7/25/2019 9788884537546_preview.pdf
29/33
20 ILGENOMAUMANO
centinaia di paia di basi tipiche del DNA recuperabile da reperti antichi.
Inoltre, trattandosi di sequenze ripetute centinaia di volte, il rischio dicontaminazione da parte di DNA moderno era molto elevato. Unulterio-re limitazione derivava dal fatto che, mentre nel caso di DNA modernolassenza del prodotto di amplicazione indica un individuo femminile,
altrettanto non si pu concludere per il DNA antico. La mancata amplica-zione potrebbe infatti essere legata alla scarsa quantit e qualit del DNAestratto cos come alla presenza di sostanze inibenti. Ulteriori sviluppiportarono allimpiego del locus a singola copia del gene dellamelogeni-na, successivamente utilizzato nel campo della genetica forense. Il genedellamelogenina si trova nei cromosomi sessuali in posizione telomerica(regione p22.2 sullX e p 11.2 sullY) e codica per una proteina, lame-logenina, coinvolta nello sviluppo dello smalto dentario. Questo gene hala particolarit di presentare un dimorsmo di lunghezza: il frammento
sul cromosoma X lungo 106 bp mentre quello sul cromosoma Y lungo112 bp. Questa differenza dovuta ad una delezione di 6 bp presentesul primo introne del cromosoma X che invece non esiste nel rispettivointrone del cromosoma Y.
Con lutilizzo di primer specici queste due varianti alleliche possono
essere evidenziate e distinte come frammenti di 106 e di 112 bp: un indi-viduo di sesso maschile dovrebbe avere quindi un prolo allelico carat-
terizzato da entrambi i frammenti di 106 e 112 bp, mentre un individuodi sesso femminile mostrer solo il frammento di 106 bp. Attualmentelamplicazione del gene omologo dellamelogenina rappresenta il metodo
pi comunemente usato per la determinazione del sesso in reperti antichi.Tuttavia esso presenta alcuni problemi tra cui la perdita allelica dovutaallamplicazione parziale di uno solo dei due alleli, spesso riscontrata
nei loci biallelici e la presenza seppur con una frequenza molto bassa
Figura 1.9. Posizionamento degli STRs sul cromosoma Y.
-
7/25/2019 9788884537546_preview.pdf
30/33
ANTROPOLOGIAMOLECOLARE 21
di un raro polimorsmo di delezione sul cromosoma Y che impedisce
lamplicazione del frammento di 112 bp.
Per evitare il problema dellamplicazione parziale sono state messe
a punto diverse strategie, una delle quali prevede limpiego nella stessa
reazione di tre coppie di primers, uno comune e gli altri specici per ognicromosoma. I prodotti di amplicazione che si ottengono sono rispetti-
vamente di 218 bp per il cromosoma Y e di 330 bp per il cromosoma X. Iframmenti amplicati in questa amplicazione risultano per di dimen-sioni troppo elevate per studiare reperti in cui il DNA presente moltodegradato. Unaltra strategia consiste invece nellutilizzo di primers cheamplicano un segmento di 112 bp dellesone 6 del gene dellamelogenina
le cui copie sui due cromosomi sessuali hanno la medesima lunghezzama differiscono in 10 posizioni della sequenza nucleotidica. I prodotti diamplicazione vengono poi fatti ibridare con due oligonucleotidi sintetici
marcati, ciascuno specico per un solo cromosoma sessuale. Questa per
risulta essere una metodica un po lunga. La metodica migliore che per-mette di superare i problemi sopra elencati prevede la co-amplicazione
dellamelogenina e di una piccola porzione del gene SRY (sex determinigregion Y), locus che, trovandosi sul braccio corto del cromosoma Y (Yp11.3), presente unicamente negli individui di sesso maschile. Tale gene,altamente conservato, rappresenta il male-determinig factor poich,durante il processo dembriogenesi la sua presenza o assenza determinase le gonadi, no a quel momento bipotenziali, si sviluppino come testicoli
o ovaie. Questo sistema di co-amplicazione presenta inoltre il vantaggio
di necessitare di un numero inferiore di prove per singolo campione, ab-bassando fortemente i rischi di contaminazione inevitabilmente presentinelle prove ripetute molte volte.
Applicazioni dellanalisi del cromosoma Y
Come precedentemente accennato, data la sua struttura e le suecaratteristiche di trasmissione, lanalisi del cromosoma Y gioca un ruoloimportante nello studio dellevoluzione umana, per la ricostruzione deiussi migratori e del mescolamento delle popolazioni. Lo studio del cro-mosoma costituisce anche un valido strumento nel cercare sia di risolverequestioni di interesse storico che difcili controversie genealogiche.
Studi storici.In uno studio condotto da un team di ricercatori guidatida Chris Tyler Smith delluniversit di Oxford sono stati analizzati i proli
di pi di 2100 maschi provenienti dallAsia centrale.Lanalisi dei proli ha portato allottenimento di un unico prolo
allelico nell8% dei casi. Lulteriore analisi di 16 Y-SNPs (Single Nucleo-tide Polymorphism, trattati nel capitolo 3) pone i campioni studiatiallinterno dellaplogruppo C*, aplogruppo frequente in Asia. Attraverso
-
7/25/2019 9788884537546_preview.pdf
31/33
22 ILGENOMAUMANO
lottenimento di questi dati genetici i ricercatori hanno tentato di stimaregli anni che separano il gruppo di individui che presentavano lo stessoprolo genetico da il loro antenato comune. Considerando il tempo di
generazione, cio lintervallo di tempo che intercorre fra una generazione
e quella successiva, pari a 30 anni, e facendo delle ipotesi sul possibiletasso di mutazione , i ricercatori sono giunti a stimare un tempo di se-parazione di circa 1000 anni.
Gli studiosi hanno poi osservato che il suddetto prolo era molto pre-sente in Mongolia, dato questo che faceva considerare la regione in que-stione come la culla del prolo genetico osservato nonostante risultasse
ampliamente diffuso anche in altre 16 differenti popolazioni asiatiche.Il dato di maggior interesse era che la distribuzione geograca del
gruppo di individui caratterizzati dal prolo genetico studiato, corri-spondeva, in Mongolia, allarea occupata dallex impero mongolico diGenghis Khan. Questa scoperta faceva ipotizzare che il prolo Y-STR
s
studiato potesse essere correlato a quello di Genghis Khan e dei suoi di-scendenti. Lipotesi che questa Y-lineage potesse derivare direttamente
da Genghis Khan (circa 1162-1227) e dalla sua linea parentale maschile stata rafforzata dal fatto che il prolo genetico in questione risultava
uguale al prolo di un gruppo di individui in Pakistan i quali, secondo
la tradizione orale, sarebbero i diretti discendenti per linea maschile diGenghis Khan. In questo studio lanalisi del cromosoma Y ha rivelato uninteressante indizio sul nostro passato.
Controversie genealogiche.Nel 1802, alcuni anni dopo che divennepresidente degli Stati Uniti, Thomas Jefferson fu pubblicamente accusatodal Richmond, giornale della Virginia, di essere il padre naturale di un
bambino avuto dalla sua schiava, Sally Hemings. Nonostante non si sap-pia come sia nata questa accusa, il legame fra Thomas Jefferson e SallyHemings stato oggetto di controversia per almeno 200 anni. Poi nel
1998, il prestigioso giornale scientico Nature, ha pubblicato uno studiosullintroduzione delle prove a DNA nelle controversie storiche. Il lavoro,intitolatoJefferson fathered slaves last child, metteva in evidenza comecon luso dei marcatori del cromosoma Y era stata seguita la linea maschiledei discendenti di Jefferson no a giungere ad un discendente del glio
pi giovane di Sally Hemings, Eston Hemings. Sfortunatamente i gli
legittimi di Thomas Jefferson morirono tutti quando ancora in fasce, le
sue due glie che arrivarono alla maturit ovviamente non portavano ilsuo cromosoma Y cos i discendenti non si sono potuti utilizzare in que-sto studio. Rimanevano per altre due possibilit da sfruttare: il fratelloRandolph ed il fratello di suo padre, Field. Lultimo discendente maschiledel fratello di Thomas per mor nel 1920 o 1930 e cos le analisi si sonodovute indirizzare sui discendenti dello zio del Presidente. Cinque deisetti discendenti individuati furono daccordo nel collaborare allo studio
-
7/25/2019 9788884537546_preview.pdf
32/33
ANTROPOLOGIAMOLECOLARE 23
donando per lanalisi del cromosoma Y il loro sangue. Per quanto riguardala famiglia Hemings lanalisi stata condotta sui discendenti del glio
di Sally Hemings, Eston Hemings. Eston infatti ebbe due gli maschi
ed una glia, il suo glio pi giovane, Beverly, ebbe un glio Carl-Smith
che a sua volta ebbe due gli, solo uno dei quali ebbe un glio maschio dinome John Weeks. Questultimo, nato nel 1946, stato utilizzato comecampione di confronto per la famiglia Hemings (Fig. 1.10).
Figura 1.10. Esempio di genealogia del cromosoma Y.
In questo studio diversi sono stati i campioni ulteriori che sono statiraccolti per essere utilizzati come controlli e per cercare di risolvere lacontroversa questione della paternit. Uno di questi campioni aggiuntivifu quello di un discendente di Thomas Woodson, primogenito di Sally
Hemings. Oggi i discendenti infatti di questo sono in un numero superiorea 1400 e sono sparsi per tutti gli Stati Uniti. Secondo la tradizione oraledella famiglia Woodson, Thomas era il glio pi grande di Sally e del
Presidente. Dal momento che non cerano documenti che supportasserola pretesa della famiglia Woodson, si prelevarono anche campioni di san-gue di cinque discendenti ancora in vita di Thomas Woodson in modo dapoter aiutare a confermare o confutare ci che la famiglia si tramandavadi generazione in generazione. Per lo studio furono utilizzati anche trecampioni di discendenti della linea maschile dei nipoti di Thomas Jef-ferson, gli cio della sorella in quanto alcune testimonianze indicavano
i nipoti come possibili padri dei gli di Sally Hemings e di sua sorella.
Inne vennero prelevati anche cinque campioni di discendenti per linea
maschile da diverse vecchie famiglie della Virginia utili come campioni di
-
7/25/2019 9788884537546_preview.pdf
33/33
24 ILGENOMAUMANO
confronto. Questi campioni sono stati inseriti nello studio per fornire ilsegnale di background, con lidea che le potenziali similarit riscontratenellanalisi del cromosoma Y dovute alla vicinanza geograca dovessero
essere eliminate. I risultati ottenuti da questo studio sono riportati nella
tabella 1.3.Come si evince dalla tabella, tutti le 19 regioni del cromosoma Y
analizzate dai discendenti della famiglia Jefferson sono perfettamentecompatibili con i proli ottenuti dai discendenti di Eston Hemings. Questo
risultato stato interpretato dai ricercatori come la prova che il Presidente
Tabella 1.3. Risultati dello studio sui discendenti di Jefferson.
Marcatoristudiati
Linea maschileField Jefferson
Linea maschileEston Hemings
Linea maschilenipoti
Presidente
Linea maschileThomas
Woodson
Numero diindividuitipizzati
5 1 3 5
Y-STR lociDYS19 15 15 14 14
DYS388 12 12 12 12
DYS389A 4 4 5 5
DYS389B 11 11 12 11
DYS389C 3 3 3 3
DYS389D 9 9 10 10
DYS390 11 11 11 11
DYS391 10 10 10 13
DYS392 15 15 13 13
DYS393 13 13 13 13
DXYS156Y 7 7 7 7
Y-SNP loci (0 = allele ancestrale; 1 = allele derivato)
DYS287(YAP) 0 0 0 0
SRYm8299 0 0 0 0
DYS271(SY81)
0 0 0 0
LLY22g 0 0 0 0
Tat 0 0 0 0
92R7 0 0 1 1SRYm1532 1 1 1 1
Minisatellite