9788884537546_preview.pdf

download 9788884537546_preview.pdf

of 33

Transcript of 9788884537546_preview.pdf

  • 7/25/2019 9788884537546_preview.pdf

    1/33

    dAVIDcARAMELLI

    ANTROPOLOGIA MOLECOLARE

    Manuale di base

    FIRENZEUNIVERSITY

    PRESS

  • 7/25/2019 9788884537546_preview.pdf

    2/33

    MANUALI

    SCIENZE

    5

  • 7/25/2019 9788884537546_preview.pdf

    3/33

    PIANETAREDI

    COMITATOSCIENTIFICO

    RENATOFANIDAVIDCARAMELLI

    ALESSIOMENGONI

    TITOLIGIPUBBLICATI

    La PCR e le sue varianti. Quaderno di laboratorio, a cura di Angela Scialpi,Alessio Mengoni, 2008

    David Caramelli,Antropologia molecolare. Manuale di base, 2009

  • 7/25/2019 9788884537546_preview.pdf

    4/33

    DAVIDCARAMELLI

    Antropologia molecolareManuale di base

    Firenze University Press2009

  • 7/25/2019 9788884537546_preview.pdf

    5/33

    Il volume stato realizzato grazie al contributo del progetto UE BioTethedcontract number 017474.

    Progetto graco di Alberto Pizarro Fernndez

    2009 Firenze University Press

    Universit degli Studi di FirenzeFirenze University PressBorgo Albizi, 28, 50122 Firenze, Italyhttp://www.fupress.com/

    Printed in Italy

    Antropologia molecolare : Manuale di base /David Caramelli. Firenze : Firenze UniversityPress, 2009.(Manuali . Scienze ; 5)

    http://digital.casalini.it/9788884537546

    ISBN 978-88-8453-696-9 (print)ISBN 978-88-8453-754-6 (online)

  • 7/25/2019 9788884537546_preview.pdf

    6/33

    Sommario

    Cap. 1 Il genoma umano 1

    1.1 Introduzione 11.2 La struttura degli acidi nucleici 21.3 Caratteristiche dei cromosomi umani 51.4 I geni 71.5 Le sequenze ripetute e intersperse nel genoma 121.6 Le parti non ricombinanti del genoma umano 15

    Cap. 2 La variabilit del genoma umano 492.1 Introduzione 492.2 Origine della variabilit genetica 532.3 Polimorsmi a singolo nucleotide: mutazioni geniche

    o puntiformi 582.4 Polimorsmi di lunghezza 702.5 Gli elementi trasponibili 76

    Cap. 3 Studio della diversit del genoma umano 793.1 Considerazioni generali 793.2 Il database e gli SNPs 803.3 Scoperta e tipizzazione dei microsatelliti 873.4 Scoperta e tipizzazione dei minisatelliti 893.5 Scoperta e tipizzazione dei polimorsmi Alu/LINE 903.6 Scoperta e tipizzazione di satelliti e polimorsmi

    strutturali 91

    Cap. 4 I meccanismi dellevoluzione 934.1 Introduzione 934.2 La legge di Hardy-Weinberg 934.3 Processi che agiscono sulla variabilit delle popolazioni 94

  • 7/25/2019 9788884537546_preview.pdf

    7/33

    VI SOMMARIO

    4.4 La teoria neutrale dellevoluzione molecolaree lipotesi dellorologio molecolare 113

    Cap. 5 Evoluzione molecolare 117

    5.1 Introduzione 1175.2 Sostituzioni nucleotidiche in una sequenza di DNA 1175.3 Divergenza tra sequenze e stima delle distanze

    genetiche fra molecole 1245.4 Misura della variabilit genetica nelle popolazioni

    e stima delle distanze genetiche fra popolazioni 127

    Cap. 6 Metodi flogenetici 1336.1 Terminologia e topologia degli alberi logenetici 1336.2 Metodi per la costruzione di alberi logenetici 1356.3 Datazione delle ricostruzioni logenetiche e stima

    del TMRCA 147

    Cap. 7 Lanalisi molecolare 149

    7.1 Estrazione del DNA: introduzione 1497.2 La reazione a catena della polimerasi 1647.3 Il clonaggio 1717.4 Il sequenziamento automatico del DNA. Il metodo

    di Sanger 179

    Cap. 8 Il DNA antico 185

    8.1 Introduzione 1858.2 Diagenesi del DNA antico 1868.3 Sopravvivenza del DNA nellambiente naturale 1888.4 Esempi di resti antichi da cui possibile estrarre il DNA 1898.5 Problemi relativi allanalisi del DNA antico 1918.6 Marcatori del DNA antico 2088.7 Importanza della quanticazione 2108.8 Differenza tra sequenziamento diretto

    e sequenziamento da cloni 2108.9 Amplicazioni di frammenti lunghi 212

    Cap. 9 Come si effettua uno studio sul DNA antico 2139.1 Introduzione 213

    9.2 Il recupero 2159.3 La conservazione 2179.4 Il prelievo del campione per lanalisi molecolare

    e la preparazione della polvere 2189.5 Analisi della racemizzazione degli amminoacidi 2199.6 Analisi termogravimetrica 2259.7 Estrazione del DNA 225

  • 7/25/2019 9788884537546_preview.pdf

    8/33

    ANTROPOLOGIAMOLECOLARE VII

    9.8 I primers 2269.9 La prova inibitori 2279.10 La PCR competitiva 2279.11 Visualizzazione del risultato 230

    9.12 La Real Time PCR: levoluzione della PCRcompetitiva 233

    9.13 Lamplicazione del DNA 2349.14 Taglio della banda e puricazione 2359.15 Clonaggio del DNA con il TopoTA Cloning 2369.16 Conservazione dellamplicone e creazione

    dellArchivio Biologico 2369.17 Reazione di sequenza 2369.18 Ricostruzione al PC della sequenza nucleotidica 237

    Cap. 10 Il DNA antico ed il DNA forense 24110.1 Introduzione 24110.2 DNA antico 241

    10.3 DNA forense 24210.4 Principali punti dunione tra le analisi 24410.5 Lautenticit dei risultati: valutazioni e metodiche

    applicate 244

    Cap. 11 Evoluzione umana e popolamento 24711.1 Origine delluomo anatomicamente moderno 249

    11.2. Prove di una origine africana dai resti fossili 25011.3 Evidenze genetiche 25211.4 Diffusione extra-africana diHomo sapiens 25811.5 Dispersioni multiple 26411.6 Contributo degli studi sul DNA antico allorigine

    delluomo anatomicamente moderno 26611.7 Studio logenetico delle popolazioni

    secondo i marcatori classici 279

    Bibliografa 295

    Indice dei concetti 321

  • 7/25/2019 9788884537546_preview.pdf

    9/33

    Hanno collaborato alla ricerca e alla stesura dei capitoli:

    Giulio Catalano e Elena Pilli (Capitolo 1); Elena Pilli (Capitoli 2, 3, 8, 9, 10);Martina Lari (Capitoli 4, 5 e 6); Giulio Catalano e Elena Pilli (Capitolo 7); Lucio

    Milani (Capitolo 11)

  • 7/25/2019 9788884537546_preview.pdf

    10/33

    Capitolo 1Il genoma umano

    1.1 Introduzione

    Ogni organismo vivente, unicellulare o multicellulare, caratterizzatodalla presenza di molecole di acido nucleico (DNA o RNA) in grado di pro-durre copie identiche a se stesse. Esclusi alcuni virus a RNA, linformazionegenetica degli organismi viventi contenuta nelle molecole di DNA. Conil termine genoma si denisce il contenuto completo dellinformazione

    genetica. Il contenuto totale di DNA negli eucarioti e quindi la dimensione

    del genoma correlata alla complessit dellorganismo (ad es., il genomaumano pi grande di quello degli insetti che a sua volta pi grande diquello funghi). Esistono per diverse eccezioni: es. il genoma diX. laevis grande quanto quello dei mammiferi; altri anbi hanno un genoma circa

    50 volte pi grande del genoma umano; tra le piante, il genoma di Zeamais (5000 Mbp) pi grande di quello umano. In genere, per un datoraggruppamento tassonomico, la dimensione minima del genoma ap-prossimativamente proporzionale alla complessit dellorganismo. Comeper il contenuto di DNA, anche il numero e le dimensioni dei cromosomi molto variabile tra gli eucarioti (Tab. 1.1). Il materiale genetico deglieucarioti suddiviso in pi cromosomi lineari. Il numero cromosomico,salvo poche eccezioni, caratteristico per ciascuna specie. Molti eucariotihanno due copie di ciascun tipo di cromosoma presente nel nucleo, e per

    questo motivo, il loro assetto detto diploide, vale a dire 2N.Nelluomo il cariotipo, ovvero linsieme completo di tutti i cromo-somi metafasici di una cellula, costituito da 46 cromosomi. Di questi,44 cromosomi, detti autosomi, sono 22 coppie di cromosomi omologhi,identici nei due sessi. Per questo motivo i geni contenuti in ogni autoso-ma sono in duplice copia, una per omologo. Gli altri 2 cromosomi sonoquelli sessuali, rappresentati da due cromosomi X nella femmina e da

  • 7/25/2019 9788884537546_preview.pdf

    11/33

    2 ILGENOMAUMANO

    1 cromosoma X e un cromosoma Y nel maschio. La femmina ha quindiuna doppia copia, una per omologo, dei geni localizzati sul cromosomaX, il maschio invece ne ha una sola ed quindi emizigote per i geni delcromosoma X.

    Tabella 1.1. Dimensioni e numero di cromosomi in alcuni eucarioti.

    TAXON SPECIE GENOMA (Mpb) N CROMOSOMI

    Mammalia Homo sapiensPan troglodites

    Bos taurusCanis familiarisMus musculus

    Rattus norvegicus

    320021003000238525002700

    232430392021

    Aves Gallus gallus 1054 39

    Amphibia Xenopus laevisXenopus tropicalis

    31001700

    1810

    Fish Danio rerio

    Tetradon nigroviridis

    1700

    400

    25

    22Insecta Drosophila melanogaster

    Anopheles gambiaeApis mellifera

    180278228

    4516

    Nematoda Caenorhabditis elegans 97 6

    Protozoa Leishmania majorPlasmodium falciparum

    3426

    3614

    1.2 La struttura degli acidi nucleici

    Sia il DNA sia lRNA sono grandi macromolecole (polimeri) composteda unit costitutive pi piccole (monomeri). Per comprendere meglio laloro struttura, possiamo considerare alcuni livelli di complessit:

    1. I nucleotidi sono lunit strutturale ripetitiva degli acidi nucleici.2. I nucleotidi sono legati tra loro a formare un lamento di DNA o

    di RNA. La sequenza lineare di nucleotidi di un lamento detta

    struttura primaria del DNA o dellRNA.3. Due lamenti di DNA (e talvolta di RNA) possono interagire luno

    con laltro per formare una doppia elica (Fig.1.1a). La doppia elica un esempio di struttura secondaria regolare ripetitiva. La doppiaelica del DNA pu adottare differenti strutture secondarie, detteDNA-A, DNA-B e DNA-Z.

    4. I vari ordini di ripiegamento delle strutture secondarie formanouna struttura tridimensionale nale che prende il nome di strut-tura terziaria. Allinterno delle cellule viventi il DNA associato

  • 7/25/2019 9788884537546_preview.pdf

    12/33

    ANTROPOLOGIAMOLECOLARE 3

    ad unampia variet di proteine che inuenzano la sua struttura

    terziaria nale.

    Il nucleotide lunit strutturale ripetitiva del DNA e dellRNA. Un

    nucleotide ha tre componenti: un gruppo fosfato, uno zucchero pentosioe una base azotata. Come indicato in gura (Fig. 1.1), i nucleotidi possono

    differire per quanto riguarda lo zucchero e la base azotata. Vi sono duetipi di zuccheri: ribosio e deossiribosio.

    Figura 1.1. Struttura del DNA.

    Nel DNA lo zucchero presente sempre il deossiribosio, nellRNA

    il ribosio. I due zuccheri differiscono per i gruppi sostituenti legati alcarbonio 2: un gruppo idrossilico (OH) nel ribosio, un gruppo idrogeno(H) nel desossiribosio. Le cinque diverse basi sono distinte in due diversigruppi: purine e pirimidine. Le basi puriniche, ladenina (A) e la guanina(G), contengono una struttura a doppio anello (biciclica); le basi pirimidi-niche, la citosina (C), la timina(T) e luracile (U), presentano invece unastruttura a singolo anello (monociclica). Il DNA e lRNA si distinguono

    per alcune importanti caratteristiche chimiche (Figg. 1.2.a, 1.2.b). Infattila base timina non presente nellRNA e al suo posto presente luracile.Ladenina, la guanina e la citosina sono i nucleotidi costituenti sia del DNAsia dellRNA. Nel DNA e nellRNA le basi sono sempre unite al carbonio1 del pentoso da un legame covalente. Le basi puriniche sono legateallazoto 9, mentre le pirimidine si legano allazoto 1. La combinazionedi uno zucchero e di una base detta anche nucleoside. Il nucleoside conun fosfato ad esso legato diventa un nucleotide, o un nucleoside fosfato.Il gruppo fosfato legato al carbonio 5 dello zucchero sia nel DNA chenellRNA. Per la formazione dei polinucleotidi di DNA e di RNA, i nu-cleotidi vengono uniti da un legame covalente tra il gruppo fosfato di unnucleotide ed il carbonio in 3 del pentoso dellaltro nucleotide. Questotipo di legame fosfato 5-3 viene detto legame fosfodiesterico.

  • 7/25/2019 9788884537546_preview.pdf

    13/33

    4 ILGENOMAUMANO

    Figura 1.2. a) Struttura del ribosio e del desossiribosio b) Struttura di

    un nucleotide.

    1.2.1 La doppia elica di Watson e Crick

    La scoperta della doppia elica da parte di Watson e Crick nel 1953 fusenza dubbio uno dei momenti pi importanti di tutta la biologia. Per laformulazione del loro modello, Watson e Crick si avvalsero delle scopertecondotte da Erwin Chergaff, riguardanti la composizione in basi del DNA,e da Rosalind Franklin e Maurice H.F. Wilkins nel campo della diffrazioneai raggi X. Chargaff aveva dimostrato che in qualsiasi tipo di DNA a doppiaelica la quantit di purine era uguale a quella di pirimidine. E ancora chela quantit di adenina (A) era pari a quella di timina (T), mentre la quan-tit di guanina (G) era pari a quella di citosina (C). Queste equivalenzesono divenute note come le regole di Chargaff. Nel confronto di DNA daorganismi diversi, i rapporti A/T e G/C erano sempre gli stessi.

    Rosalind Franklin, coadiuvata da Maurice Wilkins, aveva studiatobre isolate di DNA mediante la tecnica della diffrazione dei raggi X. Iraggi X diffratti sono registarti su una lastra fotograca: analizzando la

    fotograa, Franklin ottenne delle informazioni sulla struttura atomica

    della molecola. I suoi studi giunsero alla conclusione che il DNA era unastruttura ad elica che presentava due periodicit riconoscibili di 0,34 nme 34 nm lungo lasse della molecola.

    Watson e Crick elaborarono questi risultati e costruirono un modellotridimensionale della struttura del DNA. Il modello proposto da Watsone Crick presenta le seguenti caratteristiche:

    1. La molecola di DNA composta da due catene polinucleotidicheavvolte luna intorno allaltra a formare una doppia elica destrorsa,

    ovvero in senso orario

  • 7/25/2019 9788884537546_preview.pdf

    14/33

    ANTROPOLOGIAMOLECOLARE 5

    2. Le due catene sono antiparallele, cio hanno polarit opposta. Unlamento orientato n direzione 5-3 e laltro in quella 3-5.

    3. Lo scheletro, costituito dalle catene di zucchero legate fra lorodallortofosfato, allesterno della struttura, mentre le basi azotate

    sono allinterno. Le basi sono disposte perpendicolarmente allasseprincipale della doppia elica.

    4. Le basi dei lamenti opposti sono unite da deboli legami idrogeno.

    Il diametro della doppia elica di 20 , e le basi sono appaiate inmodo tale da non creare distorsioni nella struttura della molecola: auna purina su unelica corrisponde sempre una pirimidina sullaltraelica. Non c mai appaiamento tra due purine o tra due pirimidine.Inoltre data la struttura chimica delle basi e la possibilit di stabilirelegami idrogeno, gli unici appaiamenti possibili sono tra adenina etimina e tra guanina e citosina.

    5. La forma pi comune, assunta dalla doppia elica in condizionisiologiche, detta forma B. In questa forma, un giro completodella doppia elica di 34 , e la distanza fra due coppie di basi di

    3,4 , per cui ogni giro dellelica formato da 10 coppie di basi.6. Entrambi i lamenti sono destrorsi, e le ossature esterne di zucche-

    ro-ortofosfato formano due solchi di dimensioni diverse, detti solcomaggioree solco minore. Le proteine che interagiscono con il DNA,e che riconoscono una determinata sequenza di basi, normalmenteentrano in contatto con la doppia elica nel solco maggiore.

    1.3 Caratteristiche dei cromosomi umani

    I cromosomi umani variano in grandezza e morfologia. La morfologiaviene denita dalla posizione del centromero, che per convenzione divide

    il cromosoma in un braccio corto, denominatop, e in un braccio lungo,denominato q. I cromosomi si dicono metacentrici quando il rapporto

    tra la lunghezza del braccio corto e quella del braccio lungo allincirca1 (il centromenro posizionato al centro del cromosoma); si diconosubmetacentrici quando la lunghezza delle braccia lunghe superiore aquella delle braccia corte (il centromero posizionato a breve distanza dalcentro del cromosoma); si deniscono acrocentrici quando il centromero

    si trova terminalzzato verso unestremit del cromosoma. Il cromosoma costituito da due strutture fondamentali: il centromero e il telomero. Il

    centromero lega i microtubuli del fuso durante la divisione cellulare ed responsabile della corretta segregazione in fase di mitosi e di meiosi. Iltelomero protegge le estremit dei cromosomi dalla degradazione e dallafusione coda-coda, e assicura un ancoraggio alla DNA polimerasi per laduplicazione delle sequenze pi terminali.

    Quando i cromosomi sono a determinata tecniche di bandeggio,come il bandeggio G o il bandeggio R, avviene una denaturazione lungo

  • 7/25/2019 9788884537546_preview.pdf

    15/33

    6 ILGENOMAUMANO

    il loro asse, che determina, dopo colorazione con Giemsa, unalternanzadi bande chiare e scure. Il pattern di alternanza di tali bande ricorrentein ogni individuo ed specicodi ogni cromosoma, in quanto riette la

    concentrazione relativa, che regione-specica, di AT o CG.

    Quando possiamo concretamente osservare nel modo migliore i cro-mosomi, e cio alla metafase, i cromosomi appaiono a forma di X: due

    bastoncini attaccati nella loro zona centrale. In questo stadio ogni cromo-soma quindi composto da due parti dette cromatidi (Fig. 1.3). Poich lamolecola di DNA che compone un cromatide di un cromosoma ha la stessasequenza della molecola di DNA che costituisce laltro, i due cromatidi diuno stesso cromosoma sono anche detti cromatidi fratelli. La conden-sazione dei cromosomi ne facilita una ripartizione ordinata, senza pericolodi aggrovigliamento tra molecole di DNA diverse. La cellula quindi primaduplica tutto il DNA nucleare, poi lo divide tra le due cellule glie. Pertanto

    solo durante le prime fasi della divisione cellulare il corredo dei cromosomiapparir come un insieme di 46 elementi a forma di X (due cromatidiuniti a livello del centromero, per un totale di 92 cromatidi), mentre alla

    anafase i due cromatidi si separeranno e appariranno come due baston-cini singoli a forma di I. Nel periodo che intercorre tra una divisione elaltra il materiale genetico normale in effetti composto, per ogni cellulasomatica, da 46 cromatidi singoli, che tuttavia noi non visualizziamo perchqueste 46 molecole di DNA sono despiralizzate in lamenti sottilissimi a

    formare la cromatina. Questa si differenzia in eucromatina che comprendele regioni cromosomiche non condensate, attivamente trascritte e ad altadensit genica (bre 30 nm) e in eterocromatina (facoltativa o costitutiva)che rappresenta una cromatina mediamente o altamente condensata e

    Figura 1.3. I 46 cromosomi umani.

  • 7/25/2019 9788884537546_preview.pdf

    16/33

    ANTROPOLOGIAMOLECOLARE 7

    generalmente non trascritta, ad alta percentuale di sequenze ripetute econtenuto di geni relativamente basso.

    1.3.1 Il bandeggio cromosomico

    La denizione corretta del cariotipo deve basarsi su tecniche di ban-deggio. Ne esistono diverse, speciche per le diverse regioni cromosomi-che, di cui riettono la costituzione in basi e sequenze (uniche o ripetute)

    e lo stato trascrizionale.Il bandeggio G (Giemsa) o R (Reverse) specico delleucromatina, de-

    termina una scomposizione in bande chiare e scure dellasse cromosomico(lalternanza di bande chiare e scure nel bandeggio R quasi complemen-tare rispetto a quella ottenuta con il bandeggio G, da qui il termine riverse)ed quindi indispensabile per la corretta denizione del cariotipo. Anche il

    bandeggio Q specico per leucromatina, dando un pattern di bandeggio

    del tutto sovrapponibile al bandeggio G, e colora selettivamente anche ilbraccio lungo del cromosoma Y, nella sua larga porzione eterocromatica.

    Il bandeggio C specico per leterocromatina centromerica e pericen-tromerica, che con questa tecnica appare intensamente colorata, mentreleucromatina delle braccia corte e lunghe rimane pressoch incolore. Lacolorazione NOR colora specicamente i satelliti dei cromosomi acrocen-trici 13, 14,15,21 e 22, ed esclusiva di queste regioni.

    Il pattern di bandeggio delle braccia corte e lunghe di ogni cromosomaviene indicato secondo una nomenclatura internazionale. Ogni banda identicata da un numero, di grandezza crescente procedendo dal centro-mero verso il telomero, e ogni regione cromosomica usualmente denita

    da un doppio ordine di numeri:il primo riferito alla banda maggiore e ilsecondo a una delle sue sottobande minori. I numeri che identicano le

    regioni cromosomiche, cos come il numero complessivo delle bande, sidiversicano a seconda del grado di condensazione cromosomica.

    1.3.2 DNA a sequenze uniche

    Le sequenze uniche (a singola copia), sono denite come le sequenze

    presenti nel genoma come copie singole. Nelluso corrente, il termine siapplica alle sequenze di cui nel genoma presente una o poche copie. Lamaggior parte dei geni strutturali, rientra nella classe di DNA a sequenza

    uniche. Nelluomo si stima che le sequenze uniche rappresentino circa il65 per cento del genoma.

    1.4 I geni

    Tradizionalmente, il gene denito come un segmento di DNA che

    codica per un polipeptide o per una specica molecola di RNA. Signi-

  • 7/25/2019 9788884537546_preview.pdf

    17/33

    8 ILGENOMAUMANO

    cativi progressi in campo molecolare hanno tuttavia contribuito a ren-dere il concetto di gene pi ampio. In accordo con questi studi, il gene una specica regione di DNA, la cui trascrizione regolata da uno o pi

    promotori e altri elementi di controllo trascrizionale che contiene linfor-

    mazione per la sintesi di molecole di RNA tra loro correlate (con un trattodi sequenza in comune) che possono svolgere varie attivit funzionali, edeventualmente dirigere la sintesi di catene polipeptidiche.

    Oggi si riconoscono quattro classi di geni: (1) geni che codicano per le

    proteine, che sono trascritti in RNA e successivamente tradotti in proteine,(2) geni codicanti per proteine organizzati in famiglie geniche (3) geni

    RNA-specici (geni per rRNA, tRNA ed istoni), che sono esclusivamente

    trascritti e organizzati per unit ripetute in tandem e (4) geni per ncRNA(Cavalier-Smith 1985; Watson et al. 1987; Lewin 1994). Questultimacategoria di geni include solo sequenze non-trascritte, mentre i geni re-golatori trascritti appartengono essenzialmente ad una delle prime duecategorie. I geni che codicano per le proteine e i geni RNA-specici sono

    anche noti come geni strutturali.I geni organizzati in famiglie genichesono tra loro omologhi, e derivano da un evento di duplicazione genica odi retrotrasposizione mediata da RNA. I membri di una famiglia genicaallinterno di uno stesso genoma sono detti paraloghi, e normalmente sispecializzano acquisendo funzioni distinte. Nei batteri la trascrizione ditali geni condotta da un solo tipo di RNA polimerasi e la sintesi avvienenel citoplasma. Nel genoma nucleare degli eucarioti, sono coinvolti tretipi di RNA polimerasi (Watson et al. 1987; Lewin 1994). I geni RNA

    ribosomici (rRNA) sono trascritti dalla RNA polimerasi I (Pol I), i genistrutturali dalla RNA polimerasi II (Pol II), e i geni RNA citoplasmatici(scRNA), come i geni codicanti gli RNA di trasporto, dalla RNA polime-rasi III (Pol III).

    1.4.1 I geni strutturali

    Un gene strutturale tipo che codica per un polipeptide consiste di

    una parte trascritta e di una parte non-trascritta. Le parti non trascrittesono denite, in ragione della loro ubicazione allinterno del gene, come

    regioni ancheggianti alle estremit 5 e 3. La regione ancheggiante

    allestremit 5(o regione del promotore) provvede attraverso numerosisegnali a promuovere lavvio della trascrizione. Negli eucarioti, la sequenza

    del promotore pi variabile e spesso pi complessa di quella presentenei procarioti. Di solito costituita da un nucleo del promotore (corepromoter) e da elementi regolativi. Il nucleo del promotore indispen-sabile afnch avvenga la trascrizione; infatti il nucleo del promotore,

    la cui funzione simile a quella di un promotore batterico, a fornire ilsito di legame iniziale per i fattori generici di trascrizione e per la RNApolimerasi. Alcune brevi sequenze di DNA, dette elementi o box, sono

  • 7/25/2019 9788884537546_preview.pdf

    18/33

    ANTROPOLOGIAMOLECOLARE 9

    importanti afnch i fattori generici di trascrizione e la RNA polimerasi

    si assemblino in corrispondenza del promotore. Il nucleo del promotore composto di solito da una sequenza TATAAAA detta TATA box situataa 19-27 paia di basi a monte del punto di inizio della trascrizione. Inoltre

    sono presenti altri due elementi del promotore a monte della TATA boxuna sequenza GGCCAATCT, detta CAAT box, e una sequenza GGGCGG,detta GC box. Per il numero e la posizione delle GC box e delle CAAT box

    variano notevolmente nei diversi geni strutturali eucariotici. Il ruolo dellaTATA box differisce da quello a della CAAT box e della GC box. La TATA

    box importante nel determinare il sito di inizio preciso della trascrizio-ne. Se manca dal nucleo del promotore, il sito di inizio della trascrizionediventa indenito, e la trascrizione pu iniziare in varie posizioni. Invece

    la CAAT box e la GC box funzionano da siti di riconoscimento ai qualisi legano i fattori di trascrizione, e inoltre reclutano la RNA polimerasinelle vicinanze della regione del promotore. Negli eucarioti sono presentiparecchi fattori generici di trascrizione. Queste proteine interagiscono perattirare la RNA polimerasi verso la regione del nucleo del promotore e dare

    il via al processo della trascrizione. Allestremit 3 gli eucarioti superioricontengono una sequenza AAUAAA. Questa sequenza di poliadenilazione(o coda di poliA) contiene i segnali responsabili della terminazione delprocesso di trascrizione.

    Durante la trascrizione viene sintetizzato un RNA corrispondenteallintera sequenza genica; successivamente, le sequenze dellRNA checorrispondono agli introni genici (sequenze non codicanti) vengono

    tagliate via, mentre le sequenze di RNA derivanti dagli esoni (sequenzecodicanti) vengono giuntate tra loro. Questo processo prende il nome

    di splicing (taglio e saldatura) dellRNA. Oltre allo splicing, le ricerchehanno indicato che esistono svariati meccanismi molecolari che spieganole diverse modicazioni dellRNA. Per esempio, gli rRNA e i tRNA vengono

    sintetizzati come lunghi trascritti che sono scissi in segmenti funzionali pi

    piccoli. Inoltre, la maggior parte degli mRNA eucariotici ha un cappuccio(cap) attaccato allestremit 5 e una coda di poliA attaccata allestremit3. A livello molecolare sono stati identicati tre differenti meccanismi di

    splicing dellRNA. In tutti e tre i casi lo splicing determina la rimozionedellRNA intronino e lunione covalente dellRNA esonico mediante unlegame fosfodiesterico. A differenza dello splicing degli introni del I gruppoe del II gruppo, capaci di auto-splicing, il terzo meccanismo di splicing

    (del pre-mRNA) richiede lausilio di una struttura a pi componenti det-ta spliceosoma. Non si conosce limportanza biologica degli introni delgruppo I e del gruppo II, mentre lo splicing del pre-mRNA un fenomenofrequente negli eucarioti superiori.

    Per i geni strutturali la sequenza nucleotidica dellmRNA tradotta inuna sequenza di aminoacidi: la traducibilit dellmRNA in una specica

    sequenza aminoacidica si basa sul codice genetico. La sequenza delle basi

  • 7/25/2019 9788884537546_preview.pdf

    19/33

    10 ILGENOMAUMANO

    di una molecola di mRNA fornisce uninformazione codicata che viene

    letta a gruppi di tre nucleotidi. Ogni gruppo di tre nucleotidi si chiamacodone. A seconda della successione delle sue tre basi, un codone puavere due funzioni diverse: nella maggior parte delle combinazioni esso

    specica un particolare aminoacido. Per esempio, il codone CCC specicalaminoacido prolina, il codone AUG laminoacido metionina. A volte, per,un codone, denito di arresto, ha il compito di terminare il processo di

    traduzione. Poich nellmRNA ci sono quattro tipi di basi (A, U, G e C)e in ogni codone ci sono tre nucleotidi, possono formarsi 43=64 codonidiversi. Tuttavia ci sono soltanto 20 tipi di aminoacidi (Fig. 1.4). Poichi codoni sono pi degli amminoacidi, il codice genetico degenerato;ci signica che pi di un codone specica lo stesso amminoacido. Per

    esempio, i codoni GGU, GGC, GGA e GGG specicano tutti laminoacido

    glicina. In molti casi la base degenerata la terza che per questo motivoviene denita base oscillante (wobble base). Il termine deriva dallidea che

    la base complementare del tRNA possa oscillare leggermente durante ilriconoscimento della terza base del codone dellmRNA.

    Figura 1.4. Codice genetico degenerato.

    Dallanalisi di molte specie diverse di batteri, protozoi, funghi, piantee animali i ricercatori hanno ricavato che il codice genetico quasi uni-

    versale. Esistono, infatti, alcune eccezioni. I mitocondri hanno un propriocodice, con alcune differenze. Per esempio, AUA signica metionina e

    UGA signica triptofano

    SECONDA BASE DEL CODONE

    PRIMA

    BA

    SEDELCODONE

    TERZA

    BASE

    DE

    LCODONE

  • 7/25/2019 9788884537546_preview.pdf

    20/33

    ANTROPOLOGIAMOLECOLARE 11

    Afnch la traduzione dellmRNA avvenga a un ritmo efciente allin-terno di una cellula vivente, sono necessari svariati componenti cellulari.Tra di essi vi sono i ribosomi, gli RNA di trasporto (tRNA), certi fattoriproteici e alcune piccole molecole. Speciche sequenze dellmRNA sono

    necessarie per garantire che sia sintetizzata la sequenza corretta di aminoa-cidi. Negli eucarioti il ribosoma esplora lmRNA in cerca di un codone diinizio, che sar il punto iniziale della traduzione. Generalmente il codone diinizio AUG, codone che specica il primo aminoacido del polipeptide, la

    metionina. La sintesi di un polipeptide comporta interazioni tra lmRNA, ilribosoma e le molecole di tRNA. Il ribosoma scorre lungo lmRNA nella di-rezione 53. Mentre il ribosoma scorre su un codone dellmRNA, un tRNAcon un anticodone complementare si lega al codone; allestremit oppostail tRNA porta un amino acido. Il tRNA ha quindi due funzioni importanti:il suo anticodone si lega in modo specico con un codone dellmRNA e,

    inoltre, esso trasporta lamminoacido giusto alla sua estremit opposta. Inquesto modo il tRNA funge da intermediario traduttore durante la sintesidel polipeptide. Il codone di inizio dellmRNA generalmente seguito da

    centinaia o anche da migliaia di codoni che specicano la sequenza ammi-noacidica del polipeptide che deve essere sintetizzato. Il ribosoma scorre icodoni uno dopo laltro, in un processo a tappe, mentre le molecole di tRNAsi legano ai codoni tramite gli anticodoni, portando con s lamminoacidocorretto. Nel frattempo, gli amminoacidi vengono staccati dalle molecoledi tRNA e legati luno allaltro a formare una catena polipeptidica. Inne,

    si raggiunge un codone di arresto che segnala la ne della traduzione. A

    questo punto il ribosoma, lmRNa e il polipeptide si dissociano.

    1.4.2 I geni tRNA e rRNA specifici

    I singoli geni codicanti per i tRNA sono presenti in copie multiple

    nel genoma. Nella sequenza del genoma umano, sono stati individuati 497

    geni per tRNA, che rappresentano 49 specie di tRNA sulla base dellan-ticodone. I geni per tRNA sono dispersi nel genoma ma sono organizzatiin cluster: pi del 50% sono localizzati sul cromosoma 6 (140 geni inuna regione di 4Mpb) e sul cromosoma 1. Altri cromosomi hanno menodi 10 geni per tRNA. Il numero di geni per tRNA risulta correlato con ledimensioni degli oociti. I geni codicanti per per gli rRNA 28S, 5,8S e 18S

    sono organizzati in ununit trascrizionale ripetuta in tandem. Nel genoma

    umano, le ripetizioni sono organizzate in 5 cluster di circa 150-200 copiepresenti sul braccio corto dei cromosomi 13,14,15, 21 e 22. I geni lrRNA5S sono organizzati in unit ripetute che formano un cluster di ~200-300geni in prossimit dellestremit telomerica del cromosoma 1. I genomieucariotici codicano per un gran numero di RNA non codicanti pro-teine (ncRNA). Circa il 30% dei trascritti identicati nel topo risulta non

    codicante per proteine.

  • 7/25/2019 9788884537546_preview.pdf

    21/33

    12 ILGENOMAUMANO

    1.4.3 Le famiglie geniche

    Le famiglie geniche sono componenti comuni di tutti i genomi eucariotici,soprattutto di quelli degli organismi complessi, dove la formazione delle

    famiglie geniche considerata una strategia utilizzata dal genoma nucleareper specializzare il ruolo funzionale di alcuni geni, sia per quanto riguardail prolo di espressione che per quanto riguarda il ruolo funzionale delle

    proteine espresse. Le famiglie geniche possono andare incontro a contrazionio espansioni (relazioni uno a molti o molti a molti) Le famiglie genichepossono essere generate attraverso diversi meccanismi:poliploidizzazione del

    genoma, duplicazione di segmenti genomici (famiglia dei geni omeotici), du-plicazione di un singolo gene (geni per e globine) e retrotrascrizione.

    1.4.4 Gli pseudogeni

    Talvolta la copia di un gene non funzionale, ovvero non viene tra-scritta in RNA, o viene trascritta in un RNA non funzionale. Le copie

    inattive di un gene vengono dette pseudogeni. Gli pseudogeni possonoessere classicati in: 1) non processati; 2) processati. Nel primo caso il

    gene inattivo originato dal gene funzionale e contiene la tipica strutturain esoni ed introni. La copia genica pu essere completa o parziale. Glipseudogeni di questo tipo si formano con maggiore probabilit nelle re-gioni pericentromeriche. Gli pseudogeni processati sono privi di introniin quanto derivano dalla retrotrasposizione di mRNA (retropseudogeni).Il numero di copie di retropseudogeni correlato al livello di espressionedel gene da cui derivano. Nel genoma umano sono stati descritti ~8.000pseudogeni (~5.000 nel genoma del topo). Il maggior numero di pseu-dogeni processati deriva da geni per proteine ribosomiali; altri gruppiderivano da geni che codicano per proteine che legano il DNA e lRNA,

    per molecole strutturali ed enzimi metabolici. Molti pseudogeni derivano

    da geni a cui non stata attribuita una funzione. Oltre al livello di espres-sione dei geni, altri fattori gene-specici sono responsabili delloriginedegli pseudogeni, quali la lunghezza o il loro contenuto in G+C.

    1.5 Le sequenze ripetute e intersperse nel genoma

    In seguito ad analisi molecolari stato quindi osservato che alcune

    sequenze sono presenti una volta nel genoma, mentre altre sequenzesono ripetute. Complessivamente si identicano tre categorie di sequenze:

    DNA e sequenze uniche (presenti da una a poche copie per genoma), DNAmoderatamente ripetuto (presenti da poche no a 105nel genoma) e DNAaltamente ripetuto (presenti circa da 105a 107). I genomi eucarioti sono co-stituiti da DNA sia a sequenze uniche sia a sequenze ripetute, queste ultimemolto complesse nel numero di tipi, numero di copie e dislocazione.

  • 7/25/2019 9788884537546_preview.pdf

    22/33

    ANTROPOLOGIAMOLECOLARE 13

    1.5.1 DNA a sequenze ripetute

    Con il termine di sequenza ripetuta (o ripetitiva) ci si pu riferire adue grandi classi di DNA non codicante. Nella prima classe risiedono le

    sequenze distribuite a intervalli regolari (ripetizioni intersperse), nellaseconda invece si trovano sequenze raggruppate insieme (ripetizioni intandem) che verranno trattate nel capitolo 3.

    Le ripetizioni intersperse sono anche conosciute con il nome di retro-trasposoni. I retrotrasposoni fanno parte della famiglia dei trasposoni, sonocio frammenti di DNA che si spostano da una parte allaltra del genoma

    attraverso un meccanismo noto come trasposizione. Essi copiandosi primain un intermedio a RNA e, successivamente, revertendo in DNA (attraversola trascrittasi inversa) riescono ad integrarsi in una nuova posizione allin-terno del genoma. Questo meccanismo permette ai trasposoni di incremen-tare notevolmente e rapidamente la presenza delle loro copie allinterno delgenoma, aumentando conseguentemente anche la grandezza del genomastesso. I retrotrasposoni ,come altri tipi di elementi trasponibili, possono

    indurre mutazioni inserendosi casualmente allinterno di geni funzionali,alterandone o, in alcuni casi, impedendone lespressione.

    Si distinguono due sottoclassi di retrotrasposoni: i retrotrasposoniche presentano alle estremit delle lunghe sequenze ripetute terminali(LTR, Long Terminal Repeat, per questo chiamati retrotrasposoni LTR)e i retrotrasposoni che non le presentano (retrotrasposoni non-LTR).Iretrotrasposoni LTR possiedono alle estremit sequenze ripetute, lunghedalle 100 alle 5000 coppie di basi. Sono suddivisi a loro volta in due gruppi,i retrotrasposoni Ty1-copia simili e i retrotrasposoni Ty3-copia simili, in

    base alle loro sequenze genomiche e allordine dei geni codicati. Entrambi

    i gruppi si ritrovano in gran numero sia nelle piante (dalle pi semplicialgheunicellulari no alle angiosperme) che nei mammiferi, compresoluomo, di cui costituiscono approssimativamente l8% dellintero geno-

    ma. A differenza degli LTR, I retrotrasposoni non-LTR non presentanosequenze ripetute alle estremit e vengono suddivisi in due sottotipi, lebrevi sequenze intersperse (SINE, Short Interspersed Nuclear Elemen-ts) e le lunghe sequenze intersperse (LINE,Long Interspersed NuclearElements). Le SINE sono brevi sequenze di DNA (di meno di 500 coppiedi basi). Le SINE raramente sono trascritte, e non codicano per la tra-scrittasi inversa; hanno perci bisogno delle proteine codicate da altre

    sequenze (come le LINE) per trasporre. Le SINE pi comuni nei primati(e dunque anche nelluomo) appartengono alla famiglia delle sequenze

    Alu. Gli elementi di questa famiglia genica sono lunghi circa 300 coppiedi basi, e possono essere individuate dal fatto che sono capaci di legarelenzima Alu I (da cui il nome). Il genoma umano contiene oltre un milionedi copie di sequenze Alu, parziali o complete, disperse tra i geni allinternodegli introni. Esse infatti costituiscono allincirca l11% del patrimonio

  • 7/25/2019 9788884537546_preview.pdf

    23/33

    14 ILGENOMAUMANO

    genetico totale. Le LINE sono lunghe sequenze di DNA (di pi di 5000coppie di basi). Codicano per 2 geni, uno dei quali presenta attivit di

    trascrittasi inversa e di integrasi, permettendo la copia e la trasposizionesia di loro stessi, sia di altre sequenze non codicanti (come le SINE).

    Poich traspongono replicandosi, le LINE sono in grado di accrescere lagrandezza di un genoma. Il genoma umano, per esempio, contiene oltre900000 LINE, che costituiscono allincirca il 21% dellintero genoma.

    Vi sono tre famiglie principali di elementi LINEs: L1, L2 e L3. I genomidei mammiferi possiedono molte copie di una particolare famiglia LINE disequenze ripetute, la famiglia LINE-1. Le LINE inoltre sono spesso utilizza-te dai genetisti per il ngerprinting. Sebbene solitamente classicate comeDNA spazzatura, ricerche recenti hanno suggerito che le LINE e le SINEpossano aver avuto sia un ruolo importante nellevoluzione dei genomi,sia signicativi effetti a livello strutturale e trascrizionale. La trasposizione

    di questi elementi stata implicata come causa di alcuni disturbi genetici(come la neurobromatosi) e di alcuni tipi di cancro.Come i retrotrasposoni anche i trasposoni a DNA sono elementi mobili e

    fanno parte della famiglia dei trasposoni. Nei trasposoni a DNA per alcontrario dei retrotrasposoni, il meccanismo di trasposizione non utilizzaun intermedio a RNA. I trasposoni a DNA vengono distinti in due cate-gorie: trasposoni a Dna che si spostano replicandosi e trasposoni a DNAche si spostano in maniera conservativa, da un sito allaltro del genomasenza aumentare il numero di copie. Sono meno comuni negli eucariotirispetto ai retrotrasposoni. Mentre si dispone di molte informazioni sul-

    lorganizzazione delle sequenze e sulla distribuzione delle SINE e delleLINE (Tabella 1.2), le conoscenze sulla funzione di queste sequenze sonomolto scarse. Una delle ipotesi che la maggior parte di queste sequenze

    Tabella 1.2. Sequenze ripetute e intersperse nel genoma.

    CLASSE FAMIGLIA DIMENSIONI UNITRIPETUTA N COPIE GENOMA

    SINE Alu

    MIR

    0,3 kb lunghezzacompleta

    0,13 kb dimensionemedia

    1.200.000 ca

    450.000 ca

    10,7 % ca

    2,5 % ca

    LINE LINE-1

    (kpn)

    LINE-2

    0,8 kb dimensione

    media

    0,25 kb dimensionemedia

    2.600.000 ca

    370.000 ca

    17,3 %

    3,3 %

    LTR ERV 1,3 kb dimensionemedia

    240.000 4,7 %

    TRASPOSONIA DNA

    MER-1(Charlie)

    0,25 kb dimensionemedia

    213.000 1,4 %

  • 7/25/2019 9788884537546_preview.pdf

    24/33

    ANTROPOLOGIAMOLECOLARE 15

    non abbia alcuna funzione. Unaltra ipotesi che alcune delle sequenzeripetute, o dei loro trascritti, o entrambi, siano in qualche modo coinvoltinei meccanismi di regolazione dellespressione genica.

    1.6 Le parti non ricombinanti del genoma umano

    Il processo mediante il quale si producono nuove combinazioni dicaratteri rispetto a quelli parentali detto ricombinazione genica. Mentrei cromosomi autosomici omologhi sono sottoposti, durante la meiosi, aricombinazione genica e si mescolano ad ogni generazione in modo tale

    che linformazione genetica di ciascun nuovo individuo sia formata permet da quella materna e per met da quella paterna, il cromosoma Y ed ilDNA mitocondriale (mtDNA) invece passano di generazione in generazionesenza subire cambiamenti (se ovviamente si escludono gli eventi mutazio-nali). Per questo motivo costituiscono un valido strumento per lo studiodellevoluzione umana, per la ricostruzione della storia demograca, dei

    ussi migratori e del mescolamento delle popolazioni, per la ricostruzione

    di relazioni di parentela e vengono considerati dei marcatori lineari (lineagemarkers). Il corredo genetico che si trova nella regione differenziale (regionedi non omologia con il cromosoma X) del cromosoma Y viene ereditato,nella specie umana, soltanto dai maschi e la trasmissione avviene di padrein glio. I geni invece presenti sullmtDNA vengono trasmessi dalla madre

    ai suoi gli siano essi maschi o femmine. Nelle ricostruzioni di relazioni

    di parentela quindi le informazioni sulla linea parentale materna possonoessere desunte dallanalisi delle sequenze di mtDNA mentre le informazionisulla linea parentale paterna dallanalisi del cromosoma Y (Fig. 1.5).

    1.6.1 Il cromosoma Y

    Dove si trova e sua struttura.Negli animali ed in molte piante, le

    cellule maschili e femminili che contengono il proprio corredo cromo-somico allinterno del nucleo, si distinguono per i cromosomi sessuali,cromosomi che, in molti organismi eucarioti, sono rappresentati diversa-mente nei due sessi. Nelluomo, le femmine possiedono due cromosomiX, submetacentrici e di media lunghezza, mentre i maschi portano uncromosoma X ed un cromosoma Y, acrocentrico di piccole dimensioni(Fig. 1.6). Il cromosoma Y lungo circa un terzo del cromosoma X e perquesto motivo molti geni presenti sul cromosoma X non hanno una con-troparte sul cromosoma Y. Dal punto di vista strutturale il cromosoma Y una molecola lineare di circa 50 Mb.

    In un lavoro pubblicato su Nature nel 2003 i ricercatori del WhiteheadInstitute e della Washington University, riportano la sequenza di 23 Mbdelle circa 50 Mb del cromosoma Y umano. La restante porzione del cro-

  • 7/25/2019 9788884537546_preview.pdf

    25/33

    16 ILGENOMAUMANO

    mosoma di circa 30 Mb, non riportata nellarticolo una regione costituitada eterocromatina, posizionata sul braccio lungo del cromosoma (Fig. 1.7)che non viene trascritta e composta da DNA altamente ripetuto difcile

    da sequenziare con le attuali tecnologie. Il cromosoma Y con le sue 50 Mb il terzo cromosoma pi corto del corredo genetico umano, pi grande

    solo del cromosoma 21 (47 Mb) e del cromosoma 22 (49 Mb)

    Figura 1.5. Ereditariet dei marcatori autosomici ed uniparentali.

    Figura 1.6. Cromosomi sessuali umani.

    Figura 1.7. Struttura del cromosoma Y.

  • 7/25/2019 9788884537546_preview.pdf

    26/33

    ANTROPOLOGIAMOLECOLARE 17

    Nonostante la dimensione del cromosoma Y sia circa quattromilavolte maggiore di quella dellmtDNA, esso caratterizzato da una bassadensit di geni e dai una bassa frequenza di mutazione.

    Il cromosoma Y costituito da unampia regione non omologa (re-

    gione differenziale) a quella del cromosoma X, chiamata regione nonricombinante (NRY non-ricombinig region of the human Y chromosome)che comprende pi o meno il 95% di tutto il cromosoma (Fig. 1.8) e dadue piccole regioni posizionate allestremit del cromosoma che sonoconosciute come regioni pseudo-autosomali 1 e 2 (PAR pseudo-autosomalregions) che presentano omologia con una porzione del cromosoma X.Durante la meiosi nei maschi, le regioni pseudo-autosomiche del cromo-soma X e del cromosoma Y si appaiano e si scambiano di materiale genicoattraverso il crossing-over e ci assicura che i due cromosomi migrino poi

    verso le estremit opposte della cellula meiotica, si abbia cio una correttasegregazione dei cromosomi X ed Y e la meiosi proceda.

    La regione pseudo-autosomale 1 (PAR 1) localizzata allestremitdel braccio corto (Yp) del cromosoma ha una lunghezza di circa 2,5 Mb

    mentre PAR 2, posizionata allestremit opposta, quella cio del bracciolungo (Yq) ha dimensioni inferiori ad 1 Mb.Skaletsky et al.nel 2003 hanno dato alla regione non ricombinante

    il nome di male specic region (MSY) invece di NRY per sottolineare

    lappartenza specica di questa regione ad individui di sesso maschile. In

    questa regione sono presenti solo poche dozzine di geni, solo alcuni deiquali hanno il loro corrispondente sul cromosoma X. Tra questi ultimi,

    molti sono quelli coinvolti nella differenziazione sessuale maschile, inparticolare il gene SRY (sex-determinig region Y), mentre molti altrigeni specici sono coinvolti nella produzione di spermatozoi. LSRY

    posizionato sul braccio corto del cromosoma (Yp11.3) e la sua presenzao assenza determina durante lembriogenesi la possibilit che le gonadi,no a quel momento bipotenziali, si sviluppino in testicoli oppure in

    ovaie. Nei maschi quindi, i geni presenti nella regione differenziale sonodetti emizigoti (met zigote). Riassumendo quindi il cromosoma Ydetermina la mascolinit nei mammiferi placentali mediante lazione

    Figura 1.8. Frammenti ricombinanti tra il cromosoma X ed Y.

  • 7/25/2019 9788884537546_preview.pdf

    27/33

    18 ILGENOMAUMANO

    di uno o pi geni che controllano la transizione verso la differenzia-zione sessuale maschile. Questo prodotto genico chiamato fattore dideterminazione del testicolo determina la differenziazione delle gonadiprimordiali in testicoli piuttosto che in ovari. Questo levento chiave

    nella determinazione del sesso in molti mammiferi; tutte le altre diffe-renze fra i sessi sono effetti secondari derivanti dallazione di ormoni odi fattori prodotti dalle gonadi. In poche parole la determinazione delsesso dipende dalla determinazione delle gonadi. A livello della regioneMSY, il cromosoma Y caratterizzato dalla presenza di diverse regioniche non sono altro che copie del cromosoma X oppure regioni duplicatedel cromosoma Y stesso. Tre sono le classi di sequenze che sono statetipizzate sul cromosoma: X-trasposte, X-degenerate ed ampliconic.Due blocchi, posizionati sul braccio corto del cromosoma, con unalunghezza complessiva di 3,4 Mb, formano le sequenze X-trasposte.Queste ultime sono identiche al 99% rispetto a delle sequenze trovate sulcromosoma X in posizione Xq21 che contengono due sequenze genichee che non partecipano al crossing over X-Y durante la meiosi maschile.

    Le sequenze X-degenerate si trovano organizzate in otto blocchi subraccio corto e su quello lungo del cromosoma, per una lunghezza di8,6 Mb. Queste sequenze presentano unomologia del 96% con sequenzepresenti sul cromosoma X. I segmenti ampliconic sono costituiti dasette ampi blocchi sparsi sia sul braccio corto che su quello lungo delcromosoma, coprono una lunghezza di circa 10,2 Mb. Il 60% di questesequenze hanno unidentit intracromosomica pari al 99,9% o pi. Inaltre parole, molto difcile distinguere queste sequenze luna dallaltra.Unaltra caratteristica che queste sequenze sono palindromiche, pre-sentano cio una sequenza identica ma invertita. Otto ampie palindromioccupano 5,7 Mb del braccio lungo del cromosoma e per lo meno sei diqueste contengono geni coinvolti nella formazione del testicolo.

    Eredit del cromosoma Y

    La modalit di trasmissione dei cromosomi X ed Y attraverso legenerazioni molto semplice e chiara. La femmina produce solo gametiportatori dellX mentre il maschio produce sia gameti con lX che gameticon lY. Lunione casuale dei gameti maschili e femminili produce unagenerazione in cui il 50% sar maschio (XY) ed il 50% sar femmina (XX).

    Il cromosoma Y in quanto portatore del gene per la determinazione delsesso maschile, si trasmette solo di padre in glio. Per la sua struttura e

    per la sua peculiare valenza ereditaria costituisce insieme al DNA mito-condriale un valido strumento per lo studio dellevoluzione umana. Inoltrerisulta essere uno strumento molto utile nella ricostruzione di relazioniparentali per linea paterna. Per queste sue funzioni, il cromosoma Y vieneconsiderato lanalogo al maschile del DNA mitocondriale.

  • 7/25/2019 9788884537546_preview.pdf

    28/33

    ANTROPOLOGIAMOLECOLARE 19

    Marcatori del cromosoma Y e loro tasso di mutazione

    In generale due sono le categorie di marcatori molecolari usati perlanalisi della diversit del cromosoma Y: loci bi-allelici che producono

    solo due alleli possibili e loci multi-allelici.I marcatori bi-allelici comprendono i single nucleotide polymorphisms

    (Y-SNPs) e linserzione degli elementi Alu. Questi tipi di polimorsmisono i primi marcatori bi-allelici scoperti sul cromosoma Y. Qualche voltai marcatori bi-allelici riguardano un singolo evento di mutazione (UEPsunique event polymorphisms) dal momento che il loro tasso di mutazione

    basso (~108

    per generazione). Per lanalisi del cromosoma Y 250 marcatoribi-allelici sono stati caratterizzati. Y-SNPs giocano un ruolo importantenon in genetica forense, dato il basso potere di discriminazione rispettoagli Y-STRs ma negli studi della migrazione umana in quanto consento-no una valutazione effettiva delle maggiori differenze fra i vari gruppi dipopolazioni. Gli alleli degli Y-SNPs vengono indicati come ancestralee derivato e possono essere indicati nella forma binaria di 0 e 1 per la

    forma ancestrale e derivata rispettivamente. Lo stato ancestrale dei mar-catori Y-SNP solitamente determinato dal confronto con la sequenza diDNA dello chimpazee per lo stesso marcatore. I marcatori multi-allelicicomprendono invece due minisatelliti e pi di 200 short tandem repeat(Y-STR). Questi loci multi-allelici permettono di differenziare aplotipidiversi con abbastanza alta risoluzione dal momento che presentano unalto tasso di mutazione. I minisatelliti hanno un tasso di mutazione del6-11% per generazione mentre la media del tasso di mutazione per gliSTRs di circa 0,2% per generazione.

    Il numero di STRs disponibili per lidenticazione umana aumentato

    drasticamente da quando stata disponibile lintera sequenza del genomaumano. Intorno al 1990 infatti solo una manciata di Y-STRs erano staticaratterizzati ed erano disponibili per luso. Agli inizi del 2002, 30 erano

    gli STRs a disposizione dei ricercatori ma da allora il numero aumentatoenormemente no ad un numero di circa 200 STRs depositati in GenomeDatabase ad oggi (GDB; ) (Fig. 1.9).

    Le basi molecolari della determinazione del sesso

    I primi tentativi di determinazione molecolare del sesso si basarono

    sullamplicazione, per mezzo della reazione a catena della polimerasi(PCR), di regioni ripetute sul cromosoma Y. La presenza di regioni di DNAesclusive di ciascuno dei cromosomi sessuali port alla messa a puntodi metodi basati soprattutto sullamplicazione di sequenze ripetute,

    appartenenti alla famiglia del DNA satellite. Questi metodi risultaronoper inadeguati per il DNA antico perch, in alcuni casi, i frammentiamplicati presentavano una lunghezza decisamente superiore alle poche

  • 7/25/2019 9788884537546_preview.pdf

    29/33

    20 ILGENOMAUMANO

    centinaia di paia di basi tipiche del DNA recuperabile da reperti antichi.

    Inoltre, trattandosi di sequenze ripetute centinaia di volte, il rischio dicontaminazione da parte di DNA moderno era molto elevato. Unulterio-re limitazione derivava dal fatto che, mentre nel caso di DNA modernolassenza del prodotto di amplicazione indica un individuo femminile,

    altrettanto non si pu concludere per il DNA antico. La mancata amplica-zione potrebbe infatti essere legata alla scarsa quantit e qualit del DNAestratto cos come alla presenza di sostanze inibenti. Ulteriori sviluppiportarono allimpiego del locus a singola copia del gene dellamelogeni-na, successivamente utilizzato nel campo della genetica forense. Il genedellamelogenina si trova nei cromosomi sessuali in posizione telomerica(regione p22.2 sullX e p 11.2 sullY) e codica per una proteina, lame-logenina, coinvolta nello sviluppo dello smalto dentario. Questo gene hala particolarit di presentare un dimorsmo di lunghezza: il frammento

    sul cromosoma X lungo 106 bp mentre quello sul cromosoma Y lungo112 bp. Questa differenza dovuta ad una delezione di 6 bp presentesul primo introne del cromosoma X che invece non esiste nel rispettivointrone del cromosoma Y.

    Con lutilizzo di primer specici queste due varianti alleliche possono

    essere evidenziate e distinte come frammenti di 106 e di 112 bp: un indi-viduo di sesso maschile dovrebbe avere quindi un prolo allelico carat-

    terizzato da entrambi i frammenti di 106 e 112 bp, mentre un individuodi sesso femminile mostrer solo il frammento di 106 bp. Attualmentelamplicazione del gene omologo dellamelogenina rappresenta il metodo

    pi comunemente usato per la determinazione del sesso in reperti antichi.Tuttavia esso presenta alcuni problemi tra cui la perdita allelica dovutaallamplicazione parziale di uno solo dei due alleli, spesso riscontrata

    nei loci biallelici e la presenza seppur con una frequenza molto bassa

    Figura 1.9. Posizionamento degli STRs sul cromosoma Y.

  • 7/25/2019 9788884537546_preview.pdf

    30/33

    ANTROPOLOGIAMOLECOLARE 21

    di un raro polimorsmo di delezione sul cromosoma Y che impedisce

    lamplicazione del frammento di 112 bp.

    Per evitare il problema dellamplicazione parziale sono state messe

    a punto diverse strategie, una delle quali prevede limpiego nella stessa

    reazione di tre coppie di primers, uno comune e gli altri specici per ognicromosoma. I prodotti di amplicazione che si ottengono sono rispetti-

    vamente di 218 bp per il cromosoma Y e di 330 bp per il cromosoma X. Iframmenti amplicati in questa amplicazione risultano per di dimen-sioni troppo elevate per studiare reperti in cui il DNA presente moltodegradato. Unaltra strategia consiste invece nellutilizzo di primers cheamplicano un segmento di 112 bp dellesone 6 del gene dellamelogenina

    le cui copie sui due cromosomi sessuali hanno la medesima lunghezzama differiscono in 10 posizioni della sequenza nucleotidica. I prodotti diamplicazione vengono poi fatti ibridare con due oligonucleotidi sintetici

    marcati, ciascuno specico per un solo cromosoma sessuale. Questa per

    risulta essere una metodica un po lunga. La metodica migliore che per-mette di superare i problemi sopra elencati prevede la co-amplicazione

    dellamelogenina e di una piccola porzione del gene SRY (sex determinigregion Y), locus che, trovandosi sul braccio corto del cromosoma Y (Yp11.3), presente unicamente negli individui di sesso maschile. Tale gene,altamente conservato, rappresenta il male-determinig factor poich,durante il processo dembriogenesi la sua presenza o assenza determinase le gonadi, no a quel momento bipotenziali, si sviluppino come testicoli

    o ovaie. Questo sistema di co-amplicazione presenta inoltre il vantaggio

    di necessitare di un numero inferiore di prove per singolo campione, ab-bassando fortemente i rischi di contaminazione inevitabilmente presentinelle prove ripetute molte volte.

    Applicazioni dellanalisi del cromosoma Y

    Come precedentemente accennato, data la sua struttura e le suecaratteristiche di trasmissione, lanalisi del cromosoma Y gioca un ruoloimportante nello studio dellevoluzione umana, per la ricostruzione deiussi migratori e del mescolamento delle popolazioni. Lo studio del cro-mosoma costituisce anche un valido strumento nel cercare sia di risolverequestioni di interesse storico che difcili controversie genealogiche.

    Studi storici.In uno studio condotto da un team di ricercatori guidatida Chris Tyler Smith delluniversit di Oxford sono stati analizzati i proli

    di pi di 2100 maschi provenienti dallAsia centrale.Lanalisi dei proli ha portato allottenimento di un unico prolo

    allelico nell8% dei casi. Lulteriore analisi di 16 Y-SNPs (Single Nucleo-tide Polymorphism, trattati nel capitolo 3) pone i campioni studiatiallinterno dellaplogruppo C*, aplogruppo frequente in Asia. Attraverso

  • 7/25/2019 9788884537546_preview.pdf

    31/33

    22 ILGENOMAUMANO

    lottenimento di questi dati genetici i ricercatori hanno tentato di stimaregli anni che separano il gruppo di individui che presentavano lo stessoprolo genetico da il loro antenato comune. Considerando il tempo di

    generazione, cio lintervallo di tempo che intercorre fra una generazione

    e quella successiva, pari a 30 anni, e facendo delle ipotesi sul possibiletasso di mutazione , i ricercatori sono giunti a stimare un tempo di se-parazione di circa 1000 anni.

    Gli studiosi hanno poi osservato che il suddetto prolo era molto pre-sente in Mongolia, dato questo che faceva considerare la regione in que-stione come la culla del prolo genetico osservato nonostante risultasse

    ampliamente diffuso anche in altre 16 differenti popolazioni asiatiche.Il dato di maggior interesse era che la distribuzione geograca del

    gruppo di individui caratterizzati dal prolo genetico studiato, corri-spondeva, in Mongolia, allarea occupata dallex impero mongolico diGenghis Khan. Questa scoperta faceva ipotizzare che il prolo Y-STR

    s

    studiato potesse essere correlato a quello di Genghis Khan e dei suoi di-scendenti. Lipotesi che questa Y-lineage potesse derivare direttamente

    da Genghis Khan (circa 1162-1227) e dalla sua linea parentale maschile stata rafforzata dal fatto che il prolo genetico in questione risultava

    uguale al prolo di un gruppo di individui in Pakistan i quali, secondo

    la tradizione orale, sarebbero i diretti discendenti per linea maschile diGenghis Khan. In questo studio lanalisi del cromosoma Y ha rivelato uninteressante indizio sul nostro passato.

    Controversie genealogiche.Nel 1802, alcuni anni dopo che divennepresidente degli Stati Uniti, Thomas Jefferson fu pubblicamente accusatodal Richmond, giornale della Virginia, di essere il padre naturale di un

    bambino avuto dalla sua schiava, Sally Hemings. Nonostante non si sap-pia come sia nata questa accusa, il legame fra Thomas Jefferson e SallyHemings stato oggetto di controversia per almeno 200 anni. Poi nel

    1998, il prestigioso giornale scientico Nature, ha pubblicato uno studiosullintroduzione delle prove a DNA nelle controversie storiche. Il lavoro,intitolatoJefferson fathered slaves last child, metteva in evidenza comecon luso dei marcatori del cromosoma Y era stata seguita la linea maschiledei discendenti di Jefferson no a giungere ad un discendente del glio

    pi giovane di Sally Hemings, Eston Hemings. Sfortunatamente i gli

    legittimi di Thomas Jefferson morirono tutti quando ancora in fasce, le

    sue due glie che arrivarono alla maturit ovviamente non portavano ilsuo cromosoma Y cos i discendenti non si sono potuti utilizzare in que-sto studio. Rimanevano per altre due possibilit da sfruttare: il fratelloRandolph ed il fratello di suo padre, Field. Lultimo discendente maschiledel fratello di Thomas per mor nel 1920 o 1930 e cos le analisi si sonodovute indirizzare sui discendenti dello zio del Presidente. Cinque deisetti discendenti individuati furono daccordo nel collaborare allo studio

  • 7/25/2019 9788884537546_preview.pdf

    32/33

    ANTROPOLOGIAMOLECOLARE 23

    donando per lanalisi del cromosoma Y il loro sangue. Per quanto riguardala famiglia Hemings lanalisi stata condotta sui discendenti del glio

    di Sally Hemings, Eston Hemings. Eston infatti ebbe due gli maschi

    ed una glia, il suo glio pi giovane, Beverly, ebbe un glio Carl-Smith

    che a sua volta ebbe due gli, solo uno dei quali ebbe un glio maschio dinome John Weeks. Questultimo, nato nel 1946, stato utilizzato comecampione di confronto per la famiglia Hemings (Fig. 1.10).

    Figura 1.10. Esempio di genealogia del cromosoma Y.

    In questo studio diversi sono stati i campioni ulteriori che sono statiraccolti per essere utilizzati come controlli e per cercare di risolvere lacontroversa questione della paternit. Uno di questi campioni aggiuntivifu quello di un discendente di Thomas Woodson, primogenito di Sally

    Hemings. Oggi i discendenti infatti di questo sono in un numero superiorea 1400 e sono sparsi per tutti gli Stati Uniti. Secondo la tradizione oraledella famiglia Woodson, Thomas era il glio pi grande di Sally e del

    Presidente. Dal momento che non cerano documenti che supportasserola pretesa della famiglia Woodson, si prelevarono anche campioni di san-gue di cinque discendenti ancora in vita di Thomas Woodson in modo dapoter aiutare a confermare o confutare ci che la famiglia si tramandavadi generazione in generazione. Per lo studio furono utilizzati anche trecampioni di discendenti della linea maschile dei nipoti di Thomas Jef-ferson, gli cio della sorella in quanto alcune testimonianze indicavano

    i nipoti come possibili padri dei gli di Sally Hemings e di sua sorella.

    Inne vennero prelevati anche cinque campioni di discendenti per linea

    maschile da diverse vecchie famiglie della Virginia utili come campioni di

  • 7/25/2019 9788884537546_preview.pdf

    33/33

    24 ILGENOMAUMANO

    confronto. Questi campioni sono stati inseriti nello studio per fornire ilsegnale di background, con lidea che le potenziali similarit riscontratenellanalisi del cromosoma Y dovute alla vicinanza geograca dovessero

    essere eliminate. I risultati ottenuti da questo studio sono riportati nella

    tabella 1.3.Come si evince dalla tabella, tutti le 19 regioni del cromosoma Y

    analizzate dai discendenti della famiglia Jefferson sono perfettamentecompatibili con i proli ottenuti dai discendenti di Eston Hemings. Questo

    risultato stato interpretato dai ricercatori come la prova che il Presidente

    Tabella 1.3. Risultati dello studio sui discendenti di Jefferson.

    Marcatoristudiati

    Linea maschileField Jefferson

    Linea maschileEston Hemings

    Linea maschilenipoti

    Presidente

    Linea maschileThomas

    Woodson

    Numero diindividuitipizzati

    5 1 3 5

    Y-STR lociDYS19 15 15 14 14

    DYS388 12 12 12 12

    DYS389A 4 4 5 5

    DYS389B 11 11 12 11

    DYS389C 3 3 3 3

    DYS389D 9 9 10 10

    DYS390 11 11 11 11

    DYS391 10 10 10 13

    DYS392 15 15 13 13

    DYS393 13 13 13 13

    DXYS156Y 7 7 7 7

    Y-SNP loci (0 = allele ancestrale; 1 = allele derivato)

    DYS287(YAP) 0 0 0 0

    SRYm8299 0 0 0 0

    DYS271(SY81)

    0 0 0 0

    LLY22g 0 0 0 0

    Tat 0 0 0 0

    92R7 0 0 1 1SRYm1532 1 1 1 1

    Minisatellite