Gambari ba-lez10

35
Roberto Gambari Biochimica applicata Lezione 10 Sequenziamento del DNA

description

sequenziamento del dna

Transcript of Gambari ba-lez10

Page 1: Gambari ba-lez10

Roberto GambariBiochimica applicataLezione 10

Sequenziamento del DNA

Page 2: Gambari ba-lez10

2. PRODUZIONE DEL DNA RICOMBI NANTE E INGEGNERIA GENETICA A. Il fenomeno restrizio ne: cenni sul ciclo litico del batteriofago lambda. B. Gli enzimi di restrizione: nome nclatura, purificazione, saggio di funzionalità, siti di riconoscimento (sequenze palindromiche), enzimi che tagliano il DNA generando estremità "coesive" (EcoRI, BamHI); enzimi che tagliano il DNA generando estremità "piatte" (HaeIII); efficienza della reazione tra enzima di restrizione e DNA: concentrazione salina, qualità del DNA substrato, temperatura, mappe di restrizione; digestione completa e digestione parziale del DNA. C. Riassociazione intramolecolare e intermolecolare; la DNA ligasi; clonaggio utilizzando DNA con estremità coesive; clonaggio utilizzando code omopolimeriche: meccanismo d'azione della trasferasi terminale, uso della lambda-esonucleasi, ricostituzione del sito PstI; clonaggio utilizzando molecole linker. D. Vettori del DNA ricombinan te: plasmidi, siti singoli per enzimi di restrizione, trasformazione del batterio e inattivazione inserzionale, selezione dei plasmidi ricombinanti con antibiotici, pBR322; vettori del DNA ricombinante: il DNA del ba tteriofago lambda: i geni del batteriofago lambda, regioni indispensabili per il ciclo litico e il ciclo lisogenico, vettori a rimpiazzo (lambda gtWES) e v ettori ad inserzione (Charon). E. Produzione di genoteche e cDNA teche. F. Screening di genot eche o cDNA teche: ibridazione con sonde specifiche di DNA, HART (hybrid arrested tr anslation), selezione positiva di mRNA e traduzione in vitro, utilizzo di anticorpi monoclonali, utilizzo di oligonucleotidi a doppia elica per identificare sequenze codificanti per fattori di trascrizione, utilizzo della sequenza aminoacidica codificata dal gene da identificare. G. Sequenziamento del DNA ricombinante clonato: M13, sequenziamento secondo Sanger, sequenziamento progressivo.

Page 3: Gambari ba-lez10

• Doppia elica formata da due filamenti di ac. nucleico uniti da ponti ad idrogeno• Acido nucleico: catena di nucleotidi• Nucleotide: nucleoside + ac. fosforico• Nucleoside: desossiribosio + base azotata • Basi azotate: adenina, citosina, guanina e timina

Sequenziamento: individuazione della

successione delle basi azotate nel filamento di acido nucleico

Struttura del DNA

Page 4: Gambari ba-lez10

Le basi azotate

• Complementarità fra i due filamenti:

A-TA-TG-CG-C

Page 5: Gambari ba-lez10

Struttura del DNA

La sequenza del DNA contiene tutte le informazioni genetiche ereditarie che sono la base per lo sviluppo di tutti gli organismi

viventi.

All’interno di questa sequenza sono codificati i geni, nonché le istruzioni per esprimerli nel tempo e nello spazio

Determinarne l’esatta sequenza è dunque utile nella ricerca del perché e del come gli organismi vivono

Sequenziamento genicoSequenziamento genico

Page 6: Gambari ba-lez10

Date storiche della sequenza del DNA

1869

Miescher osservaper la prima volta il DNA

1953 Watson e Crick determinano lastruttura della doppia elica

1944Avery propone il DNA come materiale genetico

1965Holley sequenza il tRNAdi lievito

1970

Vengono sviluppate le tecnicheper la sintesi degli oligonucleotidi e perla degradazione chimica del DNA. Viene introdotta l’elettroforesi su gel per la Separazione di frammenti di DNA

1980 Il DNA genomico viene clonato nel fago M13 o in vettori plasmidici, nascono i primi programmi informatici di analisi dei dati, vengono sviluppate nuove tecnologie per il sequenziamento

1977

METODO SANGER(terminazione di catena)METODO MAXAM-GILBERT(degradazione chimica)

1986KARY MULLISIntroduce la PCR 1989

AUTOMAZIONE PARZIALEVengono sviluppate le prime apparecchiatureper il sequenziamento che impiegano sistemi per la rilevazione della fluorescenza.

2000Automazione completaSequenziamento completodel genoma umano

Page 7: Gambari ba-lez10

-Metodo di Maxam e Gilbert(della degradazione chimica del DNA)

-Metodo di Sanger(a terminazione di catena)

-Pyrosequencing(sequenziamento ad elevato parallelismo)

Tecniche di sequenziamento del DNA

Page 8: Gambari ba-lez10

Il metodo Sanger (o metodo a terminazione di catena)

Il sequenziamento secondo il metodo di Sanger, nella variante chiamata “a ciclo termico”, consisteva nella sintesi di nuovi filamenti di DNA, complementari al DNA stampo

• La sintesi del DNA si eseguiva in 4 provette diverse e ciascuna richiedeva :

- -Una piccola quantità di DNA stampo a doppio filamento;

-Un innesco specifico (un solo primer) complementare al filamento da sequenziare;

-L’enzima Taq DNA polimerasi

-Una miscela dei 4 dNTP di cui uno marcato (con 35S o 32P) per la visualizzazione finale dei filamenti di nuova sintesi dopo elettroforesi

- 1 terminatore di catena: ddNTP , diverso per ciascuna delle 4 reazioni

Page 9: Gambari ba-lez10

ddNTPs :dideossinucleotidetifosfatoNucleotide, detto terminatore, che blocca l’allungamento del

filamento di acido nucleico poiché la mancanza del gruppo ossidrilico in 3’ impedisce l’attacco all’acido fosforico del nucleotide successivo

ddNTPddNTP

dNTPdNTP

Page 10: Gambari ba-lez10

I nuovi frammenti di DNA prodotti, chiamati anche “frammenti di Sanger”, sono prodotti mediante amplificazione lineare di una piccola quantità di DNA stampo, utilizzando i cicli termici della PCR

•La reazione incomincia con la denaturazione del DNA stampo

• l’annealing del primer

•La Taq polimerasi incomincia la sintesi del filamento complementare

•Se viene inserito uno dei 4 dNTPs l’allungamento prosegue

•Se invece viene inserito il ddNTP terminatore l’allungamento si blocca

principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)

Page 11: Gambari ba-lez10

principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)

In ciascuna delle 4 provette contenente nucleotidi terminatori con una diversa base

azotata si formano soltanto filamenti che terminano con tale base. Tali filamenti avranno

tutte le lunghezze possibili a seconda che il nucleotide terminatore si sia legato alla 1°, 2°, . . ,

ennesima, posizione possibile.

Al termine della reazione, ogni miscelacontiene una popolazione di filamenti di

nuova sintesi, che hanno in comune l’estremità 5’ ma che differiscono in

lunghezza perché la loro sintesi è statabloccata in diverse posizioni al 3’.

I filamenti marcati sono separati medianteelettroforesi su gel di poliacrilammide-urea

ad elevato voltaggio.

Page 12: Gambari ba-lez10

principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)

Si esegue una elettroforesi disponendo i prodotti di amplificazione delle 4 provette in 4 corsie parallele così che in ognuna di esse siano presenti filamenti che terminano con una diversa base.Si usa un gel ad altissima risoluzione, capace di separare frammenti di DNA che differiscono fra loro per un solo nucleotide. Il gel (0,3-0,4 mm di spessore) è interposto fra due lastre di vetro di notevole lunghezza (40 cm circa ).

Page 13: Gambari ba-lez10

La migrazione è inversamente proporzionale alla lunghezza del filamentoLa posizione della banda indica la posizione occupata all’interno della sequenza, mentre il tipo di base è indicato dalla corsia in cui tale banda si trova

principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)

A T A C A G C T G T T . . . . . . SEQUENZA OTTENUTA :

ATA

C

AG

T

C

TGT

Page 14: Gambari ba-lez10

Evoluzione del sequenziamento Sanger:metodo automatizzato, con marcatori fluorescenti

I nucleotidi terminator i (ddNTPs) sono marcati con un fluorocromo. Si usa un fluorocromo diverso per ciascuno dei quattro tipi di terminatori

Coniugando a ciascun ddNTP un diverso marcatore fluorescente, è possibile effettuare le quattro reazioni di sequenziamento in un unico

tubo da saggio e caricare il tutto in un solo pozzetto di gel

Page 15: Gambari ba-lez10

I nucleotidi terminatori (ddNTPs) sono marcati con un fluorocromo. Si usa un fluorocromo diverso per ciascuno dei quattro tipi di

terminatori

Nucleotidi terminatori (ddNTPs) marcati con un fluorocromo

ddATP ddGTP

ddTTPddCTP

Page 16: Gambari ba-lez10

I quattro fluorocromi hanno differenti propietà di emissione

Nucleotidi terminatori (ddNTPs) marcati con un fluorocromo

Page 17: Gambari ba-lez10

Metodo automatizzato, con marcatori fluorescenti:Immagine virtuale del gel

ddA

ddC

ddT

ddG

Page 18: Gambari ba-lez10

Metodo automatizzato, con marcatori fluorescenti:Il sequenziatore automatico

IL GEL

“slab” gel di poliacrilammide (dal 4% al 6%) molto sottili in condizioni

denaturanti (Urea)

L’APPARATO PER IL GEL

Apparati verticali di lunghezza variabile a seconda del numero di

basi da leggere (22 cm-1 m)

LO STRUMENTO

Composto da un unità in grado di alloggiare il gel e far avvenire

l’elettroforesi in campo elettrico, e l’acquisizione dei dati di

fluorescenza, connesso ad un computer contenente il software

Page 19: Gambari ba-lez10

Metodo automatizzato, con marcatori fluorescenti:Il sequenziatore automatico

L’intensità e la lunghezza d’onda delle emissioni fluorescenti vengono captate durante l’elettroforesi quando i frammenti del DNA, eccitati dalla luce laser, passano davanti ad un rilevatore

Page 20: Gambari ba-lez10

L’elettroferogramma Le emissioni fluorescenti vengono captate da un rilevatore e le

informazioni vengono integrate e trasformate in picchi di colorediverso, con aree proporzionali all’intensità di emissione.

Page 21: Gambari ba-lez10

Normalmente il sistema interpreta automaticamente l’elettroferogramma. Quando l’interpretazione non è ovvia, il sistema inserisce una N al posto

della base azotata mancante, questa può essere corretta manualmente, dopo aver letto ad occhio l’elettroferogramma, o in base alla sequenza del filamento reverse

L’elettroferogramma

Page 22: Gambari ba-lez10

Sequenziamento automatico

Sequenziatore a elettroforesi capillareLa separazione elettroforetica dei frammenti fluorescenti avviene in un capillare del diametro di 50 µm, contenente un polimero di corsa.

Il sistema carica automaticamente il capillare prelevando direttamente da una provetta o da una micropiastra i campioni ottenuti dalla PCR di sequenziamento,

I frammenti marcati di DNA vengono rilevati man mano che correndo lungo il capillare, raggiungono la “detection window”.

1-4-16-96 capillari

Page 23: Gambari ba-lez10

• Durante l’attraversamento del capillare i vari frammenti di DNA vengono colpiti da un raggio laser

• Il raggio laser eccita i vari fluorocromi che marcano i singoli frammenti

• Ciascuno dei quattro fluorocromi emette una diversa lunghezza d’onda

• Una cellula fotoelettrica rileva sequenza, tipo ed intensità delle varie emissioni luminose ed il tutto viene registrato in forma grafica

• La sequenza dei picchi corrisponde alla sequenza dei nucleotidi; il tipo (colore del picco) corrisponde al tipo di base azotata.

Sequenziamento automatico

Sequenziatore a capillare

Page 24: Gambari ba-lez10

A cosa serve quindi il sequenziamento:

La comprensione dell’esatta sequenza del genoma degli organismi viventi è importante per:

In biologia: per capire il perché e come gli organismi viventi si sono evoluti (es: filogenesi)

Per comprendere meglio i meccanismi che sono alla base della vita e della sopravvivenza

In medicina: per diagnosticare malattie ereditarie e sviluppare nuovi trattamenti (es: mutazioni nucleotidiche)

La conoscenza del genoma degli agenti patogeni può portare allo sviluppo di medicine contro malattie contagiose (es: antibiogramma)

La determinazione di sequenze del DNA è utile anche nelle scienze forensi ed in quelle alimentari

Page 25: Gambari ba-lez10

ES: Individuazione di una mutazione di un singolo nucleotide

Page 26: Gambari ba-lez10

Il progetto “Genoma Umano”HGP: Human Genome Project

Il Progetto Genoma Umano è stato un progetto di ricerca scientifica internazionale il cui obiettivo principale era quello di determinare la sequenza delle coppie di basi azotate che formano il DNA e di identificare e mappare i circa 30 mila geni del genoma umano dal punto di vista sia fisico che funzionale.

Il progetto, originariamente della durata di 15 anni, ha avuto inizio nel 1990 presso i National Institutes of Health degli Stati Uniti. La prima bozza del genoma è stata rilasciata nel 2000 mentre quella completa si è avuta nel 2003, quindi con 2 anni di anticipo dalla fine del progetto, e ulteriori analisi sono ancora in corso di pubblicazione (in realtà una piccola % del genoma non è ancora stata sequenziata).

Page 27: Gambari ba-lez10

Il progetto “Genoma Umano”HGP: Human Genome Project

Per portare a termine la ricerca si è lavorato sul DNA offerto da un certo numero di donatori selezionati con criteri di rappresentatività statistica.

Il "genoma" di qualsiasi individuo (tranne quello dei gemelli monozigoti e degli organismi clonati) è unico; mappare quindi il "genoma umano" significa fare il sequenziamento delle variazioni multiple di ciascun gene.

Page 28: Gambari ba-lez10

Il progetto “Genoma Umano”HGP: Human Genome Project

COME E’ STATO EFFETTUATO

Le sequenze dei cromosomi interi vengono ricostruite a partire dalle sequenze di centinaia di migliaia di frammenti di DNA, normalmente di lunghezza compresa fra 500 e 800 pb

Si usano 2 strategie generali per la frammentazione e laricostruzione:

Il sequenziamento gerarchicoIl sequenziamento a rosa di pallini (shotgun)

Le due strategie sono reciprocamente complementari

Page 29: Gambari ba-lez10

Differenze:

Nel sequenziamento gerarchico il prmo passaggio è quello di costruire un sentiero principale (tiling path) che serva ad assicurarsi che la sequenza sia ottenuta in grandi pezzi ordinati tra di loro Mentre nel metodo shotgun frammenta semplicemente il genoma in piccole unità sequenziabili e si affida ad algoritmi del computer per ricostruire l’ordine dei frammenti

Page 30: Gambari ba-lez10
Page 31: Gambari ba-lez10

Il progetto “Genoma Umano”HGP: Human Genome Project

ALCUNE SCOPERTE DEL PROGETTO GENOMA1.Nell’uomo, sequenziare l’intero genoma ha voluto dire esattamente identificare ed ordinare ciascuna delle 3 * 109 (3 miliardi) paia di basi di cui è costituito

1.Gli esseri umani hanno circa 30.000 geni, più o meno lo stesso numero di quelli dei topi e il doppio di quelli di alcune specie di vermi. La comprensione dell'espressione di questi geni potrà fornire degli indizi sulle cause di alcune malattie.

2.Tutte le razze umane sono uguali al 99,99%, quindi le differenze razziali sono geneticamente insignificanti. Questo potrebbe significare una discendenza da un'unica madre.

3.La maggior parte delle mutazioni genetiche avviene nel maschio della specie, il quale è quindi da considerare un agente del cambiamento. I maschi hanno quindi una responsabilità maggiore nella trasmissione delle anomalie genetiche.

4.La genomica ha portato a progressi nel campo dell'archeologia genetica e ha migliorato la nostra comprensione di come ci siamo evoluti in quanto esseri umani e di come ci siamo separati dai primati 25 milioni di anni fa.

Page 32: Gambari ba-lez10
Page 33: Gambari ba-lez10

Il progetto “Genoma Umano”HGP: Human Genome Project

Adesso che il genoma umano è stato sequenziato il prossimo obiettivo, è quello di associare ad ogni sequenza genica una funzione, considerando che buona parte del DNA non ha probabilmente una funzione ma rappresenta solo un fossile genetico. Questo lavoro richiederà molto tempo anche perché alcuni geni possono dar luogo a più proteine diverse o ad una proteina unica che però può avere una funzione diversa a seconda del tessuto o dello stadio embrionale in cui viene espressa.

Page 34: Gambari ba-lez10

Elenco dei siti che contengono

informazioni sul Progetto Genoma

Umano e sui frammenti di DNA

sequenziati.

The Human Genome Project http://w ww.nhgri.nih.gov

un sito dedicato al Progetto GenomaUmano gestito dal NHGRI ( TheNational Human Genome ResearchI nstitute)

GenBank http://w ww.ncbi.nlm.nih.govun sito in cui si possono trovaresequenze di DNA e di proteine.

EMBL http://w ww.ebi.ac.uk un sito dove sono raccolte lesequenze del genoma umano.

GDB (genome database): http://w ww.gdb.org/il più importante databaseconcernente la mappatura delgenoma.

dbESThttp://w ww.ncbi.nlm.nih.gov/dbEST/ index.html

raccoglie le sequenze parzialiottenute dai cDNA

OMI M (on-line MendelianI nheritance in Man)

accesso attraverso GDBcatalogo elett ronico di MendelianI nheritance in Man di VictoMcKusick, un elenco delle malattieumane ereditarie.

MGD (Mouse Genome Database) http://w ww.informatics.jax.orgdatabase del genoma murino,

Généthon http://w ww.genethon.fr/ mappa genetica basata sui marcatoricon ripetizioni (CA)n

CHLC (Co-operative Human LinkageCenter)

http://lp g.nci.nih.gov/CHCL/

database contenente una mappagenetica e dati riguardanti ilgenotipo e i marcatori genetici,contenente un programma perl’analisi di linkage

CEPHhttp://w ww.cephb.fr/ bio/ ceph-genethon-map.html

mappa f isica del genoma umanobasato sugli YAC.

CELERAhttp://w ww.celera.com/ il sito internet della società privata

americana diretta da Greg Venter

bibliografia sul progetto genomaumano

www.nature.com/genomics/0

Whitehead I nstitutehttp://w ww-genome.wi.mit.edu/

mappa f isica del genoma umanobasata sugli YAC

Page 35: Gambari ba-lez10

GenBank

• Banca dati pubblica (in Internet) contenente circa 50 milioni di sequenze geniche delle più varie regioni di, praticamente, tutti gli organismi viventi

• Chiunque può depositare (ovviamente non in maniera anonima) sequenze in GenBank

• E’ possibile confrontare la propria sequenza con tutte quelle presenti in GenBank

• Un motore di ricerca individua e restituisce le sequenze presenti in GenBank che hanno il più elevato grado di somiglianza con la sequenza in esame