TECNICHE DI FINGERPRINTING E ANALISI MOLECOLARE · 2010. 12. 21. · 1. Frammenti prodotti da una...
Transcript of TECNICHE DI FINGERPRINTING E ANALISI MOLECOLARE · 2010. 12. 21. · 1. Frammenti prodotti da una...
TECNICHE DI FINGERPRINTING E ANALISI MOLECOLARE
Praticamente tutte le tecniche si basano sulla Polimerase Chain Reaction (amplificazione PCR) per ottenere una enorme quantità di copie di uno (o più) frammenti di genoma
E dopo aver fatto una PCR????
E’ necessario rispondere ad alcune domande; la risposta influenzerà enormemente il tipo di risultati che otterrò!
1) Cosa amplificare?2) Come separare i frammenti genomici amplificati?3) Cosa esplorare all’interno dei frammenti genomici amplificati?4) Chi amplificare?5) E’ necessario amplificare?
Le risposte influenzeranno� Sensibilità del metodo (capacità di osservare “oggetti” rari nel mio campione)� Sensibilità tassonomica (capacità di indagare a livello di specie, sottospecie, ceppo)� Ricchezza dell’analisi (numero di dati che ottengo e loro significatività)� Replicabilità del metodo (bassa incidenza di errori sperimentali tra le repliche)� Riproducibilità del metodo (bassa incidenza di errori sperimentali tra laboratori)
dNTP
LE COPIE DEL GENE AUMENTANO OGNI CICLO IN PROGRESSIONE GEOMETRICA ESPONENZIALE
Il thermal cycler applica alla miscela di reazione una serie CICLI composti da 3 fasi:
DENATURAZIONE (95°C)APPAIAMENTO (40-70°C)ALLUNGAMENTO (72°C)
• È possibile amplificare qualunque tratto del DNA di un batterio, basta conoscere le sequenze a monte ed a valle della zona di interesse per poter sintetizzare i primer di innesco per la DNA-polimerasi
PCR (Polymerase Chain Reaction) – LA TECNICA DI BASE
Pcr-film.exe
Si possono amplificare• GENI• REGIONI SPAZIATRICI TRA GENI• PARTI DI GENOMI
COSA AMPLIFICARE?
Sensibilità tassonomica
+-Geni molto conservati Regioni spaziatriciZone geniche ipervariabili Zone random nel genoma
Genere Specie Sottospecie Ceppo
Molti geni (es. 16S rRNA) sono un misto di zone ipervariabili e zone conservate, per cui studiando zone diverse dello stesso gene, si possono ottenere informazioni a diverso livello tassonomico
(vedi per esempio la tabella a lato)
Vedremo più avanti le caratteristiche di questi geni
16S 23StRNA tRNA
CHI AMPLIFICARE? - BATTERI COLTIVABILI E NON COLTIVABILI
Storicamente un’analisi ambientale prevedeva:1 – Piastramento del campione ambientale su un terreno di coltura
2 – Isolamento dei ceppi in colture pure
3 – Analisi del ceppo (microscopio, PCR sul suo genoma, fenotipo, etc)
Sfortunatamente non tutti i microrganismi possono essere isolati in laboratorio
Si calcola che meno dell’1% delle specie batteriche ambientali è isolabile
Cioè, su 100 specie diverse in un ambiente io ne posso isolare solo 1 !!!
CHI AMPLIFICARE? - BATTERI COLTIVABILI E NON COLTIVABILI
1. Non tutti i microrganismi possono essere isolati in laboratorio2. Questo significa che gli studi che si basano sulla sola analisi della microflora coltivabile (es.
analizzando solo le conte batteriche su pochi terreni di coltura) sono ben poco veritieri3. La non coltivabilità è dovuta principalmente ai seguenti fattori:• Assenza di un terreno di coltura appropriato;• Necessità per quella specie di crescere in co-cultura con altri che gli forniscono metaboliti
essenziali alla sua crescita• Fenomeni di quorum-sensing, cioè meccanismi fisiologici che impediscono ad una colonia di batteri
della stessa specie di proliferare ulteriormente quando si è raggiunto una determinata densità di batteri
QUALSIASI ANALISI DELLA COMUNITA’ BATTERICA O FUNGINA PRESENTE IN UN AMBIENTE NON PUO’ EVITARE LO STUDIO DELLA
MICROFLORA NON COLTIVABILE
CHI AMPLIFICARE? - BATTERI COLTIVABILI E NON COLTIVABILI
CAMPIONE AMBIENTALE
ISOLAMENTO SU PIASTRA
BATTERIO IN COLTURA PURA
ESTRAZIONE DEL DNA
AMPLIFICAZIONE DI UN GENE CON PCR
COME SEPARARE LA MISCELA DEI PRODOTTI PCR?
Ceppo puro ------� Prodotto PCR “puro”
CAMPIONE AMBIENTALE
ESTRAZIONE DEL DNA
AMPLIFICAZIONE DEL GENE CON PCR
Miscela di ceppi ------� Miscela di prodotti PCR
Dal punto di vista prettamente tecnico, la differenza tra analisi di ceppi puri e di comunità è:
1) COLTIVABILI: Separazione (con piastramenti) -> POI -> PCR ed analisi
2) INCOLTIVABILI: PCR -> POI -> Separazione (con clonaggio o su gel) -> POI -> analisi
CHI AMPLIFICARE? - BATTERI COLTIVABILI E NON COLTIVABILI
Popolazione di attinobatteri da pietra silicea in deserto Sahara separata su terreno di coltura
1Miscela di prodotti PCR separati su gel. Ogni banda rappresenta una specie batterica
2
COME SEPARARE I FRAMMENTI AMPLIFICATI?
Matrici di separazione in elettroforesi
� AGAROSIO: supporto orizzontale (plastica); 0.5 – 1.5 cm di spessore� ACRILAMMIDE: supporto verticale (vetro); 0.5 – 1.0 mm di spessore� MDE: è una particolare acrilammide che viene usata per separare i frammenti di DNA a singola elica, come per esempio le formazioni di eteroduplex (single strand); supporto verticale (vetro); 0.5 – 1.0 mm di spessore� POLIMERI IN CAPILLARI: come vedremo si tratta di sistemi estremamente efficienti nella separazione (± 0,5 bp); capillare (vetro); 0.05 mm di spessore
MDE
Agarosio
CapillareAcrilammide
SEPARAZIONE DI FRAMMENTI DI DNA MEDIANTE CLONAGGIO E TRASFORMAZIONE IN E. coli
• Un altro metodo prevede il clonaggio dei prodotti PCR presenti in una miscela complessa;
• E’ possibile legare ogni singolo frammento di DNA amplificato in un DNA circolare (plasmide) detto vettore;
• Il vettore può quindi essere inserito in una cellula batterica recipiente, in genere di Escherichia coli. Si parla di trasformazione e E. coli si trova in stato competente, cioè è capace di assumere DNA dall’ambiente
• Il plasmide vettore (parte blu nella figura) contiene anche altri geni, come per esempio un gene che conferisce resistenza ad un antibiotico (geni marker di selezione);
• Piastrando su terreno con antibiotico i vari E. coli, solo le cellule che avranno inserito il plasmide potranno crescere (trasformanti);
• Dopo una notte, ogni colonia generata da ogni singola cellula di E. coli conterrà un solo frammento di prodotto PCR; si può pertanto isolare la colonia, estrarre il plasmide, e analizzare il frammento inserito
E’ però necessario analizzare numerosi cloni e quindi è un metodo costoso
SEPARAZIONE DI FRAMMENTI DI DNA MEDIANTE CLONAGGIO E TRASFORMAZIONE IN E. coli
Esempio di risultato di un clonaggio: ogni cellula contiene un frammento di DNA amplificato
METODI AUTOMATIZZATI DI SEPARAZIONE
Il “sequenziatore” è in realtà una normale elettroforesi in grado di separare, individuare e riconoscere qualsiasi frammento genomico purchè fluorescente
1. Frammenti prodotti da una reazione di sequenza e differenti tra loro di un solo nucleotide
2. Qualsiasi prodotto di amplificazione o di digestione fluorescente (esempio: un prodotto di PCR ottenuto usando almeno un primer marcato con un fluorescente
Sequenza
Fingerprinting di ceppi o comunità
Detection di un gene
LASER
ABI Prism 310CCD camera
-+
HEX
ELETTROFORESI CAPILLARE
Gene
N. picco T di uscita Paia di basi Altezza picco Area picco Datapoint
ELETTROFORESI CAPILLARE: SOFTWARE GENESCAN
COSA ESPLORARE ALL’INTERNO DEI FRAMMENTI GENOMICI AMPLIFICATI?
A) Semplicemente si possono osservare l’assenza/presenza (e eventualmente abbondanza) di un frammento genomico -> FINGERPRINTING
B) Altrimenti si può studiare la sequenza di un gene -> SEQUENZIAMENTO
--------------
A)Da un’analisi fingerprinting si possono ottenere informazioni sui
-> Polimorfismi di lunghezza (es. con corsa su gel e confronto con frammenti a lunghezza nota)
-> Polimorfismi puntiformi di sequenza (es. tramite digestione enzimatica)
-> Polimorfismi di sequenza (es. tramite denaturazione del DNA per via chimica)
B)Da un sequenziamento si possono ottenere informazioni filogenetiche e molecolari
PS: un’analisi fingerprinting può essere associata ad una di sequenziamento:
Taglio della bandacon un bisturi Analisi della sequenza
• Gene lungo ca 1500 - 1600 nt, dopo la trascrizione non è tradotto in proteina, ma assume una particolare struttura secondaria che serve per la costruzione del ribosoma
• In particolare, codifica per la subunitàpiccola del ribosoma (16S nei procarioti; negli eucarioti come i funghi è il 18S rRNA)
• Deve assumere una determinata struttura tridimensionale per assolvere la sua funzione, quindi ha un basso tasso di mutazione (la maggior parte delle mutazioni producono ribosomi non funzionanti e non vengono trasmesse alla progenie)
• E’ presente nei genomi in multicopia (anche 15 copie!), proprio perché è essenziale per la vita. Per questo motivo è facilmente amplificabile
IL 16S rRNA
16S23S+5S
Nella sequenza del gene 16S rRNA si riconoscono diverse regioni:
• regioni CONSERVATE universali, che hanno la stessa sequenza in tutti i batteri
• regioni SEMICONSERVATE, che hanno sequenza uguale tra batteri dello stesso taxon
• regioni VARIABILI, che hanno la stessa sequenza tra batteri appartenenti alla stessa specie
Confrontando la sequenza di questo gene di diversi batteri è possibile:
• Quantificarne la DISTANZA FILOGENETICA: determinare a che punto dell’evoluzione 2 organismi si sono differenziati
• Determinare la diversità tra gli organismi• Identificare un batterio: se 2 organismi
hanno 16S rRNA con più del 97% delle basi omologhe, possono appartere alla stessa specie
IL 16S rRNA
OPERONE RIBOSOMALE
� Il gene codificante il 16S rRNA fa parte di una regione di più geni trascritti da un medesimo promotore trascrizionale (operone); tali geni sono denominati 16S, 23S e 5S� I geni sono separati tra loro da due regioni intergeniche (ITS) aventi anche funzione di regolazione del processo di maturazione degli rRNA� All’interno dell’ITS tra 16S e 23S, possono esserci uno o due geni codificanti tRNA
� Tra questi geni il 16S rRNA è quello più analizzato, seguito dal 23S rRNA; attualmente per la definizione di una nuova specie, oltre che ad approfondite analisi fenotipiche e genotipiche, è richiesto il sequenziamento completo del 16S; nel caso di un nuovo genere batterico, il 16S è più che sufficiente.� Gli ITS e lo stesso 16S sono utilissimi per l’analisi sia di ceppi puri che dell’intera comunità batterica, come vedremo in seguito
16S tAla tIle 23S 5S
ITS
Pr
TECNICHE DI ANALISI MOLECOLARE
a) A carico del 16S rRNA
b) A carico degli ITS dell’operone ribosomale
c) A carico di un qualsiasi altro gene o regione genomica nota
d) A carico dell’intero genoma
e) Tecniche che non prevedono l’uso della PCR
Specie) Permette di distinguere diverse specie
Sottospecie) Permette di distinguere diverse sottospecie
Ceppo) Permette di distinguere diversi ceppi
ARDRA – Amplified Ribosomal DNA Restriction Analysis
Prevede l’amplificazione del gene 16S rRNA e quindi restrizione con un “enzima di restrizione” a 4 nucleotidi;L’enzima di restrizione (endonucleasi di restrizione) è una proteina che taglia il DNA in una ben specifica sequenza nucleotidica (4,6 o 8 nucleotidi)
Le sequenze riconosciute hanno la proprietà di essere palindromiche
HpaII ..CCGG.. RsaI ..GTAC.. PvuI ..CGATCG....GGCC.. ..CATG.. ..GCTAGC..
Es. Ceppi di Geodermatophilaceae isolati da calcareniti pesantemente bioalterate prese dalle mura di Cagliari
* Ceppo di riferimento Blastococcus aggregatus
** Ceppo diverso dagli altri
***
a specie
RFLP (Restriction Fragment Length Polymorphism)
Si digerisce l’intero DNA genomico di un ceppo con un particolare enzima di restrizione (meglio che riconosca 6 o 8 nucleotidi)
I frammenti generati sono separati su un normale gel di agarosio
Con il termine RFLP si intende anche una tecnica che prevede la digestione non dell’intero DNA, ma semplicemente di un gene amplificato; la RFLP sul 16S rRNA è detta ARDRA
c specie
AFLP (Amplified Fragment Length Polymorphism)
• Si digerisce il DNA genomico con due enzimi di restrizione; ai bordi di ogni frammento si avranno delle sticky ends diverse per ogni enzima utilizzato;
• Si ligano alle sticky end dei brevi frammenti di DNA che favoriranno l’annealing dei primer per la PCR;
• Tramite PCR si amplificano i frammenti
• Metodo alquanto intricato, ma tuttavia abbastanza usato specialmente nello studio degli organismi superiori (es. piante)
d sottospecie
T-RFLP (Terminal Restriction Fragment Length Polymorphism)
E’ una tecnica di fingerprinting su comunità in cui il target è il 16S digerito mediante opportuni enzini di restrizione
Ceppo 1
Ceppo 2
Ceppo 3
Ceppo 4
16S diger it i
Taglio enzimaticoComunità:
a specie
ITS-HHP (Intergenic Transcribed Spacers – Homoduplex Heteroduplex Polymorphism)
• Come abbiamo visto l’operone ribosomale è presente in multicopia in tutti in microrganismi; inoltre tra 16S e 23S vi è una regione spaziatrice (ITS) che può contenere i geni per due tRNA;
• Tale regione varia tra 150 e 1300 bp, ma più normalmente è tra 200 e 600 bp;
• Con primer universali posti alla fine del 16S e all’inizio del 23S è possibile amplificare gli ITS
• La separazione può essere fatta su gel d’agarosio o meglio ancora di acrilammide
16S 23S
16S 23StRNA
16S 23StRNA tRNA
Su agarosio
In questo modo è possibile separare anche i frammenti heteroduplex, ibridi creati dall’appaiamento di eliche di
DNA provenienti da ceppi simili
Su MDE
b Sottospecie
Homoduplex
Heteroduplex
Le bande possono essere tagliate dal gel; si estrae dalla matrice il frammento di ITS e lo si può sequenziare, determinando così la specie batterica o fungina in maniera simile al 16S
RISA
Ribosomal Intergenic Spacers Analysis;
variante per comunità
b Sottospecie
ARISA (Automated Ribosomal Intergenic Spacer Analysis)
LASER
ABI Prism 310CCD camera
-+
16S rDNA 23S rDNAITS
HEX
B.cereus + P. stutzeri+ S. bovis
+ S. coelicolor+ E. coli
Cardinale et al. 2004 Appl. Environ. Microbiol., 70:6147-6156b Sottospecie
Rel
ativ
e pe
ak f
luor
esce
nce
(%)
Expected
100
80
60
40
20
0
0.14 ng/µl
COMPARAZIONE DELL’EFFICIENZA DEI PRIMER NELL’ANALISI DI MODELLI DI COMUNITA’ EUBATTERICHE
•Forte influenza della lunghezza e della percentuale GC
•ARISA: tecnica che descrive con fedeltà la popolazione batterica; in grado di
individuare la presenza di specie rare nella popolazione
50%
10%
5% 1% 0.5%
0.1%
Miscela di DNA di diversi ceppi di collezione, diluita da 28 a 0.14 ng/µl
Miscela di DNA di diversi ceppi di collezione, con quantità decrescenti di DNA di P. stutzeri (dal 50 allo 0.14 %)
ARISA (Automated Ribosomal Intergenic Spacer Analysis)
b Sottospecie
ARISA su comunità batteriche provenienti da due statue (castello Buonconsiglio; TN)
ARISA (Automated Ribosomal Intergenic Spacer Analysis)
b Sottospecie
150 300 450 600 750 900 1050Length (bp)
400
200
0
200
0
200
0
200
0
200
0
200
0
200
0
200
0
Uni
ts o
f flu
ores
cenc
e
W-48
T-48
P-48
C-48
W-96
T-96
P-96
C-96
Esempio di comunitàcomplessa
ARISA-PCR su suolo sottoposto a essudati
radicali di tabacco
Come si vede l’analisi èmolto più sensibile
rispetto ai gel e permette di osservare
un gran numero di specie non altrimenti visibile; non è però
possibile stabilire chi esse siano
b Sottospecie
ARISA
LH-PCR (Length Heterogeneity-PCR)
• Alta precisione e riproducibilitàdell’elettroforesi capillare
•Specie batteriche quasi sempre ben separabili sulla base della lunghezza
del frammento, purché di specie filogeneticamente affini
• Occasionali picchi secondari (polimorfismi interoperonici)
Specie più affine Lunghezza
frammento (± 0.5 bp)
Enterobacter sp. 344 Enterobacter sp. 344 (345) Bacillus coagulans 351 Lactococcus lactis lactis 353 Bacillus m egaterium 354 (352) Enterococcus flavescens 361 Enterococcus faecium 363 (362) Enterococcus faecium 363 Lactobacillus brevis 369 Lactobacillus paraplantarum 370 Ped iococcus acid ilactici 377 Ped iococcus pentosaceus 378 Lactobacillus perolens 379 Weissella kim chii 379 Weissella confusa 379 Weissella confusa 380 Lactobacillus plantarum 381
V1 V2Specie1
Specie2
Specie3
2 1 3
ANALISI DI COMUNITA’
b Sottospecie
Uni
tU
nit àà
di fl
uore
scen
zadi
fluo
resc
enza
Paia di basiPaia di basi
15001500
10001000
500500
00
15001500
10001000
500500
00
15001500
10001000
500500
00
15001500
10001000
500500
00
15001500
10001000
500500
00
15001500
10001000
500500
00
15001500
10001000
500500
00
279 285 291 297 303 309 315 321 327 333 339 345 351 279 285 291 297 303 309 315 321 327 333 339 345 351 357 363 369 375 381 387 393357 363 369 375 381 387 393399399
As
Ad
Bs
Bd
Cs
Ds
Dd
LH-PCR (Length Heterogeneity-PCR)
Analisi della comunitàbatterica biodeteriogena
isolata da calcarenite proveniente da Cagliari
b Sottospecie
tRNA-PCR
E’ possibile distinguere i microrganismi anche sulla base dei loro tRNA;
Si amplifica le regioni del genoma comprese tra due operoni ribosomali vicini, sfruttando la caratteristica del primer sul tRNA che può appaiare sia in Forward che in Reverse
b/d Sottospecie
Operone ribosomale 1 Operone ribosomale 2
Primer A
Primer A
Primer B
Primer B
tRNAmaturo
SSCP (Single Strand Conformation Polimorphism)
• La tecnica sfrutta il fatto che eliche singole di DNA creano strutture tridimensionali di forma diversa a seconda della loro sequenza nucleotidica;
• Date per esempio due sequenze uguali ad eccezione di una sola mutazione, le relative singole eliche assumeranno forme 3D diverse;
• E’ possibile pertanto distinguere geni provenienti da microrganismi diversi;
• La denaturazione può essere chimica, termica oppure è possibile digerire enzimaticamente una delle due eliche per ridurre la complessità dell’analisi e per migliorarne la pulizia;
PCR e denaturazione
Rapido raffreddamento
a/b/c Sottospecie
Dop
pia
elic
a no
n de
natu
rate
Sing
ole
elic
he
SSCP (Single Strand Conformation Polimorphism)
L’SSCP può essere anche fatta su campioni ambientaliAnche in questo caso è possibile tagliare le bande e sequenziarle
a/b/c Sottospecie
RAPD (Random Amplified Polymorphism DNA Analysis)
Prevede l’amplificazione di piccoli frammenti di DNA grazie all’uso di un primer molto breve che si allinea casualmente all’interno del genoma;
A basse temperature di annealing (<40°C) i primer si disporranno casualmente sulla base della forza ionica del mix di reazione e di altri fattori
d Ceppo
Rep-PCR (Repetitive extragenic palindromic PCR)
Prevede l’amplificazione di piccoli frammenti di DNA grazie all’uso di un primer molto breve che si allinea all’interno del genoma lungo sequenze ben precise e ripetute all’interno dell’intero genoma (interspersed sequences);
Tali sequenze sono più o meno conservate in molti batteri; si tratta spesso di sequenze di regolazione genica
REP-PCR: Primer REP da batteri entericiBOX-PCR: Primer BOX da Streptococcus pneumoniaeERIC-PCR: Primer ERIC da batteri entericiBc-Rep-PCR: Primer Bc-Rep da Bacillus
d Ceppo
100 300 500 700 900 1100 1300 1500 1700 1900
Lenght (bp)
800
600
400
200
0
600
400
200
0
600
400
200
0
600
400
200
0
Un
its o
f flu
ores
cen
ce
A
B
C
D
Estremamente riproducibile
ceppo CO2-33 Geodermatophilaceae
A: Estr. 1; PCR 1B: Estr. 1; PCR 2C: Estr. 2; PCR 1D: Estr. 2; PCR 2
FRep-PCR (Fluorescent-REP-PCR)
d Ceppo
100 300 500 700 900 1100 1300 1500 1700 1900
Length (bp)
800
600
400
200
0
600
400
200
0
600
400
200
0
600
400
200
0
Un
its o
f flu
ores
cen
ce
A
B
C
D
FRep-PCR (Fluorescent-REP-PCR)
Esempio di fingerprintingdi 3 ceppi biodeteriogeni e un riferimento
A: Blastococcus sp. CI2 13B: Blastococcus sp. CI1 23C: Modestobacter sp. DS3D: E. coli DSM50902
A
B
C
D
d Ceppo
Sau-PCR
E’ una tecnica recente;Si digerisce il DNA con l’enzima Sau3AI
..gatc..
..ctag..
Con un ciclo di PCR si completano le sticky ends (i puntini)Si sceglie un primer con termine
GATCXX
Dove XX rappresentano 2 nucleotidi scelti a caso (nell’es. a fianco sono AG)Il primer in 5’ è molto più lungo (nell’es. CCGCCGC)Si continua come una normale PCR
gatc..
..ctag
d Ceppo
DGGE (Denaturing Gradient Gel Electrophoresis)
1. Si amplificano i 16S dell’intera comunità con primer universali; uno di questi primer ha in posizione 5’ una estensione di GC; es: cgcgcgcccccggccgcgcgccctgctgtatataaatc
2. A questo punto tutti i frammenti amplificati avranno la coda GC all’inizio
3. Si separano i frammenti in un elettroforesi con un gel particolare; la parte iniziale del gel (presso i pozzetti) è normale; la parte finale invece è satura di urea e formammide, due composti fortemente denaturanti, cioè che fanno separare le due eliche del DNA
4. Scendendo lungo il gel, attirati dal campo elettrico, i frammenti incontrano una concentrazione sempre maggiore di denaturante ed iniziano a denaturarsi
5. A basse concentrazioni di denaturante si iniziano a separare le coppie AT, debolmente legate tra loro e solo a concentrazioni maggiori le coppie GC
6. Al termine della corsa i frammenti sono tutti denaturati eccetto la coda GC che èestremamente resistente; le eliche denaturate si avvolgono su se stesse bloccando l’avanzata del frammento
Coda GC primer
a/b/c Specie -> Sottospecie
DGGE (Denaturing Gradient Gel Electrophoresis)
La separazione totale del frammento (eccetto la coda GC) avviene in posizione diversa lungo il gel a seconda della sequenza nucleotidica del frammento; una sequenza ricca in AT si bloccherà prima che una ricca in GC
Specie ricche in AT
Specie ricche in GC
Le bande possono essere tagliate dal gel; si estrae dalla matrice il frammento di 16S e lo si può sequenziare, determinando così la specie batterica o fungina
Una versione alternativa (TGGE) prevede una denaturazione secondo un gradiente termico e non chimico
a/b/c Specie -> Sottospecie
Sequenziamento di tutto (o parte) del genoma
Ovviamente PCR o restrizioni esaminano soltanto l’immediato intorno del genoma in cui primer o enzimi agiscono; cioè, se si usa un enzima di restrizione (RFLP) per digerire un DNA genomico, ovviamente si avrà un’informazione positiva di tutte quelle brevissime zone riconosciute dall’enzima stesso. Delle altre zone non sapremo mai nulla.
Il sequenziamento fornisce la massima informazione possibile.
Finora il costo del sequenziamento dell’intero genoma di un microrganismo è ancora elevato; inoltre la tecnica fornisce un numero così elevato di informazioni che diventa di difficile gestione; spesso, poi il fine della ricerca non giustifica tutti questi sforzi.
La scelta più conveniente è il sequenziamento del 16S rRNA o dello spaziatore tra 16S e 23S per la definizione della specie batterica; il discorso cambia invece se si vuole studiare una comunità batterica in toto, comprendendo anche le specie non isolabili in laboratorio.
Tuttavia sequenziamenti mirati sono di grandissima utilità per distinguere ceppi estremamente simili, spesso appartenenti a specie diverse, ma genotipicamente molto vicine.
a/b/c/d Specie -> Ceppo
MLST (Multi-Locus Sequence Typing)
• E’ una tecnica che prevede l’amplificazione e il sequenziamento di un certo numero di geni essenziali per i microrganismi da studiare;
• Si deve almeno conoscere la specie batterica che si sta studiando per determinare quali geni siano i migliori da analizzare;
• L’informazione ricavata dallo studio di ogni singolo gene scelto viene correlata con quelle ricavate dagli altri geni analizzati, ricavando una visione d’insieme estremamente efficace;
Sequenziamento
Analisi totale
a/b/c Specie -> Sottospecie
VNTR (Variable Number Tandem Repeats)
Nel genoma possono essere presenti delle brevissime sequenze ripetute per un numero elevatissimo di volte; tali regioni sono difficilmente conservabili durante la replicazione del DNA e pertanto fenomeni di delezione o inserzione di nucleotidi sono abbastanza comuni
atgtagatgggtccgggtccgggtccgggtccgggtccgggtccgggtccgggtccatcgaatct
Nell’esempio la sequenza GGGTCC è ripetuta 8 volte; può essere che in altri ceppi della stessa specie batterica, la sequenza sia presente 10 o 6 volte, e questo fa variare la lunghezza complessiva della regione
atgtagatgggtccgggtccgggtccgggtccgggtccgggtccgggtccgggtccatcgaatct
Amplificando l’intera regione e separando i frammenti in acrilammide o su sistemi a capillare è possibile distinguere ceppi sulla base di queste diversità
a/b/c Specie -> Sottospecie
PFGE (Pulsed Field Gel Electrophoresis)
Si tratta di una elettroforesi abbastanza complessa
Si fanno crescere i batteri in terreno di coltura; si raccolgono le cellule e le si bloccano in cubetti di agarosio; quindi si trattano i cubetti con detergenti e spesso enzimi di restrizione
Si caricano nei pozzetti i cubetti trattati con all’interno il DNA genomico dei ceppi da analizzare;
Durante la corsa elettroforetica, il campo elettrico varia di polarità (campo pulsato) in modo programmato, consentendo la separazione dei frammenti genomici in base alla loro diversità di sequenza
e Ceppo
CFLP (Cleavase I Fragment Length Polymorphism
• Si denatura un DNA genomico a 95°C e poi lo si raffredda immediatamente;• Si formano così delle zone in cui il DNA è a singolo filamento, mentre altre sono a doppio filamento;
• La Cleavasi I è un enzima che digerisce le strutture a singolo filamento mantenendo soltanto le strutture a doppio filamento le quali possono essere così separate in un gel
�� �
� ��
e Ceppo
SOUTHERN BLOTTING
M 5
0 bp
448
460
496
498
499
500
501
502
507
519
526
545
554
555
556
G20
472
Aco
N24
d
CeD
E15
A
rP rQ M 5
0 bp
448
460
496
498
499
500
501
502
507
519
526
545
554
555
556
G20 472
Aco
N24
d
CeD
E15
A rP rQ
Outgroup
BC 519
65° C
70° C
• La tecnica del blottaggio è comunemente praticata per ricercare l’effettiva presenza di un gene nel genoma di un organismo
• Nell’analisi fingerprinting, si digerisce il DNA genomico con un enzima di restrizione
• Si ibridizza la digestione con una sonda specifica per una regione complementare al genoma e che comprenda la sequenza digerita dall’enzima
e Specie -> Ceppo
• Un fluorocromo è legato ad un oligonucleotide o sonda. Per trattamento delle membrane cellulari queste diventano permeabili e permettono entrata sonda marcata che ibridizza con rRNA nei ribosomi. Le cellule diventano uniformemente fluorescenti e possono essere osservate al microscopio a epifluorescenza;
• Microrganismi coltivabili e non;
• Proprio perché la sonda si lega ai ribosomi, le cellule devono essere vitali e metabolicamente attive
Sonda per cianobatteri
Sonda per Archea
FLUORESCENT IN-SITU HYBRIDIZATION (FISH)
FLUORESCENT IN-SITU HYBRIDIZATION (FISH)
The sample is first fixed to stabilize the cells and permeabilize the cell membranes. The labelled oligonucleotide probe is then added and allowed to hybridize to its intracellular targets before the excess probe is washed away. The sample is then ready for single-cell identification and quantification by either epifluorescence microscopy or flow cytometry.
Sonde per Geodermatophilus / Blastococcus e per Modestobacter (Urzì et al., 2004)
FLUORESCENT IN-SITU HYBRIDIZATION (FISH)
BLU: colorante DAPI, che legandosi al DNA colora indifferentemente tutte le cellule (sia vive che morte)
Propidium iodide
MOLLICUTES probe
ESEMPI DI USO DI MARCATORI FLUORESCENTI
Propidium iodideBACTEROIDETES probe SULCIA probe
ESEMPI DI USO DI MARCATORI FLUORESCENTI
• Intestino di insetti
ESEMPI DI USO DI MARCATORI FLUORESCENTI
BACTERIA probe
Propidium iodide
SULCIA probe
Another
bacterium is
co-localized
with Sulcia sp.
in the ovary
Sulcia sp. in
the oocyte
while the other
bacterium in
the follicolar
cells
• Ovario di insetti
WORKFLOW DELLE TECNICHE DI FINGERPRINTING
SENSIBILITA’ DELLE TECNICHE DI FINGERPRINTING
A volte le tecniche possono essere accostate tra loro migliorando l’efficienza dell’analisi;
Il caso a fianco è una ARDRA-SSCP
Cioè:- amplificato il 16S rRNA- digerito con un enzima di restrizione- denaturato a 95°C- separato su gel di acrilammide
ABBINAMENTO DI ANALISI FINGERPRINTING
Nel caso a fianco si analizzano contemporaneamente una BOX, una ERIC ed una REP (tutte Rep-PCR) “fondendo” i risultati in una sola analisi statistica, aumentando in tal modo la bontà dell’analisi
ABBINAMENTO DI ANALISI FINGERPRINTING
DISEGNI SPERIMENTALI COMPLESSI PER L’ANALISI DELLE COMUNITA’ BATTERICHE
ISOLAMENTO E IDENTIFICAZIONE DI BATTERI
CAMPIONE AMBIENTALE
ISOLAMENTO SU PIASTRA
BATTERIO IN COLTURA PURA
ESTRAZIONE DEL DNA
AMPLIFICAZIONE DEL GENE 16S rRNA
SEQUENZIAMENTO DEL GENE 16S rRNA
CONFRONTO DELLA SEQUENZA CON QUELLE IN
BANCA DATI
CV2
Sphingomonas echinoides AJ012461
Sphingomonas aquatilis AF131295
Sphingomonas pruni Y09637
Sphingomonas mali Y09638
Blastobacter aggregatus X73041
ALLINEAMENTO E COSTRUZIONE DELL’ALBERO
FILOGENETICO
CAMPIONE AMBIENTALE
ESTRAZIONE DEL DNA
AMPLIFICAZIONE DEL GENE 16S rRNA
SEQUENZIAMENTO DEI GENI 16S rRNA
CONFRONTO DELLE SEQUENZE CON QUELLE IN
BANCA DATI
ALLINEAMENTO E COSTRUZIONE DELL’ALBERO
FILOGENETICO
Miscela di molecole di 16SrRNA, ciascuna proveniente dai diversi batteri presenti nel campione ambientale
SEPARAZIONE DELLE MOLECOLE AMPLIFICATE
A
B
C
A
Bacillus subtilis
Bacillus amyloliquefaciens
B
Bacillus licheniformis
CPseudomonas putida
IDENTIFICAZIONE DI BATTERI SENZA ISOLAMENTO
PCR Campione ambientale Estrazione DNA-RNA
Clonaggio e trasformazione
in E. coli
Isolamento di ceppi
Sequenziamento dei cloni o delle bande DGGE
Fissaggio delle cellule
(Fluorescent) in situ hybridization
Blotting
Isolate 16S rRNA sequencing
Isolamento di ceppi con un particolare gene
Elettroforesi DGGE
ANALISI SUL 16S rRNA
SCHEMA CONCETTUALE DELL’ANALISI DELLE COMUNITA’ MICROBICHE
PCR sul 16S rRNA con primer “universali”
Sequenziamento delle bande o di cloni
Analisi dei profili di bande
DNA ambientale
Campione ambientale
DIVERSITA’STRUTTURA
Incorporazione di nucleotidi marcati
(BRdU)
Analisi diretta del DNA ambientale
Determinazione del metagenoma
ambientale
COMPLESSITA’
DNA marcato
Linee B o C
FUNZIONE
A
B C
D
ANALISI STATISTICA DEI DATI MOLECOLARI
L’analisi di bande o picchi è praticamente identica:
-> Assenza o Presenza di una banda/picco (matrice binaria – 1/0)
-> Assenza o Presenza + Quantità di una banda/picco (matrice quantitativa)
Da una matrice binaria/quantitativa si calcola una matrice di distanza, simile in tutto alle tabelle delle distanze stradale autostradali, in cui la distanza tra le città (campioni; ceppi) ècalcolata con speciali coefficienti di distanza (es. Jaccard; Ward;...)
Diversi algoritmi (es. Unweighted Pair Group Method with Arithmetic mean – UPGMA; ecc) ricavano dalla matrice di distanza un dendrogramma che spiega la natura dei rapporti di distanza che ci sono tra le città (campioni; ceppi)
123456...
ANALISI DEI PROFILI DI BANDE O DI PICCHI
Esempio:
A B C D E1 1 1 1 10 1 1 0 10 0 0 1 10 1 1 1 1...
A B C D E
A B C D EA 00B 54 00C 35 87 00D 21 76 56 00E 96 56 31 12 000 33 66 100
A
E
96
AE B C DAE 00B 67 00C 82 70 00D 33 78 66 00 0 33 66 100
A
E
71
C
ANALISI UPGMA
AEC B DAEC 00B 62 00D 17 77 00
0 33 66 100
A
E
77
C
B
D
AEC BDAEC 00BD 54 00
A
E
54
C
B
D
0 33 66 100
ANALISI UPGMA
50% 60% 70% 80% 90% 100%
78%
Ramo
Nodo (antenato)
Nodo (OTU)
Outgroup
ALBERI FILOGENETICI
PRINCIPAL COMPONENT ANALYSIS (PCA)
L
H
W
3 variabili
LH LHW
L LH
H W
56 21
100µ
E’ un’analisi più complessa che prevede la riduzione statistica delle variabili considerate
1 2
3 4
Un albero filogenetico spiega le relazioni tra le “Operational Taxonomic Units” (OTUs) che possono essere sequenze nucleotidiche o aminoacidiche provenienti da organismi diversi
oppure sequenze di diverse proteine dello stesso organismo oppure profili di bande (fingerprinting)
ANTENATO COMUNE
ALBERI FILOGENETICI
A
B
C
DE
A
B
C
D
E
Tempo ossia n° di mutazioni
ALBERI FILOGENETICI
Tuttavia è essenziale sapere dove si trova la mutazione nel 16S: se essa si trova in una zona altamente conservata della sequenza, allora acquista importanza; in tal modo i rami del dendrogramma vengono “allungati” o “accorciati” in funzione della posizione e quindi dell’importanza delle mutazioni.
A
B
C
D
E
A
B
C
D
E
ALBERI FILOGENETICI
Il controllo statistico del lavoro che abbiamo svolto è fondamentale per la corretta assegnazione delle specie batteriche; l’analisi più diffusa è denominata bootstrap
A
B
C
D
E
* *TGAAAGGTGAAAAGTGTAAAG
**GATGGAAGATAGAAGATAGTA
Dato un allineamento, si “scambiano” casualmente l’ordine delle basi in orizzontale, pur rispettando la
relativa posizione in verticale (vedi per es. *)
Una volta scambiate le posizione, si riallineano le sequenze e si genera un nuovo albero; essendo la costruzione dell’albero un’operazione algoritmica, non sempre col nuovo allineamento si ottiene lo stesso albero. Alcuni nodi possono scomparire, mentre altri rimangono. Si ripete questa operazione per almeno 1000 volte e si conta quante volte ogni nodo dell’albero originale è presente negli alberi successivi
10096
24
76
100 e 96 = nodo molto significativo
76 = nodo significativo
24 = nodo poco significativo; in questo caso D ed E non sono così ben separati come mostra l’albero
EUROPEAN BIOINFORMATICS INSTITUTEhttp:\\www.ebi.ac.uk
Database• Browsers• Nucleotide databases• Protein databases• Structure databases• Microarray databases• Literature databases
Toolbox• Homology & Similarity
• Protein functional analysis• Structural analysis
• Sequences analysis• Utilities
Submissions• EMBL• Swiss-Prot• PDB
Downloads• Software repository• Database repository
• FTP servers• Help files
EBI
NCBI DDBJ
http://www.ncbi.nlm.nih.gov/
Pubmed(bibliografia)
Nucleotide(database)
Entrez (motore di ricerca in NCBI)
Taxonomy(tassonomia)
Nucleotide-nucleotide BLASTN
atcatactaggta ...tcatgagtcgtagact...
Proteina-proteina BLASTP
GNTRGSRG …WAKGMYAW...
Nucleotide-proteina BLASTX
atcatactaggta ... WAKGMYAW...
Proteina-Database tradotto TBLASTN
GNTRGSRG ... (WAKGMYAW)...
Nucleotide-Database tradotto TBLASTX
(atcatactaggta) ... (WAKGMYAW)...
BLAST - Identificazione delle sequenze in base alla similarità con le sequenze del database
http://www.ncbi.nlm.nih.gov/blast/
Basic Local Alignment Search Tool
COME SI IDENTIFICA UN BATTERIO
Lunghezza 700 bpLa sequenza da analizzare (Query) viene suddivisa in numerosi frammenti molto brevi
CTAAGAGGTGATAGAACAGGGGCTACAAATTTAGATTAGAACTAAGAGCATAATATATAACACCTGCTCAACGTTT
CTAAGAGGTGATAGAACAGGGGCTACAAATTTAGATTAGAACTAAGAGCATAATATATAACACCTGCTCAACGTTT
CAGCT
TCGTC
...TGCTCCTAAGAGGCACCT...TCTACTCCCTACTCTGTTTTCCTCAGTCATGCTCCTAAGAGGCACCTGTCTCGCTCGCTCGCGTAGC
CCTACTCTGTTTTCCTCAGTCATGCTCCTAAGAGGCACCTGTCTCGCTCGCTCGCTCCATCTCACCTACTCTGTTTTCCTCAGTCATGCTCCTAAGAGGCACCTGTCTCGCTCGCTCGCTTTAATAAG
GGTGCAAGG GGGTTCTAC
� �
Il metodo si basa sull’algoritmo HSP (High-scoring segment pair) che cerca parti della sequenza sottomessa il più possibile estese; parti che abbiano il massimo punteggio (score). Più questo
punteggio è elevato e più il frammento sottomesso è simile a quello allineato.
BLAST (Basic Local Alignment Search Tool)Nella ricerca con BLAST si presuppone che sequenze simili derivino da un antenato comune. (ma non sempre ciò è vero!)
…
COME SI IDENTIFICA UN BATTERIO
COME SI IDENTIFICA UN BATTERIO
COME SI IDENTIFICA UN BATTERIO
Nostro ceppo
Ceppo simile
MULTICONFRONTO TRA SEQUENZE
1. Per l’assegnazione corretta della specie batterica è necessario confrontare la sequenza del proprio ceppo isolato con un alto numero di sequenze ad esso affini
2. Questo è possibile con opportuni algoritmi che “allineano” la nostra sequenza con altre sequenze della banca dati, in modo da avere un risultato di questo tipo:
ALBERI FILOGENETICI
Dall’allineamento si ricava un dendrogramma o albero filogenetico nelle modalità viste in precedenza