TECNICHE DI FINGERPRINTING E ANALISI MOLECOLARE · 2010. 12. 21. · 1. Frammenti prodotti da una...

TECNICHE DI FINGERPRINTING E ANALISI MOLECOLARE

Praticamente tutte le tecniche si basano sulla Polimerase Chain Reaction (amplificazione PCR) per ottenere una enorme quantità di copie di uno (o più) frammenti di genoma

E dopo aver fatto una PCR????

E’ necessario rispondere ad alcune domande; la risposta influenzerà enormemente il tipo di risultati che otterrò!

1) Cosa amplificare?2) Come separare i frammenti genomici amplificati?3) Cosa esplorare all’interno dei frammenti genomici amplificati?4) Chi amplificare?5) E’ necessario amplificare?

Le risposte influenzeranno� Sensibilità del metodo (capacità di osservare “oggetti” rari nel mio campione)� Sensibilità tassonomica (capacità di indagare a livello di specie, sottospecie, ceppo)� Ricchezza dell’analisi (numero di dati che ottengo e loro significatività)� Replicabilità del metodo (bassa incidenza di errori sperimentali tra le repliche)� Riproducibilità del metodo (bassa incidenza di errori sperimentali tra laboratori)

dNTP

LE COPIE DEL GENE AUMENTANO OGNI CICLO IN PROGRESSIONE GEOMETRICA ESPONENZIALE

Il thermal cycler applica alla miscela di reazione una serie CICLI composti da 3 fasi:

DENATURAZIONE (95°C)APPAIAMENTO (40-70°C)ALLUNGAMENTO (72°C)

• È possibile amplificare qualunque tratto del DNA di un batterio, basta conoscere le sequenze a monte ed a valle della zona di interesse per poter sintetizzare i primer di innesco per la DNA-polimerasi

PCR (Polymerase Chain Reaction) – LA TECNICA DI BASE

Pcr-film.exe

Si possono amplificare• GENI• REGIONI SPAZIATRICI TRA GENI• PARTI DI GENOMI

COSA AMPLIFICARE?

Sensibilità tassonomica

+-Geni molto conservati Regioni spaziatriciZone geniche ipervariabili Zone random nel genoma

Genere Specie Sottospecie Ceppo

Molti geni (es. 16S rRNA) sono un misto di zone ipervariabili e zone conservate, per cui studiando zone diverse dello stesso gene, si possono ottenere informazioni a diverso livello tassonomico

(vedi per esempio la tabella a lato)

Vedremo più avanti le caratteristiche di questi geni

16S 23StRNA tRNA

CHI AMPLIFICARE? - BATTERI COLTIVABILI E NON COLTIVABILI

Storicamente un’analisi ambientale prevedeva:1 – Piastramento del campione ambientale su un terreno di coltura

2 – Isolamento dei ceppi in colture pure

3 – Analisi del ceppo (microscopio, PCR sul suo genoma, fenotipo, etc)

Sfortunatamente non tutti i microrganismi possono essere isolati in laboratorio

Si calcola che meno dell’1% delle specie batteriche ambientali è isolabile

Cioè, su 100 specie diverse in un ambiente io ne posso isolare solo 1 !!!


1. Non tutti i microrganismi possono essere isolati in laboratorio2. Questo significa che gli studi che si basano sulla sola analisi della microflora coltivabile (es.

analizzando solo le conte batteriche su pochi terreni di coltura) sono ben poco veritieri3. La non coltivabilità è dovuta principalmente ai seguenti fattori:• Assenza di un terreno di coltura appropriato;• Necessità per quella specie di crescere in co-cultura con altri che gli forniscono metaboliti

essenziali alla sua crescita• Fenomeni di quorum-sensing, cioè meccanismi fisiologici che impediscono ad una colonia di batteri

della stessa specie di proliferare ulteriormente quando si è raggiunto una determinata densità di batteri

QUALSIASI ANALISI DELLA COMUNITA’ BATTERICA O FUNGINA PRESENTE IN UN AMBIENTE NON PUO’ EVITARE LO STUDIO DELLA

MICROFLORA NON COLTIVABILE


CAMPIONE AMBIENTALE

ISOLAMENTO SU PIASTRA

BATTERIO IN COLTURA PURA

ESTRAZIONE DEL DNA

AMPLIFICAZIONE DI UN GENE CON PCR

COME SEPARARE LA MISCELA DEI PRODOTTI PCR?

Ceppo puro ------� Prodotto PCR “puro”

CAMPIONE AMBIENTALE

ESTRAZIONE DEL DNA

AMPLIFICAZIONE DEL GENE CON PCR

Miscela di ceppi ------� Miscela di prodotti PCR

Dal punto di vista prettamente tecnico, la differenza tra analisi di ceppi puri e di comunità è:

1) COLTIVABILI: Separazione (con piastramenti) -> POI -> PCR ed analisi

2) INCOLTIVABILI: PCR -> POI -> Separazione (con clonaggio o su gel) -> POI -> analisi


Popolazione di attinobatteri da pietra silicea in deserto Sahara separata su terreno di coltura

1Miscela di prodotti PCR separati su gel. Ogni banda rappresenta una specie batterica

2

COME SEPARARE I FRAMMENTI AMPLIFICATI?

Matrici di separazione in elettroforesi

� AGAROSIO: supporto orizzontale (plastica); 0.5 – 1.5 cm di spessore� ACRILAMMIDE: supporto verticale (vetro); 0.5 – 1.0 mm di spessore� MDE: è una particolare acrilammide che viene usata per separare i frammenti di DNA a singola elica, come per esempio le formazioni di eteroduplex (single strand); supporto verticale (vetro); 0.5 – 1.0 mm di spessore� POLIMERI IN CAPILLARI: come vedremo si tratta di sistemi estremamente efficienti nella separazione (± 0,5 bp); capillare (vetro); 0.05 mm di spessore

MDE

Agarosio

CapillareAcrilammide

SEPARAZIONE DI FRAMMENTI DI DNA MEDIANTE CLONAGGIO E TRASFORMAZIONE IN E. coli

• Un altro metodo prevede il clonaggio dei prodotti PCR presenti in una miscela complessa;

• E’ possibile legare ogni singolo frammento di DNA amplificato in un DNA circolare (plasmide) detto vettore;

• Il vettore può quindi essere inserito in una cellula batterica recipiente, in genere di Escherichia coli. Si parla di trasformazione e E. coli si trova in stato competente, cioè è capace di assumere DNA dall’ambiente

• Il plasmide vettore (parte blu nella figura) contiene anche altri geni, come per esempio un gene che conferisce resistenza ad un antibiotico (geni marker di selezione);

• Piastrando su terreno con antibiotico i vari E. coli, solo le cellule che avranno inserito il plasmide potranno crescere (trasformanti);

• Dopo una notte, ogni colonia generata da ogni singola cellula di E. coli conterrà un solo frammento di prodotto PCR; si può pertanto isolare la colonia, estrarre il plasmide, e analizzare il frammento inserito

E’ però necessario analizzare numerosi cloni e quindi è un metodo costoso

SEPARAZIONE DI FRAMMENTI DI DNA MEDIANTE CLONAGGIO E TRASFORMAZIONE IN E. coli

Esempio di risultato di un clonaggio: ogni cellula contiene un frammento di DNA amplificato

METODI AUTOMATIZZATI DI SEPARAZIONE

Il “sequenziatore” è in realtà una normale elettroforesi in grado di separare, individuare e riconoscere qualsiasi frammento genomico purchè fluorescente

1. Frammenti prodotti da una reazione di sequenza e differenti tra loro di un solo nucleotide

2. Qualsiasi prodotto di amplificazione o di digestione fluorescente (esempio: un prodotto di PCR ottenuto usando almeno un primer marcato con un fluorescente

Sequenza

Fingerprinting di ceppi o comunità

Detection di un gene

LASER

ABI Prism 310CCD camera

-+

HEX

ELETTROFORESI CAPILLARE

Gene

N. picco T di uscita Paia di basi Altezza picco Area picco Datapoint

ELETTROFORESI CAPILLARE: SOFTWARE GENESCAN

COSA ESPLORARE ALL’INTERNO DEI FRAMMENTI GENOMICI AMPLIFICATI?

A) Semplicemente si possono osservare l’assenza/presenza (e eventualmente abbondanza) di un frammento genomico -> FINGERPRINTING

B) Altrimenti si può studiare la sequenza di un gene -> SEQUENZIAMENTO

--------------

A)Da un’analisi fingerprinting si possono ottenere informazioni sui

-> Polimorfismi di lunghezza (es. con corsa su gel e confronto con frammenti a lunghezza nota)

-> Polimorfismi puntiformi di sequenza (es. tramite digestione enzimatica)

-> Polimorfismi di sequenza (es. tramite denaturazione del DNA per via chimica)

B)Da un sequenziamento si possono ottenere informazioni filogenetiche e molecolari

PS: un’analisi fingerprinting può essere associata ad una di sequenziamento:

Taglio della bandacon un bisturi Analisi della sequenza

• Gene lungo ca 1500 - 1600 nt, dopo la trascrizione non è tradotto in proteina, ma assume una particolare struttura secondaria che serve per la costruzione del ribosoma

• In particolare, codifica per la subunitàpiccola del ribosoma (16S nei procarioti; negli eucarioti come i funghi è il 18S rRNA)

• Deve assumere una determinata struttura tridimensionale per assolvere la sua funzione, quindi ha un basso tasso di mutazione (la maggior parte delle mutazioni producono ribosomi non funzionanti e non vengono trasmesse alla progenie)

• E’ presente nei genomi in multicopia (anche 15 copie!), proprio perché è essenziale per la vita. Per questo motivo è facilmente amplificabile

IL 16S rRNA

16S23S+5S

Nella sequenza del gene 16S rRNA si riconoscono diverse regioni:

• regioni CONSERVATE universali, che hanno la stessa sequenza in tutti i batteri

• regioni SEMICONSERVATE, che hanno sequenza uguale tra batteri dello stesso taxon

• regioni VARIABILI, che hanno la stessa sequenza tra batteri appartenenti alla stessa specie

Confrontando la sequenza di questo gene di diversi batteri è possibile:

• Quantificarne la DISTANZA FILOGENETICA: determinare a che punto dell’evoluzione 2 organismi si sono differenziati

• Determinare la diversità tra gli organismi• Identificare un batterio: se 2 organismi

hanno 16S rRNA con più del 97% delle basi omologhe, possono appartere alla stessa specie

IL 16S rRNA

OPERONE RIBOSOMALE

� Il gene codificante il 16S rRNA fa parte di una regione di più geni trascritti da un medesimo promotore trascrizionale (operone); tali geni sono denominati 16S, 23S e 5S� I geni sono separati tra loro da due regioni intergeniche (ITS) aventi anche funzione di regolazione del processo di maturazione degli rRNA� All’interno dell’ITS tra 16S e 23S, possono esserci uno o due geni codificanti tRNA

� Tra questi geni il 16S rRNA è quello più analizzato, seguito dal 23S rRNA; attualmente per la definizione di una nuova specie, oltre che ad approfondite analisi fenotipiche e genotipiche, è richiesto il sequenziamento completo del 16S; nel caso di un nuovo genere batterico, il 16S è più che sufficiente.� Gli ITS e lo stesso 16S sono utilissimi per l’analisi sia di ceppi puri che dell’intera comunità batterica, come vedremo in seguito

16S tAla tIle 23S 5S

ITS

Pr

TECNICHE DI ANALISI MOLECOLARE

a) A carico del 16S rRNA

b) A carico degli ITS dell’operone ribosomale

c) A carico di un qualsiasi altro gene o regione genomica nota

d) A carico dell’intero genoma

e) Tecniche che non prevedono l’uso della PCR

Specie) Permette di distinguere diverse specie

Sottospecie) Permette di distinguere diverse sottospecie

Ceppo) Permette di distinguere diversi ceppi

ARDRA – Amplified Ribosomal DNA Restriction Analysis

Prevede l’amplificazione del gene 16S rRNA e quindi restrizione con un “enzima di restrizione” a 4 nucleotidi;L’enzima di restrizione (endonucleasi di restrizione) è una proteina che taglia il DNA in una ben specifica sequenza nucleotidica (4,6 o 8 nucleotidi)

Le sequenze riconosciute hanno la proprietà di essere palindromiche

HpaII ..CCGG.. RsaI ..GTAC.. PvuI ..CGATCG....GGCC.. ..CATG.. ..GCTAGC..

Es. Ceppi di Geodermatophilaceae isolati da calcareniti pesantemente bioalterate prese dalle mura di Cagliari

* Ceppo di riferimento Blastococcus aggregatus

** Ceppo diverso dagli altri

***

a specie

RFLP (Restriction Fragment Length Polymorphism)

Si digerisce l’intero DNA genomico di un ceppo con un particolare enzima di restrizione (meglio che riconosca 6 o 8 nucleotidi)

I frammenti generati sono separati su un normale gel di agarosio

Con il termine RFLP si intende anche una tecnica che prevede la digestione non dell’intero DNA, ma semplicemente di un gene amplificato; la RFLP sul 16S rRNA è detta ARDRA

c specie

AFLP (Amplified Fragment Length Polymorphism)

• Si digerisce il DNA genomico con due enzimi di restrizione; ai bordi di ogni frammento si avranno delle sticky ends diverse per ogni enzima utilizzato;

• Si ligano alle sticky end dei brevi frammenti di DNA che favoriranno l’annealing dei primer per la PCR;

• Tramite PCR si amplificano i frammenti

• Metodo alquanto intricato, ma tuttavia abbastanza usato specialmente nello studio degli organismi superiori (es. piante)

d sottospecie

T-RFLP (Terminal Restriction Fragment Length Polymorphism)

E’ una tecnica di fingerprinting su comunità in cui il target è il 16S digerito mediante opportuni enzini di restrizione

Ceppo 1

Ceppo 2

Ceppo 3

Ceppo 4

16S diger it i

Taglio enzimaticoComunità:

a specie

ITS-HHP (Intergenic Transcribed Spacers – Homoduplex Heteroduplex Polymorphism)

• Come abbiamo visto l’operone ribosomale è presente in multicopia in tutti in microrganismi; inoltre tra 16S e 23S vi è una regione spaziatrice (ITS) che può contenere i geni per due tRNA;

• Tale regione varia tra 150 e 1300 bp, ma più normalmente è tra 200 e 600 bp;

• Con primer universali posti alla fine del 16S e all’inizio del 23S è possibile amplificare gli ITS

• La separazione può essere fatta su gel d’agarosio o meglio ancora di acrilammide

16S 23S

16S 23StRNA

16S 23StRNA tRNA

Su agarosio

In questo modo è possibile separare anche i frammenti heteroduplex, ibridi creati dall’appaiamento di eliche di

DNA provenienti da ceppi simili

Su MDE

b Sottospecie

Homoduplex

Heteroduplex

Le bande possono essere tagliate dal gel; si estrae dalla matrice il frammento di ITS e lo si può sequenziare, determinando così la specie batterica o fungina in maniera simile al 16S

RISA

Ribosomal Intergenic Spacers Analysis;

variante per comunità

b Sottospecie

ARISA (Automated Ribosomal Intergenic Spacer Analysis)

LASER

ABI Prism 310CCD camera

-+

16S rDNA 23S rDNAITS

HEX

B.cereus + P. stutzeri+ S. bovis

+ S. coelicolor+ E. coli

Cardinale et al. 2004 Appl. Environ. Microbiol., 70:6147-6156b Sottospecie

Rel

ativ

e pe

ak f

luor

esce

nce

(%)

Expected

100

80

60

40

20

0

0.14 ng/µl

COMPARAZIONE DELL’EFFICIENZA DEI PRIMER NELL’ANALISI DI MODELLI DI COMUNITA’ EUBATTERICHE

•Forte influenza della lunghezza e della percentuale GC

•ARISA: tecnica che descrive con fedeltà la popolazione batterica; in grado di

individuare la presenza di specie rare nella popolazione

50%

10%

5% 1% 0.5%

0.1%

Miscela di DNA di diversi ceppi di collezione, diluita da 28 a 0.14 ng/µl

Miscela di DNA di diversi ceppi di collezione, con quantità decrescenti di DNA di P. stutzeri (dal 50 allo 0.14 %)


b Sottospecie

ARISA su comunità batteriche provenienti da due statue (castello Buonconsiglio; TN)


b Sottospecie

150 300 450 600 750 900 1050Length (bp)

400

200

0

200

0

200

0

200

0

200

0

200

0

200

0

200

0

Uni

ts o

f flu

ores

cenc

e

W-48

T-48

P-48

C-48

W-96

T-96

P-96

C-96

Esempio di comunitàcomplessa

ARISA-PCR su suolo sottoposto a essudati

radicali di tabacco

Come si vede l’analisi èmolto più sensibile

rispetto ai gel e permette di osservare

un gran numero di specie non altrimenti visibile; non è però

possibile stabilire chi esse siano

b Sottospecie

ARISA

LH-PCR (Length Heterogeneity-PCR)

• Alta precisione e riproducibilitàdell’elettroforesi capillare

•Specie batteriche quasi sempre ben separabili sulla base della lunghezza

del frammento, purché di specie filogeneticamente affini

• Occasionali picchi secondari (polimorfismi interoperonici)

Specie più affine Lunghezza

frammento (± 0.5 bp)

Enterobacter sp. 344 Enterobacter sp. 344 (345) Bacillus coagulans 351 Lactococcus lactis lactis 353 Bacillus m egaterium 354 (352) Enterococcus flavescens 361 Enterococcus faecium 363 (362) Enterococcus faecium 363 Lactobacillus brevis 369 Lactobacillus paraplantarum 370 Ped iococcus acid ilactici 377 Ped iococcus pentosaceus 378 Lactobacillus perolens 379 Weissella kim chii 379 Weissella confusa 379 Weissella confusa 380 Lactobacillus plantarum 381

V1 V2Specie1

Specie2

Specie3

2 1 3

ANALISI DI COMUNITA’

b Sottospecie

Uni

tU

nit àà

di fl

uore

scen

zadi

fluo

resc

enza

Paia di basiPaia di basi

15001500

10001000

500500

00

15001500

10001000

500500

00

15001500

10001000

500500

00

15001500

10001000

500500

00

15001500

10001000

500500

00

15001500

10001000

500500

00

15001500

10001000

500500

00

279 285 291 297 303 309 315 321 327 333 339 345 351 279 285 291 297 303 309 315 321 327 333 339 345 351 357 363 369 375 381 387 393357 363 369 375 381 387 393399399

As

Ad

Bs

Bd

Cs

Ds

Dd

LH-PCR (Length Heterogeneity-PCR)

Analisi della comunitàbatterica biodeteriogena

isolata da calcarenite proveniente da Cagliari

b Sottospecie

tRNA-PCR

E’ possibile distinguere i microrganismi anche sulla base dei loro tRNA;

Si amplifica le regioni del genoma comprese tra due operoni ribosomali vicini, sfruttando la caratteristica del primer sul tRNA che può appaiare sia in Forward che in Reverse

b/d Sottospecie

Operone ribosomale 1 Operone ribosomale 2

Primer A

Primer A

Primer B

Primer B

tRNAmaturo

SSCP (Single Strand Conformation Polimorphism)

• La tecnica sfrutta il fatto che eliche singole di DNA creano strutture tridimensionali di forma diversa a seconda della loro sequenza nucleotidica;

• Date per esempio due sequenze uguali ad eccezione di una sola mutazione, le relative singole eliche assumeranno forme 3D diverse;

• E’ possibile pertanto distinguere geni provenienti da microrganismi diversi;

• La denaturazione può essere chimica, termica oppure è possibile digerire enzimaticamente una delle due eliche per ridurre la complessità dell’analisi e per migliorarne la pulizia;

PCR e denaturazione

Rapido raffreddamento

a/b/c Sottospecie

Dop

pia

elic

a no

n de

natu

rate

Sing

ole

elic

he

SSCP (Single Strand Conformation Polimorphism)

L’SSCP può essere anche fatta su campioni ambientaliAnche in questo caso è possibile tagliare le bande e sequenziarle

a/b/c Sottospecie

RAPD (Random Amplified Polymorphism DNA Analysis)

Prevede l’amplificazione di piccoli frammenti di DNA grazie all’uso di un primer molto breve che si allinea casualmente all’interno del genoma;

A basse temperature di annealing (<40°C) i primer si disporranno casualmente sulla base della forza ionica del mix di reazione e di altri fattori

d Ceppo

Rep-PCR (Repetitive extragenic palindromic PCR)

Prevede l’amplificazione di piccoli frammenti di DNA grazie all’uso di un primer molto breve che si allinea all’interno del genoma lungo sequenze ben precise e ripetute all’interno dell’intero genoma (interspersed sequences);

Tali sequenze sono più o meno conservate in molti batteri; si tratta spesso di sequenze di regolazione genica

REP-PCR: Primer REP da batteri entericiBOX-PCR: Primer BOX da Streptococcus pneumoniaeERIC-PCR: Primer ERIC da batteri entericiBc-Rep-PCR: Primer Bc-Rep da Bacillus

d Ceppo

100 300 500 700 900 1100 1300 1500 1700 1900

Lenght (bp)

800

600

400

200

0

600

400

200

0

600

400

200

0

600

400

200

0

Un

its o

f flu

ores

cen

ce

A

B

C

D

Estremamente riproducibile

ceppo CO2-33 Geodermatophilaceae

A: Estr. 1; PCR 1B: Estr. 1; PCR 2C: Estr. 2; PCR 1D: Estr. 2; PCR 2

FRep-PCR (Fluorescent-REP-PCR)

d Ceppo

100 300 500 700 900 1100 1300 1500 1700 1900

Length (bp)

800

600

400

200

0

600

400

200

0

600

400

200

0

600

400

200

0

Un

its o

f flu

ores

cen

ce

A

B

C

D

FRep-PCR (Fluorescent-REP-PCR)

Esempio di fingerprintingdi 3 ceppi biodeteriogeni e un riferimento

A: Blastococcus sp. CI2 13B: Blastococcus sp. CI1 23C: Modestobacter sp. DS3D: E. coli DSM50902

A

B

C

D

d Ceppo

Sau-PCR

E’ una tecnica recente;Si digerisce il DNA con l’enzima Sau3AI

..gatc..

..ctag..

Con un ciclo di PCR si completano le sticky ends (i puntini)Si sceglie un primer con termine

GATCXX

Dove XX rappresentano 2 nucleotidi scelti a caso (nell’es. a fianco sono AG)Il primer in 5’ è molto più lungo (nell’es. CCGCCGC)Si continua come una normale PCR

gatc..

..ctag

d Ceppo

DGGE (Denaturing Gradient Gel Electrophoresis)

1. Si amplificano i 16S dell’intera comunità con primer universali; uno di questi primer ha in posizione 5’ una estensione di GC; es: cgcgcgcccccggccgcgcgccctgctgtatataaatc

2. A questo punto tutti i frammenti amplificati avranno la coda GC all’inizio

3. Si separano i frammenti in un elettroforesi con un gel particolare; la parte iniziale del gel (presso i pozzetti) è normale; la parte finale invece è satura di urea e formammide, due composti fortemente denaturanti, cioè che fanno separare le due eliche del DNA

4. Scendendo lungo il gel, attirati dal campo elettrico, i frammenti incontrano una concentrazione sempre maggiore di denaturante ed iniziano a denaturarsi

5. A basse concentrazioni di denaturante si iniziano a separare le coppie AT, debolmente legate tra loro e solo a concentrazioni maggiori le coppie GC

6. Al termine della corsa i frammenti sono tutti denaturati eccetto la coda GC che èestremamente resistente; le eliche denaturate si avvolgono su se stesse bloccando l’avanzata del frammento

Coda GC primer

a/b/c Specie -> Sottospecie

DGGE (Denaturing Gradient Gel Electrophoresis)

La separazione totale del frammento (eccetto la coda GC) avviene in posizione diversa lungo il gel a seconda della sequenza nucleotidica del frammento; una sequenza ricca in AT si bloccherà prima che una ricca in GC

Specie ricche in AT

Specie ricche in GC

Le bande possono essere tagliate dal gel; si estrae dalla matrice il frammento di 16S e lo si può sequenziare, determinando così la specie batterica o fungina

Una versione alternativa (TGGE) prevede una denaturazione secondo un gradiente termico e non chimico


Sequenziamento di tutto (o parte) del genoma

Ovviamente PCR o restrizioni esaminano soltanto l’immediato intorno del genoma in cui primer o enzimi agiscono; cioè, se si usa un enzima di restrizione (RFLP) per digerire un DNA genomico, ovviamente si avrà un’informazione positiva di tutte quelle brevissime zone riconosciute dall’enzima stesso. Delle altre zone non sapremo mai nulla.

Il sequenziamento fornisce la massima informazione possibile.

Finora il costo del sequenziamento dell’intero genoma di un microrganismo è ancora elevato; inoltre la tecnica fornisce un numero così elevato di informazioni che diventa di difficile gestione; spesso, poi il fine della ricerca non giustifica tutti questi sforzi.

La scelta più conveniente è il sequenziamento del 16S rRNA o dello spaziatore tra 16S e 23S per la definizione della specie batterica; il discorso cambia invece se si vuole studiare una comunità batterica in toto, comprendendo anche le specie non isolabili in laboratorio.

Tuttavia sequenziamenti mirati sono di grandissima utilità per distinguere ceppi estremamente simili, spesso appartenenti a specie diverse, ma genotipicamente molto vicine.

a/b/c/d Specie -> Ceppo

MLST (Multi-Locus Sequence Typing)

• E’ una tecnica che prevede l’amplificazione e il sequenziamento di un certo numero di geni essenziali per i microrganismi da studiare;

• Si deve almeno conoscere la specie batterica che si sta studiando per determinare quali geni siano i migliori da analizzare;

• L’informazione ricavata dallo studio di ogni singolo gene scelto viene correlata con quelle ricavate dagli altri geni analizzati, ricavando una visione d’insieme estremamente efficace;

Sequenziamento

Analisi totale


VNTR (Variable Number Tandem Repeats)

Nel genoma possono essere presenti delle brevissime sequenze ripetute per un numero elevatissimo di volte; tali regioni sono difficilmente conservabili durante la replicazione del DNA e pertanto fenomeni di delezione o inserzione di nucleotidi sono abbastanza comuni

atgtagatgggtccgggtccgggtccgggtccgggtccgggtccgggtccgggtccatcgaatct

Nell’esempio la sequenza GGGTCC è ripetuta 8 volte; può essere che in altri ceppi della stessa specie batterica, la sequenza sia presente 10 o 6 volte, e questo fa variare la lunghezza complessiva della regione

atgtagatgggtccgggtccgggtccgggtccgggtccgggtccgggtccgggtccatcgaatct

Amplificando l’intera regione e separando i frammenti in acrilammide o su sistemi a capillare è possibile distinguere ceppi sulla base di queste diversità


PFGE (Pulsed Field Gel Electrophoresis)

Si tratta di una elettroforesi abbastanza complessa

Si fanno crescere i batteri in terreno di coltura; si raccolgono le cellule e le si bloccano in cubetti di agarosio; quindi si trattano i cubetti con detergenti e spesso enzimi di restrizione

Si caricano nei pozzetti i cubetti trattati con all’interno il DNA genomico dei ceppi da analizzare;

Durante la corsa elettroforetica, il campo elettrico varia di polarità (campo pulsato) in modo programmato, consentendo la separazione dei frammenti genomici in base alla loro diversità di sequenza

e Ceppo

CFLP (Cleavase I Fragment Length Polymorphism

• Si denatura un DNA genomico a 95°C e poi lo si raffredda immediatamente;• Si formano così delle zone in cui il DNA è a singolo filamento, mentre altre sono a doppio filamento;

• La Cleavasi I è un enzima che digerisce le strutture a singolo filamento mantenendo soltanto le strutture a doppio filamento le quali possono essere così separate in un gel

��

� ��

e Ceppo

SOUTHERN BLOTTING

M 5

0 bp

448

460

496

498

499

500

501

502

507

519

526

545

554

555

556

G20

472

Aco

N24

d

CeD

E15

A

rP rQ M 5

0 bp

448

460

496

498

499

500

501

502

507

519

526

545

554

555

556

G20 472

Aco

N24

d

CeD

E15

A rP rQ

Outgroup

BC 519

65° C

70° C

• La tecnica del blottaggio è comunemente praticata per ricercare l’effettiva presenza di un gene nel genoma di un organismo

• Nell’analisi fingerprinting, si digerisce il DNA genomico con un enzima di restrizione

• Si ibridizza la digestione con una sonda specifica per una regione complementare al genoma e che comprenda la sequenza digerita dall’enzima

e Specie -> Ceppo

• Un fluorocromo è legato ad un oligonucleotide o sonda. Per trattamento delle membrane cellulari queste diventano permeabili e permettono entrata sonda marcata che ibridizza con rRNA nei ribosomi. Le cellule diventano uniformemente fluorescenti e possono essere osservate al microscopio a epifluorescenza;

• Microrganismi coltivabili e non;

• Proprio perché la sonda si lega ai ribosomi, le cellule devono essere vitali e metabolicamente attive

Sonda per cianobatteri

Sonda per Archea

FLUORESCENT IN-SITU HYBRIDIZATION (FISH)


The sample is first fixed to stabilize the cells and permeabilize the cell membranes. The labelled oligonucleotide probe is then added and allowed to hybridize to its intracellular targets before the excess probe is washed away. The sample is then ready for single-cell identification and quantification by either epifluorescence microscopy or flow cytometry.

Sonde per Geodermatophilus / Blastococcus e per Modestobacter (Urzì et al., 2004)


BLU: colorante DAPI, che legandosi al DNA colora indifferentemente tutte le cellule (sia vive che morte)

Propidium iodide

MOLLICUTES probe

ESEMPI DI USO DI MARCATORI FLUORESCENTI

Propidium iodideBACTEROIDETES probe SULCIA probe


• Intestino di insetti


BACTERIA probe

Propidium iodide

SULCIA probe

Another

bacterium is

co-localized

with Sulcia sp.

in the ovary

Sulcia sp. in

the oocyte

while the other

bacterium in

the follicolar

cells

• Ovario di insetti

WORKFLOW DELLE TECNICHE DI FINGERPRINTING

SENSIBILITA’ DELLE TECNICHE DI FINGERPRINTING

A volte le tecniche possono essere accostate tra loro migliorando l’efficienza dell’analisi;

Il caso a fianco è una ARDRA-SSCP

Cioè:- amplificato il 16S rRNA- digerito con un enzima di restrizione- denaturato a 95°C- separato su gel di acrilammide

ABBINAMENTO DI ANALISI FINGERPRINTING

Nel caso a fianco si analizzano contemporaneamente una BOX, una ERIC ed una REP (tutte Rep-PCR) “fondendo” i risultati in una sola analisi statistica, aumentando in tal modo la bontà dell’analisi

ABBINAMENTO DI ANALISI FINGERPRINTING

DISEGNI SPERIMENTALI COMPLESSI PER L’ANALISI DELLE COMUNITA’ BATTERICHE

ISOLAMENTO E IDENTIFICAZIONE DI BATTERI

CAMPIONE AMBIENTALE

ISOLAMENTO SU PIASTRA

BATTERIO IN COLTURA PURA

ESTRAZIONE DEL DNA

AMPLIFICAZIONE DEL GENE 16S rRNA

SEQUENZIAMENTO DEL GENE 16S rRNA

CONFRONTO DELLA SEQUENZA CON QUELLE IN

BANCA DATI

CV2

Sphingomonas echinoides AJ012461

Sphingomonas aquatilis AF131295

Sphingomonas pruni Y09637

Sphingomonas mali Y09638

Blastobacter aggregatus X73041

ALLINEAMENTO E COSTRUZIONE DELL’ALBERO

FILOGENETICO

CAMPIONE AMBIENTALE

ESTRAZIONE DEL DNA

AMPLIFICAZIONE DEL GENE 16S rRNA

SEQUENZIAMENTO DEI GENI 16S rRNA

CONFRONTO DELLE SEQUENZE CON QUELLE IN

BANCA DATI

ALLINEAMENTO E COSTRUZIONE DELL’ALBERO

FILOGENETICO

Miscela di molecole di 16SrRNA, ciascuna proveniente dai diversi batteri presenti nel campione ambientale

SEPARAZIONE DELLE MOLECOLE AMPLIFICATE

A

B

C

A

Bacillus subtilis

Bacillus amyloliquefaciens

B

Bacillus licheniformis

CPseudomonas putida

IDENTIFICAZIONE DI BATTERI SENZA ISOLAMENTO

PCR Campione ambientale Estrazione DNA-RNA

Clonaggio e trasformazione

in E. coli

Isolamento di ceppi

Sequenziamento dei cloni o delle bande DGGE

Fissaggio delle cellule

(Fluorescent) in situ hybridization

Blotting

Isolate 16S rRNA sequencing

Isolamento di ceppi con un particolare gene

Elettroforesi DGGE

ANALISI SUL 16S rRNA

SCHEMA CONCETTUALE DELL’ANALISI DELLE COMUNITA’ MICROBICHE

PCR sul 16S rRNA con primer “universali”

Sequenziamento delle bande o di cloni

Analisi dei profili di bande

DNA ambientale

Campione ambientale

DIVERSITA’STRUTTURA

Incorporazione di nucleotidi marcati

(BRdU)

Analisi diretta del DNA ambientale

Determinazione del metagenoma

ambientale

COMPLESSITA’

DNA marcato

Linee B o C

FUNZIONE

A

B C

D

ANALISI STATISTICA DEI DATI MOLECOLARI

L’analisi di bande o picchi è praticamente identica:

-> Assenza o Presenza di una banda/picco (matrice binaria – 1/0)

-> Assenza o Presenza + Quantità di una banda/picco (matrice quantitativa)

Da una matrice binaria/quantitativa si calcola una matrice di distanza, simile in tutto alle tabelle delle distanze stradale autostradali, in cui la distanza tra le città (campioni; ceppi) ècalcolata con speciali coefficienti di distanza (es. Jaccard; Ward;...)

Diversi algoritmi (es. Unweighted Pair Group Method with Arithmetic mean – UPGMA; ecc) ricavano dalla matrice di distanza un dendrogramma che spiega la natura dei rapporti di distanza che ci sono tra le città (campioni; ceppi)

123456...

ANALISI DEI PROFILI DI BANDE O DI PICCHI

Esempio:

A B C D E1 1 1 1 10 1 1 0 10 0 0 1 10 1 1 1 1...

A B C D E

A B C D EA 00B 54 00C 35 87 00D 21 76 56 00E 96 56 31 12 000 33 66 100

A

E

96

AE B C DAE 00B 67 00C 82 70 00D 33 78 66 00 0 33 66 100

A

E

71

C

ANALISI UPGMA

AEC B DAEC 00B 62 00D 17 77 00

0 33 66 100

A

E

77

C

B

D

AEC BDAEC 00BD 54 00

A

E

54

C

B

D

0 33 66 100

ANALISI UPGMA

50% 60% 70% 80% 90% 100%

78%

Ramo

Nodo (antenato)

Nodo (OTU)

Outgroup

ALBERI FILOGENETICI

PRINCIPAL COMPONENT ANALYSIS (PCA)

L

H

W

3 variabili

LH LHW

L LH

H W

56 21

100µ

E’ un’analisi più complessa che prevede la riduzione statistica delle variabili considerate

1 2

3 4

Un albero filogenetico spiega le relazioni tra le “Operational Taxonomic Units” (OTUs) che possono essere sequenze nucleotidiche o aminoacidiche provenienti da organismi diversi

oppure sequenze di diverse proteine dello stesso organismo oppure profili di bande (fingerprinting)

ANTENATO COMUNE

ALBERI FILOGENETICI

A

B

C

DE

A

B

C

D

E

Tempo ossia n° di mutazioni

ALBERI FILOGENETICI

Tuttavia è essenziale sapere dove si trova la mutazione nel 16S: se essa si trova in una zona altamente conservata della sequenza, allora acquista importanza; in tal modo i rami del dendrogramma vengono “allungati” o “accorciati” in funzione della posizione e quindi dell’importanza delle mutazioni.

A

B

C

D

E

A

B

C

D

E

ALBERI FILOGENETICI

Il controllo statistico del lavoro che abbiamo svolto è fondamentale per la corretta assegnazione delle specie batteriche; l’analisi più diffusa è denominata bootstrap

A

B

C

D

E

* *TGAAAGGTGAAAAGTGTAAAG

**GATGGAAGATAGAAGATAGTA

Dato un allineamento, si “scambiano” casualmente l’ordine delle basi in orizzontale, pur rispettando la

relativa posizione in verticale (vedi per es. *)

Una volta scambiate le posizione, si riallineano le sequenze e si genera un nuovo albero; essendo la costruzione dell’albero un’operazione algoritmica, non sempre col nuovo allineamento si ottiene lo stesso albero. Alcuni nodi possono scomparire, mentre altri rimangono. Si ripete questa operazione per almeno 1000 volte e si conta quante volte ogni nodo dell’albero originale è presente negli alberi successivi

10096

24

76

100 e 96 = nodo molto significativo

76 = nodo significativo

24 = nodo poco significativo; in questo caso D ed E non sono così ben separati come mostra l’albero

EUROPEAN BIOINFORMATICS INSTITUTEhttp:\\www.ebi.ac.uk

Database• Browsers• Nucleotide databases• Protein databases• Structure databases• Microarray databases• Literature databases

Toolbox• Homology & Similarity

• Protein functional analysis• Structural analysis

• Sequences analysis• Utilities

Submissions• EMBL• Swiss-Prot• PDB

Downloads• Software repository• Database repository

• FTP servers• Help files

EBI

NCBI DDBJ

http://www.ncbi.nlm.nih.gov/

Pubmed(bibliografia)

Nucleotide(database)

Entrez (motore di ricerca in NCBI)

Taxonomy(tassonomia)

Nucleotide-nucleotide BLASTN

atcatactaggta ...tcatgagtcgtagact...

Proteina-proteina BLASTP

GNTRGSRG …WAKGMYAW...

Nucleotide-proteina BLASTX

atcatactaggta ... WAKGMYAW...

Proteina-Database tradotto TBLASTN

GNTRGSRG ... (WAKGMYAW)...

Nucleotide-Database tradotto TBLASTX

(atcatactaggta) ... (WAKGMYAW)...

BLAST - Identificazione delle sequenze in base alla similarità con le sequenze del database

http://www.ncbi.nlm.nih.gov/blast/

Basic Local Alignment Search Tool

COME SI IDENTIFICA UN BATTERIO

Lunghezza 700 bpLa sequenza da analizzare (Query) viene suddivisa in numerosi frammenti molto brevi

CTAAGAGGTGATAGAACAGGGGCTACAAATTTAGATTAGAACTAAGAGCATAATATATAACACCTGCTCAACGTTT

CTAAGAGGTGATAGAACAGGGGCTACAAATTTAGATTAGAACTAAGAGCATAATATATAACACCTGCTCAACGTTT

CAGCT

TCGTC

...TGCTCCTAAGAGGCACCT...TCTACTCCCTACTCTGTTTTCCTCAGTCATGCTCCTAAGAGGCACCTGTCTCGCTCGCTCGCGTAGC

CCTACTCTGTTTTCCTCAGTCATGCTCCTAAGAGGCACCTGTCTCGCTCGCTCGCTCCATCTCACCTACTCTGTTTTCCTCAGTCATGCTCCTAAGAGGCACCTGTCTCGCTCGCTCGCTTTAATAAG

GGTGCAAGG GGGTTCTAC

� �

Il metodo si basa sull’algoritmo HSP (High-scoring segment pair) che cerca parti della sequenza sottomessa il più possibile estese; parti che abbiano il massimo punteggio (score). Più questo

punteggio è elevato e più il frammento sottomesso è simile a quello allineato.

BLAST (Basic Local Alignment Search Tool)Nella ricerca con BLAST si presuppone che sequenze simili derivino da un antenato comune. (ma non sempre ciò è vero!)

…


Nostro ceppo

Ceppo simile

MULTICONFRONTO TRA SEQUENZE

1. Per l’assegnazione corretta della specie batterica è necessario confrontare la sequenza del proprio ceppo isolato con un alto numero di sequenze ad esso affini

2. Questo è possibile con opportuni algoritmi che “allineano” la nostra sequenza con altre sequenze della banca dati, in modo da avere un risultato di questo tipo:

ALBERI FILOGENETICI

Dall’allineamento si ricava un dendrogramma o albero filogenetico nelle modalità viste in precedenza

TECNICHE DI FINGERPRINTING E ANALISI MOLECOLARE · 2010. 12. 21. · 1. Frammenti prodotti da una...

Documents

Transcript of TECNICHE DI FINGERPRINTING E ANALISI MOLECOLARE · 2010. 12. 21. · 1. Frammenti prodotti da una...