Post on 03-May-2015
Genetica ForenseGenetica ForenseDocente: Fulvio CrucianiDocente: Fulvio Cruciani
fulvio.cruciani@uniroma1.itfulvio.cruciani@uniroma1.it
Ricevimento: mercoledì 13:30-15:30 Ricevimento: mercoledì 13:30-15:30
Edificio genetica, stanza 3-09 (2° piano)Edificio genetica, stanza 3-09 (2° piano)
Telefono (per comunicazioni urgenti): 06 49912826Telefono (per comunicazioni urgenti): 06 49912826
Parte del corso di Parte del corso di
«Metodologie genetico-molecolari «Metodologie genetico-molecolari nell’uomo»nell’uomo»
Modulo Genetica ForenseModulo Genetica ForenseProgramma AA 2013-2014Programma AA 2013-2014
Breve storia della genetica forense: dal sistema AB0 ai mini-STR. Breve storia della genetica forense: dal sistema AB0 ai mini-STR. Repertamento, conservazione e determinazione del tipo cellulare e/o tissutale dei Repertamento, conservazione e determinazione del tipo cellulare e/o tissutale dei reperti biologici. reperti biologici. Estrazione differenziale, quantificazione e determinazione del sesso genetico del DNA Estrazione differenziale, quantificazione e determinazione del sesso genetico del DNA dei reperti. dei reperti. Metodi e strumenti per la tipizzazione di marcatori polimorfici in ambito forense. Metodi e strumenti per la tipizzazione di marcatori polimorfici in ambito forense. Problematiche relative alla natura del campione biologico: DNA fortemente degradato Problematiche relative alla natura del campione biologico: DNA fortemente degradato e/o in tracce minime; determinazione dei genotipi in campioni misti. e/o in tracce minime; determinazione dei genotipi in campioni misti. Problematiche concernenti l’interpretazione del profilo di DNA: stuttering, microvarianti Problematiche concernenti l’interpretazione del profilo di DNA: stuttering, microvarianti e alleli “off-ladder” nei microsatelliti, alleli nulli, drop-out e drop-in allelico. e alleli “off-ladder” nei microsatelliti, alleli nulli, drop-out e drop-in allelico. Utilizzazione dei sistemi ad ereditarietà uniparentale in ambito forense.Utilizzazione dei sistemi ad ereditarietà uniparentale in ambito forense.Identificazione nelle indagini criminali; identificazione delle vittime dei disastri di Identificazione nelle indagini criminali; identificazione delle vittime dei disastri di massa. massa. Test di parentela e paternità. Test di parentela e paternità. Elementi di calcolo delle probabilità. Potere di esclusione, probabilità di identità, Elementi di calcolo delle probabilità. Potere di esclusione, probabilità di identità, probabilità di match casuale, indice di paternità. probabilità di match casuale, indice di paternità. Inferenza sull’origine geografica e aspetto fenotipico attraverso l’analisi del DNA.Inferenza sull’origine geografica e aspetto fenotipico attraverso l’analisi del DNA.La ricerca scientifica in ambito genetico-forense. La ricerca scientifica in ambito genetico-forense.
Per eventuali approfondimenti:
Genetica ForenseGenetica ForenseDocente: Fulvio CrucianiDocente: Fulvio Cruciani
Testo consigliato:
La genetica nelle scienze La genetica nelle scienze forensiforensi
La genetica forense è una delle molteplici discipline delle scienze forensi. La genetica forense è una delle molteplici discipline delle scienze forensi.
L’importanza della genetica nelle scienze forensi si è notevolmente accresciuta negli L’importanza della genetica nelle scienze forensi si è notevolmente accresciuta negli ultimi anni, grazie ai progressi nella conoscenza dei marcatori genetici polimorfici ultimi anni, grazie ai progressi nella conoscenza dei marcatori genetici polimorfici ed all’evoluzione degli strumenti utilizzati per analizzarli.ed all’evoluzione degli strumenti utilizzati per analizzarli.
I mass media hanno notevolmente contribuito all’interesse verso le indagini genetico I mass media hanno notevolmente contribuito all’interesse verso le indagini genetico forense….forense….
La genetica come «strumento» La genetica come «strumento» in ambito forense e investigativoin ambito forense e investigativo
A cosa serve?A cosa serve? Identificare individui che abbiano commesso dei criminiIdentificare individui che abbiano commesso dei crimini Risolvere casi di paternità incertaRisolvere casi di paternità incerta Predire la popolazione di origine di un DNA (es. Africano, Predire la popolazione di origine di un DNA (es. Africano,
Asiatico ecc.)Asiatico ecc.) Ottenere informazioni fenotipiche su un soggetto (es. colore Ottenere informazioni fenotipiche su un soggetto (es. colore
occhi)occhi) Identificare e «ricostruire» cadaveri la cui identità sia ignota Identificare e «ricostruire» cadaveri la cui identità sia ignota
(vittime di catastrofi naturali, disastri aerei, guerre, genocidi) (vittime di catastrofi naturali, disastri aerei, guerre, genocidi) Investigazioni su persone scomparseInvestigazioni su persone scomparse Identificare tracce di sostanze illegali Identificare tracce di sostanze illegali Identificare DNA appartenente a specie a rischio di estinzione Identificare DNA appartenente a specie a rischio di estinzione
in crimini legati al loro contrabbandoin crimini legati al loro contrabbando ……………………………………..
Il fenomeno biologico sul quale si basa Il fenomeno biologico sul quale si basa la genetica forense:la genetica forense:
DIVERSITA’ GENETICA
La genetica forense si basa sulla presenza di diversità geneticaLa genetica forense si basa sulla presenza di diversità genetica
DIVERSITA’ GENETICA: A QUALE LIVELLO?
1. Diversità genetica tra individui
2. Diversità genetica tra popolazioni
3. Diversità genetica tra specie
Applica
zione in
A
mbito
fore
nse
Nella maggior parte delle applicazioni la genetica forense sfrutta la diversità genetica tra individui (variabilità intra-popolazione). In un
minor numero di casi sfrutta la variabilità genetica tra specie. In alcuni casi sfrutta «direttamente» la variabilità genetica tra
popolazioni, della quale va tenuto comunque sempre conto (effetti della suddivisione della popolazione, ecc.)
La genetica forense si basa sulla presenza di diversità geneticaLa genetica forense si basa sulla presenza di diversità genetica
DIVERSITA’ GENETICA: A QUALE LIVELLO?
1. Diversità genetica tra individui
2. Diversità genetica tra popolazioni
3. Diversità genetica tra specie
Le basi teoriche della genetica forense vanno ricercate nella genetica mendeliana e nella
genetica delle popolazioni
Applica
zione
in a
mbito
fore
nse
La genetica forense si basa sulla presenza di diversità geneticaLa genetica forense si basa sulla presenza di diversità genetica
DIVERSITA’ GENETICA: IN QUALE PORZIONE DEL GENOMA?
• Autosomi
• DNA mitocondriale
• Cromosoma Y
• Cromosoma X
I marcatori più utilizzati in ambito forense sono localizzati sugli
autosomi
Rile
vanza
in
Am
bito
fore
nse
La genetica forense si basa sulla presenza di diversità geneticaLa genetica forense si basa sulla presenza di diversità genetica
DIVERSITA’ GENETICA: CHE TIPO DI VARIAZIONE?
• Microsatelliti (short tandem repeats, STRs)• Sostituzioni nucleotidiche (~ SNPs)• Minisatelliti (~ VNTR)• Inserzione/delezione di basi (indels)• Presenza/assenza di elementi trasponibili• Copy number variants (CNVs)• Polimorfismi «citogenetici»
I marcatori più utilizzati in ambito forense sono i microsatelliti
Rile
vanza
in
am
bito
fore
nse
Confronto dei profiliQ K
Corte
Ricerca in database
Esclusione (no match)
Compatibilità (match)
May match another (K’)
Raccolta
Estrazione
Quantificaz.
Marcatori polimorfici
Interpretaz.ne dei dati
Conservazione
Amplificaz.
Interpretaz.ne statistica
Caratterizzazione
Separazione/detection
Campione “Q” (Question)
Bio
log
yT
ech
no
log
yG
en
etic
sS
ero
log
y
Profilo depositato in database
Steps coinvolti
Report(con peso statistico)
Q = K
Q ≠ K
CrimineTrasferimento del materiale biologico
Raccolta
Estrazione
Quantificaz.
Marcatori polimorfici
Interpretaz.ne dei dati
Conservazione
Amplificaz.
Separazione/Detection
Reference (Known) campione “K”
Steps coinvolti
Sospettato individuato
QUALITY
ASSURANCE
QUALITY
ASSURANCE
Profilo depositato in database
Esempio di Lab Report relativo ad un indaginesul DNA estratto da 2 reperti (Q1 e Q2) e da due indagati (K1 e K2)
Tratto da Butler JM «Fundamentals of forensic DNA typing» 2010.
Breve storia della genetica forense
Il primo sistema polimorfico utilizzato in ambito forense:
Sistema di gruppo sanguigno ABO (scoperto nel 1900 da Landsteiner)
Utilizzato per la prima volta in un processo nel 1915 in Italia (Lattes) e successivamente utilizzato in casi di identificazione e paternità incerta anche in altri paesi europei ed in US
Caratteristiche :
4 fenotipi (gruppi sang. A, B, AB, 0)
Rapidità di esecuzionePossibilità di esclusione Limitato potere di
discriminazione--------------------------------------------------------------------------------------
Successivamente affiancato da altri sistemi di gruppo sanguigno: MN (1927), Rh (1937) fino a circa 30 sistemi di gruppo sanguigno oggi noti
Breve storia della genetica forense
Differenze nel materiale genetico possono «tradursi» in differenze nelle sequenze aminoacidiche delle proteine. Tali differenze vennero utilizzate negli anni 60-80 per studi di genetica di popolazioni ed in ambito forense. Differenti forme dello stesso enzima (isoenzimi) venivano evidenziate mediante elettroforesi su agar, agarosio o acrilammide, sfruttando la differente carica degli isoenzimi per la separazione e la specificità enzimatica per la colorazione.
Caratteristiche rilevanti in ambito genetico-forense: - Numero di alleli ridotto (in genere 2-4)- Tempi di esecuzione relativamente lunghi- Potere di discriminazione maggiore (quando combinati) rispetto ai sistemi di gruppo sanguigno- Livelli di proteine bassi nei reperti, e instabili
L’era dei polimorfismi proteici
Breve storia della genetica forense
1985: MINISATELLITI, inizia l’era del DNA typing
Il primo caso criminale risolto mediante DNA typing: il signor Colin PitchforkIl primo caso criminale risolto mediante DNA typing: il signor Colin Pitchfork
1983: Lynda Mann, 15 anni, viene violentata e uccisa nel Leichestershire (UK)1983: Lynda Mann, 15 anni, viene violentata e uccisa nel Leichestershire (UK)
1986: Dawn Ashworth, 15 anni, viene violentata e uccisa nella stessa zona1986: Dawn Ashworth, 15 anni, viene violentata e uccisa nella stessa zona
Il Il modus operandimodus operandi nei due delitti era lo stesso ed il gruppo sanguigno (gruppo nei due delitti era lo stesso ed il gruppo sanguigno (gruppo A), determinato dalle tracce di liquido seminale, era il medesimo.A), determinato dalle tracce di liquido seminale, era il medesimo.
1986: Richard Buckland, un ragazzo del posto, venne incriminato dei due 1986: Richard Buckland, un ragazzo del posto, venne incriminato dei due delitti, ma l’analisi del DNA mediante fingerprinting rivelò che egli era delitti, ma l’analisi del DNA mediante fingerprinting rivelò che egli era innocente.innocente.
Circa 5000 individui nel Leichestershire possedevano il gruppo sanguigno A. Circa 5000 individui nel Leichestershire possedevano il gruppo sanguigno A. Si organizzò uno screening di massa ed in nessun caso il DNA fingerprinting Si organizzò uno screening di massa ed in nessun caso il DNA fingerprinting dei 5000 individui corrispondeva a quello dell’assassino.dei 5000 individui corrispondeva a quello dell’assassino.
1987: Per un puro caso, si venne a sapere che una persona del posto, un 1987: Per un puro caso, si venne a sapere che una persona del posto, un certo Colin Pitchfork, aveva chiesto ad un amico ed ottenuto di partecipare certo Colin Pitchfork, aveva chiesto ad un amico ed ottenuto di partecipare allo screening in sua vece.allo screening in sua vece.
Il signor Pitchfork venne invitato a donare il sangue ed il profilo del suo DNA Il signor Pitchfork venne invitato a donare il sangue ed il profilo del suo DNA risultò identico a quello del DNA raccolto sulla scena dei due delitti.risultò identico a quello del DNA raccolto sulla scena dei due delitti.
MinisatellitiMinisatelliti
I minisatelliti sono una classe di DNA ripetuto in tandem, con un motivo ripetuto di 8-100 basi ed un numero di ripetizioni spesso molto elevato (fino a 1000).
Breve storia della genetica forense
Sono localizzati in tutto il genoma umano, preferenzialmente nelle regioni subtelomeriche.
Il polimorfismo consiste nel diverso numero di ripetizioni in tandem (alleli) presenti nello stesso minisatellite.
Il numero degli alleli è spesso nell’ordine delle decine (sempio di sistema multiallelico).
Minisatelliti: la tecnica del «DNA fingerprinting»Minisatelliti: la tecnica del «DNA fingerprinting»
Breve storia della genetica forense
Il metodo per evidenziare la variabilità dei minisatelliti si basa sulla tecnica «southern blotting». Si utilizza una sonda che riconosce un motivo “core” comune a più minisatelliti, e che permette quindi di evidenziare più minisatelliti contemporaneamente.
Il DNA fingerprintingIl DNA fingerprinting
Introdotto da Alec Jeffreys nel Introdotto da Alec Jeffreys nel 1985. Il DNA viene estratto, 1985. Il DNA viene estratto, digerito con enzimi di restrizione, digerito con enzimi di restrizione, sottoposto ad elettroforesi, sottoposto ad elettroforesi, denaturato e trasferito su denaturato e trasferito su membrana (southern blotting). membrana (southern blotting). Quindi viene utilizzata una sonda Quindi viene utilizzata una sonda multi-locus “core” minisatellite multi-locus “core” minisatellite marcata con radioattivo per marcata con radioattivo per l’ibridazione. l’ibridazione.
Il segnale radioattivo viene Il segnale radioattivo viene rivelato mediante esposizione di rivelato mediante esposizione di una lastra sensibile ai raggi Xuna lastra sensibile ai raggi X
Alec Jeffreys
VantaggiVantaggi e e limitazionilimitazioni::
Potere di discriminazione molto elevatoPotere di discriminazione molto elevato
Sensibilità limitata (>50-500 ng)Sensibilità limitata (>50-500 ng)
Tecnica time-consumingTecnica time-consuming
Non automatizzabileNon automatizzabile
Elevato peso molecolare: non adatto Elevato peso molecolare: non adatto per campioni degradatiper campioni degradati
Differenti alleli difficili da distinguereDifferenti alleli difficili da distinguere
Problemi per l’interpretazione statisticaProblemi per l’interpretazione statistica
Minisatelliti: esempio di «DNA fingerprinting»Minisatelliti: esempio di «DNA fingerprinting»
Breve storia della genetica forense
Note sulla nomenclatura: ambiguità relativa ai termini RFLP, VNTR, DNA fingerprinting
Introduzione di sonde che riconoscono un solo locus
Minisatelliti: esempio di «DNA fingerprinting»Minisatelliti: esempio di «DNA fingerprinting»
Breve storia della genetica forense
DNA fingerprinting di una famiglia. E’ stata utilizzata una sonda multicolus di tipo (GTG)5
La tecnica della reazione a catena della polimerasi ha rivoluzionato il modo di fare ricerca in diversi settori della genetica e della biologia molecolare.
In ambito forense, l’introduzione della PCR ha rappresentato un punto di svolta fondamentale, permettendo di risolvere un problema molto ricorrente nelle indagini criminali:La scarsa quantità di DNA che può essere estratta dalla maggior parte dei reperti.
1985: viene descritta la tecnica PCR1985: viene descritta la tecnica PCR1990: la tecnica PCR viene accolta in ambito forense1990: la tecnica PCR viene accolta in ambito forense
Breve storia della genetica forense
1990: la prima tecnica basata su PCR accolta in ambito forense1990: la prima tecnica basata su PCR accolta in ambito forense
Il sistema polimorfico Human Leucocite Antigen (HLA) Il sistema polimorfico Human Leucocite Antigen (HLA) DQA1DQA1
Breve storia della genetica forense
La tecnica (reverse dot blot)1)Amplificazione mediante PCR di una porzione del gene DQA1. I primers sono marcati con biotina.2)Ibridazione del prodotto PCR con oligo «allele specifici» fissati su una strip di membrana di nylon.
3) Lavaggio ad elevata stringenza: rimangono sulla membrana solo i prodotti PCR con sequenze perfettamente complementari ai relativi oligo.
4) Rivelazione mediante sistema streptavidina/biotina
1990: la prima tecnica basata su PCR accolta in ambito forense1990: la prima tecnica basata su PCR accolta in ambito forense
Il sistema polimorfico Human Leucocite Antigen (HLA) DQA1Il sistema polimorfico Human Leucocite Antigen (HLA) DQA1
Breve storia della genetica forense
Nel sistema «DQ amplyTaq» erano presenti inizialmente 9 sonde in grado di distinguere 6 alleli, per un totale di 21 differenti genotipi (pannelo “a” in figura)
Un kit prodotto successivamente (Amplitype PM + DQA1) permetteva di discriminare un ulteriore allele in DQA (4.1 vs 4.2,4.3) e al tempo stesso permetteva di conoscere il genotipo di altri 5 sistemi polimorfici, due triallelici e tre biallelici (pannello “b” in figura, dove è mostrato il genotipo per una linea cellulare -9948- utilizzata come standard).
Vantaggi e svantaggi:- Metodo semplice e rapido- Elevata sensibilità (PCR)- Potere di discriminazione relativamente basso (circa 1/10000)
1994: Il minisatellite D1S801994: Il minisatellite D1S80(un minisatellite amplificabile mediante PCR)(un minisatellite amplificabile mediante PCR)
Breve storia della genetica forense
L’introduzione del kit Amplitype D1S80 rispondeva a due esigenze fondamentali in ambito genetico forense:
-La possibiltà di analizzare quantità minime di DNA mediante PCR
-La necessità di avere a disposizione marcatori multiallelici e caratterizzati da un elevato grado di eterozigosità (maggiore dei sistemi DQA1).
Il minisatellite presenta una unità ripetitiva di 16 basi (corta per essere un minisatellite) con più di venti alleli caratterizzati da un numero di ripetizioni nel range 14-41. L’intero prodotto PCR varia da circa 400 bp (alleli più corti) a circa 800 bp (alleli più lunghi).
Il minisatellite D1S80Il minisatellite D1S80(un minisatellite amplificabile mediante PCR)(un minisatellite amplificabile mediante PCR)
Breve storia della genetica forense
Vantaggi e svantaggi:-Metodo relativamente semplice (PCR + elettroforesi)-Elevata sensibilità (PCR)-Potere di discriminazione elevato (per un singolo locus)-La presenza di alleli multipli facilita l’interpretazione delle «misture»-Range bp del prodotto PCR troppo grande (problemi con DNA degradato)-Difficoltà per l’analisi in multiplex e per l’automazione
1995-present: MICROSATELLITI1995-present: MICROSATELLITI
Breve storia della genetica forense(fine)
L’introduzione dei microsatelliti in ambito forense verso la metà degli anni ’90 portò alla rapida «estinzione» dei marcatori utilizzati in precedenza. Dal 1995 ad oggi i microsatelliti autosomici sono rimasti i marcatori di elezione in ambito forense, ed è opinione diffusa (sebbene non da tutti condivisa) che lo rimarranno per sempre.Ciò nonostante, altri tipi di marcatori e sistemi polimorfici vengono oggi utilizzati in casi forensi specifici:
- Variazione di sequenza del DNA mitocondriale - Microsatelliti del cromosoma Y e del cromosoma X- SNPs
Questi sistemi polimorfici, assieme ai microsatelliti, saranno trattati in dettaglio in lezioni dedicate
Confronto tra sistemi polimorfici utilizzati in ambito genetico forense nel XX secolo (variabilità vs. rapidità
analisi)
Speed of Analysis (Technology)
Power of Discrimination
(Genetics)
Low
High
Slow Fast
RFLPSingle Locus Probes
RFLPMulti-Locus Probes
ABO blood groups
Multiplex STRs
DQsingle STR
D1S80mtDNA
PolyMarker
Figure 1.1, J.M. Butler (2005) Forensic DNA Typing, 2nd Edition © 2005 Elsevier Academic Press
Breve storia della genetica forense(fine)
In qualsiasi tipo di applicazione (forense, evolutiva, mappatura, diagnostica) che coinvolga dei marcatori genetici polimorfici sono disponibili (o sono stati disponibili) diversi tipi di marcatori. Storicamente, nelle diverse discipline alcuni marcatori sono stati preferiti ad altri, che sono caduti in disuso. La scelta dei marcatori si basa (o si è basata storicamente) su una serie di caratteristiche dei marcatori, che possono essere di tipo biologico o tecnico:
• localizzazione nel genoma• tasso di mutazione• grado di eterozigosità• numero di alleli• ereditarietà mendeliana • sensibilità del metodo• precisione del metodo• possibilità di analisi multiple• possibilità di standardizzazione• tempi tecnici dell’esperimento• costi dell’attrezzatura• costi dell’esperimento
Caratteristiche biologiche
Caratteristiche tecniche
Natura molecolare dei microsatellitiNatura molecolare dei microsatelliti
I microsatelliti sono una classe di DNA ripetuto in tandem (VNTR, variable number of tandem repeats) caratterizzato da un piccolo numero di ripetizioni corte in tandem.
Sono comuni nel DNA nucleare di tutti gli eucarioti fino ad ora esaminati (circa 1/10 mila basi)
Nei primati rappresentano circa 1% del genoma
Esempio di microsatellite utilizzato in ambito genetico forense: D16S539
I microsatelliti possono essere perfetti, interrotti o composti e vengono ulteriormente classificati in base alla lunghezza del motivo ripetuto (dinucleotide repeats, trinucleotide repeats ecc..)
perfetti
interrotti
composti
Natura molecolare dei microsatellitiNatura molecolare dei microsatelliti
I microsatelliti sono distribuiti in modo abbastanza omogeneo nel DNA nucleare dove si ritrovano sia sugli autosomi che nei cromosomi sessuali. Nei primati rappresentano circa 1% del genoma. Non sono invece presenti nel mtDNA umano
Distribuzione dei microsatellitiDistribuzione dei microsatelliti
L’elevato tasso di mutazione nei microsatelliti è L’elevato tasso di mutazione nei microsatelliti è dovuto a scivolamento della polimerasi in dovuto a scivolamento della polimerasi in replicazionereplicazione
•Tasso di mutazione molto elevato:
•10-2 – 10-4 mutazioni/STR/generazione
•La mutazione avviene generalmente per aumento o diminuzione di una singola unità ripetitiva
•Mutazioni per aumento più frequenti di mutazioni per diminuzione
•Il tasso di mutazione per ciascun microsatellite è positivamente correlato con la lunghezza dell’allele
Mutazione nei microsatellitiMutazione nei microsatelliti
• Il polimorfismo nei microsatelliti consiste nel diverso numero di copie del motivo semplice
• il numero degli alleli è generalmente compreso tra 4 e 40
• il grado di variabilità dei microsatelliti è correlato positivamente con il numero di ripetizioni; microsatelliti corti sono in genere monomorfici
• A causa dell’elevato tasso di mutazione, gli alleli dei microsatelliti uguali in stato spesso non lo sono per discendenza (CORSO EVOL. MOLECOLARE)
• Microsatelliti interrotti in genere mostrano un grado minore di variabilità di microsatelliti perfetti di pari lunghezza
• La mutazione nei microsatelliti generalmente non ha effetti fenotipici, ma in alcuni casi è causa di importanti malattie, in gran parte neuro-degenerative (CORSO GENETICA UMANA)
Variabilità genetica dei microsatellitiVariabilità genetica dei microsatelliti
I microsatelliti in ambito forense
«Il microsatellite ideale»(nella genetica forense)
1) Microsatellite con elevata eterozigosità2) Microsatellite con range allelico contenuto3) Microsatellite amplificabile in corti prodotti PCR 4) Microsatellite i cui alleli siano ben separabili su gel5) Microsatellite che presenti un ridotto fenomeno di
stuttering6) Microsatellite con tasso di mutazione contenuto7) Microsatellite situato su autosomi
Molte di queste caratteristiche si escludono vicendevolmente:Qual è un ragionevole compromesso?
Tetranucleotide repeats selezionati
I microsatelliti in ambito forenseNecessità di identificare un set unico (core) di microsatelliti
che sia condiviso da tutta la comunità genetico forense.
Pannello di 13 microsatelliti «core» (in giallo) secondo il CODIS, USA
CODIS (Combined DNA Index System)Programma dell’FBI in supporto alla giustizia attraverso l’utilizzazione di databases di profili genetici.
In UK e alcuni altri stati Europei si utilizza un core di 10 STR, 8 dei quali in comune con il CODISI 13 microsatelliti furono scelti nel 1997 a partire da 17 loci candidati, in
base alla loro variabilità e facilità di interpretazione dei risultati. I 13 loci sono tutti «tetranuceotide repeats», sia semplici che composti. L’analisi dei 13 loci del CODIS porta a profili genetici la cui probabilità di random match media è minore di 1 su un milione di milioni (10-12) .
I microsatelliti in ambito forenseNecessità di identificare un set unico (core) di microsatelliti
che sia condiviso da tutta la comunità genetico forense.
I kit commerciali sviluppati da Applied Biosystems (a sinistra) e Promega (sotto) permettono di amplificare i 13 STR «core» del CODIS più alcuni altri STR. I kit commerciali sono in continua «evoluzione» inseguendo le richieste della comunità forense (>loci, mini STR, Y-STR , STR ipervariabili ecc.)
I kit commerciali sono in continua «evoluzione» inseguendo le richieste della comunità forense ( maggior numero di loci coamplificabili, mini STR, Y-STR , STR ipervariabili ecc.)
Nomenclatura dei microsatelliti (e dei loro alleli)
Necessità di fare riferimento ad una nomenclatura univoca per permettere il confronto tra laboratori e con i diversi database
Nomenclatura degli alleli:
(1) Scelta del filamento- Se il microsatellite è in un gene, si prende in considerazione il filamento codificante- Se il microsatellite non è in un gene, si prende in considerazione il filamento corrispondente alla sequenza originariamente descritta in letteratura e riportata in un database pubblico.
La direzione di lettura è sempre, ovviamente, 5’-3’ 1 2 3 4 5 65’-TTTCCC TCAT TCAT TCAT TCAT TCAT TCAT TCACCATGGA-3’3’-AAAGGG AGTA AGTA AGTA AGTA AGTA AGTA AGTGGTACCT-5’
6 5 4 3 2 1
Nomenclatura dei microsatelliti (e dei loro alleli)
(2) Nome del motivo ripetuto.Nell’esempio riportato sotto, potremmo parlare di un microsatellite di tipo (TCAT)n oppure (CATT)n oppure (ATTC)n o ancora (TTCA)n
(TCAT)n
(3) «Microvarianti». Alleli con motivi ripetuti incompleti devono includere il numero di ripetizioni complete e, separate da un punto, il numero di basi nella ripetizione incompleta. Esempio 9.3; 14.2 ecc.
1 2 3 4 5 65’-TTTCCC TCAT TCAT TCAT TCAT TCAT TCAT TCACCATGGA-3’3’-AAAGGG AGTA AGTA AGTA AGTA AGTA AGTA AGTGGTACCT-5’
6 5 4 3 2 1
Generare un profilo Generare un profilo STRSTR
1. Estrazione e quantificazione del DNA1. Estrazione e quantificazione del DNA (attenzione: questi steps in genetica forense sono di fondamentale importanza e sono successivi ad uno step di (attenzione: questi steps in genetica forense sono di fondamentale importanza e sono successivi ad uno step di
caratterizzazione del campione – vedi lezioni Maggiore Iacovacci) caratterizzazione del campione – vedi lezioni Maggiore Iacovacci)
Contenuto in DNA nucleare dei campioni biologici:Tipo di campione Quantità di DNASangue 30000 ng/mLmacchia 1 cm2 200 ngmacchia 1 mm2 2 ng
Liquido seminale 250000 ng/mLtampone vaginale postcoitale 0 - 3000 ng/tampone
Capellicapello strappatocapello perso
1 - 750 ng/capello 1 - 12 ng/capello
SalivaUrineCellula umana diploide
10000 ng/mL 1 - 20 ng/mL ~5 pg
Amplificare tramite PCR Amplificare tramite PCR contemporaneamente più microsatelliti contemporaneamente più microsatelliti (multiplex), utilizzando primers (multiplex), utilizzando primers fiancheggianti ciascun locus.fiancheggianti ciascun locus.
Generare un profilo STR:Generare un profilo STR:
2. Amplificazione mediante PCR multiplex2. Amplificazione mediante PCR multiplex
Per ottenere buoni risultati i primers devono essere scelti con attenzione:Per ottenere buoni risultati i primers devono essere scelti con attenzione:-Le temperature di annealing dei vari primers devono essere similiLe temperature di annealing dei vari primers devono essere simili-Devono essere valutate e minimizzate le possibili interazioni tra primers, Devono essere valutate e minimizzate le possibili interazioni tra primers, anche appartenenti a coppie diverse (esempio complementarietà al 3’)anche appartenenti a coppie diverse (esempio complementarietà al 3’)-Una valutazione sperimentale della concentrazione ottimale dei singoli Una valutazione sperimentale della concentrazione ottimale dei singoli primers è sempre necessaria quando si mette a punto una nuova multiplex, primers è sempre necessaria quando si mette a punto una nuova multiplex, così come una titolazione dei vari componenti della PCR. così come una titolazione dei vari componenti della PCR.
PRESENZA DI INIBITORI: I reperti biologici possono essere mescolati con PRESENZA DI INIBITORI: I reperti biologici possono essere mescolati con inibitori della PCR di tipo organico ed inorganico che non sempre vengono inibitori della PCR di tipo organico ed inorganico che non sempre vengono eliminati efficacemente negli step di purificazione del DNA.eliminati efficacemente negli step di purificazione del DNA.
Ulteriore purificazione, BSA, diluzioneUlteriore purificazione, BSA, diluzione
CONTAMINAZIONE IN LABORATORIO O IN FASE DI REPERTAZIONE: CONTAMINAZIONE IN LABORATORIO O IN FASE DI REPERTAZIONE:
a causa della sua elevata sensibilità, la PCR presenta un forte problema legato a causa della sua elevata sensibilità, la PCR presenta un forte problema legato alla contaminazione, in misura tanto maggiore quanto più il DNA in esame è alla contaminazione, in misura tanto maggiore quanto più il DNA in esame è scarso e/o degradato. scarso e/o degradato.
Utilizzazione di guanti monouso e mascherine (in lab e in repertazione)Utilizzazione di guanti monouso e mascherine (in lab e in repertazione)
Strumentazione e spazi pre- e post- PCR separati;Strumentazione e spazi pre- e post- PCR separati;
Utilizzazione di puntali monouso con filtroUtilizzazione di puntali monouso con filtro
Irradiazione con UV dell’area dedicata alla preparazione della PCRIrradiazione con UV dell’area dedicata alla preparazione della PCR
Creazione di un database di profili genetici del personale del laboratorioCreazione di un database di profili genetici del personale del laboratorio
Generare un profilo STR:Generare un profilo STR:
2. Amplificazione mediante PCR multiplex2. Amplificazione mediante PCR multiplexProblemi in ambito forenseProblemi in ambito forense
Generare un profilo STR:Generare un profilo STR:
3. sequenziamento mediante elettroforesi 3. sequenziamento mediante elettroforesi capillarecapillare
Contribution of the Contribution of the National Institute of National Institute of Standards and Standards and Technology, 2010Technology, 2010
Laser
InletBuffer
Capillary filled with polymer solution
5-20 kV- +
OutletBuffer
Sample tray
Detection window
(cathode) (anode)
Data Acquisition
Sample tray moves automatically beneath the cathode end of the capillary to deliver each sample in succession
Prodotto PCR fluorescente viene Prodotto PCR fluorescente viene denaturato con formammide e denaturato con formammide e posto nel campionatoreposto nel campionatore
Si applica voltaggio elettrico Si applica voltaggio elettrico Il prodotto PCR viene Il prodotto PCR viene elettroiniettato nel capillareelettroiniettato nel capillare
Quando il frammento arriva in Quando il frammento arriva in corrispondenza di una finestra corrispondenza di una finestra nel capillare, una sorgente nel capillare, una sorgente laser eccita il fluorocromo laser eccita il fluorocromo legato al prodotto PCRlegato al prodotto PCR
DetectorWindow
Generare un profilo STR:Generare un profilo STR:
3. sequenziamento mediante elettroforesi capillare: 3. sequenziamento mediante elettroforesi capillare:
Il DNA migra nel polimero contenuto nel Il DNA migra nel polimero contenuto nel capillare; tanto più velocemente quanto capillare; tanto più velocemente quanto minore è la grandezza del frammentominore è la grandezza del frammento
Il fluorocromo eccitato dal laser emette luce nel visibile, Il fluorocromo eccitato dal laser emette luce nel visibile, in un determinato intervallo di lunghezze d’onda (vedi in un determinato intervallo di lunghezze d’onda (vedi dia succ.) e con una intensità che è proporzionale alla dia succ.) e con una intensità che è proporzionale alla quantità di molecole di fluorocromo eccitate. quantità di molecole di fluorocromo eccitate. La luce emessa viene filtrata per determinati range di La luce emessa viene filtrata per determinati range di lunghezza d’onda e convertita in un segnale elettrico che lunghezza d’onda e convertita in un segnale elettrico che viene misurato in RFUs (Relative Fluorescence Units). viene misurato in RFUs (Relative Fluorescence Units). I segnali elettrici vengono tradotti nei tipici picchi I segnali elettrici vengono tradotti nei tipici picchi colorati degli elettroferogrammi.colorati degli elettroferogrammi.
Generare un profilo STR:Generare un profilo STR:
3. sequenziamento mediante elettroforesi capillare 3. sequenziamento mediante elettroforesi capillare (segue) (segue)
CCD Panel (with virtual filters)
Argon ion LASER (488
nm)
ColorSeparation
Fluorescence
ABI Prism spectrograph
Processing with GeneScan/Genotyper software
Sample Interpretation
Sample Detection
Capillary(filled with
polymer solution)
520 540 560 580 600 620 640WAVELENGTH (nm)
100
80
60
40
20
0
310 Filter Set F with color contributions
5-FAM JOE NED ROX
Laser excitation(488 nm, 514.5 nm)Laser excitation(488 nm, 514.5 nm)
Norm
aliz
ed F
luore
scent
Inte
nsi
tySpettri di emissione dei fluorocromi Applied B. in uso nel kit AmpFlSTR.
I filtri virtuali sono rappresentati dalle quattro colonne nere centrate sul picco dello spettro di ciascuno dei 4 fluorocromi.
A causa della sovrapposizione degli spettri, una matrice di deconvoluzione (4 x 4) deve essere utlizzata per una corretta interpretazione dei dati. (Butler 2010 Figura 9.8)
Generare un profilo STR:Generare un profilo STR:4. interpretazione dei dati del sequenziamento: dati grezzi4. interpretazione dei dati del sequenziamento: dati grezzi
D3 vWA FGA
D8 D21 D18
D5 D13 D7
Am
RAW DATARAW DATA
PROCESSED DATAPROCESSED DATA
•Il software GENESCAN divide I dati grezzi in un elettroferogramma separato per ciascun colore
•Blue•Green•Yellow•Red
•Il software GENOTYPER identifica i differenti loci e per ciascuno di essi riconosce gli alleli facendo riferimento ad uno standard di peso molecolare e ad un ladder allelico (vedi dia successive)
Ladder allelicoLadder allelico
(a) Ladder kit “PowerPlex ESI 17”
(b) Ladder kit “Identifiler”
Ladder allelico per il locus D16S539 prodotto da Promega (a) e Applied Biosystems (b)
Allelic ladder PCR-amplified sample
Internal size standard Internal size standard
Co
lor-
sep
arat
ed a
nd
siz
ed
alle
le p
eaks
fo
r ea
ch l
ocu
s
10 11 12 13 14 15
Data from CE instrument (prior to color separation
and peak sizing)
Il genotipo di un campione siottiene mediante confronto del profilo con quello di un ladder
allelico
Color separation and peak
sizing
Color separation and peak
sizingLocus 1
Genotype = 12, 14
All ladder alleles sized
using internal size standard
All sample alleles sized
using internal size standard
Genotyping allele bins(+/-0.5 bp around ladder allele)
Alleles (# repeats)
Joh
n M
. B
utle
r (2
00
9)
Fu
nd
am
ent
als
of F
ore
nsi
c D
NA
Typ
ing
, Fig
ure
10
.4
Peak Color Separation and Sizing and STR Genotyping
Contribution of the National Institute of Standards and Technology, 2010
Data Collection
Peak Identification
Data Review by Analyst/Examiner
Color Separation
Peak Sizing
Comparison to Allelic Ladder
Confirmation of Results by Second Analyst/Examiner
Genotype Assign. to Alleles
GeneScan software
Genotyper software
Internal size standard
Matrix file (spectral calibration)
Allelic ladder sample
GeneMapperID
software
Expert Systems (e.g., FSS-i3, TrueAllele)
Peak Editing to Remove Artifact Calls
User-defined thresholds
La probabilità di match casuale La probabilità di match casuale “la regola del prodotto” “la regola del prodotto”
Il peso di una corrispondenza (match) tra un profilo di Il peso di una corrispondenza (match) tra un profilo di DNA Q ed il profilo di un sospettato K è «quantificato» DNA Q ed il profilo di un sospettato K è «quantificato» in termini di probabilità. in termini di probabilità.
Ovvero: qual’è la probabilità che un profilo come quello Ovvero: qual’è la probabilità che un profilo come quello creato a partire dal materiale biologico rinvenuto creato a partire dal materiale biologico rinvenuto corrisponda al profilo genetico di un individuo scelto a corrisponda al profilo genetico di un individuo scelto a caso dalla popolazione?caso dalla popolazione?
Si applica la regola statistica del prodotto per eventi Si applica la regola statistica del prodotto per eventi indipendenti. Si assume che la probabilità dei singoli indipendenti. Si assume che la probabilità dei singoli eventi (genotipi) corrisponda alla frequenza attesa del eventi (genotipi) corrisponda alla frequenza attesa del genotipo in questione in una popolazione che sia genotipo in questione in una popolazione che sia all’equilibrio di Hardy-Weinbergall’equilibrio di Hardy-Weinberg
Prima di vedere come calcolare questa probabilità, è Prima di vedere come calcolare questa probabilità, è necessario (ri)prendere in con siderazione alcuni necessario (ri)prendere in con siderazione alcuni concetti base di genetica delle popolazioniconcetti base di genetica delle popolazioni
BREVE (MA FONDAMENTALE) INCISOBREVE (MA FONDAMENTALE) INCISO
Per la loro rilevanza in ambito genetico forense, nelle 5 Per la loro rilevanza in ambito genetico forense, nelle 5 slides a seguire si parlerà di:slides a seguire si parlerà di:
Frequenze allelicheFrequenze alleliche Frequenze genotipicheFrequenze genotipiche
Equilibrio di Hardy - Weinberg Equilibrio di Hardy - Weinberg
Un allele è una variazione ad un locus
La frequenza allelica è la frequenza di un certo allele in una popolazione.Es. Popolazione composta da
20 omozigoti CC45 eterozigoti CT35 omozigoti TT
Frequenza allele C = (20 x 2 + 45)/ 2x100 = 0.425Frequenza allele T = (35 x 2 + 45)/ 2x100 = 0.575
ad esempio
Allele 1: CCGCTACGTACGGCGATCGATGGCGGCCACGCTCGCGATCGCTACGCTAAllele 2: CCGCTACGTACGGCGATCGATGGCGGCTACGCTCGCGATCGCTACGCTA
Eterozigosità della popolazione per il locus in esame = 1-0.4252-0.5752 = 0.489
Esempio: Frequenze genotipiche e frequenze alleliche del locus STR D13S317 nella popolazione caucasuica americana:
Equilibrio di Hardy-Weinberg
Assunzioni:• accoppiamento casuale • no mutazione • no migrazione• no selezione• popolazione infinita
(no deriva genetica)
= p2
= q2
= 2pq
AA
Aa
aa
sia p la frequenza di A ,
e q la frequenza di a .
Le frequenze genotipiche raggiungono l’equilibrio in una generazione;Le frequenze alleliche rimangono costanti nel tempo
All’equilibrio:
Le popolazioni raggiungono l’equilibrio di Hardy-Weinberg in una generazione
A1A1 A1A2 A2A2
Non in equilibrio
A1A1 A1A2 A2A2
0.6 0 0.4
In equilibrioA1A1 A1A2 A2A2
0.36 0.48 0.16
Generazione successiva
p2 2pq q2
Hardy-Weinberg equilibrium
Nelle popolazioni naturali, le frequenze genotipiche sono quasi sempre in equilibrio di Hardy-Weinberg
http://www.micro.utexas.edu/courses/levin/bio304/popgen/popgen.html
Frequenza allelica
Fre
quen
za g
enot
ipic
a
Equilibrio di Hardy-Weinberg
Probabilità di match Probabilità di match casualecasuale
0.222 x 0.222 x 2
= 0.1
Locus D3S1358
Probabilità di match: la regola del Probabilità di match: la regola del prodottoprodotto
1 in 79,531,528,960,000,000
1 in 10 1 in 111 1 in 20
1 in 22,200
x x
1 in 100 1 in 14 1 in 81
1 in 113,400
x x
1 in 116 1 in 17 1 in 16
1 in 31,552
x x
La legge di H-W e la misura di La legge di H-W e la misura di variabilità dei sistemi polimorficivariabilità dei sistemi polimorfici
La maggior parte delle misure di variabilità dei singoli marcatori La maggior parte delle misure di variabilità dei singoli marcatori genetici si basa sulla legge di Hardy-Weinberg.genetici si basa sulla legge di Hardy-Weinberg.
(1) L’eterozigosità (H)(1) L’eterozigosità (H)corrisponde (se non diversamente specificato) alla proporzione di corrisponde (se non diversamente specificato) alla proporzione di genotipi eterozigoti in una popolazione che sia all’equilibrio H-W genotipi eterozigoti in una popolazione che sia all’equilibrio H-W (eterozigosità attesa)(eterozigosità attesa)
Se Se pp e e qq sono le frequenze alleliche di un sono le frequenze alleliche di un sistema biallelicosistema biallelico, allora , allora l’eterozigosità è il l’eterozigosità è il ben notoben noto prodotto prodotto 2pq2pq
Se il sistema è Se il sistema è multiallelico multiallelico con con ii alleli, indicate con alleli, indicate con ppii le le frequenze degli alleli, l’eterozigosità corrisponde afrequenze degli alleli, l’eterozigosità corrisponde a
1-∑1-∑ppii22
La legge di H-W e la misura di La legge di H-W e la misura di variabilità dei sistemi polimorficivariabilità dei sistemi polimorfici
La maggior parte delle misure di variabilità dei singoli La maggior parte delle misure di variabilità dei singoli marcatori genetici si basa sulla legge di Hardy-Weinberg.marcatori genetici si basa sulla legge di Hardy-Weinberg.
(2) Probabilità di identità (matching probability)(2) Probabilità di identità (matching probability) Considerato un locus, corrisponde alla probabilità che due Considerato un locus, corrisponde alla probabilità che due individui «estratti» a caso dalla popolazione presentino lo individui «estratti» a caso dalla popolazione presentino lo stesso genotipo. stesso genotipo.
Questa probabilità è pari alla sommatoria del quadrato delle Questa probabilità è pari alla sommatoria del quadrato delle frequenze dei singoli genotipi frequenze dei singoli genotipi (perché?)(perché?)..
In una popolazione all’equilibrio H-W, considerando un sistema In una popolazione all’equilibrio H-W, considerando un sistema polimorfico con polimorfico con ii alleli, indicate con alleli, indicate con ppii le frequenze degli alleli, le frequenze degli alleli, e con e con XXii la frequenza dei genotipi, questa probabilità la frequenza dei genotipi, questa probabilità corrisponde a:corrisponde a:
La legge di H-W e la misura di La legge di H-W e la misura di variabilità dei sistemi polimorficivariabilità dei sistemi polimorfici
La maggior parte delle misure di variabilità dei singoli La maggior parte delle misure di variabilità dei singoli marcatori genetici si basa sulla legge di Hardy-Weinberg.marcatori genetici si basa sulla legge di Hardy-Weinberg.
(3) Potere di esclusione (probabilità di esclusione)(3) Potere di esclusione (probabilità di esclusione) Considerato un locus, misura quanto un locus sia «potente» Considerato un locus, misura quanto un locus sia «potente» nel discriminare tra genotipi di una popolazione, e nel discriminare tra genotipi di una popolazione, e corrisponde alla probabilità di «estrarre» a caso dalla corrisponde alla probabilità di «estrarre» a caso dalla popolazione due individui che presentino genotipi diversi. popolazione due individui che presentino genotipi diversi.
Questa probabilità corrisponde al complemento ad uno della Questa probabilità corrisponde al complemento ad uno della probabilità di identità : probabilità di identità :
PD = 1 PI
U.S. Caucasians, STR D13S317
H = 0.7845PD = 0.8896PI = 0.1104
Indici di diversità al locus D13S317Indici di diversità al locus D13S317
Nota: fare attenziona alla differenza tra:(1) probabilità di match casuale tra genotipo Q e genotipo casuale della popolazione (corrisponde alla frequenza nella popolazione del genotipo Q) e (2) probabilità di identità (PI) per l’intero locus (sempre di probabilità di match si tratta).
La legge di H-W e la misura di La legge di H-W e la misura di variabilità dei sistemi polimorficivariabilità dei sistemi polimorfici
Esercitasi nel calcolo dei vari indici in uso in genetica forense(più avanti vedremo anche l’indice di paternità)
Ipotetico locus biallelicop = q = 0.5H = 0.5 (val. max per locus biallelico)PD = 0.625 (val max per locus biallelico)PI = 0.375 (val min per locus biallelico)
Ipotetico locus multiallelico10 alleli di uguale frequenzaH = 0.90PD = 0.981PI = 0.019
Problemi nell’interpretazione di profili Problemi nell’interpretazione di profili STRSTR
Purtroppo, non sempre si ottiene un risultato di facile interpretazione come quello dell’esempio utlizzato per valutare la probabilità di match casuale
Problemi nell’interpretazione di profili Problemi nell’interpretazione di profili STRSTR
A. Problemi «biologici»
A.1: prodotti «stutter».
Come conseguenza dello scivolamento della polimerasi nell’amplificare durante la PCR ripetizioni in tandem (fenomeno analogo a quello che porta alla mutabilità in natura dei microsatelliti) si ottengono alcuni prodotti PCR più corti di un’unità rispetto al numero di ripetizioni dell’allele amplificato.
In genere, il prodotto dello stuttering ha un’altezza inferiore al 20% del picco «reale» (almeno per i loci validati in ambito forense).Punti da considerare: - differenze tra loci, - differenze per lo stesso locus in esperimenti diversi,- possibili problemi nell’interpretazione di tracce miste.
Problemi nell’interpretazione di profili Problemi nell’interpretazione di profili STRSTR
A. Problemi «biologici»
A.2: Pattern «multiallelici»
Sono generalmente conseguenza della duplicazione (intra- inter- cromosomica) della regione che contiene uno dei microsatelliti della multiplex. Per quanto si tratti di un fenomeno raro (almeno nei microsatelliti forensi standard) sono state riportate in letteratura decine di differenti pattern triallelici.
Punti da considerare:-Differenza rispetto alle misture di campioni-Problemi per il calcolo delle probabilità
12
31 2 3
Type 1sbilanciata
Type 2bilanciata
Problemi nell’interpretazione di profili Problemi nell’interpretazione di profili STRSTR
A. Problemi «biologici»
A.3: Aggiunta di adenina al 3’ incompleta
La Taq polimerasi in genere aggiunge al 3’ del filamento PCR neosintetizzato un’adenina. Le multiplex STR sono ottimizzate in modo che questo avvenga regolarmente. Può accedere tuttavia in alcuni casi che si verifichi una adenilazione incompleta dei prodotti PCR, che da luogo, per ciascun allele) a due picchi distanziati di una sola base nell’elettroferogramma.
Punti da considerare:Un picco più corto di una base rispetto al normale potrebbe essere interpretato come una «microvariante»
Incomplete adenylation
D8S1179
-A
+A
-A
+A
Problemi nell’interpretazione di profili Problemi nell’interpretazione di profili STRSTR
A. Problemi «biologici»
A.4: Alleli «off ladder»
below ladder between-ladder(microvariante)
Allelic ladder Allelic ladder Allelic ladder
above ladder
Sono alleli che presentano un numero minore (alleli “below ladder”) o maggiore (“above ladder”) di ripetizioni di quante ne siano presenti nei ladder commerciali per multiplex STR. Sono considerati “off ladder” anche gli alleli con una lunghezza dell’amplicone PCR tale da ricadere tra due alleli del ladder (microvarianti o alleli “between ladder”), generalmente dovuti a piccole inserzioni delezioni nell’amplicone.
Problemi nell’interpretazione di profili Problemi nell’interpretazione di profili STRSTR
A. Problemi «biologici»
A.5: Alleli nulli
In presenza di una mutazione al 3’ del sito di annealing di uno dei due primers utilizzati per amplificare un STR, la Taq polimerasi non è in grado di sintetizzare il prodotto PCR. La conseguenza può essere quella che solo uno dei due alleli STR vengono amplificati. (vedi slide successiva per figura)
Punti da considerare:-Kit differenti per STR multiplex con diversi set di primers -Problemi per il confronto con databases: stringenza della ricerca di match-Problemi nei test di paternità
Contribution of the National Institute of Standards and Technology, 2010
*
*
8
86
6 8
Allele 6 amplicon has ‘dropped out’
Imbalance in allele peak heights
Heterozygous alleles are well balanced
No mutation
Mutation at 3’-end of primer binding site (allele dropout)
Mutation in middle of primer
binding site
(a)
(b)
(c)
Alleli nulli o sbilanciati dovuti a mutazioni nel sito di annealing di un primer
Problemi nell’interpretazione di profili Problemi nell’interpretazione di profili STRSTR
B. Problemi «tecnici»
B.1: “pull up”: Incapacità del detector nel risolvere appropriatamente i colori emessi dai fluorocromi utilizzati per marcare i primers.
B.2: “Dye blobs”: Dovuti al distaccamento dei fluorocromi dai primers con conseguente loro migrazione indipendente
B.3: Cristalli di urea e bolle d’aria: Rilevabili come falsi picchi sottili nell’elettroferogramma.
B.4: Contaminanti: Sostanze normalmente non presenti nel polimero all’interno del capillare, fluorescenti nella regione visibile dello spettro.
Reperti Reperti difficili:difficili:
1. DNA degradato2. DNA scarso3. Campioni misti
Situazioni molto comuni nelle indagini forensi di tipo investigativo
Quali strategie (tecniche e computazionali) possono essere utilizzate per risolvere casi in cui sono coinvolti campioni di
questo tipo?
Reperti Reperti difficili:difficili:
L’esposizione all’ambiente (acqua,batteri e funghi, UV, nucleasi) determina la progressiva degradazione del DNA.
In presenza di DNA degradato, il vantaggio dell’utilizzazione di marcatori «corti» quali gli STRs è evidente.
Se il DNA è fortemente degradato, potrebbero presentarsi dei problemi di amplificazione utilizzando le multiplex STRs, principalmente a carico dei microsatelliti in ampliconi più grandi.
1. DNA degradato
Progressiva diminuzione dell’amplificato
Reperti Reperti difficili:difficili:
In situazioni di forte degradazione, si può ricorrere a markers/strategie alternative rispetto agli STR convenzionali
In questi casi si possono utilizzare:
-SNPs (ampliconi < 100 basi)
-mtDNA (l’elevato numero di copie rispetto al nucleare aumenta la probabilità che i primer si appaino ad un segmento di DNA «intatto»)
-«Mini-STRs» (STR con primer ridisegnati in modo da ottenere ampliconi più piccoli di quelli utilizzati normalmente)
-Altre possibilità valutate: aree protette da nucleosomi, riparazione del DNA
1. DNA degradato
Differenti Markers
RFLP (minisat multi-locus
50
100
500
1000
D1S80
STRs
miniSTRsSNPs
Reperti Reperti difficili:difficili:
Mini STR
1. DNA degradato
Reperti Reperti difficili:difficili:
Si parla di «low template» DNA (LT-DNA) quando la quantità di DNA disponibile per l’analisi è inferiore a 100-200 pg (il contenuto in DNA di 20-40 cellule diploidi).
Sebbene la PCR sia in grado (con qualche difficoltà) di amplificare un bersaglio a partire da una sola cellula, il problema principale del LT-DNA è quello della sensibilità del metodo. Nel tempo sono stati messi a punto vari sistemi per aumentare il prodotto PCR, ad esempio aumentando il numero di cicli.
Un’alternativa agli STR, in caso di LT_DNA, è l’analisi di mtDNA
Perché?Vantaggi e svantaggi
2. DNA scarso(Low Copy Number ~ Low template; «touch» DNA)
Reperti Reperti difficili:difficili:
Problemi:I problemi sono tutti relativi al piccolo numero di copie dello stampo. L’entità di amplificazione dei singoli loci (e dei singoli alleli di ciascun locus) è soggetta alle leggi del caso. Interi loci o singoli alleli possono essere non amplificati, oppure può verificarsi uno sbilanciamento tra alleli. Allo stesso modo, può verificarsi un’amplificazione significativa degli stutter.
Figura slide successiva
2. DNA scarso
Reperti Reperti difficili:difficili:
2. LT-DNA: problemi con STR
Replicat
e #1
High stutter
Consensus Profile: 14,19 7,9.3 12,13 11,13 24,Z
Correct Profile: 14,19 7,9.3 12,13 11,13 18,24
Replicat
e #2
Replicat
e #3
Reperti Reperti difficili:difficili:
Quando due o più individui hanno contribuito al campione in esame si parla di campioni misti o «misture». Il profilo STR relativo a questi campioni sarà a sua volta un «profilo misto», nel quale potranno facilmente essere evidenziati loci con un numero di alleli > 2.
Importanza dei sistemi multiallelici nell’analisi di misture
L’altezza relativa dei picchi dell’elettroferogramma riflette in modo abbastanza preciso la quantità relativa di DNA dei due (o più) individui nella mistura, e permette di valutare se un determinato picco possa risultare dalla sovrapposizione di alleli provenienti da individui diversi.
Come conseguenza delle diverse possibili combinazioni di due (o più) genotipi ad un singolo locus, si verificheranno fenomeni di sbilanciamento allelico (es mistura tra un omozigote con ripetizioni 10/10 ed un eterozigote 10/11).
La maggior parte delle misture coinvolge solo due individui
3. Reperti misti
Reperti Reperti difficili:difficili:
3. Reperti mistiSteps per l’interpretazione di profili misti
1. Identificare la presenza di una mistura
2. Designare gli alleli nell’elettroferogramma
3. Stabilire il numero di individui coinvolti
4. Stimare il contributo relativo dei diversi individui alla mistura
5. Considerare tutte le possibili combinazioni genotipiche
6. Confrontare con campione di riferimento
Reperti Reperti difficili:difficili:
3. Reperti misti
Dal profilo misto ai singoli profili: i diversi casi, le diverse strategie (cenni)
Le alternative agli STR autosomiciLe alternative agli STR autosomici
Non solo STR: gli Non solo STR: gli SNPsSNPs nelle scienze forensi nelle scienze forensi
Sebbene gli STR autosomici siano i marcatori d’elezione Sebbene gli STR autosomici siano i marcatori d’elezione della genetica forense, in alcuni casi si fa ricorso a della genetica forense, in alcuni casi si fa ricorso a marcatori differenti (SNPs) o situati su porzioni del marcatori differenti (SNPs) o situati su porzioni del genoma non autosomiche (mtDNA oppure cromosoma Y).genoma non autosomiche (mtDNA oppure cromosoma Y).
Gli SNPs sono utilizzati principalmente quando il DNA da Gli SNPs sono utilizzati principalmente quando il DNA da analizzare è fortemente degradato (prodotti PCR più analizzare è fortemente degradato (prodotti PCR più piccoli, quindi maggiore probabilità di successo tecnico). piccoli, quindi maggiore probabilità di successo tecnico). Trovano tuttavia applicazione anche in:Trovano tuttavia applicazione anche in:Predizione circa la popolazione di origine di un reperto Predizione circa la popolazione di origine di un reperto biologico (AIMs, ancestry informartive markers) – biologico (AIMs, ancestry informartive markers) – (perché (perché non gli STR?)non gli STR?)Predizione di caratteristiche fenotipiche. Ad esempio il Predizione di caratteristiche fenotipiche. Ad esempio il fenotipo «capelli rossi» può essere dedotto (in una certa fenotipo «capelli rossi» può essere dedotto (in una certa misura) dall’analisi di polimorfismi nel gene «recettore misura) dall’analisi di polimorfismi nel gene «recettore della melanocortina 1» (MC1R).della melanocortina 1» (MC1R).
Non solo STR: gli SNPs nelle scienze forensiNon solo STR: gli SNPs nelle scienze forensi
Marcatori autosomici, del mtDNA e del Marcatori autosomici, del mtDNA e del cromosoma Y: vantaggi e svantaggi nelle cromosoma Y: vantaggi e svantaggi nelle
scienze forensiscienze forensi
Marcatori “uniparentali” nelle scienze forensiMarcatori “uniparentali” nelle scienze forensi
Cromosoma YCromosoma Ysi utilizzano principalmente Y-STRsi utilizzano principalmente Y-STR
La variabilità del cromosoma Y viene sfruttata nelle scienze forensi La variabilità del cromosoma Y viene sfruttata nelle scienze forensi principalmente nei casi di misture maschio-femmina (es. violenza principalmente nei casi di misture maschio-femmina (es. violenza sessuale), per ottenere un profilo STR maschio-specifico non contaminato sessuale), per ottenere un profilo STR maschio-specifico non contaminato dal DNA della vittima.dal DNA della vittima.
Altre applicazioni interessano:- test di parentela nei quali non siano disponibili parenti stretti del probando (il profilo STR del cromosoma Y sarà identico in parenti anche molto lontani lungo le linee di discendenza maschile)- Misture con un numero elevato di maschi possono essere più facilmente interpretabili se si analizza il cromosoma Y.- Maschi deficienti per amelogenina
Problemi principali: Essendo un cromosoma non ricombinante ( a parte le PAR) la variabilità si accumula solo per mutazione.Minore informazione e impossibilità di ottenere probabilità di match con la regola del prodotto (si usa la frequenza dell’intero aplotipo nella popolazione)
Marcatori “uniparentali” nelle scienze forensiMarcatori “uniparentali” nelle scienze forensi
mtDNAmtDNAsi “utilizza” principalmente la sequenza delle regioni ipervariabilisi “utilizza” principalmente la sequenza delle regioni ipervariabili
(nel mtDNA umano non ci sono microsatelliti!!)(nel mtDNA umano non ci sono microsatelliti!!)
La variabilità del mtDNA viene sfruttata nelle scienze forensi La variabilità del mtDNA viene sfruttata nelle scienze forensi principalmente nei casi di principalmente nei casi di DNA degradato o scarso DNA degradato o scarso (lezioni precedenti), a (lezioni precedenti), a causa dell’elevato numero di copie di mtDNA per cellula. causa dell’elevato numero di copie di mtDNA per cellula.
Al pari del cromosoma Y, il mtDNA viene usato anche nei test di Al pari del cromosoma Y, il mtDNA viene usato anche nei test di parentela nei quali non siano disponibili parenti stretti del probando (la parentela nei quali non siano disponibili parenti stretti del probando (la sequenza del mtDNA sarà identica in parenti anche molto lontani lungo le sequenza del mtDNA sarà identica in parenti anche molto lontani lungo le linee di discendenza femminile).linee di discendenza femminile).Problemi principali: Come il cromosoma Y, mtDNA è un sistema non ricombinante e quindi la variabilità si accumula solo per mutazione.
Ne consegue minore informatività («minore» variabilità) e impossibilità di ottenere probabilità di match con la regola del prodotto (si usa la frequenza dell’intero aplotipo nella popolazione per dare un peso alle compatibilità).
Il DNA mitocondriale, per il tipo di genotyping cui è sottoposto (sequenziamento) non si presta facilmente nella risoluzione delle misture.
La presenza frequente di eteroplasmia rappresenta un problema, soprattutto nel confronto di profili genetici provenienti da DNA estratto da tessuti diversi
Test di parentela e Test di parentela e paternitàpaternità
Test di parentela e Test di parentela e paternitàpaternità
L’analisi del DNA può essere usata per studi sulla parentela di individui diversi. La maggior parte di questi studi riguarda:
1. Test di paternità
2. Studi per determinare se determinati individui (viventi o deceduti) siano imparentati.
3. Analisi volte a risolvere casi di persone scomparse.
4. Analisi volte ad identificare cadaveri nei disastri di massa
5. Analisi di supporto ad investigazioni criminali (…il parente dell’assassino…)
6. Predizione dell’origine etnica di un DNA (estendendo il concetto di parentela a quello di «coancestry»)
Test di paternitàTest di paternità
In tutti i casi, i test di parentela si basano su un concetto semplice:
Individui imparentati condividono alleli in una maggiore proporzione (spesso misurabile) rispetto
ad individui presi a caso dalla popolazione.
Sono, in altre parole, più simili geneticamente
Differenze tra autosomi, mtDNA, Cromosoma YConsanguineità e alleli uguali per discendenza
Test di paternitàTest di paternità
Due possibili risultati:
(1) Compatibilità:Tutti* gli “alleli obbligati paterni” del figlio sono
presenti nel padre putativo
(2) Esclusione:Più* “alleli obbligati paterni” del figlio non sono
presenti nel genotipo del padre putativo
* Attenzione ad alleli nulli e mutazioni!!!
Test di paternitàTest di paternità
Allele obbligato paterno
L’allele (i) che il padre DEVE avere
In base alle leggi dell’ereditarietà (1° legge Mendel ), considerando un locus autosomico e
assumendo che “la madre sia certa”, se si conosce il genotipo di madre e figlio, è possibile dedurre (nella maggior parte dei casi) l’allele di
origine paterna. Oppure (nei casi meno fortunati) due alleli di cui uno sia di origine paterna.
Questo allele (o alleli) deve essere presente nel padre putativo (allele obbligato) pena esclusione
della paternità.
Test di paternitàTest di paternità
Allele obbligato paterno
Test di paternitàTest di paternità
In caso di esclusione, il test può considerarsi concluso
In caso di compatibilità, è necessario quantificare il “peso” dell’osservazione.
P.I. = Indice di paternità (per un locus)
C.P.I = Indice di paternità combinato (considerando più loci).
Test di paternitàTest di paternità
Indice di paternità
L’ indice di paternità si calcola attraverso il rapporto di due probabilità:
(1)Numeratore: probabilità che il padre putativo trasmetta l’allele(i) obbligato essendo il vero padre. Il trio in analisi è un vero trio
(2)Denominatore: probabilità che un uomo qualsiasi della popolazione trasmetta l’allele(i) obbligato essendo il vero padre. Il trio in analisi è un falso trio
Queste due probabilità discendono rispettivamente dalle leggi di Mendel e dalle leggi della genetica di popolazioni, il loro rapporto esprime una verosimiglianza (Likelihood Ratio, LR)
Test di paternitàTest di paternità
Indice di paternità:
Esercitarsi nel calcolo!
Esempio (semplice): Madre AB, Figlio AC, Padre AC(1)Individuare l’allele/i paterno obbligato/i (allele C in questo esempio)(2)Numeratore: Probabilità che il padre trasmetta l’allele obbligato = ½ (Mendel!!)(3)Denominatore: Probabilità che un individuo a caso della popolazione trasmetta l’allele obbligato = Frequenza dell’allele nella popolazione (Hardy-Weinberg!!) necessità di utilizzare database di frequenze alleliche. Se l’allele C ha frequenza nella popolazione (ad esempio) pC = 0,1, allora (in questo esempio):
P.I. = 0,5/0,1 = 5
Test di paternitàTest di paternità
Indice di paternità
Test di paternitàTest di paternità
Indice di paternità
Un solo locus non è generalmente sufficiente per ottenere una informazione che abbia un peso rilevante circa la compatibilità
osservata.
Si considerano più loci
C.P.I = Indice di paternità combinato
Si ottiene come prodotto dei singoli P.I.
Un valore di CPI > 100 viene in genere considerato sufficientemente alto da far ritenere il padre putativo il vero padre.
CPI = 100 significa: « E’ 100 volte più probabile ottenere i risultati osservati (i profili genetici dei tre soggetti del trio) se il padre
putativo (piuttosto che un uomo preso a caso dalla popolazione) è il vero padre
Con i loci microsatelliti attualmente in uso in genetica forense, in caso di compatibilità si ottengono valori di CPI >> 100
Test di paternitàTest di paternità
Indice di paternità
Un solo locus non è generalmente sufficiente per ottenere una informazione che abbia un peso rilevante circa la compatibilità
osservata.
Si considerano più loci
C.P.I = Indice di paternità combinato
Si ottiene come prodotto dei singoli P.I.
Un valore di CPI > 100 viene in genere considerato sufficientemente alto da far ritenere il padre putativo il vero padre.
CPI = 100 significa: « E’ 100 volte più probabile ottenere i risultati osservati (i profili genetici dei tre soggetti del trio) se il padre
putativo (piuttosto che un uomo preso a caso dalla popolazione) è il vero padre
Con i loci microsatelliti attualmente in uso in genetica forense, in caso di compatibilità si ottengono valori di CPI >> 100
Test di paternitàTest di paternità
Test di paternità in presenza di mutazioni
In caso di esclusione si osserva generalmente non compatibilità per più loci.
Ma come considerare una situazione in cui solo uno (o “pochi”) dei loci analizzati non sono compatibili?
Bisogna tener conto delle possibili mutazioni
Tasso di mutazione?
Come si tiene conto delle mutazioni?
“two exclusion rule”e
CPI in presenza di mutazioni
Test di paternitàTest di paternità
Test di paternità in assenza di madre
In caso di assenza della madre è sempre possibile determinare quale/i siano gli alleli obbligati paterni.
In caso di non paternità, sarà molto frequente ottenere un giudizio di esclusione
In caso di paternità, si avranno meno informazioni per dare un peso alla compatibilità osservata
Si può utilizzare anche in questo caso il CPI
•distribuzione nel genoma: sufficiente che i geni non siano in LD per una più facile trattazione statistica: OK tutti i marcatori• tasso di mutazione: non fondamentale ma da tenere in considerazione
OK tutti i marcatori• grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore l’informazione: OK minisatelliti, STR• ereditarietà mendeliana: importante per una più facile trattazione statistica
OK STR, SNPs • tempi tecnici dell’esperimento• costi dell’attrezzatura• costi dell’esperimento• precisione del metodo• tipizzazione mediante PCR: non rilevante se non in relazione ai costi• possibilità di automazione su larga scala: non rilevante
Nella pratica forense per i test di paternità si utilizzano quasi solamente STRs
Test di parentelaTest di parentela
Investigazioni su persone scomparse
Tre categorie di campioni utilizzabili per identificazione di persone scomparse tramite l’analisi di profili genetici:
1) Campioni provenienti dall’individuo scomparso (spazzolino da denti, pettine, vestiti, vecchi reperti medici come biopsie)2) Campioni di parenti che possono essere utlizzati per “ricostruire” il genotipo dell’individuo scomparso (“reverse parentage testing”)3) Campioni provenienti da resti umani non identificati
Si utilizzano e si confrontano: (1) database di profili di DNA di persone scomparse; (2) database di profili di resti umani non identificati; (3) database di profili di parenti di persone scomparse
Test di parentelaTest di parentela
Identificazione delle vittime dei disastri di massa (DVI)
Tre categorie di campioni utilizzabili per identificazione di vittime di disastri:
1) Campioni provenienti dall’individuo scomparso (spazzolino da denti, pettine, vestiti, vecchi reperti medici come biopsie)2) Campioni di parenti che possono essere utlizzati per “ricostruire” il genotipo dell’individuo scomparso (“reverse parentage testing”)3) Campioni provenienti dai resti rinvenuti sulla scena del disastro
Problemi:-Complicazioni dovute al numero di vittime-In alcuni casi frammentazione e dispersione dei reperti-Spesso DNA fortemente degradato a causa di incendi
Identificazione delle persone Identificazione delle persone disperse nel World trade center in disperse nel World trade center in seguito ad attacco terroristico del seguito ad attacco terroristico del 9/119/11 Il progetto ha Il progetto ha
generatogenerato– 52,000 profili STR 52,000 profili STR – 44,000 profili mtDNA 44,000 profili mtDNA – 17,000 profili SNPs17,000 profili SNPs
850 delle 1594 850 delle 1594 vittime identificate vittime identificate grazie all’analisi del grazie all’analisi del DNADNA