Dott.ssa Silvia Pellegrini Laboratorio Microarray Dipartimento di Patologia Sperimentale,...

Post on 02-May-2015

215 views 0 download

Transcript of Dott.ssa Silvia Pellegrini Laboratorio Microarray Dipartimento di Patologia Sperimentale,...

Dott.ssa Silvia Pellegrini

Laboratorio MicroarrayDipartimento di Patologia Sperimentale, Biotecnologie

Mediche, Infettivologia ed Epidemiologia

Tel. 050 2211251

e-mail: silvia.pellegrini@bioclinica.unipi.it

Le scienze della vita sono attualmente al centro di una vera e propria rivoluzione

1953: modello di Watson e Crick

Progetto Genoma Umano

19901990

20032003

Genoma

L’insieme di tutte le molecole di DNA presenti nel nucleo di ogni cellula

Nell’uomo: 44 cromosomi autosomici 2 cromosomi sessuali

Struttura del DNA

2

2

2

nucleocromosoma

Doppia elica

istoni Coppie di basi

cellula

1 ccctgtggag ccacacccta gggttggcca atctactccc aggagcaggg agggcaggag 61 ccagggctgg gcataaaagt cagggcagag ccatctattg cttacatttg cttctgacac 121 aactgtgttc actagcaacc tcaaacagac accatggtgc acctgactcc tgaggagaag 181 tctgccgtta ctgccctgtg gggcaaggtg aacgtggatg aagttggtgg tgaggccctg 241 ggcaggttgg tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcatgt 301 ggagacagag aagactcttg ggtttctgat aggcactgac tctctctgcc tattggtcta 361 ttttcccacc cttaggctgc tggtggtcta cccttggacc cagaggttct ttgagtcctt 421 tggggatctg tccactcctg atgctgttat gggcaaccct aaggtgaagg ctcatggcaa 481 gaaagtgctc ggtgccttta gtgatggcct ggctcacctg gacaacctca agggcacctt 541 tgccacactg agtgagctgc actgtgacaa gctgcacgtg gatcctgaga acttcagggt 601 gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa gttcatgtca 661 taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa tgattgcatc 721 agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa caattgtttt 781 cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact attatactta 841 atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa gtaacttaaa 901 aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg tgcttatttg 961 catattcata atctccctac tttattttct tttattttta attgatacat aatcattata 1021 catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg 1081 taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat 1141 cttatttcta atactttccc taatctcttt ctttcagggc aataatgata caatgtatca 1201 tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag gcaatagcaa 1261 tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt 1321 gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct 1381 ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc 1441 tcccacagct cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat 1501 tcaccccacc agtgcaggct gcctatcaga aagtggtggc tggtgtggct aatgccctgg 1561 cccacaagta tcactaagct cgctttcttg ctgtccaatt tctattaaag gttcctttgt 1621 tccctaagtc caactactaa actgggggat attatgaagg gccttgagca tctggattct 1681 gcctaataaa aaacatttat tttcattgca atgatgtatt taaattattt ctgaatattt 1741 tactaaaaag ggaatgtggg aggtcagtgc atttaaaaca taaagaaatg atgagctgtt 1801 caaaccttgg gaaaatacac tatatcttaa actccatgaa agaaggtgag gctgcaacca 1861 gctaatgcac attggcaaca gcccctgatg cctatgcctt attcatccct cagaaaagga 1921 ttcttgtaga ggcttgattt gcaggttaaa gttttgctat gctgtatttt acattactta 1981 ttgttttagc tgtcctcatg aatgtctttt cactacccat ttgcttatcc tgcatctctc 2041 tcagccttga ct//

gene della beta-globina umana

Il contenuto di informazioni del DNA

umano è dato dall’alternanza di 4

lettere A, G, T, C

Flusso delle informazioni genetiche

Il codice genetico

Alcuni dati sul genoma umanoAlcuni dati sul genoma umano

3 miliardi di paia di basi

2% codificanti

Circa 20.000 geni diversi

Più di 10 milioni di variazioni

Non siamo tutti uguali…

Non esiste un’unica sequenzadel genoma umano, ma circa il 10%

dei 3 miliardi di paia di basi che compongono il genoma umano

variano da individuo a individuo e costituiscono dei polimorfismi genetici.

I. Single Nucleotide--SNPs

G

A

II. “indel” (inserzioni/delezioni)

TGACG

TG

Variable Number of Tandem Repeats

Polimorfismi geneticiForme alleliche diverse di una stessa sequenza presenti in più

dell’1% degli individui di una popolazione

SNP (Single Nucleotide Polymorphism)

Polimorfismi a singolo nucleotide ovvero cambiamenti di una base

Una sequenza di DNA di 60 basi in 25 soggetti diversi

SNPs

•Variazioni di sequenza comuni•Possono avere un significato funzionale

diretto– Aumento dell’attività della proteina– Diminuzione dell’attività della proteina

•Possono essere semplicemente associati ad altre variazioni di sequenza con significato funzionale

•Possono essere silenti

Variazioni di una base nella regione codificante di un gene portano ad un’alterazione della sequenza aminoacidica della proteina corrispondente con possibile cambiamento funzionale

globuli rossi a falce

GAA > GAGGlu > Val

Esempio di variazione di una sola base di tipo causativo

anemia a cellule falciformi

Hb-A Hb-S

Molto più complicato è il caso delle malattie multifattoriali causate dall’alterazione di più geni che agiscono in concomitanza con

numerosi fattori ambientali

In questo caso le alterazioni geniche rappresentano fattori di suscettibilità,

ciascuno dei quali contribuisce in una certa misura alla malattia, che si manifesterà soltanto quando i fattori

di rischio nel loro insieme (geni e ambiente) superano una data soglia

112 158

ApoE ε2 GACGTGTGCGGCCGC……CAGAAGTGCCTGGCA

ApoE ε3 GACGTGTGCGGCCGC……CAGAAGCGCCTGGCA

ApoE ε4 GACGTGCGCGGCCGC……CAGAAGCGCCTGGCA

ApoE ε2 Cys Cys

ApoE ε3 Cys Arg

ApoE ε4 Arg Arg

ApoE e malattia di Alzheimer

35

30

25

20

15

10

5

0

35

30

25

20

15

10

5

00 1 23 4+

0 1 23 4+n = (184) (138) (104) (64)

(91)n = (79) (3) (57) (26)

(29)

“s” genotype(n = 581)

“l” genotype(n = 264)

Groups of individuals having different numbers of life events

Maj

or

dep

ress

ion

ep

iso

des

(%

)

I polimorfismi possono essere responsabili di una diversa suscettibilità alle malattie…

…come pure della variabilità individuale nella risposta alla

terapia farmacologica

•paziente gusto

•Farmaco giusto

•dose giusta

Esamina le varianti genetiche che determinano la risposta ad un Esamina le varianti genetiche che determinano la risposta ad un farmaco e studia il modo in cui queste varianti possono essere farmaco e studia il modo in cui queste varianti possono essere usate per prevedere il tipo di rispostausate per prevedere il tipo di risposta

Farmacogenetica

Selezione sulla base di fattori predisponenti alle malattie

diagnosi precoce

Selezione sulla base di fattori responsabili di una diversa risposta al trattamento

Terapia personalizzata

A caccia di alleli di suscettibilità

CCGGTT CC TT AAGGGG GGTT GGTT AA AA TT CC

Studi di associazione casi-controlli

Popolazione senza malattia

AA TT CC CCGGAA GGTT CC TT AAAAGG GGTT GG CCGGTTGGTT AA AA CCTT CC TT AAGG GGTT GGSNP

Popolazione con malattia

Gene A

Malati

Controlli sani

Nessuna variante del gene (verde o nera) è associata con la

malattia

Gene B

Malati

Controlli sani

La variante rossa del gene è associata con la malattia

Questo tipo di analisi può essere fatto senza conoscere la funzione

del gene

Selezione delle due popolazioni

•devono differire solo per il fenotipo di interesse•devono essere il più omogenee possibile per tutti

gli altri aspetti (sesso, età, etnia…)

•non devono esserci stratificazioni all’interno (= sottogruppi diversi)

•devono essere sufficientemente numerose (la numerosità del campione per rilevare associazioni statisticamente significative dipende dalla frequenza degli SNP studiati)

Whole genome scans

Single SNPanalysis

Genotyping of candidate genes and SNPs

da Nature 426, 789-796 (2003)

L’utilizzo degli aplotipi può facilitare l’analisi

HapMap project

http://www.hapmap.org

Il futuro: l’intero assetto genetico su un chip grande come una carta di credito

La necessità di un approccio informatico alla ricerca nel settore

biomedico deriva da questa recente esplosione di informazioni biologiche generate dalla comunità scientifica

BIOINFORMATICA

Disciplina situata all’interfaccia tra informatica e scienze biologiche (quali la biologia molecolare e la genetica) che applica algoritmi informatici per la risoluzione di

problemi biologici

Questa quantità enorme di informazioni è conservata e resa disponibile per l’intera comunità scientifica da tre

organismi principali

NCBI = National Center for Biotechnology Informationhttp://www.ncbi.nlm.nih.gov

EMBL = European Molecular Biology Laboratoryhttp://www.embl-heidelberg.de

KEGG =Kyoto Encyclopedia of Genes and Genomeshttp://www.genome.jp/kegg/

creano Database di pubblico accesso diffondono informazioni biomediche sviluppano software per l’analisi di dati