Adriana Maggi DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE...

Post on 02-May-2015

219 views 1 download

Transcript of Adriana Maggi DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE...

Adriana Maggi

DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHECORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO

AA 2011/2012Lezione 4

Le sfide per il futuro del progetto genoma umano

• comprendere le componenti strutturali e funzionali del genoma• capire come le reti di geni e proteine contribuiscono alla

definizione del fenotipo• comprendere cosa determina le variazione nella trasmissione

dei caratteri genetici• identificare le varianti genetiche che contribuiscono al

mantenimento dello stato di salute• determinare strategie per identificare il rischio di malattia• stabilire strategie per l’identificazione del contributo del

genoma nella determinazione delle patologie e delle risposte alla terapia

• utilizzare le conoscenze genetiche per lo sviluppo di farmaci innovativi

Il progetto Genoma Umano si è focalizzato sulla generazione di mappe

genomiche tramite mappe di concatenazione e mappe fisiche.

Una mappa genomica indica l’ordine in cui i geni e i marcatori genici si trovano

nei singoli cromosomi

Nella ricerca del gene malattia, i ricercatori in genere trovano

un marcatore specifico che indica il segmento di DNA nelle vicinanze del gene di interesse,

con clonaggi posizionali e analisis di sequenze si possono individuare I geni responsabili

della patologia

GENOMATICA FUNZIONALE

Studio di funzione genica

LA RICERCA DELLA FUNZIONE DEI GENI

La tradizione: ricerca di di mutazioni per identificare perdite o acquisizione di funzioniI metodi della genetica all’incontrario:Analisi mutazionale in organismi modello: Generare nuovi organismi geneticamente modificati per studiare perdita o acquisizione di funzioni

Metodologie innovative:Studio comparativo di popolazioni di prodotti genici

La tradizione:

ricerca e analisi di mutazioni e polimorfismi (es RFLP; SNP) del genoma stesso

Siti polimorfici • 99.99 % della sequenza del DNA di due individui e’ identica

• la maggioranza delle differenze (0.01%) coinvolgono singole sostituzioni

Polimorfismi al taglio con enzimi di restrizione (RFLP)

Single nucleotide polymorphysm (SNP)

Polimorfismi al taglio con enzimi di restrizione (RFLP)

Allele 1 Allele 2*

Polimorfismi al taglio con enzimi di restrizione (RFLP)

associazione RLFP-patologia

Famiglia Patol.

sani

variab nella popol.

The Lod (log of odds) score is used to calculate the probability of a pedigree arising randomly or by genetic linkage. The test was developed by Newton and Morton

In practice, linkage is declared if the LOD score is equal to or greater than 3 (i.e. the likelihood of observing the result if the two loci are not linked is less than 1 in 1000). On the other hand, linkage can be completely excluded if the LOD score is strictly below -2.

LOD = log Probability of birth sequence with a given linkage value

Probability of birth sequence with no linkage

Studio di funzione genica Localizzazione posizionale di geni/malattia

Studio di linkage familiare con polimorfismi

Ereditarietà – autosomica dominante : penetranza 100% Frequenza - circa 1/10,000 natiManifestazione clinica: 35 - 45 anni di etàLa manifestazione in età adulta ne ha causato l’espandersi della malattia

Gli studi delle basi molecolari della malattia sono iniziati con la identificazione di famiglie di grandi dimensioni i cui membri fossero viventi: questo è stato possibile grazie al registro Nazionale dei Pazienti con Huntington USA presso l’Università dell?Indiana e alla scoperta di una famiglia presso il lago Maracaibo in Venezuela in cui diversi membri erano affetti dalla malattia

Da diverse famiglie sono state prelevate cellule ematiche per la Generazione di cellule immortalizzateOgni famiglia è stata seguita da neurologi e la paternità dei pazienti è stata opportunamente verificata

Huntington, la malattia ideale per position cloning

1981 - Gusella's group started with a group of anonymous probes that uncovered RFLPs - very few available.

the 12th probe they tried -called G8 - indicated linkage. Disease associated with the A haplotype in the American family and the C haplotype in the Venezuelan family.

LOD Scores 1983 - G8 (also called D4S10) mapped approximately 4 cM from the HD locus. It took 10 more years to clone the gene.

1986-87 DNA markers were used and D4S10 was localized by in situ hybridization and somatic cell genetics to chromosome region 4p16.3; Further linkage studies for isolating HDIdentification of Putative Coding Sequences Exon Trapping; Use trapped exons to identify candidate genes from cDNAs; Four transcripts were analyzed; IT15 - Huntingtin

Dall’osservazione:Gusella JF, Wexler NS, Conneally PM, Naylor SL, Anderson MSA, Tanzi RE, Walkins PC, et al (1983) A polymorphic DNA marker genetically linked to Huntington's disease. Nature 306:234-238

Al brevetto:Huntingtin DNA, protein and uses thereof

US Patent Issued on November 11, 1997 Inventor(s): Marcy E. MacDonald; Christine M. Ambrose; Mabel P. Duyao; James F. GusellaAssignee: The General Hospital CorporationApplication: No. 246982 filed on 1994-05-20

Metodologie innovative:

Studio comparativo di popolazioni di prodotti genici

• genomatica comparativa• generazione di arrays per lo studio

comparato di espressione genica

analisi basata sulla omologia di geni codificanti proteine a funzione nota

Genomatica comparata:

Genomatica comparata

Utile per:

• Identificare similarità/dissimilarità tra speci diverse• Studiare evoluzione della specie• Identificare geni codificanti e loro funzione• Identificare regioni funzionali nei genomi

Ortologo e paralogo

• Ortologhi – geni omologi con la stessa funzione in organismi diversi

• Paraloghi – geni all’interno dello stessoorganismo derivanti da duplicazione genica

Geni ortologhi o paraloghi

Allineamento di sequenze

generazione di arrays per lo studio comparato di espressione genica

ARRAY

MACROARRAY

MICROARRAY

DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto

rapresentante un singolo gene immobilizzati su un supporto (vetro,

plastica o silicone) mediante legami di tipo irreversibile.

Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA

mRNA or gene expression profiling

Clustered Image Maps

Drugs x CellsGenes x Cells

Genes x Drugs

I LIMITI DELLA ANALISI GENOMICA:

RIPRODUCIBILITA’

ANALISI NON QUANTITATIVA

I mRNA NON RIFLETTONO ESATTAMENTELE PROTEINE PRESENTI NELLA CELLULA

Come classificare la materia vivente per comprenderla?

Il progetto GENE ONTOLOGY

Gene Ontology http://www.geneontology.org/index.shtml

Un progetto atto a costruire un vocabolario strutturato pensato per descrivere i geni e i loro prodotti in qualsiasi tipo di organismo

Questo vocabolario serve per dare un unico nome a un specifico prodotto in modo che questi così compaia nelle diverse banche dati e possa venire rapidamente ritrovato

L'ontologia, una delle branche fondamentali della

filosofia, è lo studio dell'essere in quanto tale,

nonché delle sue categorie fondamentali.

Il termine deriva dal greco ὄντος, òntos (genitivo

singolare del participio presente ὤν di εἶναι, èinai,

il verbo essere) più λόγος, lògos, letteralmente

"discorso sull'essere”

Gene Ontology (GO, ontologia genica): un

vocabolario controllato e strutturato per

la descrizione di prodotti genici in termini

• di funzione molecolare,

• di ruolo biologico e

• di ubicazione cellulare

Le Ontologie differiscono dalle terminologie controllate (Lexicon) poiché si tratta di una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse,le regole, gli assiomi, ed i vincoli specifici del dominio; mentre le terminologie controllate semplicemente restringono l’insieme di parole usate per descrivere il dominio.

Gene Ontology http://www.geneontology.org/index.shtml

Ogni gene/proteina si contraddistingue per un numero identificativo unico (GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita, trasduttore del segnale).

Ogni termine viene assegnato a una o più delle tre suddivisioni della banca (ontology):

1.Funzioni molecolari2.Componenti cellulari3.Componenti I processi biologici

Esempio di annotazione:

Il prodotto genico della citocromo-C-ossidasi puo’ essere descritto in GENE ONTOLOGY tramite:

La sua funzione molecolare: attività ossidoreduttasicaIl componente cellulare nel quale è presente: la matrice mitocondriale o la membrana interna del mitocondrioIl processo biologico che causa: fosforilazione ossidativa e induzione di morte cellulare

DAG (Grafico Acilico Diretto)

Il grafico Acilico Diretto è la forma rappresentativa usata in GO.

Il DAG è una forma di grafico che differisce da una normale gerarchia poichè ogni termine può avere più padri e in cui possono esistere molteplici percorsi da un termine qualsiasi al termine radice Ciascun vocabolo della GO rappresenta un nodo del DAG al quale è associato un identificativo (GO ID).

Grafico Acilico Diretto

un termine di gene ontology molto “generico” contiene al suo interno” più termini di gene ontology via via più specifici. Questo fa sì che man mano che si va “verso il basso” le definizioni diventino sempre più precise ed i geni che soddisfano a quella descrizione sempre meno. Questo albero può quindi essere “letto” a più livelli, da quelli più generali, che stanno alla radice, a quelli via via sempre più specifici che stanno sulle foglie.

POSSIBILI UTILIZZI DI GENE ONTOLOGY

La categorizzazione con GENE ONTOLOGY può avere diversi scopi finali:

1) comprendere in che processo/funzione/componente in cui è coinvolto un gene2) categorizzazione di un set di dati (gene e proteine); in formato normale o usando un Goslim per avere una visione d'insieme dei dati3) categorizzare un set di dati e valutare eventuali sovra-rappresentazioni (“gene enrichment”) che non siano fruttto del caso4) estrazione dei geni (sequenze) che sono coinvolte in un processo, funzione, componente