BASI MOLECOLARI DELL’AZIONE DEL FARMACO BIOTECNOLOGIE FARMACOLOGICHE LEZIONE 4

47
BASI MOLECOLARI DELL’AZIONE DEL FARMACO BIOTECNOLOGIE FARMACOLOGICHE LEZIONE 4 CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO Adriana Maggi ttp://users.unimi.it/mpl/lezioni.h

description

CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO Adriana Maggi. BASI MOLECOLARI DELL’AZIONE DEL FARMACO BIOTECNOLOGIE FARMACOLOGICHE LEZIONE 4. http://users.unimi.it/mpl/lezioni.html. STUDIO DELLA FUNZIONE GENICA. ARRAY MACROARRAY MICROARRAY. - PowerPoint PPT Presentation

Transcript of BASI MOLECOLARI DELL’AZIONE DEL FARMACO BIOTECNOLOGIE FARMACOLOGICHE LEZIONE 4

BASI MOLECOLARI DELL’AZIONE DEL FARMACOBIOTECNOLOGIE FARMACOLOGICHE

LEZIONE 4

CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO

Adriana Maggi

http://users.unimi.it/mpl/lezioni.html

STUDIO DELLA FUNZIONE GENICA

ARRAY

MACROARRAY

MICROARRAY

DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto rapresentante un singolo gene immobilizzati su un supporto (vetro, plastica o silicone) mediante legami di tipo irreversibile.

Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA

APPLICAZIONI DI ARRAY:

• SNP detection arrays – per identificare Single nucleotide polymorphism nel genoma di diverse popolazioni

• comparative genomic hybridization (Array CGH) – per identificare riarragiamenti coinvolgenti un numero significtativo di basi

• mRNA or gene expression profiling – per studiare I livelli di espressione di migliaia di geni simultaneamente

• Chromatin immunoprecipitation (chIP) studies – per determinare il legame di specifche proteine in porzioni specifiche del DNA (ChIP-on-chip technology)

Siti polimorfici per singola sostituzione di base (SNP)

•di base

Nel genoma umano ci sono 200.000 SNP all’interno di sequenze codificanti, alcuni di questi possono essere marcatori di patologia

http://www.ncbi.nlm.nih.gov/About/primer/snps.html

polimorfismo a singolo nucleotide

Gli SNP sono la causa di circa il 90% della variabilità genetica umana ed in genere si trova uno SNP ogni 100-300 pb. 2/3 SNP vedono sostituita la C con T.

Siti polimorfici per singola sostituzione di base (SNP)

Individuo 1

Individuo 2

Perchè una variazione possa essere considerata un SNP deve essere presente in almeno l’1% della popolazione

Metodi di identificazione di SNP

IBRIDAZIONE ALLELE-SPECIFICA

REAZIONE DI ELONGAZIONE DI PRIMER FISSATO SU SUPPORTO SOLIDO

AT CGTAGC

TA5’GC

3’

TG5’

AC 3’

DNA is denatured and mixed with oligonudeotides and ligase. The ligase joins pairs of oligonudeotides annealed head to tail if they are correctly base-paired at the junction. Radioactively labeled oligonudeotides (*) are immobilized and detected by autoradiography only if ligated to biotinylated oligonucleotides (B) that can be bound to streptavidin on a solid support.

LANDEGREN, et al. Science 1998

Michiel J. T. van Eijk*, et al. NAR 2004

BANCHE DATI E IDENTIFICAZIONE DI SNP

dbSNP sono presenti (“annotati”) in diverse banche dati quali: PubMed, genome project sequences, GenBank records, the Entrez Gene database, and the dbSTS database of sequence tagged sites.

 

Clustered Image Maps

Drugs x CellsGenes x Cells

Genes x Drugs

Database Microarray Experiment Sets Sample Profiles

Genomics and bioinformatics group NCI and NIH

Studio di proteine che interagiscono con DNA

ChIP-on-chip (o ChIP-chip) è una tecnica che combina la immunoprecipitazione di cromatina (chromatin immunoprecipitation "ChIP” con la tecnologia del micro array(microarray technology “chip").

read-outNormalizzazione dei dati e analisi esplorativa dei dati

“estrazione delle informazioni”

Sito DNA

arricchimento proteina di interesse

Le prime analisi si sono focalizzate sulle differenze tra animali in Proestro e Metestro, per vedere se la differenza dei livelli di Estradiolo circolante avesse degli effetti sull’espressione genica.Come atteso, gli animali LID non mostrano nessuna significativa differenza nell’espressione genica nelle due fasi del ciclo, come se quest’ultimo fosse appiattito. Gli animali WT, al contrario, mostrano deboli ma rilevabili differenze nelle due fasi; tuttavia, il quadro osservato e’ totalmente inatteso, in quanto i geni differenzialmente espressi sono tutti geni MAGGIORMENTE espressi nella fase di metestro o, guardando all’inverso, downregolati nella fase di Proestro. Considerando cio’ che abbiamo sempre osservato, vale a dire un’attivazione del recettore degli estrogeni in fase di proestro, questo stupisce.

WT M vs WT P WT P vs WT M

Downregulated in P

Upregulated in M

SEM Analysis

GO Term Analysis

Una volta identificati i trascritti differenzialmente espressi nei due gruppi (t test & SAM analysis, tenendo in considerazione solo quelli con Fold Indution >=1,5), si cerca di capire se questi geni sono implicati in determinati ‘Biological Process’ o hanno particolari ‘Molecular Function’ o interferiscono in un determinato ‘Pathway’.

Questa analisi si puo’ fare a diversi “livelli”, i risultati riportati si riferiscono ad un livello piuttosto superficiale, ma per questo piu’ generale e credo indicativo.

Riporto:- BP = Biological Process- MF = Molecular Function- Pathway

L’analisi e’ stata fatta principalmente con DAVID http://david.abcc.ncifcrf.gov/summary.jsppiu’ molti altri software e websites (le risorse sono infinite)

Term Count % PValueBP00019:Lipid, fatty acid and steroid metabolism 40 20.00% 1.57E-19BP00076:Electron transport 25 12.50% 1.96E-08BP00020:Fatty acid metabolism 17 8.50% 9.20E-04BP00013:Amino acid metabolism 9 4.50% 9.33E-04BP00180:Detoxification 11 5.50% 1.92E-03BP00064:Protein phosphorylation 31 15.50% 1.98E-03BP00148:Immunity and defense 25 12.50% 4.40E-03BP00150:MHCI-mediated immunity 27 13.50% 7.00E-03BP00001:Carbohydrate metabolism 11 5.50% 7.97E-03BP00143:Cation transport 42 21.00% 9.66E-03BP00295:Steroid metabolism 10 5.00% 1.21E-02BP00063:Protein modification 32 16.00% 1.52E-02BP00271:Other homeostasis activities 4 2.00% 2.77E-02BP00273:Chromatin packaging and remodeling 13 6.50% 3.04E-02BP00069:Protein disulfide-isomerase reaction 9 4.50% 3.12E-02BP00267:Homeostasis 5 2.50% 3.63E-02BP00147:Other transport 4 2.00% 4.27E-02BP00044:mRNA transcription regulation 87 43.50% 4.74E-02BP00008:Tricarboxylic acid pathway 5 2.50% 4.83E-02BP00151:MHCII-mediated immunity 15 7.50% 6.80E-02BP00289:Other metabolism 30 15.00% 7.38E-02BP00156:Interferon-mediated immunity 3 1.50% 8.79E-02

I geni per ogni categoria sono nel file Excel ‘Panther_BP_WTall_vs_LIDAll.xls’

Biological Process - WTall vs LIDall

Considerando tutti i trascritti differentemente espressi, sia upregolati che downregolati.

Term Count % PValueMF00123:Oxidoreductase 33 16.50% 1.69E-16MF00124:Oxygenase 26 13.00% 4.86E-13MF00140:Other transferase 12 6.00% 2.09E-04MF00087:Transfer/carrier protein 12 6.00% 9.62E-04MF00099:Small GTPase 29 14.50% 2.01E-03MF00082:Transporter 13 6.50% 3.45E-03MF00212:Other G-protein modulator 36 18.00% 3.71E-03MF00131:Transferase 27 13.50% 6.35E-03MF00007:Interferon receptor 4 2.00% 6.86E-03MF00254:Actin and actin related protein 13 6.50% 1.72E-02MF00174:Complement component 6 3.00% 1.91E-02MF00042:Nucleic acid binding 74 37.00% 2.68E-02MF00126:Dehydrogenase 9 4.50% 3.83E-02MF00005:Cytokine receptor 6 3.00% 5.09E-02MF00224:KRAB box transcription factor 52 26.00% 5.62E-02MF00074:Translation release factor 4 2.00% 6.44E-02MF00063:Histone 5 2.50% 7.09E-02MF00213:Non-receptor serine/threonine protein kinase 43 21.50% 7.30E-02MF00033:Voltage-gated calcium channel 12 6.00% 7.52E-02MF00211:Kinase activator 11 5.50% 8.12E-02MF00118:Synthase and synthetase 4 2.00% 9.05E-02MF00242:RNA helicase 16 8.00% 9.49E-02MF00217:Other proteases 7 3.50% 9.83E-02

Molecular Function - WTall vs LIDall

I geni per ogni categoria sono nel file Excel ‘Panther_MF_WTAll_vs_LIDAll.xls’

Gene Ontology http://www.geneontology.org/index.shtml

Un progetto atto a costruire un vocabolario per descrivere geni e prodotti genici attribuibili a ogni organismo

Ogni gene/proteina si contraddistingue per un numero identificativo unico (GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita, trasduttore del segnale). Ogni termine viene assegnato a una delle tre suddivisioni della banca (ontology):

1.Funzioni molecolari2.Componenti cellulari3.Componenti I processi biologici

Questo vocabolario serve per dare un unico nome a un specifico prodotto in modo che questi così compaia nelle diverse banche dati e possa venire rapidamente ritrovato

The three organizing principles of GO are cellular component, biological process and molecular function.

A gene product might be associated with or located in one or more cellular components; it is active in one or more biological processes, during which it performs one or more molecular functions.

For example, the gene product cytochrome c can be described by

the molecular function term oxidoreductase activity,

the biological process terms oxidative phosphorylation and induction of cell death, and

the cellular component terms mitochondrial matrix and mitochondrial inner membrane.

Topology

The ontologies are structured as directed acyclic graphs, which are similar to hierarchies but differ in that a more specialized term (child) can be related to more than one less specialized term (parent).

For example, the biological process term

hexose biosynthetic process

has two parents, hexose metabolic process and monosaccharide biosynthetic process.

This is because biosynthetic process is a type of metabolic process and a hexose is a type of monosaccharide. When any gene involved in hexose biosynthetic process is annotated to this term, it is automatically annotated to both hexose metabolic process and monosaccharide biosynthetic process.

I LIMITI DELLA ANALISI GENOMICA:

RIPRODUCIBILITA’

ANALISI NON QUANTITATIVA

I mRNA NON RIFLETTONO ESATTAMENTELE PROTEINE PRESENTI NELLA CELLULA

proteomica

Il fine della proteomica consiste nella completa identificazione delle proteine e della loro espressione in determinati cellule o tessuti La metodologia su cui si basa la proteomica comprende: gel elettroforesi bidimensionale; HPLC e spettrometria di massa

• (20,000 to 25,000 genes vs. > 500,000 proteins).

• E’ stato calcolato che il corpo umano puo’ esprimere fino a 2 milioni di proteine, ciascuna con differenti funzioni

I metodi della proteomica

• dagli anni ‘70: gel elettroforesi bidimensionale

Limiti di definizione e riproducibilità

•Anni ’90 spettrometria di massa con metodi di ionizzazione alternativi

(electrospray o MALDI Matrix Assisted Laser Desorption Ionization )

Non si amplificano le proteine: dimensione campioniIdentificazione dei peptidi da miscele complesseRapiditàAnalisi quantitativaLimiti nelle conoscenze di genomi da diversi organismiDisponibilità di strumentazione

electrospray ionization liquid chromatography mass spectrometry

John Bennett Fenn ha ricevuto il premio Nobel per la chimica nel 2002 per lo sviluppo della tecnica di elettrospray per l’analisi di macromolecole biologiche

Stable isotope labeling with amino acids in cell culture (SILAC) per analisi proteomica quantitativa

Mann Nature Reviews Molecular Cell Biology 7, 952–958 (December 2006) | doi:10.1038/nrm2067

Functional and quantitative proteomics using SILAC

SILAC (Stable isotope labelling with amino acids in cell culture)

Proteomica e trascrittomica a confronto

Uno studio in cui si sono comparati i dati di analisi di cellule MCF-7

Su un totale di 7278 geni identificati in modo univoco come messaggi o proteine

55% provengono da analisi proteomica77% provengono da microarray

LE PROSPETTIVE DELLA PROTEOMICA:

•continuo progresso della tecnologia per misure sempre più su larga scala e rapide

• costruzione di banche dati

•protomica interviene in cellule dove mRNA non è informativo (es cellule ematiche)

•La misura proteomica fornisce l’end point, il microarray va verificato con qPCR e da western

•La proteomica permette di studiare la presenza di modificazioni post-traduzionali, di interazioni proteina-proteina

INTERATTOMICA

analisi del trascrittoma, del proteoma e dell’interattoma comparati per arrivare a definire le funzioni fisiologiche di ciascun gene

L’INTERATTOMA O BIOLOGIA DEI SISTEMI

(system biology)

Per grafico intendiamo un insieme di punti, nodi o vertici che sono tra loro collegati non in modo unidirezionale. Nel digrafico la direzionalità o bidirezionalità dell’evento è segnata

L’interattoma rappresenta interazioni molecolari con un sistema digrafico

‘OMICSAPPLICAZIONI MEDICHE

Test genetici

Terapia genica

Farmacogenomica

Informazioni sulla malattia