Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera...

90
Proteomica Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.(A. Einstein)

Transcript of Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera...

Page 1: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

ProteomicaProteomica

1

“La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.” (A. Einstein)

Page 2: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

SommarioSommario

Dal genoma al proteomaDal genoma al proteoma

Classificazione delle proteineClassificazione delle proteine

Tecniche sperimentaliTecniche sperimentali

Progettazione di inibitori e di farmaciProgettazione di inibitori e di farmaci

Screening di ligandiScreening di ligandi

Strutture cristalline risolte ai raggi XStrutture cristalline risolte ai raggi X

Strutture NMRStrutture NMR

Metodi empirici e tecniche predittiveMetodi empirici e tecniche predittive

Predizione delle modificazioni postPredizione delle modificazioni posttraduzionalitraduzionali

2

Page 3: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Introduzione Introduzione 1 1Mentre il genoma è la somma complessiva del mate-riale genetico di un organismo, il proteomaproteoma è l’insieme delle sue proteineLa natura dei geni la loro semplice composizione chimica e la loro capacità di essere utilizzati come stampo per fare copie esatte di sé stessi li ha resi relativamente facili da studiare ed analizzare con metodi automaticiLa natura delle proteine con i loro venti componenti elementari, le complesse modificazioni chimiche e l’im-possibilità di duplicarsi è, invece, molto più difficile da analizzare

3

Page 4: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Introduzione Introduzione 2 2Le proteine sono gli agenti che, all’interno della cellula, “fanno ciò che c’è da fare”Una delle scoperte più eclatanti della nuova era post genomica, è che il vecchio paradigma secondo cui un gene codifica per una sola proteina risulta non essere più validoInfatti, a causa di modifiche posttraduzionali (glicosi-lazione, fosforilazione) delle proteine, ad un genoma possono corrispondere più di un proteomaIl genoma di un essere vivente, anche quando comple-tamente sequenziato, non permette di comprendere tutte le funzioni biologiche che caratterizzano un organismo e che dipendono da molteplici fattori, tra i quali le vie regolatorie e metaboliche delle proteine

4

Page 6: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Introduzione Introduzione 4 4La proteomica si rivela, pertanto, complementarecomplementare alla genomica ed essenziale per la comprensione dei meccanismi biologiciLa proteomica consente lo studio delle proteine, sia nelle forme appena tradotte dai geni sia nelle isoforme (dovute a splicing alternativo) o nelle eventuali modimodi-fiche postfiche posttraduzionalitraduzionali, che possono verificarsi nella cellula dopo la traduzioneLo studio delle isoforme o delle modifiche post traduzionali consente la comprensione dei meccanismi di interazione tra le proteine: tali meccanismi ne condizionano l’attivitàattività e la funzionefunzione

6

Page 7: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Introduzione Introduzione 5 5La proteomica è la scienza che mira ad indagare e a La proteomica è la scienza che mira ad indagare e a stabilire l’identità, la quantità, la struttura e le funzioni stabilire l’identità, la quantità, la struttura e le funzioni biochimiche e cellulari di tutte le proteine presenti in biochimiche e cellulari di tutte le proteine presenti in un tessuto, in una cellula o in un comparto subun tessuto, in una cellula o in un comparto sub cellulare, descrivendo come queste proprietà siano cellulare, descrivendo come queste proprietà siano variabili nello spazio, nel tempo o in un determinato variabili nello spazio, nel tempo o in un determinato stato fisiologico stato fisiologico (M. Tyers & M. Mann, 2003)Obiettivi della proteomicaObiettivi della proteomica

Comparazione tra tessuti malati e normaliComparazione tra tessuti malati e trattati farmacologica-menteIdentificazione di nuovi bersagli proteici per farmaciStudio delle modificazioni posttraduzionaliStrategie integrate con la genomicaAnalisi dei tessuti nelle patologie tumorali

7

Page 8: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Introduzione Introduzione 6 6Gli attuali studi di proteomica sono prevalentemente focaliz-zati su due aree principali:

Proteomica funzionaleProteomica funzionaleProteomica di espressioneProteomica di espressione

La proteomica funzionale proteomica funzionale ha come obiettivo la definizione della funzione biologica di proteine, il cui ruolo è ancora sconosciuto, e l’identificazione delle interazioni proteina proteina in vivo, per la descrizione a livello molecolare dei meccanismi cellulariLa proteomica di espressione proteomica di espressione è focalizzata sullo studio quali-tativo e quantitativo dei differenti profili di espressione delle proteine; l’espressione delle proteine può infatti modificarsi per variazioni delle condizioni cellulari (diverse condizioni di crescita, stress o presenza di patologie cellulari, etc.)

Il diverso profilo delle proteine rilevate in un tessuto, assenza, presenza o livelli quantitativi differenti, sono potenziali bioin-dicatori di uno stato fisiologico e/o patologico 8

Page 9: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Introduzione Introduzione 7 7Pertanto…

Le proteine sono necessarie per tutte le attività biologicheIl proteoma rappresenta l’insieme delle proteine di un organismo o di un sistema biologico, ossia l’insieme delle proteine prodotte dal genomaLo studio del proteoma (studio della struttura e dell’at-tività proteica) è fondamentale per comprendere la fisio-logia e i processi biologici degli esseri viventi

ProteomicaProteomica Scienza che consente lo studio appro-fondito del proteoma, il completo corredo proteico espresso in una cellula o in un tessuto (Wilkins et al., 1996)

9

Page 10: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Dal genoma al proteoma Dal genoma al proteoma 1 1Nonostante la capacità di generare sbalorditive quanti-tà di dati, le tecniche di analisi dell’espressione genica forniscono poche informazioni su quali proteine siano presenti all’interno della cellula e tanto meno su quale sia la loro funzione e come venga svolta

La correlazione tra l’abbondanza relativa di un mRNA e l’abbondanza relativa della sua corrispondente proteina all’interno di ogni cellula è abitualmente inferiore allo 0.5Molte proteine, dopo la traduzione, subiscono ampie modificazioni biochimiche, con modalità molto diverse

Tali modificazioni, quasi invariabilmente, alterano l’attività proteica e si manifestano in forme diverse a seconda del tipo di tessuto e delle circostanze

10

Page 11: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Dal genoma al proteoma Dal genoma al proteoma 2 2Molte proteine non sono funzionalmente rilevanti finché non si assemblano tra loro in complessi più grandi o non vengono trasportate in collocazioni appropriate all’inter-no o all’esterno della cellula

La sequenza aminoacidica può solo offrire qualche indica-zione sullo scopo di tali interazioni e sulla destinazione finale della proteina

Difficoltà nel dedurre la popolazione proteica di una cellula ed il ruolo delle singole proteine, aggravata an-che dalla scarsa disponibilità di proteine analizzabili direttamente

11

Page 12: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Dal genoma al proteoma Dal genoma al proteoma 3 3Le proteine richiedono manipolazioni molto più accura-te rispetto al DNA perché la struttura terziaria, funzio-nalmente importante, può venire facilmente alterata quando entrano in contatto con una superficie o un ambiente inappropriatiInoltre:

La capacità degli acidi nucleici di ibridarsi in maniera specifica con altre sequenze nucleotidiche rendono l’iden-tificazione del DNA un compito relativamente semplice L’identificazione delle proteine è molto più difficile e richiede analisi complicate di spettrometria di massa e strumenti software evoluti o la generazione di specifici anticorpi

12

Page 13: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Dal genoma al proteoma Dal genoma al proteoma 4 4Infine, molte analisi effettuate sia sugli acidi nucleici sia sulle proteine si basano sulla capacità di manipo-lare miliardi di molecole identiche

La generazione di numerose copie di ogni gene è semplificata dalla capacità del gene di venire utilizzato come stampo per la propria amplificazione (PCR)Le proteine devono essere isolate chimicamente, in modo inefficiente e laborioso, a partire da un gran numero di cellule viventi

Tuttavia… le potenzialità che derivano dalla cono-scenza del proteoma di un organismo sono enormi:

Comprensione delle basi molecolari di alcune malattieConversione di cellule in fabbriche molecolariEfficienza degli organismi geneticamente ingegnerizzatiProgettazione di nuovi farmaci

13

Page 14: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Dal genoma al proteoma Dal genoma al proteoma 5 5

Genoma vs ProteomaGenoma vs ProteomaIl bruco e la farfalla sono organismi geneticamente Il bruco e la farfalla sono organismi geneticamente identici, ma posseggono diverso proteoma e fenotipo, identici, ma posseggono diverso proteoma e fenotipo, così come il girino e la rana!così come il girino e la rana!

14

Page 15: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Classificazione delle proteineClassificazione delle proteine

L’indicizzazione e la catalogazione dei dati proteomici sono compiti molto ardui, data la grande varietà di proteine differenti, utili alla cellula per svolgere i suoi compitiDiversi metodi sistemici proposti: il più antico, dovuto alla International Enzyme CommissionInternational Enzyme Commission, si basa sulle funzioni delle proteine ed assegna ogni proteina ad una delle sei differenti categorie che derivano dalle diverse “macrofunzioni”In alternativa, metodo di classificazione basato sulla storia evolutiva e le similarità strutturali, con circa mille famiglie di proteine omologhe

15

Page 16: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Nomenclatura degli enzimi Nomenclatura degli enzimi 1 1La rapida crescita, durante gli anni ‘50, del numero di enzimi conosciuti rese necessario stabilire delle con-venzioni riguardo alla loro nomenclaturaPrima della fondazione della International Enzyme Commission (1955), non era infatti insolito che un singolo enzima fosse conosciuto con nomi diversi, né che lo stesso nome venisse assegnato ad enzimi dif-ferentiInoltre, alcuni nomi non davano nessuna indicazione sulla natura delle reazioni chimiche catalizzate dal relativo enzimaNel 1965 fu suggerito un approccio sistematico per classificare gli enzimi in sei classi principali, sulla base delle tipologie generali delle reazioni catalizzate (http://www.chem.qmul.ac.uk/iubmb/enzyme/)

16

Page 17: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Nomenclatura degli enzimi Nomenclatura degli enzimi 2 2

17

Attraverso l’utilizzo di un sistema di numerazione, ad ogni enzima viene assegnato un codice numerico, dove il primo numero si riferisce alla classe principale, il secondo ed il terzo numero corrispondono a specifiche sottoclassi ed il numero finale rappresenta il numero seriale dell’enzima nella sua sottoclasse

Valued Acer Customer
Idrolisi (dal greco ydor, acqua, e lyo, sciogliere: reazione chimica in cui le molecole vengono scisse in due o più parti per effetto dell'acqua.Isomeria:fenomeno per il quale sostanze diverse per proprietà fisiche e spesso anche per comportamento chimico hanno la stessa formula bruta, cioè stesso peso molecolare e stessa composizione percentuale di atomi.ATP: L'adenosina trifosfato è il composto ad alta energia richiesto dalla stragrande maggioranza delle reazioni metaboliche endoergoniche.
Page 18: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Nomenclatura degli enzimi Nomenclatura degli enzimi 3 3

EsempiEsempiL’alcoolalcooldeidrogenasi deidrogenasi è identificato come 1.1.1.1 classe principale: ossidoreduttasiossidoreduttasi, classe: attività sul gruppo CHOH del donatore; sottoclasse: con NAD o NADP (molecole che permettono l’ossidoriduzione) come accettore; è il primo dei 269 enzimi presenti in questa categoriaL’RNARNApolimerasi DNApolimerasi DNAdipendente dipendente è identificato dal nu-mero 2.7.7.6 classe principale: transferasitransferasi; classe: trasferimento di gruppi contenti fosforo; sottoclasse: nucleotidiltransferasi; è il sesto dei 60 enzimi presenti in questa categoria

18

Page 19: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Nomenclatura degli enzimi Nomenclatura degli enzimi 4 4

19

Page 20: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Famiglie e superfamiglie Famiglie e superfamiglie 1 1

La similarità di sequenza aminoacidica, tra le molte migliaia di proteine per cui essa è disponibile, sugge-risce che tutte le proteine esistenti ai giorni nostri possano derivare da circa mille proteine originarieNon è chiaro, tuttavia, se il ristretto numero di proteine esistenti sia dettato più da vincoli fisici sul ripiegamento della catena polipeptidica in una strut-tura tridimensionale o dalla sufficiente varietà di proprietà strutturali e chimiche che esse possiedono (che non ne ha rese necessarie altre nel corso del-l’evoluzione) o da una combinazione di entrambi i fattori

20

Page 21: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Famiglie e superfamiglie Famiglie e superfamiglie 2 2

Una delle argomentazioni più forti a favore dell’ipotesi evolutiva viene dallo studio pubblicato nel 1991 da Dorit et al., nel quale si teorizzava che gli esoni stessi corrispondano strettamente ai domini funzionali delle proteine e che tutte le proteine derivino dai vari ar-rangiamenti dei circa 7000 esoni disponibiliTuttavia, a prescindere dalle basi della similarità, i metodi di allineamento di sequenze e di ricerca di similarità in database sono spesso impiegati per sco-prire le possibili relazioni familiari fra proteine diverse

Utili per predire la struttura proteica, che sembra sotto-stare a vincoli evolutivi più forti della sequenza amino-acidica

21

Page 22: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Famiglie e superfamiglie Famiglie e superfamiglie 3 3

Per definizione, le proteine che hanno un’identità di sequenza maggiore del 50% sono membri di un’unica famigliafamigliaAllo stesso modo, le superfamigliesuperfamiglie sono gruppi di famiglie proteiche correlate tramite livelli di similarità di sequenza bassi, ma ancora rilevabili (30%) hanno un’origine evolutiva comune, ma più anticaTutte le proteine possono essere ulteriormente suddi-vise in categorie sulla base delle caratteristiche predo-minanti di struttura secondaria: proteine di membrana, proteine principalmente , proteine principalmente , strutture e e strutture

22

Page 23: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Famiglie e superfamiglie Famiglie e superfamiglie 4 4

23

Sono stati realizzati diversi database gerarchici che raggruppano le proteine secondo queste caratteristiche

SCOPSCOP Structural Classification Of ProteinCATHCATH Class, Architecture, Topology and Homologous superfamilyFSSPFSSP Fold classification based on Structure-Structure alignment of Proteins

Page 24: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Ripiegamenti Ripiegamenti 1 1Mentre le famiglie di proteine hanno relazioni evolutive chiare e le superfamiglie proteiche hanno relazioni evolutive probabili, si dice che le proteine presentano un ripiegamentoripiegamento comune se hanno la stessa struttura secondaria con lo stesso tipo di arrangiamento e con la stessa connessione topologicaProteine diverse con lo stesso ripiegamento spesso presentano elementi marginali di struttura secondaria e regioni a turn che differiscono in dimensione e con-formazioneIl termine ripiegamento è utilizzato come sinonimo di motivo strutturalemotivo strutturale, anche se generalmente si riferisce a combinazioni più ampie di strutture secondarie in qualche caso, un ripiegamento coinvolge metà della struttura totale della proteina 24

Page 25: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Ripiegamenti Ripiegamenti 2 2

Proteine che si trovano nella stessa categoria di ripiegamento possono anche non avere un’origine evo-lutiva comune, ma essere il risultato di un rimesco-lamento degli esoni, in cui proteine con nuove funzioni vengono create attraverso il processo di ricombina-zione di esoni corrispondenti a domini funzionali di geni esistenti a livello del DNAAlternativamente, le similarità strutturali possono nascere solamente da caratteristiche fisiche e chimiche delle proteine, che favoriscono certi arrangiamenti e certe topologie della catena

25

Page 26: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Tecniche sperimentaliTecniche sperimentali

Come nel caso dell’analisi genomica, molte analisi proteomiche sono limitate dalle tecniche sperimentali attualmente disponibiliSfortunatamente, dalla prospettiva della proteomica, la natura stessa delle proteine rende le analisi di laboratorio particolarmente difficili e molto meno pre-cise rispetto a quelle disponibili per l’analisi genomica

Elettroforesi bidimensionaleElettroforesi bidimensionaleSpettrometria di massaSpettrometria di massaMicroarray proteiciMicroarray proteici

26

Page 27: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Elettroforesi bidimensionale Elettroforesi bidimensionale 1 1L’elettroforesi bidimensionale elettroforesi bidimensionale è una tecnica che per-mette di separare le proteine in base al peso moleco-lare e alla caricaIl procedimento utilizzato parte dall’estrazione delle proteine in un tessutoLe proteine, poste su un striscia di supporto polimerico a cui è applicata una corrente elettrica e in presenza di un gradiente di acidità, migrano in maniera a diversa a seconda della loro carica elettrica intrinseca, rag-giungendo il proprio punto isoelettrico e formando delle “bande”A questo punto il supporto viene posto sul margine di un gel per elettroforesi che consente la separazione delle proteine in base al peso molecolare in seguito all’applicazione della corrente elettrica

27

Page 28: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Elettroforesi bidimensionale Elettroforesi bidimensionale 2 2

Il risultato finale è un gel in cui virtualmente ciascuna proteina occupa un punto nello spazio bidimensionale, ed è evidenziabile attraverso opportune colorazioniLa tappa ultima consiste nell’isolamento dal gel di cia-scuna proteina per effettuare l’analisi che ne consenta l’identificazioneL’analisi può essere fatta in maniera manuale, rita-gliando dei tondini di gel contenenti una sola proteina e quindi procedendo con la spettrografia di massa, o attraverso tecniche automatiche (più o meno evolute) di lettura diretta da gel

28

Page 29: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Elettroforesi bidimensionale Elettroforesi bidimensionale 3 3

Con l’elettroforesi bidimensio-nale si ottengono fotografie in cui ogni puntino rappresenta una proteina Confrontando fotografie otte-nute da campioni diversi si pos-sono individuare quali proteine differiscono per presenza e quantità in diverse condizioni sperimentali

29

In pratica, si considera una cellula o un tessuto e, usando le tecniche indicate, si ottengono, con una sola analisi, infor-mazioni su tutte le proteine che compongono il campione

Page 30: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Elettroforesi bidimensionale Elettroforesi bidimensionale 4 4

L’elettroforesi bidimensionale ha in realtà diverse gravi limitazioni che ne impediscono l’utilizzo estensivo

Il genoma umano codifica molte decine di migliaia di proteineInadeguatezza per l’analisi delle proteine molto piccole o con poca carica elettrica e delle proteine che attraver-sano la membrana plasmatica (e che rivestono impor-tanti ruoli in molte malattie) a causa della loro scarsa solubilità nelle preparazioni e nei gelSensibilità relativamente bassa dei metodi di rilevamentoDifficoltà nel determinare con precisione quale proteina è rappresentata da ciascuno spot

30

Page 31: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Spettrometria di massa Spettrometria di massa 1 1

Lo spettrometrospettrometro è uno strumento che scompone lo spettro di una sorgente e ne misura le componentiEsistono spettrometri che misurano lo spettro della radiazione elettromagnetica e spettrometri che misu-rano lo spettro di massa di una sostanza, ossia le masse dei suoi costituenti (atomi, molecole, composti)In uno spettrometro di massa possono essere intro-dotti campioni allo stato solido, liquido o gassoso

Le sostanze solide o liquide devono essere rese volatili prima di iniziare la fase di ionizzazione in cui la molecola del composto viene ionizzata, nel caso più comune per interazione con un fascio di elettroni

31

Page 32: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Spettrometria di massa Spettrometria di massa 2 2

Lo ione molecolare carico positivamente si frammenta, con formazione di molecole e di ioni positivi (cationi)

Solo questi ultimi sono rivelati dallo spettrometro e sono separati in funzione del loro rapporto massa/caricaInfatti, i percorsi dei frammenti proteici (all’interno di un analizzatore) vengono fatti deviare da un campo magne-tico

La collisione degli ioni carichi positivamente con un collettore posto all’estremità dell’analizzatore genera una corrente elettrica che può essere amplificata e rilevata come una serie di picchi corrispondenti ad un’impronta impronta digitale della massa dei peptididigitale della massa dei peptidi (mass fingerprintmass fingerprint)

In questo modo è possibile anche individuare l’esistenza di isotopi e determinarne la massa

32

Page 33: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Spettrometria di massa Spettrometria di massa 3 3

Nel grafico di uno spettro di massa, l’asse delle x riporta i valori di rapporto massa/carica e l’asse delle y i valori di abbondanza relativa degli ioni analizzatiSe la risoluzione dello strumento è sufficientemente elevata, è possibile determinare la massa esatta dei singoli ioni, da cui si può dedurre la composizione elementare dello ione stessoLo spettrometro di massa può essere direttamente interfacciato ad un gascromatografo; miscele com-plesse di prodotti possono quindi essere risolte nei singoli componenti ed i singoli spettri possono essere interpretati o confrontati con librerie standard di spettri di composti noti

33

Page 34: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Microarray proteici Microarray proteici 1 1

I microarray proteici microarray proteici si sono diffusi grazie alla possibilità di svolgere analisi di proteine su larga scala, nello stesso modo in cui i chip genetici hanno rivolu-zionato l’analisi del trascrittomaIl concetto alla base dei chip proteici è molto simile a quello dei chip genetici: piccole quantità di sonde individuali sono legate covalentemente alla superficie di chip di silicio in array ad alta densitàLe proteine estratte dalle cellule vengono marcate con fluorofori e flussate sul chip

Proprio come avviene con i chip genetici, la quantità di materiale (in questo caso, proteina) legato alle sonde viene determinato mediante eccitazione del fluoroforo

34

Page 35: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Microarray proteici Microarray proteici 2 2Per rilevare le interazioni proteinaproteina, protei-nacomposto, etc., si possono utilizzare anche array di sonde di cattura (per esempio anticorpi), che si legano alle proteine di un campione in modo tale da rilevarne i relativi livelli di espressioneI microarray proteici non hanno lo stesso impatto dei chip genetici

Diversamente dalle sequenze di DNA, con i loro legami unici dettati dall’accoppiamento fra basi, è ragionevole aspettarsi che una singola proteina possa interagire con più sonde differentiLa cinetica di legame di ogni sonda può variare e differenze nell’in-tensità del segnale potrebbero essere dovute a differenze nell’intensità di legameLe proteine sono notoriamente sensibili alla chimica del loro ambiente ed alla superficie che esse incontrano, e sia gli estratti cellulari sia le sonde si possono comportare in modo inatteso quando vengono sottoposte alle procedure di controllo 35

Page 36: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Microarray proteici Microarray proteici 3 3

Per il momento (ed in attesa di tecniche di analisi automatica attendibili) è più semplice utilizzare i chip genetici come base, per puntare verso lo studio delle proteine di interesse

Una volta ristretto il campo, le analisi proteomiche su piccoli sottoinsiemi di proteine verranno effettuate su chip proteici realizzati appositamente

36

Page 37: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci 1 1

Una delle principali applicazioni della bioinformatica è la ricerca di agenti farmaceutici efficaci per prevenire e curare malattie dell’uomoLo sviluppo ed il test di un nuovo farmaco sono dispendiosi sia in termini di tempo spesso occorrono fino a 15 anni , sia di denaro con costi di centinaia di milioni di dollari La genomica funzionale, la bioinformatica e la proteo-mica promettono di ridurre il lavoro associato a questo processo, accelerando i tempi ed abbassando i costi di sviluppo di nuovi farmaci

37

Page 38: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci 2 2

Mentre le fasi esatte dello sviluppo di un farmaco sono variabili, il procedimento complessivo si divide nei due passi fondamentali di scopertascoperta e testtestIl processo di test, che coinvolge prove precliniche e cliniche, non è generalmente soggetto a miglioramenti significativi per l’utilizzo di metodi automaticiIl processo di scoperta, che è invece laborioso e co-stoso ed offre un terreno fertile per la ricerca bioinfor-matica, può essere suddiviso in diverse fasi

Identificazione del bersaglioIdentificazione del bersaglio

Scoperta ed ottimizzazione di un composto “guida”Scoperta ed ottimizzazione di un composto “guida”

Tossicologia e farmacocinetica (che studia quantitativa-Tossicologia e farmacocinetica (che studia quantitativa-mente l’assorbimento, la distribuzione, il metabolismo e mente l’assorbimento, la distribuzione, il metabolismo e l’eliminazione dei farmaci)l’eliminazione dei farmaci)

38

Page 39: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci 3 3

L’obiettivo dell’identificazione del bersaglio identificazione del bersaglio consiste nell’isolare una molecola biologica che sia essenziale per la sopravvivenza o la proliferazione di un parti-colare agente causa di una malattia, detto patogenopatogenoIdentificato il bersaglio, l’obiettivo della progettazione di farmaci (drug designdrug design) consiste nello sviluppo di una molecola che si leghi al bersaglio e lo inibiscaDato che la funzione del bersaglio è essenziale per il processo vitale del patogeno, l’inibizione del bersaglio ferma la proliferazione del patogeno o lo distruggeComprendere la struttura e la funzione delle proteine è una componente fondamentale nello sviluppo di far-maci, in quanto le proteine sono comuni bersagli dei farmaci stessi

39

Page 40: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci 4 4

EsempioEsempioLa HIV proteasi HIV proteasi è una proteina prodotta dal virus umano dell’immunodeficienza (HIV) il patogeno che causa l’AIDS nel contesto di una cellula umana ospiteLa HIV proteasi è essenziale per la proliferazione del virus: l’inibizione della proteina annienta l’efficacia del virus e la sua capacità di trasmissione

40

Page 41: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci 5 5

Come potrebbe una molecola inibire l’azione di un enzima, quale la HIV proteasi?

Le proteasi sono proteine che digeriscono altre proteine, come gli enzimi di restrizione utilizzati per tagliare in modo specifico la molecola di DNAMolte delle proteine di cui l’HIV ha bisogno per soprav-vivere e proliferare in un ospite umano vengono prodotte come una singola, lunga, catena polipeptidicaQuesto polipeptide deve poi essere tagliato nelle compo-nenti proteiche funzionali dalla HIV proteasiCome molti enzimi, la HIV proteasi possiede un sito attivo a cui si legano e su cui operano altre molecoleProgettare una molecola che si leghi nel sito attivo della HIV proteasi, in modo da impedirne il normale funziona-mento

41

Page 42: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Screening di ligandi Screening di ligandi 1 1Il primo passo verso la scoperta di un inibitoreinibitore per una particolare proteina è di solito l’identificazione di uno o più composti guidacomposti guida, che si leghino al sito attivo della proteina bersaglioTradizionalmente, la ricerca dei composti guida è sem-pre stata un processo trialanderror, durante il quale si testano diversi composti, fino a trovarne un numero sufficiente con effetti inibitoriRecentemente, metodologie di screeningscreening ad alta pro-duttività (HTSHTS, HighHighThroughput ScreeningThroughput Screening) hanno reso la procedura molto più efficiente, anche se il processo sotteso resta comunque una ricerca esau-stiva del maggior numero di composti guida

42

Page 43: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Screening di ligandi Screening di ligandi 2 2È noto da tempo che i siti attivi degli enzimi sono ospitati in tasche (cavità) ricavate nella struttura proteica, con specifiche caratteristiche chimicofisicheL’interazione proteinaligando è dettata principalmente dalle caratteristiche di complementarietà dei due com-posti: ligandi idrofobici legheranno regioni idrofobiche, ligandi carichi saranno richiamati da regioni cariche di segno opposto, etc.Gli algoritmi di dockingdocking di ligandi e quelli di screening tentano di rendere efficienti i processi di scoperta dei composti guida, muovendosi dal mondo della speri-mentazione in vitro a quello dei modelli astratti e del calcolo automatico

43

Page 44: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Docking di ligandi Docking di ligandi 1 1Il dockingdocking è la simulazione in silicio dell’aggancio della proteina con un ligando, ovvero obiettivo del docking è determinare come possono interagire due molecole di struttura nota

Geometria delle superficiInterazioni tra residui affiniCampi di forza elettrostatici

44

Page 45: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Docking di ligandi Docking di ligandi 2 2In molti casi, la struttura tridimensionale di una protei-na e del suo ligando sono note, ma la struttura del complesso che essi formano è sconosciuta

Nella progettazione di farmaci, il docking molecolare viene impiegato per determinare come un particolare farmaco si lega ad un bersaglio o come due proteine interagiscano fra loro a formare un sito di legame

Gli approcci di docking molecolare hanno molto in comune con gli algoritmi per il ripiegamento delle proteine

Entrambe le problematiche implicano il calcolo dell’ener-gia di una particolare conformazione molecolare e la ricerca della conformazione che minimizza l’energia libera del sistema Molti gradi di libertà: ricerche Molti gradi di libertà: ricerche euristiche e soluzioni subeuristiche e soluzioni subottimeottime

45

Page 46: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Docking di ligandi Docking di ligandi 3 3Come nel ripiegamento proteico, vi sono due considerazioni principali di cui tenere conto all’atto della progettazione di un algoritmo di docking

Formulare una funzione energia per valutare la qualità di un particolare complesso e successivamente utilizzare un algorit-mo per esplorare lo spazio di tutti i possibili modi e conforma-zioni di legame alla ricerca di una struttura con energia minimaGestire la flessibilità sia della proteina sia del ligando putativo

L’approccio chiaveapproccio chiaveserratura serratura assume una struttura proteica rigida a cui si aggancia un ligando con struttura flessibile (approccio computazionalmente vantaggioso)Il docking con adattamento indottodocking con adattamento indotto permette la flessibilità sia della proteina che del ligandoCompromesso: assumere per la proteina una catena principale rigida, mentre si permette la flessibilità delle catene laterali vicino al sito di legame del ligando

46

Page 47: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Docking di ligandi Docking di ligandi 4 4

47

Page 48: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Docking di ligandi Docking di ligandi 5 5

AutoDockAutoDock (http://autodock.scripps.edu/) è un metodo ben noto per il docking di ligandi rigidi o flessibili

Per valutare un particolare complesso usa un campo di forza basato su una grigliaIl campo di forza viene utilizzato per dare un punteggio al complesso in base alla formazione di interazioni elettrostatiche favorevoli, al numero di legami idrogeno, alle interazioni di van der Waals, etc.

48

Page 49: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Docking di ligandi Docking di ligandi 6 6AutoDockAutoDock utilizzava originariamente un approccio Monte Carlo/simulated annealing

Si inducono cambiamenti casuali nella posizione e conforma-zione corrente del ligando, tenendo quelli che danno origine a conformazioni a più bassa energia rispetto a quella corrente (quando un cambiamento porta ad un aumento di energia, viene scartato)Tuttavia, per permettere all’algoritmo di trovare stati a bassa energia, superando eventuali barriere energetiche, i cambia-menti che portano ad energie più alte, talvolta, vengono ac-cettati (con una frequenza alta all’inizio del processo di ottimiz-zazione, che decresce lentamente per iterazioni successive)

Le versioni più recenti utilizzano algoritmi genetici, programmi di ottimizzazione che emulano la dinamica della selezione naturale su una popolazione di soluzioni in competizione

49

Page 50: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Screening di database Screening di database 1 1Una delle considerazioni principali nel progettare algoritmi di docking è il bilanciamento tra la necessità di una completa ed accurata ricerca di tutte le possibili conformazioni e modalità di legame del ligando e la necessità di realizzare un algoritmo di complessità computazionale “ragionevole”

Per lo screening di database di possibili farmaci, gli algoritmi devono infatti effettuare il docking di migliaia di ligandi al sito attivo di una proteina e, pertanto, hanno bisogno di un efficienza elevata

50

Page 51: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Screening di database Screening di database 2 2Metodi progettati specificamente per lo screening di database, come l’algoritmo SLIDESLIDE, spesso riducono il numero di composti considerati, utilizzando tecniche di indicizzazione del database per scartare, a priori, i composti guida che è altamente improbabile che leghino il sito attivo del bersaglio

SLIDESLIDE caratterizza il sito attivo del bersaglio in accordo con la posizione di potenziali donatori ed accettori di legami idrogeno e con i punti di interazione idrofobica del ligando, formando un modelloOgni potenziale ligando nel database viene caratte-rizzato nello stesso modo e viene costruito un insieme di indici

51

Page 52: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Screening di database Screening di database 3 3L’operazione di indicizzazione permette a SLIDESLIDE di scartare rapidamente i ligandi che sono, per esempio, troppo grandi o troppo piccoli per adattarsi al modelloAttraverso la riduzione del numero di ligandi che vengono sottoposti alla procedura di docking, compu-tazionalmente onerosa, SLIDESLIDE (e algoritmi simili) possono sondare grandi database di potenziali ligandi in giorni, o ore, rispetto a tempistiche di mesi

52

Page 53: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Screening di database Screening di database 4 4

53

Page 54: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 1 1

Anche la più potente tecnica microscopica è insufficiente per determinare le coordinate molecolari di ciascun atomo di una proteinaLa scoperta dei raggi X da parte di W. C. Roentgen (1895) ha invece permesso lo sviluppo di un potente strumento per l’analisi della struttura proteica: la cristallografia a raggi Xcristallografia a raggi XNel 1912, M. von Laue scoprì che i cristallicristalli, strutture solide formate da un reticolo regolare di atomi o molecole, dif-frangono i raggi X in motivi (pattern) regolari e prevedibiliAll’inizio degli anni ‘50, scienziati pionieristici come D. Hodgkin furono in grado di cristallizzare alcune molecole organiche complesse e di determinare la loro struttura osservando come esse diffrangessero un fascio di raggi XOggi, la cristallografia a raggi X è stata impiegata per determinare la struttura di circa 80000 proteine ad un alto livello di risoluzione 54

Page 55: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 2 2

55Source: PDB statisticsSource: PDB statistics

Page 56: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 3 3

Il primo passo nella determinazione cristallografica della struttura di una proteina è la crescita del relativo cristalloLa cristallizzazione è un processo molto delicato ed impegnativo, ma l’idea di base è semplice

Proprio come i cristalli di zucchero possono essere fatti crescere attraverso la lenta evaporazione di una soluzione di zucchero ed acqua, i cristalli di proteine vengono fatti crescere attraverso l’evaporazione di una soluzione di proteina puraI cristalli delle proteine, però, sono generalmente molto piccoli (da circa 0.3mm ad 1.5mm in ogni dimensione) e sono fatti circa al 70% di acqua, con una consistenza più simile alla gelatina che ai cristalli di zucchero

56

Page 57: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 4 4

57

La crescita dei cristalli di proteine generalmente richiede condizioni attentamente controllate ed una grande quantità di tempo: per raggiungere le opportune condi-zioni di cristallizzazione di una sin-gola proteina possono essere ne-cessari mesi o anche anni di esperimentiUna volta ottenuti, i cristalli proteici vengono caricati all’interno di un tubo capillare ed esposti ad un fascio di raggi X, che viene diffratto dal cristallo della proteina

Page 58: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 5 5

computer, per la successiva analisiUna volta ottenuti i dati di diffrazio-ne, si utilizzano metodi numerici e modelli proteici per determinare la struttura tridimensionale della pro-teina 58

Originariamente, il pattern di diffrazione veniva cattu-rato su una pellicola radio-graficaI moderni strumenti per la cristallografia utilizzano ri-levatori di raggi X che tra-sferiscono il pattern di dif-frazione direttamente su

Page 59: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 6 6

Più in dettaglio…Dallo spettro di diffrazione dei raggi X dei cristalli, i cristallografi sono in grado di calcolare mappe di densità elettronica, le quali, in pratica, sono immagini delle molecole che formano il cristallo ingrandite circa cento milioni di volteSi esaminano le mappe di densità elettronica con la grafica computerizzata e se ne verifica l’accordo (fitting) con un modello molecolareDopo le fasi di affinamento si riesce ad ottenere un mo-dello molecolare che ha un errore medio sulle coordinate di 0.30.5 Å e che permette un esame molto dettagliato della struttura tridimensionale delle proteine

59

Page 60: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 7 7

Infine, si noti che la struttura cristallografica è essen-zialmente mediata su più copie di un singolo cristallo proteico e sul tempo durante il quale il cristallo è esposto ai raggi XLe proteine cristallizzate non sono completamente rigide e la mobilità di un atomo specifico in una proteina rende “confuso” il segnale cristallograficoLa posizione delle molecole di acqua nel cristallo (che spesso sono incluse nelle entry dei database proteici) è difficile da risolvere e provoca “rumore”Tuttavia, la cristallografia è attualmente il metodo principale per ottenere la visione della struttura tridimensionale delle proteine a risoluzione atomica

60

Page 61: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X 8 8

61

La Protein Data Bank Protein Data Bank (PDBPDB, http://www.pdb.org) è la principale banca dati in cui sono depositate le strutture di proteine derivate dalla cristallografia a raggi X

Page 62: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture NMR Strutture NMR 1 1La tecnica spettroscopica della risonanza magnetica nuclea-re fornisce un metodo alternativo per determinare la struttura delle macromolecoleAlla base della tecnica NMRNMR (Nuclear Magnetic ResonanceNuclear Magnetic Resonance) vi è il fatto che gli atomi di alcuni elementi come l’idrogeno e gli isotopi radioattivi del carbonio e dell’azoto vibrano, o risuonano, quando le molecole a cui appartengono sono immerse in un campo magnetico statico ed esposte ad un secondo campo magnetico oscillanteI nuclei atomici tentano di allinearsi con il campo magnetico statico in maniera parallela o antiparallela e quando il campo magnetico oscillante fornisce loro un’energia pari alla differenza energetica fra i due stati, si verifica il fenomeno della risonanza, che può essere rilevata attraverso sensori esterni, come gli spettrometri NMR

62

Page 63: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture NMR Strutture NMR 2 2Il comportamento di ogni atomo è influenzato princi-palmente dagli atomi vicini, posti cioè in residui adiacentiL’analisi e l’interpretazione dei dati richiede tecniche numeriche complesse e limita, di per sé, l’utilità del-l’approccio per ogni proteina o dominio proteico (un’unità globulare o fibrosa formata da catene poli-peptidiche ripiegate in più regioni compatte le quali costituiscono divisioni della struttura terziaria) più lungo di 200 aminoacidiI metodi NMR non presuppongono la cristallizzazione: sono molto vantaggiosi nel caso di proteine che non possono essere cristallizzate (specialmente proteine integrali di membrana)

63

Page 64: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture NMR Strutture NMR 3 3Il risultato di un esperimento NMR è un insieme di vincoli sulle distanze interatomiche all’interno di una struttura macromolecolareDetti vincoli possono essere poi utilizzati, insieme alla sequenza proteica, per descrivere un modello della struttura tridimensionale della proteinaTuttavia, generalmente, più di un modello proteico può effettivamente soddisfare i vincoli ottenuti dalla tecni-ca NMR, perciò le strutture NMR solitamente conten-gono diversi modelli di una proteina, cioè diversi insiemi di coordinate, mentre le strutture cristallo-grafiche, solitamente, ne contengono solo unoLa PDB contiene circa 10000 strutture di proteine derivate dalla NMR

64

Page 65: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Strutture NMR Strutture NMR 4 4

65Source: PDB statisticsSource: PDB statistics

Page 66: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

PDB PDB 1 1

66

Le strutture contenute nella PDB sono memorizzate in formato testo

Una linea del file PDB contiene le coordinate (x,y,z) in angstrom (1010 m) di ogni atomo di una proteina (con altre informazioni utili)

Si può inoltre ottenere un’immagine della struttura tridimensionale della proteinaAd ogni struttura nella banca dati PDB è assegnato un codice a quattro caratteri

EsempioEsempio: 2APR contiene le coordinate molecolari della rizopuspepsinarizopuspepsina, una proteasi asparticaI file in formato PDB sono generalmente chiamati XXXX.pdb o pdbXXXX.ent, dove XXXX è il codice a quattro lettere della struttura

Page 67: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

PDB PDB 2 2

67

Page 68: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Rappresentazioni della struttura terziariaRappresentazioni della struttura terziaria

68

La rappresenta-La rappresenta-zione zione filiformefiliforme e a e a ball and stick ball and stick illu-illu-stra le interazioni stra le interazioni molecolarimolecolari

Il metodo a Il metodo a cartooncartoon evidenzia le regioni di evidenzia le regioni di struttura secondariastruttura secondaria

La rappresentazione La rappresentazione della della superficie mosuperficie mo--lecolarelecolare rivela la for- rivela la for-ma complessiva del-ma complessiva del-la proteinala proteina

Page 69: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Metodi empirici e tecniche predittive Metodi empirici e tecniche predittive 1 1

69

ProblemaProblema: realizzare un algoritmo che, data la struttura tridimensionale di una proteina, predica quali sono i residui che più probabilmente sono coinvolti in un’interazione proteinaproteina

Importante perché molte proteine sono attive solo quando sono associate ad altre proteine in complessi multienzimatici

SoluzioneSoluzione: dalle strutture presenti nel PDB, selezionare un insieme di strutture esempio che presentano due o più proteine che formano un complesso

Vi saranno residui interfaccialiinterfacciali, coinvolti nella superficie di contatto, e residui non interfaccialiPer ogni residuo, occorre selezionare un insieme di feature da misurare e da usare per risolvere il problema di predizione

Page 70: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Metodi empirici e tecniche predittive Metodi empirici e tecniche predittive 2 2

70

Possibili feature:Numero di residui in un intorno di raggio stabilito rispetto al residuo in esameCarica netta del residuo e dei residui viciniLivello di idrofobicitàPotenziale dei legami idrogenoCostruzione di un vettore di feature descrittive del dato residuo

In concomitanza con il vettore di feature, si ha il target che attesta l’appartenenza o meno del particolare residuo all’interfaccia proteinaproteina

Utilizzo di un metodo di apprendimento automaticoUtilizzo di un metodo di apprendimento automatico

Page 71: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Predizione delle modificazioni postPredizione delle modificazioni posttraduzionalitraduzionali

L’ampia varietà di strutture e funzioni proteiche è dovuta, in parte, al fatto che le proteine sono sotto-poste ad un’ampia varietà di modificazioni dopo essere state tradotte

Rimozione di segmenti della proteinaFormazione di legami covalenti alla superficie dei residui con zuccheri, fosfati o gruppi solfatiFormazione di legami incrociati tra residui all’interno di una proteina (formazione di legami disolfuro)

Molte di queste modificazioni sono effettuate da altre proteine, che devono riconoscere specifici residui superficiali, appropriati per innescare la modificazioneTecniche di predizione basate su reti neurali

71

Page 72: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 1 1La presenza di compartimenti interni circondati da membra-ne è una caratteristica delle cellule eucarioticheL’ambiente chimico all’interno dei diversi compartimenti può differire notevolmente, come può essere molto diversa la loro popolazione proteicaÈ un imperativo funzionale ed energetico che gli eucarioti trasportino le proteine nei loro compartimenti appropriatiPer esempio, gli istoni proteine legate al DNA associate con la cromatina sono funzionalmente utili solo all’interno dei nuclei delle cellule eucariotiche, dove si trovano i cromosomiAltre proteine come le proteasi, che si trovano dentro i perossisomi (comparti metabolici specializzati) sarebbero addirittura pericolose per la cellula se si trovassero in qualsiasi altro posto al suo interno

72

Page 73: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 2 2

Sembra che le cellule eucariotiche considerino le proteine come appartenenti a due classi distinte in base alla loro localizzazione: proteine non associate/ proteine non associate/ associate alle membraneassociate alle membraneIl primo insieme di proteine è tradotto esclusivamente dai ribosomi, che si trovano sospesi, o “fluttuanti”, dentro al citoplasma

73

Page 74: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 3 3

74

Page 75: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 4 4Gli mRNA tradotti dai ribosomi fluttuanti possono quindi rimanere nel citoplasma o essere trasportati:

nel nucleonei mitocondrinei cloroplastinei perossisomi

75

Page 76: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 5 5

Risiedere dentro il citoplasma sembra essere lo stato di default per le proteine; al contrario il trasporto delle proteine nei diversi compartimenti separati da mem-brane richiede la presenza ed il riconoscimento di specifici segnali di localizzazione

76

Page 77: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 6 6

Le proteine nucleari sono destinate al nucleo grazie al fatto che possiedono una sequenza di localizzazione sequenza di localizzazione nuclearenucleare: una regione interna lunga da 7 a 41 ami-noacidi ricca di lisine e/o arginine Le proteine mitocondriali possiedono tutte un’elica anfipatica (che contiene sia un gruppo idrofilico sia uno idrofobico) lunga da 12 a 30 aminoacidi al loro Nterminale

Questa sequenza segnale mitocondriale sequenza segnale mitocondriale è riconosciuta da un recettore sulla superficie dei mitocondri e viene spesso rimossa per attivare la proteina appena viene trasportata all’interno dei mitocondri

77

Page 78: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 7 7

Le proteine dei cloroplasti, codificate da geni nucleari, possiedono una sequenza di transito al cloroplasto sequenza di transito al cloroplasto (circa 25 aminoacidi posti all’Nterminale) che viene similmente riconosciuta da recettori proteici posti sulla superficie dei cloroplastiInfine, le proteine destinate ai perossisomi possiedono uno dei due segnali di destinazione perossisomiale segnali di destinazione perossisomiale riconosciuti da recettori che assicurano il loro trasporto alla destinazione corretta

78

Page 79: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 8 8Il secondo insieme di proteine è tradotto dai ribosomi legati alla membrana che sono associati con il reticolo reticolo endoplasmaticoendoplasmatico (ERER, Endoplasmic ReticulumEndoplasmic Reticulum)Il reticolo endoplasmatico è una rete di membrane intimamente associata con l’apparato di Golgi dove avviene l’elaborazione ulteriore delle proteine (come la glicosilazione e l’acetilazione)Tutte le proteine tradotte dai ribosomi dell’ER, in realtà, iniziano ad essere tradotte dai ribosomi flut-tuanti nel citoplasma

Quando i primi 1530 aminoacidi da tradurre corri-spondono ad una particolare sequenza segnalesequenza segnale, una particella che la riconosce si lega alla proteina e ne ferma la traduzione finché il ribosoma ed il suo mRNA non vengono trasportati all’ER 79

Page 80: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Smistamento delle proteine Smistamento delle proteine 9 9

Anche se non è evidente nessuna particolare sequenza consenso per la sequenza segnale, quasi sempre si riscontra una sequenza idrofobica lunga 1015 residui che termina con uno o più aminoacidi con carica positivaQuando la traduzione riprende, il nuovo polipeptide viene estruso attraverso un poro della membrana dell’ER nel lumen (spazio interno) dello stesso ER

Un peptidasi segnale peptidasi segnale taglia dalla proteina la sequenza target dell’Nterminale (a meno che non debba essere mantenuta permanentemente come una proteina legata alla membrana)

Reti neuraliReti neurali: http://www.cbs.dtu.dk/services/SignalP/

80

Page 81: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Taglio proteolitico Taglio proteolitico 1 1

Sia i procarioti che gli eucarioti possiedono numerosi enzimi responsabili del taglio e della degradazione delle proteine e dei peptidiEsistono molteplici esempi di taglio proteico

Rimozione del residuo di metionina presente all’inizio di ogni polipeptide (poiché il codone d’inizio codifica anche per la metionina)Rimozione dei peptidi segnale

81

Page 82: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Taglio proteolitico Taglio proteolitico 2 2

Qualche volta il segnale di taglio può essere corto quanto un singolo residuo

La chimotripsina taglia i polipeptidi all’estremità Ctermi-nale dei voluminosi residui aromatici (contenenti un anello) come la fenilalaninaLa tripsina taglia il legame peptidico sul lato carbossilico dei residui di arginina e di lisinaL’elastasi taglia il legame peptidico sul lato Cterminale di piccoli residui, come la glicina e l’alanina

In molti casi, comunque, il motivo di sequenza è più lungo e più ambiguo

Reti neuraliReti neurali: livello di accuratezza di predizione >98% (http://www.paproc.de)

82

Page 83: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Glicosilazione Glicosilazione 1 1

La glicosilazioneglicosilazione è il processo che lega permanente-mente un oligosaccaride (una breve catena di zucche-ri) alla catena laterale di un residuo sulla superficie proteicaLa presenza di residui glicosilati può avere un effetto significativo sul ripiegamento delle proteine, la loro localizzazione, l’attività biologica e l’interazione con altre proteineNegli eucarioti:

NNglicosilazioneglicosilazione

OOglicosilazioneglicosilazione

83

Page 84: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Glicosilazione Glicosilazione 2 2

La NNglicosilazione glicosilazione è l’aggiunta di un oligosaccaride ad un residuo di asparagina durante la traduzione della proteina

Il segnale principale che indica che un residuo di asparagina (Asn) deve essere glicosilato è la sequenza aminoacidica locale AsnXSer o AsnXThr, dove X corrisponde ad un qualsiasi residuo tranne la prolinaTuttavia, tale sequenza da sola non è sufficiente a determinare la glicosilazione (come si osserva in natura)

84

Page 85: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Glicosilazione Glicosilazione 3 3

La OOglicosilazione glicosilazione è un processo posttraduzionale in cui l’enzima Nacetilglucosaminil transferasi attacca un oligosaccaride ad un atomo di ossigeno di un resi-duo di serina o di treoninaDiversamente dalla Nglicosilazione, non si conoscono motivi di sequenza che segnalino un sito per la Oglicosilazione, ma solo la presenza di residui di prolina e valina vicino alla Ser o Thr che deve essere glicosilata

Reti neuraliReti neurali: accuratezza del 75% per Nglicosilazione e superiore all’85% per Oglicosilazione

85

Page 86: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Fosforilazione Fosforilazione 1 1

La fosforilazionefosforilazione (attacco di un gruppo fosfato) dei residui superficiali è probabilmente la modificazione posttraduzionale più comune nelle proteine animali

Le chinasichinasi, gli enzimi responsabili della fosforilazione, sono coinvolte in un’ampia varietà di percorsi regolatori e di trasmissione dei segnaliDato che la fosforilazione serve frequentemente come segnale di attivazione per un enzima, essa rappresenta spesso una condizione temporaneaLe fosfatasifosfatasi sono gli enzimi responsabili della rimozione dei gruppi fosfato dai residui fosforilati

86

Page 87: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Fosforilazione Fosforilazione 2 2

Dato che la fosforilazione dei residui chiave di tirosina, serina e treonina serve come meccanismo regolatore in un’ampia varietà di processi molecolari, i vari tipi di chinasi coinvolte in ogni processo devono avere un’alta specificità nel riconoscimento di particolari enzimi

Nessuna sequenza consenso singola identifica un residuo come un target della fosforilazione

Reti neuraliReti neurali: accuratezza 70%(http://www.cbs.dtu.dk/services/NetPhos)

87

Page 88: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Concludendo… Concludendo… 1 1

Mentre la genomica sta rapidamente diventando un’area di ricerca molto sviluppata, le tecniche proteo-miche iniziano solo ora ad identificare le proteine codificate nel genoma e le loro varie interazioniLa caratterizzazione del proteoma di un organismo promette di colmare il varco tra la nostra conoscenza del genoma e gli effetti fisiologici e morfologici dei geni che esso contieneVarie tassonomie sono state sviluppate per classificare ed organizzare le proteine secondo la funzione enzi-matica, la similarità della sequenza e la struttura tridimensionale

88

Page 89: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Concludendo… Concludendo… 2 2

Provvisti di database di famiglie, superfamiglie e ripie-gamenti proteici, insieme con tecniche sperimentali come l’elettroforesi bidimensionale e la spettrometria di massa, gli analisti sono in grado di separare, purificare ed identificare le varie proteine espresse da una cellula in un dato momentoUn’importante applicazione delle informazioni proteo-miche è la progettazione di farmaci

I progressi nella conoscenza della struttura delle proteine e nella cristallografia a raggi X hanno permesso la realizzazione di metodi automatici per lo screening ed il docking di ligandi proteici e per contribuire al processo di scoperta dei farmaci

89

Page 90: Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Concludendo… Concludendo… 3 3

Anche se la struttura tridimensionale delle proteine è la chiave di volta per capirne la funzione e l’interazione con le altre proteine, alcune utili informazioni possono essere ottenute anche dalla sola sequenzaLa localizzazione delle proteine e le varie modificazioni posttraduzionali sono segnalate attraverso motivi di sequenza conservati nella struttura primaria delle proteine

Le modificazioni posttraduzionali danno conto del fatto che lo stesso gene può codificare per più proteine

90