Proteomica - Fisiokinesiterapia · 2017. 1. 10. · Il proteoma rappresenta l’insieme delle...

90
Proteomica Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.(A. Einstein)

Transcript of Proteomica - Fisiokinesiterapia · 2017. 1. 10. · Il proteoma rappresenta l’insieme delle...

  • ProteomicaProteomica

    1

    “La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.” (A. Einstein)

  • SommarioSommarioDal genoma al Dal genoma al proteomaproteomaClassificazione delle proteineClassificazione delle proteineTecniche sperimentaliTecniche sperimentaliProgettazione di inibitori e di farmaciProgettazione di inibitori e di farmaciScreening di Screening di ligandiligandiStrutture cristalline risolte ai raggi XStrutture cristalline risolte ai raggi XStrutture NMRStrutture NMRMetodi empirici e tecniche predittiveMetodi empirici e tecniche predittivePredizione delle modificazioni postPredizione delle modificazioni post−−traduzionalitraduzionali

    2

  • Introduzione Introduzione −− 11Mentre il genoma è la somma complessiva del materiale genetico di un organismo, il proteomaproteoma èl’insieme delle sue proteineLa natura dei geni − la loro semplice composizione chimica e la loro capacità di essere utilizzati come stampo per fare copie esatte di sé stessi − li ha resi relativamente facili da studiare ed analizzare con metodi automaticiLa natura delle proteine − con i loro venti componenti elementari, le complesse modificazioni chimiche e l’im-possibilità di duplicarsi − è, invece, molto più difficile da analizzare

    3

  • Introduzione Introduzione −− 22Le proteine sono gli agenti che, all’interno della cellula, “fanno ciò che c’è da fare”Una delle scoperte più eclatanti della nuova era post−genomica, è che il vecchio paradigma secondo cui un gene codifica per una sola proteina risulta non essere più validoInfatti, a causa di modifiche post−traduzionali (glicosi-lazione, fosforilazione) delle proteine, ad un genoma possono corrispondere più di un proteomaIl genoma di un essere vivente, anche quando comple-tamente sequenziato, non permette di comprendere tutte le funzioni biologiche che caratterizzano un organismo e che dipendono da molteplici fattori, tra i quali le vie regolatorie e metaboliche delle proteine

    4

  • 5

    Introduzione Introduzione −− 33

  • Introduzione Introduzione −− 44La proteomica si rivela, pertanto, complementarecomplementare alla genomica ed essenziale per la comprensione dei meccanismi biologiciLa proteomica consente lo studio delle proteine, sia nelle forme appena trascritte dai geni sia nelle isoforme o eventuali modifiche postmodifiche post−−traduzionalitraduzionali, che possono verificarsi nella cellula dopo la trascrizioneLo studio delle isoforme o delle modifiche post−traduzionali consente la comprensione dei meccanismi di interazione tra le proteine: tali meccanismi ne condizionano l’attivitattivitàà e la funzionefunzione

    6

  • Introduzione Introduzione −− 55La proteomica è una scienza che mira ad indagare e a stabilire l’identità, la quantità, la struttura e le funzioni biochimiche e cellulari di tutte le proteine presenti in un tessuto, in una cellula o in un comparto sub−cellulare, descrivendo come queste proprietà siano variabili nello spazio, nel tempo o in un determinato stato fisiologico (M. Tyers & M. Mann, 2003)Obiettivi della Obiettivi della proteomicaproteomica

    Comparazione tra tessuti malati e normaliComparazione tra tessuti malati e trattati farmacologica-menteIdentificazione di nuovi bersagli proteici per farmaciStudio delle modificazioni post−traduzionaliStrategie integrate con la genomicaAnalisi dei tessuti nelle patologie tumorali

    7

  • Introduzione Introduzione −− 66Gli attuali studi di proteomica sono prevalentemente focaliz-zati su due aree principali:

    ProteomicaProteomica funzionalefunzionaleProteomicaProteomica di espressionedi espressione

    La proteomicaproteomica funzionale funzionale ha come obiettivo la definizione della funzione biologica di proteine, il cui ruolo è ancora sconosciuto, e l’identificazione delle interazioni proteina−proteina in vivo, per la descrizione a livello molecolare dei meccanismi cellulariLa proteomicaproteomica di espressione di espressione è focalizzata sullo studio quali-tativo e quantitativo dei differenti profili di espressione delle proteine; l’espressione delle proteine può infatti modificarsi per variazioni delle condizioni cellulari (diverse condizioni dicrescita, stress o presenza di patologie cellulari, etc.)

    Il diverso profilo delle proteine rilevate in un tessuto, assenza, presenza o livelli quantitativi differenti, sono potenziali bioin-dicatori di uno stato fisiologico e/o patologico 8

  • Introduzione Introduzione −− 77Pertanto…

    Le proteine sono necessarie per tutte le attivitàbiologicheIl proteoma rappresenta l’insieme delle proteine di un organismo o di un sistema biologico, ossia l’insieme delle proteine prodotte dal genomaLo studio del proteoma (studio della struttura e dell’attività proteica) è fondamentale per comprendere la fisiologia e i processi biologici degli esseri viventi

    ProteomicaProteomica Scienza che consente lo studio appro-fondito del proteoma, il completo corredo proteico espresso in una cellula o in un tessuto (Wilkins et al., 1996)

    9

  • Dal genoma al Dal genoma al proteomaproteoma −− 11Nonostante la capacità di generare sbalorditive quanti-tà di dati, le tecniche di analisi dell’espressione genica forniscono poche informazioni su quali proteine siano presenti all’interno della cellula e tanto meno su quale sia la loro funzione e come venga svolta

    La longevità di un mRNA e quella della proteina che codifica sono solitamente molto differenti − la correla-zione tra l’abbondanza relativa di un mRNA e l’abbondan-za relativa della sua corrispondente proteina all’interno di ogni cellula è abitualmente inferiore allo 0.5Molte proteine, dopo la traduzione, subiscono ampie modificazioni biochimiche, con modalità molto diverse

    Tali modificazioni, quasi invariabilmente, alterano l’attivitàproteica e si manifestano in forme diverse a seconda del tipo di tessuto e delle circostanze

    10

  • Dal genoma al Dal genoma al proteomaproteoma −− 22Molte proteine non sono funzionalmente rilevanti finchénon si assemblano tra loro in complessi più grandi o non vengono trasportate in collocazioni appropriate all’inter-no o all’esterno della cellula

    La sequenza aminoacidica può solo offrire qualche indica-zione sullo scopo di tali interazioni e sulla destinazione finale della proteina

    Difficoltà nel dedurre la popolazione proteica di una cellula ed il ruolo delle singole proteine aggravata anche dalla scarsa disponibilità di proteine analizzabili direttamente

    11

  • Dal genoma al Dal genoma al proteomaproteoma −− 33Le proteine richiedono manipolazioni molto più accura-te rispetto al DNA perché la struttura terziaria, funzio-nalmente importante, può venire facilmente alterata quando entrano in contatto con una superficie o un ambiente inappropriatiInoltre:

    La capacità degli acidi nucleici di ibridarsi in maniera specifica con altre sequenze nucleotidiche rendono l’iden-tificazione del DNA un compito relativamente semplice L’identificazione delle proteine è molto più difficile e richiede analisi complicate di spettrometria di massa e strumenti software evoluti o la generazione di specifici anticorpi

    12

  • Dal genoma al Dal genoma al proteomaproteoma −− 44Infine, molte analisi effettuate sia sugli acidi nucleici sia sulle proteine si basano sulla capacità di manipo-lare miliardi di molecole identiche

    La generazione di numerose copie di ogni gene èsemplificata dalla capacità del gene di venire utilizzato come stampo per la propria amplificazione (PCR)Le proteine devono essere isolate chimicamente, in modo inefficiente e laborioso, a partire da un gran numero di cellule viventi

    Tuttavia… le potenzialità che derivano dalla cono-scenza del proteoma di un organismo sono enormi:

    Comprensione delle basi molecolari di alcune malattieConversione di cellule in fabbriche molecolariEfficienza degli organismi geneticamente ingegnerizzatiProgettazione di nuovi farmaci

    13

  • Dal genoma al Dal genoma al proteomaproteoma −− 55Genoma vs Genoma vs ProteomaProteoma

    Il bruco e la farfalla sono organismi geneticamente Il bruco e la farfalla sono organismi geneticamente identici, ma posseggono diverso identici, ma posseggono diverso proteomaproteoma e fenotipo, e fenotipo, coscosìì come il girino e la rana!come il girino e la rana!

    14

  • Classificazione delle proteineClassificazione delle proteine

    L’indicizzazione e la catalogazione dei dati proteomicisono compiti molto ardui, data la grande varietà di proteine differenti, utili alla cellula per svolgere i suoi compitiDiversi metodi sistemici proposti: il più antico, dovuto alla International International EnzymeEnzyme CommissionCommission, si basa sulle funzioni delle proteine ed assegna ogni proteina ad una delle sei differenti categorie che derivano dalle diverse “macrofunzioni”In alternativa, metodo di classificazione basato sulla storia evolutiva e le similarità strutturali, con circa mille famiglie di proteine omologhe

    15

  • Nomenclatura degli enzimi Nomenclatura degli enzimi −− 11

    La rapida crescita, durante gli anni ‘50, del numero di enzimi conosciuti rese necessario stabilire delle con-venzioni riguardo alla loro nomenclaturaPrima della fondazione della International EnzymeCommission (1955), non era infatti insolito che un singolo enzima fosse conosciuto con nomi diversi, néche lo stesso nome venisse assegnato ad enzimi dif-ferentiInoltre, alcuni nomi non davano nessuna indicazione della natura delle reazioni chimiche catalizzate dal relativo enzimaNel 1965 fu suggerito un approccio sistematico per classificare gli enzimi in sei classi principali, sulla base delle tipologie generali delle reazioni catalizzate

    16

  • Nomenclatura degli enzimi Nomenclatura degli enzimi −− 22

    17

    Attraverso l’utilizzo di un sistema di numerazione, ad ogni enzima viene assegnato un codice numerico, dove il primo numero si riferisce alla classe principale, il secondo ed il terzo numero corrispondono a specifiche sottoclassi ed il numero finale rappresenta il numero seriale dell’enzima nella sua sottoclasse

  • Nomenclatura degli enzimi Nomenclatura degli enzimi −− 33

    EsempiEsempiL’alcoolalcool−−deidrogenasi deidrogenasi è identificato come 1.1.1.1 ⎯classe principale: ossidoreduttasiossidoreduttasi, classe: attività sul gruppo CH−OH del donatore; sottoclasse: con NAD o NADP (molecole che permettono l’ossido−riduzione) come accettore; è il primo dei 269 enzimi presenti in questa categoriaL’RNARNA−−polimerasi DNApolimerasi DNA−−dipendente dipendente è identificato da 2.7.7.6 ⎯ classe principale: transferasitransferasi; classe: trasfe-rimento di gruppi contenti fosforo; sottoclasse: nucleo-tidil−transferasi; è il sesto dei 60 enzimi presenti in questa categoria

    18

  • Nomenclatura degli enzimi Nomenclatura degli enzimi −− 44

    19

  • Famiglie e superfamiglie Famiglie e superfamiglie −− 11

    La similarità di sequenza aminoacidica, tra le molte migliaia di proteine per cui essa è disponibile, sugge-risce che tutte le proteine esistenti ai giorni nostri possano derivare da circa mille proteine originarieNon è chiaro, tuttavia, se il ristretto numero di proteine esistenti sia dettato più da vincoli fisici sul ripiegamento della catena polipeptidica in una strut-tura tridimensionale o dalla sufficiente varietà di proprietà strutturali e chimiche che esse possiedono (che non ne ha rese necessarie altre nel corso del-l’evoluzione) o da una combinazione di entrambi i fattori

    20

  • Famiglie e superfamiglie Famiglie e superfamiglie −− 22

    Una delle argomentazioni più forti a favore dell’ipotesi evolutiva viene dallo studio pubblicato nel 1991 da Dorit et al., nel quale si teorizzava che gli esoni stessi corrispondano strettamente ai domini funzionali delle proteine e che tutte le proteine derivino dai vari arrangiamenti dei circa 7000 esoni disponibiliTuttavia, a prescindere dalle basi della similarità, i metodi di allineamento di sequenze e di ricerca di similarità in database sono spesso impiegati per sco-prire le possibili relazioni familiari fra proteine diverse

    Utili per predire la struttura proteica, che sembra sotto-stare a vincoli evolutivi più forti della sequenza amino-acidica

    21

  • Famiglie e superfamiglie Famiglie e superfamiglie −− 33

    Per definizione, le proteine che hanno un’identità di sequenza maggiore del 50% sono membri di un’unica famigliafamigliaAllo stesso modo, le superfamigliesuperfamiglie sono gruppi di famiglie proteiche correlate tramite livelli di similaritàdi sequenza bassi, ma ancora rilevabili (30%) hanno un’origine evolutiva comune, ma più anticaTutte le proteine possono essere ulteriormente suddi-vise in categorie sulla base delle caratteristiche predo-minanti di struttura secondaria: proteine di membrana, proteine principalmente α, proteine principalmente β, strutture α e β e strutture α+β

    22

  • Famiglie e superfamiglie Famiglie e superfamiglie −− 44

    23

    Sono stati realizzati diversi database che raggruppano le proteine secondo queste caratteristiche

    SCOPSCOP − Structural Classification Of ProteinCATHCATH − Class, Architecture, Topology and HomologoussuperfamilyFSSPFSSP − Fold classification based on Structure-Structurealignment of Proteins

  • Ripiegamenti Ripiegamenti −− 11Mentre le famiglie di proteine hanno relazioni evolutive chiare e le superfamiglie proteiche hanno relazioni evolutive probabili, si dice che le proteine presentano un ripiegamentoripiegamento comune se hanno la stessa struttura secondaria con lo stesso tipo di arrangiamento e con la stessa connessione topologicaProteine diverse con lo stesso ripiegamento spesso presentano elementi marginali di struttura secondaria e regioni a turn che differiscono in dimensione e con-formazioneTuttavia, il termine ripiegamento è utilizzato come sinonimo di motivo strutturalemotivo strutturale, anche se generalmente si riferisce a combinazioni più ampie di strutture secondarie − in qualche caso, un ripiegamento coin-volge metà della struttura totale della proteina 24

  • Ripiegamenti Ripiegamenti −− 22

    Proteine che si trovano nella stessa categoria di ripiegamento possono anche non avere un’origine evo-lutiva comune, ma essere il risultato di un rimesco-lamento degli esoni, in cui proteine con nuove funzioni vengono create attraverso il processo di ricombina-zione di esoni corrispondenti a domini funzionali di geni esistenti a livello del DNAAlternativamente, le similarità strutturali possono nascere solamente da caratteristiche fisiche e chimiche delle proteine, che favoriscono certi arrangiamenti e certe topologie della catena

    25

  • Tecniche sperimentaliTecniche sperimentaliCome nel caso dell’analisi genomica, molte analisi proteomiche sono limitate dalle tecniche sperimentali attualmente disponibiliSfortunatamente, dalla prospettiva della proteomica, la natura stessa delle proteine rende le analisi di laboratorio particolarmente difficili e molto meno pre-cise rispetto a quelle disponibili per l’analisi genomica

    Elettroforesi bidimensionaleElettroforesi bidimensionaleSpettrometria di massaSpettrometria di massaMicroarrayMicroarray proteiciproteici

    26

  • Elettroforesi bidimensionale Elettroforesi bidimensionale −− 11

    L’elettroforesi bidimensionale elettroforesi bidimensionale è una tecnica che per-mette di separare le proteine in base al peso moleco-lare e alla caricaIl procedimento utilizzato parte dall’estrazione delle proteine in un tessutoLe proteine, poste su un striscia di supporto polimerico a cui è applicata una corrente elettrica e in presenza di un gradiente di acidità, migrano in maniera a diversa a seconda della carica elettrica, formando delle “bande”A questo punto il supporto viene posto sul margine di un gel per elettroforesi che consente la separazione delle proteine in base al peso molecolare in seguito all’applicazione della corrente elettrica

    27

  • Elettroforesi bidimensionale Elettroforesi bidimensionale −− 22

    Il risultato finale è un gel in cui virtualmente ciascuna proteina occupa un punto nello spazio bidimensionale, ed è evidenziabile attraverso opportune colorazioniLa tappa ultima consiste nell’isolamento dal gel di cia-scuna proteina per effettuare l’analisi che ne consenta l’identificazioneL’analisi può essere fatta in maniera manuale, rita-gliando dei tondini di gel contenenti una sola proteina e quindi procedendo con la spettrografia di massa, o attraverso tecniche automatiche (più o meno evolute) di lettura diretta da gel

    28

  • Elettroforesi bidimensionale Elettroforesi bidimensionale −− 33

    Con l’elettroforesi bidimensio-nale si ottengono fotografie in cui ogni puntino rappresenta una proteina Confrontando fotografie otte-nute da campioni diversi si pos-sono individuare quali proteine differiscono per presenza e quantità in diverse condizioni sperimentali

    29

    In pratica, si considera una cellula o un tessuto e, usando le tecniche indicate, si ottengono, con una sola analisi, informazioni su tutte le proteine che compongono il campione

  • Elettroforesi bidimensionale Elettroforesi bidimensionale −− 44

    L’elettroforesi bidimensionale ha in realtà diverse gravi limitazioni che ne impediscono l’utilizzo estensivo

    Il genoma umano codifica molte decine di migliaia di proteineInadeguatezza per l’analisi delle proteine molto piccole o con poca carica elettrica e delle proteine che attraver-sano la membrana plasmatica (e che rivestono impor-tanti ruoli in molte malattie) a causa della loro scarsa solubilità nelle preparazioni e nei gelSensibilità relativamente bassa dei metodi di rilevamentoDifficoltà nel determinare con precisione quale proteina èrappresentata da ciascuno spot

    30

  • Spettrometria di massa Spettrometria di massa −− 11

    Lo spettrometrospettrometro è uno strumento che scompone lo spettro di una sorgente e ne misura le componentiEsistono spettrometri che misurano lo spettro della radiazione elettromagnetica e spettrometri che misu-rano lo spettro di massa di una sostanza, ossia le masse dei suoi costituenti (atomi, molecole, composti)In uno spettrometro di massa possono essere introdotti campioni allo stato solido, liquido o gassoso Le sostanze solide o liquide devono essere rese volatili prima di iniziare la fase di ionizzazione in cui la molecola del composto viene ionizzata, nel caso piùcomune per interazione con un fascio di elettroni

    31

  • Spettrometria di massa Spettrometria di massa −− 22

    Lo ione molecolare carico positivamente si frammenta, con formazione di molecole e di ioni positivi (cationi)

    Solo questi ultimi sono rivelati dallo spettrometro e sono separati in funzione del loro rapporto massa/caricaInfatti, i percorsi dei frammenti proteici (all’interno di un analizzatore) vengono fatti deviare da un campo magne-tico

    La collisione degli ioni carichi positivamente con un collettore posto all’estremità dell’analizzatore genera una corrente elettrica che può essere amplificata e rilevata come una serie di picchi corrispondenti ad un’impronta digitale impronta digitale della massa dei peptididella massa dei peptidi (mass mass fingerprintfingerprint)

    In questo modo è possibile anche individuare l’esistenza di isotopi e determinarne la massa

    32

  • Spettrometria di massa Spettrometria di massa −− 33

    Nel grafico di uno spettro di massa, l’asse delle x riporta i valori di rapporto massa/carica e l’asse delle yi valori di abbondanza relativa degli ioni analizzatiSe la risoluzione dello strumento è sufficientemente elevata, è possibile determinare la massa esatta dei singoli ioni, da cui si può dedurre la composizione elementare dello ione stessoLo spettrometro di massa può essere direttamente interfacciato ad un gas−cromatografo; miscele com-plesse di prodotti possono quindi essere risolte nei singoli componenti ed i singoli spettri possono essere interpretati o confrontati con librerie standard di spettri di composti noti

    33

  • MicroarrayMicroarray proteici proteici −− 11

    I microarraymicroarray proteici proteici si sono diffusi grazie alla possibilità di svolgere analisi di proteine su larga scala, nello stesso modo in cui i chip genici hanno rivoluzionato l’analisi del trascrittomaIl concetto alla base dei chip proteici è molto simile a quello dei chip genetici: piccole quantità di sonde individuali sono legate covalentemente alla superficie di chip di silicio in array ad alta densitàLe proteine estratte dalle cellule vengono marcate con fluorofori e flussate sul chip

    Proprio come avviene con i chip genici, la quantità di materiale (in questo caso, proteina) legato alle sonde viene determinato mediante eccitazione del fluoroforo

    34

  • MicroarrayMicroarray proteici proteici −− 22Per rilevare le interazioni proteina−proteina, protei-na−composto, etc., si possono utilizzare anche array di sonde di cattura (per esempio anticorpi), che si legano alle proteine di un campione in modo tale da rilevarne i relativi livelli di espressioneI microarray proteici non hanno lo stesso impatto dei chip genici

    Diversamente dalle sequenze di DNA, con i loro legami unici dettati dall’accoppiamento fra basi, è ragionevole aspettarsi che una singola proteina possa interagire con più sonde differentiLa cinetica di legame di ogni sonda può variare e differenze nell’in-tensità del segnale potrebbero essere dovute a differenze nell’intensitàdi legameLe proteine sono notoriamente sensibili alla chimica del loro ambiente ed alla superficie che esse incontrano, e sia gli estratti cellulari sia le sonde si possono comportare in modo inatteso quando vengono sottoposte alle procedure di controllo 35

  • MicroarrayMicroarray proteici proteici −− 33

    Per il momento (ed in attesa di tecniche di analisi automatica attendibili) è più semplice utilizzare i chip genici come base, per puntare verso lo studio delle proteine di interesse

    Una volta ristretto il campo, le analisi proteomiche su piccoli sottoinsiemi di proteine verranno effettuate su chip proteici realizzati appositamente

    36

  • Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci −− 11

    Una delle principali applicazioni della bioinformatica èla ricerca di agenti farmaceutici efficaci per prevenire e curare malattie dell’uomoLo sviluppo ed il test di un nuovo farmaco sono dispendiosi sia in termini di tempo − spesso occorrono fino a 15 anni −, sia di denaro − con costi di centinaia di milioni di dollariLa genomica funzionale, la bioinformatica e la proteo-mica promettono di ridurre il lavoro associato a questo processo, accelerando i tempi ed abbassando i costi di sviluppo di nuovi farmaci

    37

  • Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci −− 22

    Mentre le fasi esatte dello sviluppo di un farmaco sono variabili, il procedimento complessivo si divide nei due passi fondamentali di scopertascoperta e testtestIl processo di test, che coinvolge prove precliniche e cliniche, non è generalmente soggetto a miglioramenti significativi per l’utilizzo di metodi automaticiIl processo di scoperta, che è invece laborioso e co-stoso ed offre un terreno fertile per la ricerca bioinfor-matica, può essere suddiviso in diverse fasi

    Identificazione del bersaglioIdentificazione del bersaglioScoperta ed ottimizzazione di un composto Scoperta ed ottimizzazione di un composto ““guidaguida””Tossicologia e farmacocinetica (che studia quantitativaTossicologia e farmacocinetica (che studia quantitativa--mente lmente l’’assorbimento, la distribuzione, il metabolismo e assorbimento, la distribuzione, il metabolismo e ll’’eliminazione dei farmaci)eliminazione dei farmaci)

    38

  • Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci −− 33

    L’obiettivo dell’identificazione del bersaglio identificazione del bersaglio consiste nell’isolare una molecola biologica che sia essenziale per la sopravvivenza o la proliferazione di un parti-colare agente causa di una malattia, detto patogenopatogenoIdentificato il bersaglio, l’obiettivo della progettazione di farmaci (drugdrug designdesign) consiste nello sviluppo di una molecola che si leghi al bersaglio e lo inibiscaDato che la funzione del bersaglio è essenziale per il processo vitale del patogeno, l’inibizione del bersaglio ferma la proliferazione del patogeno o lo distruggeComprendere la struttura e la funzione delle proteine èuna componente fondamentale nello sviluppo di far-maci, in quanto le proteine sono comuni bersagli dei farmaci stessi

    39

  • Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci −− 44

    EsempioEsempioLa HIV HIV proteasiproteasi è una proteina prodotta dal virus umano dell’immunodeficienza (HIV) − il patogeno che causa l’AIDS − nel contesto di una cellula umana ospiteLa HIV proteasi è essenziale per la proliferazione del virus: l’inibizione della proteina annienta l’efficacia del virus e la sua capacità di trasmissione

    40

  • Progettazione di inibitori e di farmaci Progettazione di inibitori e di farmaci −− 55

    Come potrebbe una molecola inibire l’azione di un enzima, quale la HIV proteasi?

    Le proteasi sono proteine che digeriscono altre proteine, come gli enzimi di restrizione utilizzati per tagliare in modo specifico la molecola di DNAMolte delle proteine di cui l’HIV ha bisogno per soprav-vivere e proliferare in un ospite umano vengono prodotte come una singola, lunga, catena polipeptidicaQuesto polipeptide deve poi essere tagliato nelle compo-nenti proteiche funzionali dalla HIV proteasiCome molti enzimi, la HIV proteasi possiede un sito attivo a cui si legano e su cui operano altre molecoleProgettare una molecola che si leghi nel sito attivo della HIV proteasi, in modo da impedirne il normale funziona-mento

    41

  • Screening di Screening di ligandiligandi −− 11Il primo passo verso la scoperta di un inibitoreinibitore per una particolare proteina è di solito l’identificazione di uno o più composti guidacomposti guida, che si leghino al sito attivo della proteina bersaglioTradizionalmente, la ricerca dei composti guida è sem-pre stata un processo trial−and−error, durante il quale si testano diversi composti, fino a trovarne un numero sufficiente con effetti inibitoriRecentemente, metodologie di screeningscreening ad alta pro-duttività (HTSHTS, HighHigh−−ThroughputThroughput ScreeningScreening) hanno reso la procedura molto più efficiente, anche se il processo sotteso resta comunque una ricerca esau-stiva del maggior numero di composti guida

    42

  • Screening di Screening di ligandiligandi −− 22È noto da tempo che i siti attivi degli enzimi sono ospitati in tasche (cavità) ricavate nella struttura proteica, con specifiche caratteristiche chimico−fisicheL’interazione proteina−ligando è dettata principalmente dalle caratteristiche di complementarietà dei due com-posti: ligandi idrofobici legheranno regioni idrofobiche, ligandi carichi saranno richiamati da regioni cariche di segno opposto, etc.Gli algoritmi di dockingdocking di ligandi e quelli di screening tentano di rendere efficienti i processi di scoperta dei composti guida, muovendosi dal mondo della speri-mentazione in vitro a quello dei modelli astratti e del calcolo automatico

    43

  • Docking di Docking di ligandiligandi −− 11Il dockingdocking è la simulazione in silicio dell’aggancio della proteina con un ligando, ovvero obiettivo del docking èdeterminare come possono interagire due molecole di struttura nota

    Geometria delle superficiInterazioni tra residui affiniCampi di forza elettrostatici

    44

  • Docking di Docking di ligandiligandi −− 22In molti casi, la struttura tridimensionale di una protei-na e del suo ligando sono note, ma la struttura del complesso che essi formano è sconosciuta

    Nella progettazione di farmaci, il docking molecolare viene impiegato per determinare come un particolare farmaco si lega ad un bersaglio o come due proteine interagiscano fra loro a formare un sito di legame

    Gli approcci di docking molecolare hanno molto in comune con gli algoritmi per il ripiegamento delle proteine

    Entrambe le problematiche implicano il calcolo dell’ener-gia di una particolare conformazione molecolare e la ricerca della conformazione che minimizza l’energia libera del sistema MoltiMolti gradi di libertgradi di libertàà: ricerche euristiche e : ricerche euristiche e soluzioni subsoluzioni sub−−ottimeottime

    45

  • Docking di Docking di ligandiligandi −− 33Come nel ripiegamento proteico, vi sono due considerazioni principali di cui tenere conto all’atto della progettazione di un algoritmo di docking

    Formulare una funzione energia per valutare la qualità di un particolare complesso e successivamente utilizzare un algorit-mo per esplorare lo spazio di tutti i possibili modi e conforma-zioni di legame alla ricerca di una struttura con energia minimaGestire la flessibilità sia della proteina sia del ligando putativo

    L’approccio chiaveapproccio chiave−−serratura serratura assume una struttura proteica rigida a cui si aggancia un ligando con struttura flessibile (approccio computazionalmente vantaggioso)Il docking con adattamento indottodocking con adattamento indotto permette la flessibilità sia della proteina che del ligandoCompromesso: assumere per la proteina una catena principale rigida, mentre si permette la flessibilità delle catene laterali vicino al sito di legame del ligando

    46

  • Docking di Docking di ligandiligandi −− 44

    47

  • Docking di Docking di ligandiligandi −− 55AutoDockAutoDock (http://autodock.scripps.edu/) è un metodo ben noto per il docking di ligandi rigidi o flessibili

    Per valutare un particolare complesso usa un campo di forza basato su una grigliaIl campo di forza viene utilizzato per dare un punteggio al complesso in base alla formazione di interazioni elettrostatiche favorevoli, al numero di legami idrogeno, alle interazioni di van der Waals, etc.

    48

  • Docking di Docking di ligandiligandi −− 66AutoDockAutoDock utilizzava originariamente un approccio Monte Carlo/simulated annealing

    Si inducono cambiamenti casuali nella posizione e conforma-zione corrente del ligando, tenendo quelli che danno origine a conformazioni a più bassa energia rispetto a quella corrente (quando un cambiamento porta ad un aumento di energia, viene scartato)Tuttavia, per permettere all’algoritmo di trovare stati a bassa energia, superando eventuali barriere energetiche, i cambia-menti che portano ad energie più alte, talvolta, vengono ac-cettati (con una frequenza alta all’inizio del processo di ottimiz-zazione, che decresce lentamente per iterazioni successive)

    Le versioni più recenti utilizzano algoritmi genetici, programmi di ottimizzazione che emulano la dinamica della selezione naturale su una popolazione di soluzioni in competizione

    49

  • Screening di database Screening di database −− 11Una delle considerazioni principali nel progettare algoritmi di docking è il bilanciamento tra la necessitàdi una completa ed accurata ricerca di tutte le possibili conformazioni e modalità di legame del ligando e la necessità di realizzare un algoritmo di complessitàcomputazionale “ragionevole”

    Per lo screening di database di possibili farmaci, gli algoritmi devono infatti effettuare il docking di migliaia di ligandi al sito attivo di una proteina e, pertanto, hanno bisogno di un efficienza elevata

    50

  • Screening di database Screening di database −− 22Metodi progettati specificamente per lo screening di database, come l’algoritmo SLIDESLIDE, spesso riducono il numero di composti considerati, utilizzando tecniche di indicizzazione del database per scartare, a priori, i composti guida che è altamente improbabile che leghino il sito attivo del bersaglioSLIDESLIDE caratterizza il sito attivo del bersaglio in accordo con la posizione di potenziali donatori ed accettori di legami idrogeno e con i punti di interazione idrofobica del ligando, formando un modelloOgni potenziale ligando nel database viene caratte-rizzato nello stesso modo e viene costruito un insieme di indici

    51

  • Screening di database Screening di database −− 33L’operazione di indicizzazione permette a SLIDESLIDE di scartare rapidamente i ligandi che sono, per esempio, troppo grandi o troppo piccoli per adattarsi al modelloAttraverso la riduzione del numero di ligandi che vengono sottoposti alla procedura di docking, compu-tazionalmente onerosa, SLIDESLIDE (e algoritmi simili) possono sondare grandi database di potenziali ligandiin giorni, o ore, rispetto a tempistiche di mesi

    52

  • Screening di database Screening di database −− 44

    53

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 11Anche la più potente tecnica microscopica è insufficiente per determinare le coordinate molecolari di ciascun atomo di una proteinaLa scoperta dei raggi X da parte di W. C. Roentgen (1895) ha invece permesso lo sviluppo di un potente strumento per l’analisi della struttura proteica: la cristallografia a raggi Xcristallografia a raggi XNel 1912, M. von Laue scoprì che i cristallicristalli, strutture solide formate da un reticolo regolare di atomi o molecole, diffrangono i raggi X in motivi (pattern) regolari e prevedibiliAll’inizio degli anni ‘50, scienziati pionieristici come D. Hodgkin furono in grado di cristallizzare alcune molecole organiche complesse e di determinare la loro struttura osservando come esse diffrangessero un fascio di raggi XOggi, la cristallografia a raggi X è stata impiegata per determinare la struttura di oltre 64000 proteine ad un alto livello di risoluzione 54

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 22

    55Source: PDB Source: PDB statisticsstatistics

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 33

    Il primo passo nella determinazione cristallografica della struttura di una proteina è la crescita del relativo cristalloLa cristallizzazione è un processo molto delicato ed impegnativo, ma l’idea di base è semplice

    Proprio come i cristalli di zucchero possono essere fatti crescere attraverso la lenta evaporazione di una soluzione di zucchero ed acqua, i cristalli di proteine vengono fatti crescere attraverso l’evaporazione di una soluzione di proteina puraI cristalli delle proteine, però, sono generalmente molto piccoli (da circa 0.3mm ad 1.5mm in ogni dimensione) e sono fatti circa al 70% di acqua, con una consistenza piùsimile alla gelatina che ai cristalli di zucchero

    56

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 44

    57

    La crescita dei cristalli di proteine generalmente richiede condizioni attentamente controllate ed una grande quantità di tempo: per raggiungere le opportune condi-zioni di cristallizzazione di una singola proteina possono essere necessari mesi o anche anni di esperimentiUna volta ottenuti, i cristalli proteici vengono caricati all’interno di un tubo capillare ed esposti ad un fascio di raggi X, che viene diffratto dal cristallo della proteina

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 55

    computer, per la successiva analisiUna volta ottenuti i dati di diffrazio-ne, si utilizzano metodi numerici e modelli proteici per determinare la struttura tridimensionale della pro-teina 58

    Originariamente, il pattern di diffrazione veniva cattu-rato su una pellicola radio-graficaI moderni strumenti per la cristallografia utilizzano ri-levatori di raggi X che tra-sferiscono il pattern di dif-frazione direttamente su

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 66

    Più in dettaglio…Dallo spettro di diffrazione dei raggi X dei cristalli, i cristallografi sono in grado di calcolare mappe di densitàelettronica, le quali, in pratica, sono immagini delle molecole che formano il cristallo ingrandite circa cento milioni di volteSi esaminano le mappe di densità elettronica con la grafica computerizzata e se ne verifica l’accordo (fitting) con un modello molecolareDopo le fasi di affinamento si riesce ad ottenere un modello molecolare che ha un errore medio sulle coordinate di 0.3−0.5 Å e che permette un esame molto dettagliato della struttura tridimensionale delle proteine

    59

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 77

    Infine, si noti che la struttura cristallografica è essen-zialmente mediata su più copie di un singolo cristallo proteico e sul tempo durante il quale il cristallo èesposto ai raggi XLe proteine cristallizzate non sono completamente rigide e la mobilità di un atomo specifico in una proteina rende “confuso” il segnale cristallograficoLa posizione delle molecole di acqua nel cristallo (che spesso sono incluse nelle entry dei database proteici) è difficile da risolvere e provoca “rumore”Tuttavia, la cristallografia è attualmente il metodo principale per ottenere la visione della struttura tridimensionale delle proteine a risoluzione atomica

    60

  • Strutture cristalline risolte ai raggi X Strutture cristalline risolte ai raggi X −− 88

    61

    La ProteinProtein Data Data BankBank (PDBPDB, http://www.pdb.org) è la principale banca dati in cui sono depositate le strutture di proteine derivate dalla cristallografia a raggi X

  • Strutture NMR Strutture NMR −− 11La tecnica spettroscopica della risonanza magnetica nucle-are fornisce un metodo alternativo per determinare la struttura delle macromolecoleAlla base della tecnica NMRNMR (NuclearNuclear MagneticMagnetic ResonanceResonance) vi è il fatto che gli atomi di alcuni elementi − come l’idrogeno e gli isotopi radioattivi del carbonio e dell’azoto − vibrano, o risuonano, quando le molecole a cui appartengono sono immerse in un campo magnetico statico ed esposte ad un secondo campo magnetico oscillanteI nuclei atomici tentano di allinearsi con il campo magnetico statico in maniera parallela o antiparallela e quando il campo magnetico oscillante fornisce loro un’energia pari alla differenza energetica fra i due stati, si verifica il fenomeno della risonanza, che può essere rilevata attraverso sensori esterni, come gli spettrometri NMR

    62

  • Strutture NMR Strutture NMR −− 22Il comportamento di ogni atomo è influenzato princi-palmente dagli atomi vicini, posti cioè in residui adiacentiL’analisi e l’interpretazione dei dati richiede tecniche numeriche complesse e limita, di per sé, l’utilità del-l’approccio per ogni proteina o dominio proteico (un’unità globulare o fibrosa formata da catene poli-peptidiche ripiegate in più regioni compatte le quali costituiscono divisioni della struttura terziaria) piùlungo di 200 aminoacidiI metodi NMR non presuppongono la cristallizzazione: sono molto vantaggiosi nel caso di proteine che non possono essere cristallizzate (specialmente proteine integrali di membrana)

    63

  • Strutture NMR Strutture NMR −− 33Il risultato di un esperimento NMR è un insieme di vincoli sulle distanze interatomiche all’interno di una struttura macromolecolareDetti vincoli possono essere poi utilizzati, insieme alla sequenza proteica, per descrivere un modello della struttura tridimensionale della proteinaTuttavia, generalmente, più di un modello proteico può effettivamente soddisfare i vincoli ottenuti dalla tecni-ca NMR, perciò le strutture NMR solitamente conten-gono diversi modelli di una proteina, cioè diversi insiemi di coordinate, mentre le strutture cristallo-grafiche, solitamente, ne contengono solo unoLa PDB contiene quasi 9000 strutture di proteine derivate dalla NMR

    64

  • Strutture NMR Strutture NMR −− 44

    65Source: PDB Source: PDB statisticsstatistics

  • PDB PDB −− 11

    66

    Le strutture contenute nella PDB sono memorizzate in formato testo

    Una linea del file PDB contiene le coordinate (x,y,z) in angstrom (10−10m) di ogni atomo di una proteina (con altre informazioni utili)

    Si può inoltre ottenere un’immagine della struttura tridimensionale della proteinaAd ogni struttura nella banca dati PDB è assegnato un codice a quattro caratteri

    EsempioEsempio: 2APR contiene le coordinate molecolari della rizopuspepsina, una proteasi asparticaI file in formato PDB sono generalmente chiamati XXXX.pdb o pdbXXXX.ent, dove XXXX è il codice a quattro lettere della struttura

  • PDB PDB −− 22

    67

  • Rappresentazioni della struttura terziariaRappresentazioni della struttura terziaria

    68

    La rappresentaLa rappresenta--zione zione filiformefiliforme e a e a ball and ball and stickstick illuillu--stra le interazioni stra le interazioni molecolarimolecolari

    Il metodo a Il metodo a cartooncartoonevidenzia le regioni di evidenzia le regioni di struttura secondariastruttura secondaria

    La rappresentazione La rappresentazione della della superficie mosuperficie mo--lecolarelecolare rivela la forrivela la for--ma complessiva delma complessiva del--la proteinala proteina

  • Metodi empirici e tecniche predittive Metodi empirici e tecniche predittive −− 11

    69

    ProblemaProblema: realizzare un algoritmo che, data la struttura tridimensionale di una proteina, predica quali sono i residui che più probabilmente sono coinvolti in un’interazione proteina−proteina

    Importante perché molte proteine sono attive solo quando sono associate ad altre proteine in complessi multienzimatici

    SoluzioneSoluzione: dalle strutture presenti nel PDB, selezionare un insieme di strutture esempio che presentano due o più proteine che formano un complesso

    Vi saranno residui interfaccialiinterfacciali, coinvolti nella superficie di contatto, e residui non interfaccialiPer ogni residuo, occorre selezionare un insieme di feature da misurare e da usare per risolvere il problema di predizione

  • Metodi empirici e tecniche predittive Metodi empirici e tecniche predittive −− 22

    70

    Possibili feature:Numero di residui in un intorno di raggio stabilito rispetto al residuo in esameCarica netta del residuo e dei residui viciniLivello di idrofobicitàPotenziale dei legami idrogenoCostruzione di un vettore di feature descrittive del dato residuo

    In concomitanza con il vettore di feature, si ha il target che attesta l’appartenenza o meno del particolare residuo all’interfaccia proteina−proteinaUtilizzo di un metodo di apprendimento automaticoUtilizzo di un metodo di apprendimento automatico

  • Predizione delle modificazioni postPredizione delle modificazioni post−−traduzionalitraduzionali

    L’ampia varietà di strutture e funzioni proteiche èdovuta, in parte, al fatto che le proteine sono sotto-poste ad un’ampia varietà di modificazioni dopo essere state trascritte

    Rimozione di segmenti della proteinaFormazione di legami covalenti alla superficie dei residui con zuccheri, fosfati o gruppi solfatiFormazione di legami incrociati tra residui all’interno di una proteina (formazione di legami disolfuro)

    Molte di queste modificazioni sono effettuate da altre proteine, che devono riconoscere specifici residui superficiali, appropriati per innescare la modificazione

    71

  • Smistamento delle proteine Smistamento delle proteine −− 11La presenza di compartimenti interni circondati da membrane è una caratteristica delle cellule eucarioticheL’ambiente chimico all’interno dei diversi compartimenti può differire notevolmente, come può essere molto diversa la popolazione proteica all’interno di essiÈ un imperativo funzionale ed energetico che gli eucariotitrasportino le proteine nei loro compartimenti appropriatiPer esempio, gli istoni − proteine legate al DNA associate con la cromatina − sono funzionalmente utili solo all’interno dei nuclei delle cellule eucariotiche, dove si trovano i cromosomiAltre proteine − come le proteasi, che si trovano dentro i perossisomi (comparti metabolici specializzati) − sarebbero addirittura pericolose per la cellula se si trovassero in qualsiasi altro posto al suo interno

    72

  • Smistamento delle proteine Smistamento delle proteine −− 22

    Sembra che le cellule eucariotiche considerino le proteine come appartenenti a due classi distinte in base alla loro localizzazione: proteine non associate/ proteine non associate/ associateassociate alle membranealle membraneIl primo insieme di proteine è tradotto esclusivamente dai ribosomi, che si trovano sospesi, o “fluttuanti”, dentro al citoplasma

    73

  • Smistamento delle proteine Smistamento delle proteine −− 33

    74

  • Smistamento delle proteine Smistamento delle proteine −− 44Gli mRNA tradotti dai ribosomi fluttuanti possono infine rimanere nel citoplasma o essere trasportati:

    nel nucleonei mitocondrinei cloroplastinei perossisomi

    75

  • Smistamento delle proteine Smistamento delle proteine −− 55

    Risiedere dentro il citoplasma sembra essere lo stato di default per le proteine; al contrario il trasporto delle proteine nei diversi compartimenti separati da mem-brane richiede la presenza ed il riconoscimento di specifici segnali di localizzazione

    76

  • Smistamento delle proteine Smistamento delle proteine −− 66

    Le proteine nucleari sono destinate al nucleo grazie al fatto che possiedono una sequenza di localizzazione sequenza di localizzazione nuclearenucleare: una regione lunga da 7 a 41 aminoacidi ricca di lisine e/o arginineLe proteine mitocondriali possiedono tutte un’elica anfipatica (che contiene sia un gruppo idrofilico sia uno idrofobico) lunga da 12 a 30 aminoacidi al loro N−terminale

    Questa sequenza segnale mitocondriale sequenza segnale mitocondriale è riconosciuta da un recettore sulla superficie dei mitocondri e viene spesso rimossa per attivare la proteina appena viene trasportata all’interno dei mitocondri

    77

  • Smistamento delle proteine Smistamento delle proteine −− 77

    Le proteine dei cloroplasti codificate da geni nucleari possiedono una sequenza di transito al cloroplasto sequenza di transito al cloroplasto (circa 25 aminoacidi posti all’N−terminale) che viene similmente riconosciuta da recettori proteici posti sulla superficie dei cloroplastiInfine, le proteine destinate ai perossisomi possiedono uno dei due segnali di destinazione segnali di destinazione perossisomialeperossisomialericonosciuti da recettori che assicurano il loro trasporto alla destinazione corretta

    78

  • Smistamento delle proteine Smistamento delle proteine −− 88Il secondo insieme di proteine è tradotto dai ribosomi legati alla membrana che sono associati con il reticolo reticolo endoplasmaticoendoplasmatico (ERER, EndoplasmicEndoplasmic ReticulumReticulum)Il reticolo endoplasmatico è una rete di membrane intimamente associata con l’apparato di Golgi dove avviene l’elaborazione ulteriore delle proteine (come la glicosilazione e l’acetilazione)Tutte le proteine tradotte dai ribosomi dell’ER, in realtà, iniziano ad essere tradotte dai ribosomi flut-tuanti nel citoplasma

    Quando i primi 15−30 aminoacidi da tradurre corri-spondono ad una particolare sequenza segnalesequenza segnale, una particella che la riconosce si lega alla proteina e ne ferma la traduzione finché il ribosoma ed il suo mRNA non vengono trasportati all’ER 79

  • Smistamento delle proteine Smistamento delle proteine −− 99

    Anche se non è evidente nessuna particolare sequenza consenso per la sequenza segnale, quasi sempre si riscontra una sequenza idrofobica lunga 10−15 residui che termina con uno o più aminoacidi con carica positivaQuando la traduzione riprende, il nuovo polipeptide viene estruso attraverso un poro della membrana dell’ER nel lumen (spazio interno) dello stesso ER

    Un peptidasi segnale peptidasi segnale taglia dalla proteina la sequenza target dell’N−terminale (a meno che non debba essere mantenuta permanentemente come una proteina legata alla membrana)

    80

  • Taglio proteolitico Taglio proteolitico −− 11

    Sia i procarioti che gli eucarioti possiedono numerosi enzimi responsabili del taglio e della degradazione delle proteine e dei peptidiEsistono molteplici esempi di taglio proteico

    Rimozione del residuo di metionina presente all’inizio di ogni polipeptide (poiché il codone d’inizio codifica anche per la metionina)Rimozione dei peptidi segnale

    81

  • Taglio proteolitico Taglio proteolitico −− 22

    Qualche volta il segnale di taglio può essere corto quanto un singolo residuo

    La chimotripsina taglia i polipeptidi all’estremitàC−terminale dei voluminosi residui aromatici (contenenti un anello) come la fenilalaninaLa tripsina taglia il legame peptidico sul lato carbossilico dei residui di arginina e di lisinaL’elastasi taglia il legame peptidico sul lato C−terminale di piccoli residui, come la glicina e l’alanina

    In molti casi, comunque, il motivo di sequenza è piùlungo e più ambiguo

    82

  • GlicosilazioneGlicosilazione −− 11

    La glicosilazioneglicosilazione è il processo che lega permanente-mente un oligosaccaride (una breve catena di zucche-ri) alla catena laterale di un residuo sulla superficie proteicaLa presenza di residui glicosilati può avere un effetto significativo sul ripiegamento delle proteine, la loro localizzazione, l’attività biologica e l’interazione con altre proteineNegli eucarioti:

    NN−−glicosilazioneglicosilazioneOO−−glicosilazioneglicosilazione

    83

  • GlicosilazioneGlicosilazione −− 22

    La NN−−glicosilazioneglicosilazione è l’aggiunta di un oligosaccaride ad un residuo di asparagina durante la traduzione della proteina

    Il segnale principale che indica che un residuo di asparagina (Asn) deve essere glicosilato è la sequenza aminoacidica locale Asn−X−Ser o Asn−X−Thr, dove X corrisponde ad un qualsiasi residuo tranne la prolinaTuttavia, tale sequenza da sola non è sufficiente a determinare la glicosilazione (come si osserva in natura)

    84

  • GlicosilazioneGlicosilazione −− 33

    La OO−−glicosilazioneglicosilazione è un processo post−traduzionale in cui l’enzima N−acetil−glucosaminil transferasi attacca un oligosaccaride ad un atomo di ossigeno di un residuo di serina o di treoninaDiversamente dalla N−glicosilazione, non si conoscono motivi di sequenza che segnalino un sito per la O−glicosilazione, ma solo la presenza di residui di prolina e valina vicino alla Ser o Thr che deve essere glicosilata

    85

  • Fosforilazione Fosforilazione −− 11La fosforilazionefosforilazione (attacco di un gruppo fosfato) dei residui superficiali è probabilmente la modificazione post−traduzionale più comune nelle proteine animali

    Le chinasichinasi, gli enzimi responsabili della fosforilazione, sono coinvolte in un’ampia varietà di percorsi regolatori e di trasmissione dei segnaliDato che la fosforilazione serve frequentemente come segnale di attivazione per un enzima, essa rappresenta spesso una condizione temporaneaLe fosfatasifosfatasi sono gli enzimi responsabili della rimozione dei gruppi fosfato dai residui fosforilati

    86

  • Fosforilazione Fosforilazione −− 22Dato che la fosforilazione dei residui chiave di tirosina, serina e treonina serve come meccanismo regolatore in un’ampia varietà di processi molecolari, i vari tipi di chinasi coinvolte in ogni processo devono avere un’alta specificità nel riconoscimento di particolari enzimi

    Nessuna sequenza consenso singola identifica un residuo come un target della fosforilazione

    87

  • ConcludendoConcludendo…… −− 11Mentre la genomica sta rapidamente diventando un’area di ricerca molto sviluppata, le tecniche proteo-miche iniziano solo ora ad identificare le proteine codificate nel genoma e le loro varie interazioniLa caratterizzazione del proteoma di un organismo promette di colmare il varco tra la nostra conoscenza del genoma e gli effetti fisiologici e morfologici dei geni che esso contieneVarie tassonomie sono state sviluppate per classificare ed organizzare le proteine secondo la funzione enzi-matica, la similarità della sequenza e la struttura tridimensionale

    88

  • ConcludendoConcludendo…… −− 22Provvisti di database di famiglie, superfamiglie e ripie-gamenti proteici, insieme con tecniche sperimentali come l’elettroforesi bidimensionale, la fingerprint delle masse peptidiche e la spettrometria di massa, gli analisti sono in grado di separare, purificare ed identificare le varie proteine espresse da una cellula in un dato momentoUn’importante applicazione delle informazioni proteo-miche è la progettazione di farmaci

    I progressi nella conoscenza della struttura delle proteine e nella cristallografia a raggi X hanno permesso la realizzazione di metodi automatici per lo screening ed il docking di ligandi proteici e per contribuire al processo di scoperta dei farmaci

    89

  • ConcludendoConcludendo…… −− 33Anche se la struttura tridimensionale delle proteine èla chiave di volta per capirne la funzione e l’interazione con le altre proteine, alcuni utili informazioni possono essere ottenute anche dalla sola sequenzaLa localizzazione delle proteine e le varie modificazioni post−traduzionali sono segnalate attraverso motivi di sequenza conservati nella struttura primaria delle proteine

    Le modificazioni post−traduzionali danno conto del fatto che lo stesso gene può codificare per più proteine

    90