“Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per...

16
“Sperimenta il BioLab” Attività di Bioinformatica Le proteine in 3D Università degli Studi di Milano Settore Didattico, via Celoria 20, Milano Laboratorio 105

Transcript of “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per...

Page 1: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

“Sperimenta il BioLab”

Attività di Bioinformatica Le proteine in 3D

Università degli Studi di Milano Settore Didattico, via Celoria 20, Milano

Laboratorio 105

Page 2: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

2

LE PROTEINE IN 3D

Obiettivo dell'attività è lo studio di una proteina codificata da un gene. La proteina che analizzeremo è una proteina transmembrana ed è un recettore nicotinico neuronale di Torpedo mormorata. La sequenza che viene proposta parte dall’amminoacido serina (s) che è il 25esimo amminoacido della sequenza e che corrisponde al primo amminoacido della proteina matura. Quelli precedenti fanno parte della sequenza leader che hanno tutte le proteine transmembrana e che serve alla membrana del reticolo endoplasmatico durante la traduzione.

25 sehetr lvanllenyn kvirpvehht hfvditvglq 61 liqlinvdev nqivetnvrl rqqwidvrlr wnpadyggik kirlpsddvw lpdlvlynna 121 dgdfaivhmt kllldytgki mwtppaifks yceiivthfp fdqqnctmkl giwtydgtkv 181 sispesdrpd lstfmesgew vmkdyrgwkh wvyytccpdt pyldityhfi mqriplyfvv 241 nviipcllfs fltvlvfylp tdsgekmtls isvllsltvf llvivelips tssavpligk 301 ymlftmifvi ssiivtvvvi nthhrspsth tmpqwvrkif intipnvmff stmkraskek 361 qenkifaddi disdisgkqv tgevifqtpl iknpdvksai egvkyiaehm ksdeessnaa 421 eewkyvamvi dhillcvfml iciigtvsvf agrlielsqe g Per trovare informazioni su alcune caratteristiche biochimiche e strutturali della proteina in questione utilizzeremo un serie di software interrogabili on line presso il sito: http://www.expasy.org/:

calcolo del peso molecolare e del punto isoelettrico (http://www.expasy.org/tools/pi_tool.html)

analisi del profilo di idrofobicità

(http://www.expasy.org/tools/protscale.html)

previsione di eventuali regioni transmembrana (http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html)

Per la previsione della presenza del peptide segnale: (http://www.cbs.dtu.dk/services/SignalP/)

Per la previsione della struttura secondaria: (http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_seccons.html )

Per la visualizzazione della struttura tridimensionale della proteina utilizzeremo il software di visualizzazione “DeepView” (disponibile su http://www.expasy.org/spdbv/)

Page 3: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

3

1. PERCORSO Il sito www.expasy.org rappresenta una risorsa molto importante di software per l’analisi della struttura e della funzione di sequenze aminoacidiche. Le analisi che è possibile effettuare vanno dallo studio della struttura primaria secondaria e terziaria delle proteine, alla previsione delle modificazioni post-traduzionali e della localizzazione intracellulare, alla identificazione di potenziali domini funzionali.

1.1 Calcolo del peso molecolare e del punto isoelettrico Avendo a disposizione la sequenza aminoacidica (ovvero la struttura primaria) di una proteina è innanzitutto possibile calcolarne il peso molecolare (PM) e il punto isoelettrico (PI), proprietà che dipendono solo dalla sequenza di aminoacidi (anche se in realtà, a seguito di eventuali modificazioni post-traduzionali la proteina matura può avere PM e PI diversi da quelli previsti in base alla semplice composizione in aminoacidi). Copiate in un file di testo la sequenza che vi è stata fornita, aprite il sito http://www.expasy.org/tools/pi_tool.html e incollate nella finestra vuota la sequenza.

Page 4: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

4

Esercizi sul peso molecolare: a) immagina di non conoscere la sequenza di una proteina ma conosci il peso. b) dal valore medio del peso dell’a.a. calcola da quanti a.a. potrebbe essere formata la proteina e poi confrontalo con il valore reale. 1.2 Analisi del profilo di idrofobicità La conoscenza della struttura primaria di una proteina permette anche di prevederne il profilo di idrofobicità, vale a dire come cambiano le caratteristiche di idrofilicità e di idrofobicità lungo la sequenza. Questa informazione può essere utilizzata per prevedere la possibile interazione di una proteina con le membrane fosfolipidiche della cellula. Per fare questa analisi utilizzeremo il sito: http://www.expasy.org/toiche ols/protscale.html)

Procedete, come visto in precedenza, incollando la sequenza aminoacidica nella finestra vuota. Come vedete esistono diversi sistemi per il calcolo dell’indice di idrofobicità/idrofilicità di una sequenza amminoacidica. Lasciate selezionato il metodo di Kyte e Doolittle. Il risultato che otterremo sarà un grafico delle proprietà idrofiliche/idrofobiche della proteina. Nella parte alta della schermata che otterrete vengono indicati i valori di idrofobicità/idrofilicità attribuiti a ciascun residuo, valori più positivi indicano maggiore idrofobicità. I picchi del grafico sottostante rappresentano quindi le regioni di maggiore idrofobicità (vale a dire quelle in cui più residui idrofobici si susseguono in sequenza) e potrebbero corrispondere a regioni transmembrana.

Page 5: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

5

Il primo picco non rappresenta una regione di idrofobicità o transmembrana ma rappresenta il picco della sequenza leader che indirizza il ribosoma alle membrane del reticolo endoplasmico nella sintesi della catena nascente e che poi verrà rimossa. Tutte le proteine di questa tipologia avranno all’inizio (entro i primi 40 amminoacidi) questo picco. Esercizio: a) prova ad identificare tra questi picchi quali hanno valore di score superiore a 2 b) colora in rosso la parte interessata 1.3 Previsione della presenza del peptide segnale Se la proteina che stiamo studiando è una proteina transmembrana (o di secrezione o destinata ad essere indirizzata al Golgi o ai lisosomi) dovrà presentare all’estremità amino-terminale il peptide segnale (chiamato anche sequenza leader, che indirizza il ribosoma che espone la parte NH2 terminale della catena polipeptidica nascente verso la membrana del reticolo endoplasmatico, in modo che il polipeptide possa essere inserito nella membrana mentre viene sintetizzato, ovvero co-traduzionalmente; lo stesso vale per le proteine non di membrana ma secretive o che devono essere indirizzate ai lisosomi o all'apparato del Golgi). La sequenza segnale viene rimossa da una specifica proteasi non appena viene inserita nel reticolo. Con un apposito software (disponibile presso il sito http://www.cbs.dtu.dk/services/SignalP/) è possibile prevedere l’esistenza del peptide segnale e anche il punto in cui esso verrà tagliato dal resto della proteina, ovvero quale sarà il primo aminoacido della proteina “matura”.

Page 6: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

6

Il software fornisce un grafico in cui sono mostrate tre curve, che rappresentano il C S e Y score. Il C-score misura la probabilità che in quel determinato punto avvenga il taglio della sequenza segnale. L’ S-score corrisponde alla probabilità che ogni singolo amminoacido sia parte del peptide segnale. L’ Y-score è una combinazione di S e C e fornisce una previsione più accurata della posizione del sito di taglio del peptide segnale (in pratica il valore di Y è massimo quando la pendenza della curva S è molto ripida e contemporaneamente nella stessa posizione l’S-score ha un picco.

Page 7: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

7

1.4 Previsione di eventuali regioni transmembrana Esistono in realtà software più specificamente dedicati a identificare la disposizione in membrana di una proteina transmembrana come (http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html ).

Utilizzando questo programma possiamo prevedere con una certa sicurezza i tratti amminoacidici transmembrana e come essi sono disposti rispetto alla superficie extra e intra-cellulare. La schermata dei risultati dell’analisi mostra diversi dati: 1. i tratti previsti come possibili regioni transmembrana 2. un grafico di idrofobicità 3. una visione dall’alto dei tratti ad alfa elica con indicata la disposizione degli amminoacidi carichi, polari e idrofobici 4. una rappresentazione grafica della possibile disposizione della catena polipeptidica nella membrana.

La prima elica rappresenta il primo picco del grafico di pag. 5, la regione di idrofobicità della sequenza leader. La terza elica mostra una buona amfipaticità cioè espone catene laterali idrofiliche cariche da un lato e catene laterali idrofobiche sul lato opposto; le caratteristiche dei singoli amminoacidi, qui rappresentati con la nomenclatura ad una lettera, sono indicati dal codice colore (nero idrofobico, blu polare, rosso e blu grassetto carico).

Page 8: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

8

Esercizio: osserva la rappresentazione grafica della proteina; cosa puoi dedurre dalla distribuzione degli amminoacidi (per aiutarti segui la legenda sopra le eliche in figura)

1.5 Previsione della struttura secondaria

Avendo a disposizione la sequenza aminoacidica di una proteina è anche possibile cercare di prevederne la struttura secondaria, ovvero quali regioni della catena assumeranno conformazione ad alfa elica o a foglietto beta. Questo tipo di previsioni si basa sul fatto che ogni tipo di aminoacido ha una maggiore o minore tendenza a partecipare a regioni di struttura alfa o beta. Per effettuare una previsione della struttura secondaria utilizzeremo il sito: http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_seccons.html Ricorda che l’amminoacido indicato come 1 nella prima stringa (S = serina) in realtà è il 25° della proteina (il primo dopo la sequenza leader). Nella schermata vedrai tre diverse previsioni nelle successive tre stringhe (DSC, MLRC, PHD); puoi notare che non sono identiche anche se esiste una buona concordanza; le discordanze sono evidenziate con un punto di domanda nella quarta e ultima stringa. Con la lettera h sono rappresentate le regioni ad alfa elica mentre con la lettera c sono rappresentate le regioni coiled e con la lettera e le regioni a filamento beta. In generale, la previsione più attendibile è la prima DSC con i tratti ad alfa elica, coiled, e a filamento beta più estesi, senza interruzioni.

Page 9: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

9

2. VISUALIZZAZIONE DELLA STRUTTURA 3D DELLA PROTEINA Le strutture tridimensionali delle proteine possono essere determinate con una serie di approcci sperimentali, fra i quali i più utilizzati e in grado di fornire le informazioni più dettagliate sono la cristallografia ai raggi X e la risonanza magnetica nucleare. E’ inoltre possibile effetture delle previsioni di struttura per proteine che mostrino un sufficiente livello di identità di sequenza con proteine la cui struttura sia stata determinata sperimentalmente. Questo tipo di analisi è ovviamente molto meno accurato ma può fornire informazioni molto importanti sulla struttura e sulla funzione di una proteina. Le coordinate tridimensionali di ogni singolo atomo vengono scritte in un file che è poi possibile visualizzare mediante diversi software. In particolare noi utilizzeremo il software Deep View. I file contenenti le coordinate molecolari delle molecole la cui struttura 3D è già stata risolta sono raccolti (in diversi formati utilizzabili con diversi tipi di software) in un database chiamato PDB (“Protein Data Bank”).

Scaricare il file (con estensione “.pdb” o “.ent”) contenente la struttura tridimensionale della proteina in esame dal sito “Protein Data Bank” (http://www.rcsb.org/pdb/). il codice è 2bg9

Aprire il file con il software di visualizzazione “DeepView” (disponibile su

http://www.expasy.org/spdbv/)

Osservare la struttura terziaria della proteina, identificare domini e strutture secondarie

Familiarizzare con le diverse visualizzazioni: ribbon diagram, backbone and sidechains, CA trace only

Colorare i residui in funzione: (a) delle caratteristiche chimico-fisiche, (b) della struttura

secondaria cui appartengono, (c) dell’accessibilità e (d) della catena polipeptidica (solo nel caso di proteine composte da più catene polipeptidiche)

2.1 Deep View

Deep View è un potente programma di grafica, ottenibile da Expert Protein Analysis System (ExPASy) Molecular Biology Server di Ginevra. Deep View è semplice da usare e consente di vedere la struttura di una proteina e creare modelli dando una sequenza di amminoacidi, inoltre esso è anche un ottimo mezzo analitico. Permette di vedere diverse proteine contemporaneamente e sovrapporle per comparare la loro struttura e sequenza. Per le proteine con sequenza nota ma struttura sconosciuta, Deep View sottomette la sequenza a ExPASy per trovare le analogie con altre proteine, con cui potete allineare la sequenza di interesse per costruire un modello preliminare in tre dimensioni. Deep View sottopone il vostro allineamento a ExPASy, SWISS_MODEL costruirà un modello finale, chiamato homology model, che sarà inviato al vostro indirizzo e.mail. Aprite DeepView, comparirà la seguente finestra.

Barra strumenti

Barra menu

Page 10: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

10

Per inserire la proteina da analizzare, andate su File cliccate su Open PDB File scegliete un file con estensione .pdb e apritelo. Automaticamente la struttura della proteina verrà inserita in una finestra posta sotto la precedente.

La finestra superiore dà accesso al menu e ai più comuni strumenti utili per manipolare la proteina mentre la finestra posta in basso mostra la struttura della proteina. Naturalmente le singole finestre possono essere chiuse cliccando sulla X nel quadratino rosso posto in alto a destra, così come possono essere ampliate o ridotte agendo sui loro bordi tenendo premuto il tasto del mouse. Manipolazione della proteina Le 13 icone poste sotto il menu della prima finestra consentono di manipolare la proteina.

L’icona posta all’estrema sinistra consente di portare la proteina al centro dello schermo.

Le tre icone successive, poste sopra la scritta Move all, servono a trascinare, zoomare e ruotare la proteina. Una volta che l’icona è selezionata, (cliccando su di essa con il mouse) si può manipolare la proteina, mostrata nella finestra sottostante, muovendo il mouse tenendo premuto il pulsante destro.

Il terzo gruppo di 9 icone, poste sulla destra, permettono di compiere alcune operazioni di misura come ad esempio la distanza tra atomi, gli angoli tra atomi, ecc. di cui però non ci occupiamo. Cliccando sull’icona a forma di pagina scritta, situata in basso, vicino alla scritta Move all, si apre un’altra finestra dove sono elencate molte informazioni sulla proteina, compresa la sua sequenza amminoacidica. Control Panel Si può aprire la finestra del Control Panel andando sul menu. Cliccando su Window e su Control Panel si aprirà, sulla sinistra dello schermo, una nuova finestra.

Trascina

Centra

zoom ruota Informazioni sulla proteina

Finestra in cui viene mostrata la struttura della proteina

Page 11: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

11

Con il mouse potete trascinare la finestra del Control Panel dove ritenete più opportuno e cambiare le sue dimensioni agendo sui bordi della finestra stessa. Si usa il Contro Panel per selezionare, osservare e/o nascondere parte del modello agendo sui singoli amminoacidi che sono elencati sulla sinistra della finestra. Il primo click sulla finestra la rende attiva senza cambiare nulla. Quando si selezionano gli amminoacidi (group), essi diventano rossi e risultano così selezionati. Si possono selezionare cliccando su ciascuno di essi o cliccando e trascinando il mouse su di essi tenendo premuto il pulsante destro del mouse. Premendo Invio sulla tastiera, gli amminoacidi scompariranno tranne quelli selezionati (in rosso). Da notare che appare, nella colonna show del Contro Panel, una v accanto a ciascun amminoacido selezionato, che indica quali sono resi visibili. C’è una v anche nella colonna side indicando che i residui R degli amminoacidi sono visibili.

Invio

Page 12: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

12

A sinistra della colonna group ci sono altre due strette colonne, la prima è vuota se la proteina è formata da un unica catena, mentre se è formata da più catene in questa colonna compariranno delle lettere (A, B ecc.) ad indicare le varie catene che formano la proteina; la seconda colonna contiene una h se il residuo fa parte di un alfa elica o una s se il residuo costituisce il beta sheet. Si può selezionare la catena A semplicemente cliccando su una A qualsiasi: tutti i gruppi a diventeranno rossi, premendo Invio la catena A comparirà nella finestra a fondo nero. La stessa cosa vale per le h o le s: premendo su di una qualsiasi verranno selezionate le alfa eliche (o le beta sheet). Se si vuole selezionare due gruppi diversi, staccati tra loro, basta selezionare un gruppo e poi selezionare il secondo gruppo tenendo premuto il tasto Control. Una volta selezionati premere Invio per visualizzarli.

Selezionate alcuni amminoacidi, provate a cliccare sulle colonne show, side, labl, surface (un quadrato di puntini) e ribn e guardate l’effetto. Sempre tenendo premuto il pulsante del mouse e trascinandolo lungo le colonne del Control Panel si possono selezionare o deselezionare i gruppi e si può ottenere lo stesso risultato cliccando in cima alla colonna. Ricordate che potete centrare, spostare, zoomare, ruotare la figura nella finestra del display utilizzando le apposite icone.

Click su qualsiasi A

Click su qualsiasi h

Click su qualsiasi h, e tenendo premuto Control click su qualsiasi s

Page 13: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

13

Labl: mostra il nome degli amminoacidi selezionati.

Surface: mostra per ogni amminoacido, attraverso dei puntini, la superficie di van der Waals. Altri tipi di superficie sono ottenibili nel piccolo menu posto sotto il simbolo (rettangolino nero).

Ribn: disegna la struttura tridimensionale della proteina.

Colorazione (menu Color) Deep View consente di dare diversi tipi di colorazione al modello. La colorazione consente di evidenziare e rivelare le configurazioni strutturali e chimiche della proteina. Andate su menu Color e cliccate su:

Catene A di una proteina multicatena

Tipo di elica

amminoacidi

Rbn Rbn + Surface

Page 14: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

14

Secondary Structure: le alfa-eliche verranno colorate in rosso e le beta-scheet in giallo e le altre in grigio. Contemporaneamente la colorazione apparirà anche sul Contro Panel, nella colonna in cui compaiono piccoli quadrati. Secondary Structure Succession: colora le eliche e i foglietti ma l’ordine dei colori riflette l’ordine attraverso cui le varie strutture compaiono nella proteina. Risulta così più facile seguire la formazione di strutture secondarie lungo la catena polipeptidica. Chain: colora di colore diversi le singole catene che possono costituire una proteina. Naturalmente se una proteina è formata da una singola catena apparirà colorata uniformemente. Type: gli amminoacidi vengono colorati in base alle proprietà chimiche, i gruppi non polari in grigio (da notare che molti gruppi non polari sono verso l’interno perchè sono idrofobici), i gruppi acidi in rosso e basici in blu. Accessibility: questa operazione richiede qualche secondo, gli amminoacidi verranno colorati in base alla loro accessibilità al solvente, più alta è l’accessibilità e più alto sarà il valore della lunghezza d’onda utilizzato per colorarli. Si va dal violetto (400 nm) al rosso (700 nm). Il colore rosso indica quindi i residui più esposti. CPK: questa operazione riporta i gruppi ai colori standard: bianco per il carbonio, rosso per l’ossigeno, blu per l’azoto e giallo per lo zolfo. N.B. Potete cambiare i colori scelti dal programma per indicare gli atomi, gli amminoacidi, le strutture secondarie, le catene o lo sfondo andando su Preferences e cliccando su color, si apriranno nuove finestre attraverso cui potete selezionare i colori che preferite.

Page 15: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

15

Menu Select Da menu Select si possono selezionare i sottomenu: All: seleziona tutti gli amminoacidi della proteina. Premendo invio verranno mostrati. Secondary structure: permette di selezionare e mostrare (premendo Invio) varie parti della proteina.

- Helices: seleziona e mostra gli amminoacidi che formano un alfa elica, - Strand: seleziona e mostra solo le beta sheet - Coil: seleziona e mostra il resto degli amminoacidi

Group property: permette di selezionare e mostrare, sempre premendo Invio, solo gli amminoacidi basici, acidi, polari o non polari

Menu Window Dal menu Window si possono selezionare i sottomenu: Ramachandran Plot: Si usa questa finestra per giudicare la qualità del modello. Consente di visualizzare i residui i cui angoli conformazionali stanno fuori dal range permesso. Si possono anche cambiare gli angoli conformazionali del modello.

Page 16: “Sperimenta il BioLab” - users.unimi.itusers.unimi.it/cusbio/scaricare/proteine3d_08.pdf · Per la visualizzazione della struttura tridimensionale della ... proteina con le membrane

16

Layer Infos: questa tavola permette il controllo di molteplici modelli proteici, permettendo di scegliere quale modello rendere visibile, quale muovere ecc. Alignment: la finestra alignment che appare in basso mostra la sequenza di amminoacidi delle proteina. Si usa questa finestra quando si confrontano due o più proteine.