“Sperimenta il BioLab”
Transcript of “Sperimenta il BioLab”
“Sperimenta il BioLab”
Attività di Bioinformatica
Le proteine in 3D
Università degli Studi di Milano
Settore Didattico, via Celoria 20, Milano
Laboratorio 105
2
LE PROTEINE IN 3D
Obiettivo dell'attività è lo studio di una proteina codificata da un gene. La proteina che
analizzeremo è una proteina transmembrana ed è un recettore nicotinico neuronale di Torpedo
mormorata. La sequenza che viene proposta parte dall’a.a. serina (s) che è il 25esimo a.a. della
sequenza e che corrisponde al primo a.a. della proteina matura. Quelli precedenti fanno parte della
sequenza leader che hanno tutte le proteine transmembrana e che serve per indirizzare il ribosoma
nella traduzione. 25 sehetr lvanllenyn kvirpvehht hfvditvglq
61 liqlinvdev nqivetnvrl rqqwidvrlr wnpadyggik kirlpsddvw lpdlvlynna 121 dgdfaivhmt kllldytgki mwtppaifks yceiivthfp fdqqnctmkl giwtydgtkv 181 sispesdrpd lstfmesgew vmkdyrgwkh wvyytccpdt pyldityhfi mqriplyfvv 241 nviipcllfs fltvlvfylp tdsgekmtls isvllsltvf llvivelips tssavpligk 301 ymlftmifvi ssiivtvvvi nthhrspsth tmpqwvrkif intipnvmff stmkraskek 361 qenkifaddi disdisgkqv tgevifqtpl iknpdvksai egvkyiaehm ksdeessnaa 421 eewkyvamvi dhillcvfml iciigtvsvf agrlielsqe g
A questo scopo utilizzeremo un serie di software interrogabili on line presso il sito: http://www.expasy.org/ per trovare informazioni sulla proteina in questione:
calcolo del peso molecolare e del punto isoelettrico
(http://www.expasy.org/tools/pi_tool.html)
analisi del profilo di idrofobicità
(http://www.expasy.org/tools/protscale.html)
previsione di eventuali regioni transmembrana
( http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html)
Per la previsione della presenza del peptide segnale:
(http://www.cbs.dtu.dk/services/SignalP/)
Per la previsione della struttura secondaria:
( http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_seccons.html )
Per la visualizzazione della struttura tridimensionale della proteina utilizzeremo il software di
visualizzazione “DeepView” (disponibile su http://www.expasy.org/spdbv/)
3
1. PERCORSO
Il sito www.expasy.org rappresenta una risorsa molto importante di software per l’analisi della
struttura e della funzione di sequenze aminoacidiche. Le analisi che è possibile effettuare vanno
dallo studio della struttura primaria secondaria e terziaria delle proteine alla previsione delle
modificazioni post-traduzionali e della localizzazione intracellulare alla identificazione di potenziali
domini funzionali.
1.1 Calcolo del peso molecolare e del punto isoelettrico
Avendo a disposizione la sequenza aminoacidica (ovvero la struttura primaria) di una proteina è
innanzitutto possibile calcolarne il peso molecolare (PM) e il punto isoelettrico (PI), proprietà che
dipendono solo dalla sequenza di aminoacidi (anche se in realtà a seguito di eventuali modificazioni
post-traduzionali la proteina matura può avere PM e PI diversi da quelli previsti in base alla
semplice composizione in aminoacidi). Copiate negli appunti la sequenza che vi è stata fornita,
aprite il sito http://www.expasy.org/tools/pi_tool.html e incollate nella finestra vuota la sequenza.
4
Esercizi sul peso molecolare:
a) immagina di non conoscere la sequenza di una proteina ma conosci il peso.
b) dal valore medio del peso dell’a.a. calcola da quanti a.a. potrebbe essere formata la proteina e poi
confrontalo con il valore reale.
1.2 Analisi del profilo di idrofobicità
La conoscenza della struttura primaria di una proteina permette anche di prevederne il profilo di
idrofobicità, vale a dire come cambiano le caratteristiche di idrofilicità e di idrofobicità lungo la
sequenza. Questa informazione può essere utilizzata per prevedere la possibile interazione di una
proteina con le membrane fosfolipidiche della cellula. Per fare questa analisi utilizzeremo il sito:
http://www.expasy.org/toiche ols/protscale.html)
Procedete, come visto in precedenza, incollando la
sequenza aminoacidica nella finestra vuota. Come
vedete esistono diversi sistemi per il calcolo
dell’indice di idrofobicità/idrofilicità di una
sequenza aminoacidica, lasciate selezionato il
metodo di Kyte e Doolittle. Il risultato che
otterremo sarà un grafico delle proprietà
idrofiliche/idrofobiche della proteina. Nella parte
alta della schermata che otterrete vengono indicati
i valori di idrofobicità/idrofilicità attribuiti a
ciascun residuo, valori più positivi indicano
maggiore idrobobicità. I picchi del grafico
sottostante rappresentano quindi le regioni di
maggiore idrofobicità (vale a dire quelle in cui più
residui idrofobici si susseguono in sequenza) e potrebbero corrispondere a regioni transmembrana.
5
Il primo picco non rappresenta una regione di idrofobicità o transmenbrana ma rappresenta il picco
della sequenza leader che indirizza il ribosoma nella sintesi della catena nascente e che poi verrà
rimossa. Tutte le proteine di questa tipologia avranno all’inizio (entro i primi 40 amminoacidi)
questo picco.
Esercizio:
a) prova ad identificare tra questi picchi quali hanno valore di score superiore a 2
b) colora in rosso la parte interessata
1.3 Previsione della presenza del peptide segnale
Se la proteina che stiamo studiando è una proteina transmembrana (o di secrezione o destinata ad
essere indirizzata al Golgi o ai lisosomi) dovrà presentare all’estremità amino-terminale il peptide
segnale (chiamato anche sequenza leader, che indirizza il ribosoma con la catena polipeptidica
nascente verso la membrana del reticolo endoplasmatico in modo che il polipeptide possa essere
inserito in membrana mentre viene sintetizzato, ovvero co-traduzionalmente; lo stesso vale per le
proteine non di membrana ma secretive o che devono essere indirizzate ai lisosomi o al golgi). La
sequenza segnale viene rimossa da una specifica proteasi non appena viene inserita nel reticolo, con
un apposito software (disponibile presso il sito http://www.cbs.dtu.dk/services/SignalP/) è possibile
prevedere l’esistenza del peptide segnale e anche il punto in cui esso verrà tagliato dal resto della
proteina, ovvero quale sarà il primo aminoacido della proteina “matura”.
6
Il software fornisce un grafico in cui sono
mostrate tre curve, che rappresentano il C S e Y
score.
L’ S-score corrisponde alla probabilità che ogni
singolo amminoacido sia parte del peptide segnale
Il C-score misura la probabilità che in quel
determinato punto avvenga il taglio della sequenza
segnale
L’ Y-max è una combinazione di S e C e fornisce
una previsione più accurata della posizione del
sito di taglio del peptide segnale (in pratica il
valore di Y è massimo quando la pendenza della
curva “S” è molto ripida e contemporaneamente
nella stessa posizione l’S-score ha un picco.
7
1.4 Previsione di eventuali regioni transmembrana
Esistono in realtà software più specificamente dedicati a identificare la disposizione in membrana di
una proteina transmembrana come (http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html ).
Utilizzando questo programma possiamo prevedere con una certa sicurezza, i tratti aminoacidici
transmembrana e come essi sono disposti rispetto alla superficie extra- e intra-cellulare.
La schermata dei risultati dell’analisi mostra diversi dati:
1. i tratti previsti come possibili regioni transmembrana
2. un grafico di idrofobicità
3. una visione dall’alto dei tratti ad alfa elica con indicata la disposizione degli amminoacidi carichi,
polari e idrofobici
4. una rappresentazione grafica della possibile disposizione della catena polipeptidica nella
membrana.
La prima elica rappresenta il primo picco del
grafico di pag. 5 cioè i primi 40 amminoacidi del
segnale leader.
La terza elica mostra una buona amfipaticità;
confronta gli amminoacidi qui rappresentati con la
nomenclatura ad una lettera con quelli dello
schema di pag. 5 che mostra gli amminoacidi
raggruppati in base alla loro polarità e alla loro non
polarità.
8
Esercizio:
osserva la quarta elica; cosa puoi dedurre dalla distribuzione degli amminoacidi (per aiutarti segui la
legenda sopraevidenziata)
1.5 Previsione della struttura secondaria
Avendo a disposizione la sequenza aminoacidica di una proteina è anche possibile cercare di
prevederne la struttura secondaria, ovvero quali regioni della catena assumeranno conformazione ad
alfa elica o a foglietto beta. Questo tipo di previsioni si basa sul fatto che ogni tipo di aminoacido ha
una maggiore o minore tendenza a partecipare a regioni di struttura alfa o beta. Per effettuare una
previsione della struttura secondaria utilizzeremo il sito:
http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_seccons.html
Ricorda che l’a.a. indicato come 1 nella prima stringa (s= serina) in realtà è il 25° della proteina.
Nella schermata vedrai tre diverse previsioni nelle successive tre stringhe (DSC, MLRC, PHD);
puoi notare che non sono identiche anche se esiste una buona concordanza, le discordanze sono
eveidenziate con un punto di domanda nella quarta e ultima stringa.
Con la lettera h sono rappresentate le regioni ad alfa elica mentre con la lettera c sono rappresentate
le regioni coiled e con la lettera e le regioni a filamento beta.
In generale la previsione più attendibile è la prima DSC con i tratti ad alfa elica, coiled, e a
filamento beta più estesi, senza interruzioni.
9
2. VISUALIZZAZIONE DELLA STRUTTURA 3D DELLA PROTEINA
Le strutture tridimensionali delle proteine possono essere determinate con una serie di approcci
sperimentali, fra i quali i più utilizzati e in grado di fornire le informazioni più dettagliate sono la
cristallografia ai raggi X e la risonanza magnetica nucleare. E’ inoltre possibile effetture delle
previsioni di struttura per proteine che mostrino un sufficiente livello di identità di sequenza con
proteine la cui struttura sia stata determinata sperimentalmente. Questo tipo di analisi è ovviamente
molto meno accurato ma può fornire informazioni molto importanti sulla struttura e sulla funzione
di una proteina. Le coordinate tridimensionali di ogni singolo atomo vengono scritte in un file che è
poi possibile visualizzare mediante diversi software. In particolare noi utilizzeremo il software
Deep View. I file contenenti le coordinate molecolari delle molecole la cui struttura 3D è già stata
risolta sono raccolti (in diversi formati utilizzabili con diversi tipi di software) in un database
chiamato PDB (“Protein Data Bank”).
Scaricare il file (con estensione “.pdb” o “.ent”) contenente la struttura tridimensionale della
proteina in esame dal sito “Protein Data Bank” (http://www.rcsb.org/pdb/) 2bg9
Aprire il file con il software di visualizzazione “DeepView” (disponibile su
http://www.expasy.org/spdbv/)
Osservare la struttura terziaria della proteina, identificare domini e strutture secondarie
Familiarizzare con le diverse visualizzazioni: ribbon diagram, backbone and sidechains,
CA trace only
Colorare i residui in funzione: (a) delle caratteristiche chimico-fisiche, (b) della struttura
secondaria cui appartengono, (c) dell’accessibilità e (d) della catena polipeptidica (solo nel
caso di proteine composte da più catene polipeptidiche)
2.1 Deep View
Deep View è un potente programma di grafica, ottenibile da Expert Protein Analysis System
(ExPASy) Molecular Biology Server di Ginevra.
Deep View è semplice da usare e consente di vedere la struttura di una proteina e creare modelli
dando una sequenza di amminoacidi, inoltre esso è anche un ottimo mezzo analitico.
Permette di vedere diverse proteine contemporaneamente e sovrapporle per comparare la loro
struttura e sequenza. Per le proteine con sequenza nota ma struttura sconosciuta, Deep View
sottomette la sequenza a ExPASy per trovare le analogie con altre proteine, con cui potete allineare
la vostra sequenza per costruire un modello preliminare in tre dimensioni. Deep View sottopone il
vostro allineamento a ExPASy, SWISS_MODEL costruirà un modello finale, chiamato homology
model, che sarà inviato al vostro indirizzo e.mail.
Aprite DeepView, comparirà la seguente finestra.
Barra strumenti
Barra menu
10
Per inserire la proteina da analizzare, andate su File cliccate su Open PDB File scegliete un file con
estensione .pdb e apritelo. Automaticamente la struttura della proteina verrà inserita in una finestra
posta sotto la precedente.
La finestra superiore dà accesso al menu e ai più comuni strumenti utili per manipolare la proteina
mentre la finestra posta in basso mostra la struttura della proteina.
Naturalmente le singole finestre possono essere chiuse cliccando sulla X nel quadratino rosso posto
in alto a destra, così come possono essere ampliate o ridotte agendo sui loro bordi tenendo premuto
il tasto del mouse.
Manipolazione della proteina
Le 13 icone poste sotto il menu della prima finestra consentono di manipolare la proteina.
L’icona posta all’estrema sinistra consente di portare la proteina al centro dello schermo.
Le tre icone successive, poste sopra la scritta Move all, servono a trascinare,
zoomare e ruotare la proteina. Una volta che l’icona è selezionata, (cliccando su di essa con il
mouse) si può manipolare la proteina, mostrata nella finestra sottostante, muovendo il mouse
tenendo premuto il pulsante destro.
Il terzo gruppo di 9 icone, poste sulla destra, permettono
di compiere alcune operazioni di misura come ad esempio la distanza tra atomi, gli angoli tra atomi,
ecc. di cui però non ci occupiamo.
Cliccando sull’icona a forma di pagina scritta, situata in basso, vicino alla scritta Move all, si
apre un’altra finestra dove sono elencate molte informazioni sulla proteina, compresa la sua
sequenza amminoacidica.
Control Panel
Si può aprire la finestra del Control Panel andando sul menu, cliccando su Window e su Control
Panel, vi si aprirà, sulla sinistra dello schermo, una nuova finestra.
Trascina
Centra
zoom ruota
Informazioni
sulla proteina
Finestra in cui viene mostrata la
struttura della proteina
11
Con il mouse potete trascinare la finestra del Control Panel
dove meglio ritenete più opportuno e cambiare le sue
dimensioni agendo sui bordi della finestra stessa.
Si usa il Contro Panel per selezionare, osservare e/o nascondere
parte del modello agendo sui singoli amminoacidi che sono
elencati sulla sinistra della finestra.
Il primo click sulla finestra la rende attiva senza cambiare
nulla. Quando si selezionano gli amminoacidi (group), essi
diventano rossi e risultano così selezionati. Si possono
selezionare cliccando su ciascuno di essi o cliccando e
trascinando il mouse su di essi tenendo premuto il pulsante
destro del mouse. Premendo Invio sulla tastiera, gli
amminoacidi scompariranno tranne quelli selezionati (in rosso).
Da notare che appare, nella colonna show del Contro Panel,
una v accanto a ciascun amminoacido selezionato, che indica
quali sono resi visibili. C’è una v anche nella colonna side indicando che i residui R degli
amminoacidi che sono visibili.
Invio
12
A sinistra della colonna group ci sono altre due strette colonne, la prima è vuota se la proteina è
formata da un unica catena, mentre se è formata da più catene in questa colonna compariranno delle
lettere A, B ecc. ad indicare le varie catene che formano la proteina; la seconda colonna contiene
una h se il residuo fa parte di un alfa elica o una s se il residuo costituisce il beta sheet. Si può
selezionare la catena A semplicemente cliccando su una A qualsiasi, tutti i gruppi a diventeranno
rossi, premendo Invio la catena A comparirà nella finestra a fondo nero. La stessa cosa vale per le h
o le s, premendo su di una qualsiasi verranno selezionate le alfa eliche (o le beta sheet). Se si vuole
selezionare due gruppi diversi, staccati tra loro, basta selezionare un gruppo e poi selezionare il
secondo gruppo tenendo premuto il tasto Control, una volta selezionati premere Invio per
visualizzarli.
Selezionate alcuni amminoacidi e provate a cliccare sulle colonne show, side, labl, surface (un
quadrato di puntini) e ribn e guardate l’effetto.
Sempre tenendo premuto il pulsante del mouse e trascinandolo lungo le colonne del Control Panel
si possono selezionare o deselezionare i gruppi e si può ottenere lo stesso risultato cliccando in cima
alla colonna.
Ricordate che potete centrare, spostare, zoomare, ruotare la figura nella finestra del display
utilizzando le apposite icone.
Click su
qualsiasi A
Click su
qualsiasi h
Click su qualsiasi h, e
tenendo premuto
Control click su
qualsiasi s
13
Labl: mostra il nome degli amminoacidi selezionati.
Surface: mostra per ogni amminoacido, attraverso dei puntini, la superficie di van der Waals.
Altri tipi di superficie sono ottenibili nel piccolo menu posto sotto il simbolo
(rettangolino nero).
Ribn: disegna la struttura tridimensionale della proteina?
Colorazione (menu Color)
Deep View consente di dare diversi tipi di colorazione al modello. La colorazione consente di
evidenziare e rivelare le configurazioni strutturali e chimiche della proteina.
Andare su menu Color e cliccate su:
Catene A di
una proteina
Tipo di elica
amminoacidi
Rbn Rbn + Surface
14
Secondary Structure: le alfa-eliche verranno colorate di rosso e le beta-scheet in giallo e le altre in
grigio. Contemporaneamente la colorazione apparirà anche sul Contro Panel, nella colonna in cui
compaiono piccoli quadrati.
Secondary Structure Succession: colora le eliche e i folglietti ma l’ordine dei colori riflette
l’ordine attraverso cui le varie strutture compaiono nella proteina. Risulta così più facile seguire la
formazione di strutture secondarie lungo la catena polipeptidica.
Chain: colorerà di colore diversi le singole catene che possono costituire una proteina.
Naturalmente se una proteina è formata da una singola catena apparirà colorata uniformemente.
Type: gli amminoacidi vengono colorati in base alle proprietà chimiche, i gruppi non polari in
grigio (da notare che molti gruppi non polari sono verso l’interno perchè sono idrofobici), i gruppi
acidi in rossi e basici in blu.
Accessibility: questa operazione richiede qualche secondo, gli amminoacidi verranno colorati in
base alla loro accessibilità al solvente, più alta è l’accessibilità e più alto sarà il valore della
lunghezza d’onda utilizzato per colorarli. Si va dal violetto (400 nm) al rosso (700 nm). Il colore
rosso indica quindi i residui più esposti.
CPK: questa operazione riporta i gruppi ai colori standard: bianco per il carbonio, rosso per
l’ossigeno, blu per l’azoto e giallo per lo zolfo
N.B. Potete cambiare i colori scelti dal programma per indicare gli atomi, gli amminoacidi, le
strutture secondarie, le catene o lo sfondo andando su Preferences e cliccando su color, si
apriranno nuove finestre attraverso cui potete selezionare i colori che preferite.
15
Menu Select
Da menu Select si possono selezionare i sottomenu:
All: seleziona tutti gli amminoacidi della proteina, premendo invio verranno mostrati
Secondary structure: permette di selezionare e mostrare premendo Invio varie parti della proteina.
- Helices: seleziona e mostra gli amminoacidi che formano un alfa elica,
- Strand: seleziona e mostra solo le beta sheet
- Coil: seleziona e mostra il resto degli amminoacidi
Group property: permette di selezionare e mostrare, sempre premendo Invio, solo gli
amminoacidi basici, acidi, polari o non polari
Menu Window
Dal menu Window si possono selezionare i sottomenu:
Ramachandran Plot: Si usa questa finestra per giudicare la qualità del modello, consente di
visualizzare i residui i cui angoli conformazionali stanno fuori dal range permesso. Si possono
anche cambiare gli angoli conformazionali del modello.
16
Layer Infos: questa tavola permette il controllo di molteplici modelli proteici, permettendo di
scegliere quale modello rendere visibile, quale muovere ecc.
Alignment: la finestra alignment appare in basso, mostra la sequenza di amminoacidi delle
proteina. Si usa questa finestra quando si confrontano due o più proteine.