“Sperimenta il BioLab”

“Sperimenta il BioLab”

Attività di Bioinformatica

Le proteine in 3D

Università degli Studi di Milano

Settore Didattico, via Celoria 20, Milano

Laboratorio 105

2

LE PROTEINE IN 3D

Obiettivo dell'attività è lo studio di una proteina codificata da un gene. La proteina che

analizzeremo è una proteina transmembrana ed è un recettore nicotinico neuronale di Torpedo

mormorata. La sequenza che viene proposta parte dall’a.a. serina (s) che è il 25esimo a.a. della

sequenza e che corrisponde al primo a.a. della proteina matura. Quelli precedenti fanno parte della

sequenza leader che hanno tutte le proteine transmembrana e che serve per indirizzare il ribosoma

nella traduzione. 25 sehetr lvanllenyn kvirpvehht hfvditvglq

61 liqlinvdev nqivetnvrl rqqwidvrlr wnpadyggik kirlpsddvw lpdlvlynna 121 dgdfaivhmt kllldytgki mwtppaifks yceiivthfp fdqqnctmkl giwtydgtkv 181 sispesdrpd lstfmesgew vmkdyrgwkh wvyytccpdt pyldityhfi mqriplyfvv 241 nviipcllfs fltvlvfylp tdsgekmtls isvllsltvf llvivelips tssavpligk 301 ymlftmifvi ssiivtvvvi nthhrspsth tmpqwvrkif intipnvmff stmkraskek 361 qenkifaddi disdisgkqv tgevifqtpl iknpdvksai egvkyiaehm ksdeessnaa 421 eewkyvamvi dhillcvfml iciigtvsvf agrlielsqe g

A questo scopo utilizzeremo un serie di software interrogabili on line presso il sito: http://www.expasy.org/ per trovare informazioni sulla proteina in questione:

calcolo del peso molecolare e del punto isoelettrico

(http://www.expasy.org/tools/pi_tool.html)

analisi del profilo di idrofobicità

(http://www.expasy.org/tools/protscale.html)

previsione di eventuali regioni transmembrana

( http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html)

Per la previsione della presenza del peptide segnale:

(http://www.cbs.dtu.dk/services/SignalP/)

Per la previsione della struttura secondaria:

( http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_seccons.html )

Per la visualizzazione della struttura tridimensionale della proteina utilizzeremo il software di

visualizzazione “DeepView” (disponibile su http://www.expasy.org/spdbv/)

3

1. PERCORSO

Il sito www.expasy.org rappresenta una risorsa molto importante di software per l’analisi della

struttura e della funzione di sequenze aminoacidiche. Le analisi che è possibile effettuare vanno

dallo studio della struttura primaria secondaria e terziaria delle proteine alla previsione delle

modificazioni post-traduzionali e della localizzazione intracellulare alla identificazione di potenziali

domini funzionali.

1.1 Calcolo del peso molecolare e del punto isoelettrico

Avendo a disposizione la sequenza aminoacidica (ovvero la struttura primaria) di una proteina è

innanzitutto possibile calcolarne il peso molecolare (PM) e il punto isoelettrico (PI), proprietà che

dipendono solo dalla sequenza di aminoacidi (anche se in realtà a seguito di eventuali modificazioni

post-traduzionali la proteina matura può avere PM e PI diversi da quelli previsti in base alla

semplice composizione in aminoacidi). Copiate negli appunti la sequenza che vi è stata fornita,

aprite il sito http://www.expasy.org/tools/pi_tool.html e incollate nella finestra vuota la sequenza.

4

Esercizi sul peso molecolare:

a) immagina di non conoscere la sequenza di una proteina ma conosci il peso.

b) dal valore medio del peso dell’a.a. calcola da quanti a.a. potrebbe essere formata la proteina e poi

confrontalo con il valore reale.

1.2 Analisi del profilo di idrofobicità

La conoscenza della struttura primaria di una proteina permette anche di prevederne il profilo di

idrofobicità, vale a dire come cambiano le caratteristiche di idrofilicità e di idrofobicità lungo la

sequenza. Questa informazione può essere utilizzata per prevedere la possibile interazione di una

proteina con le membrane fosfolipidiche della cellula. Per fare questa analisi utilizzeremo il sito:

http://www.expasy.org/toiche ols/protscale.html)

Procedete, come visto in precedenza, incollando la

sequenza aminoacidica nella finestra vuota. Come

vedete esistono diversi sistemi per il calcolo

dell’indice di idrofobicità/idrofilicità di una

sequenza aminoacidica, lasciate selezionato il

metodo di Kyte e Doolittle. Il risultato che

otterremo sarà un grafico delle proprietà

idrofiliche/idrofobiche della proteina. Nella parte

alta della schermata che otterrete vengono indicati

i valori di idrofobicità/idrofilicità attribuiti a

ciascun residuo, valori più positivi indicano

maggiore idrobobicità. I picchi del grafico

sottostante rappresentano quindi le regioni di

maggiore idrofobicità (vale a dire quelle in cui più

residui idrofobici si susseguono in sequenza) e potrebbero corrispondere a regioni transmembrana.

5

Il primo picco non rappresenta una regione di idrofobicità o transmenbrana ma rappresenta il picco

della sequenza leader che indirizza il ribosoma nella sintesi della catena nascente e che poi verrà

rimossa. Tutte le proteine di questa tipologia avranno all’inizio (entro i primi 40 amminoacidi)

questo picco.

Esercizio:

a) prova ad identificare tra questi picchi quali hanno valore di score superiore a 2

b) colora in rosso la parte interessata

1.3 Previsione della presenza del peptide segnale

Se la proteina che stiamo studiando è una proteina transmembrana (o di secrezione o destinata ad

essere indirizzata al Golgi o ai lisosomi) dovrà presentare all’estremità amino-terminale il peptide

segnale (chiamato anche sequenza leader, che indirizza il ribosoma con la catena polipeptidica

nascente verso la membrana del reticolo endoplasmatico in modo che il polipeptide possa essere

inserito in membrana mentre viene sintetizzato, ovvero co-traduzionalmente; lo stesso vale per le

proteine non di membrana ma secretive o che devono essere indirizzate ai lisosomi o al golgi). La

sequenza segnale viene rimossa da una specifica proteasi non appena viene inserita nel reticolo, con

un apposito software (disponibile presso il sito http://www.cbs.dtu.dk/services/SignalP/) è possibile

prevedere l’esistenza del peptide segnale e anche il punto in cui esso verrà tagliato dal resto della

proteina, ovvero quale sarà il primo aminoacido della proteina “matura”.

6

Il software fornisce un grafico in cui sono

mostrate tre curve, che rappresentano il C S e Y

score.

L’ S-score corrisponde alla probabilità che ogni

singolo amminoacido sia parte del peptide segnale

Il C-score misura la probabilità che in quel

determinato punto avvenga il taglio della sequenza

segnale

L’ Y-max è una combinazione di S e C e fornisce

una previsione più accurata della posizione del

sito di taglio del peptide segnale (in pratica il

valore di Y è massimo quando la pendenza della

curva “S” è molto ripida e contemporaneamente

nella stessa posizione l’S-score ha un picco.

7

1.4 Previsione di eventuali regioni transmembrana

Esistono in realtà software più specificamente dedicati a identificare la disposizione in membrana di

una proteina transmembrana come (http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html ).

Utilizzando questo programma possiamo prevedere con una certa sicurezza, i tratti aminoacidici

transmembrana e come essi sono disposti rispetto alla superficie extra- e intra-cellulare.

La schermata dei risultati dell’analisi mostra diversi dati:

1. i tratti previsti come possibili regioni transmembrana

2. un grafico di idrofobicità

3. una visione dall’alto dei tratti ad alfa elica con indicata la disposizione degli amminoacidi carichi,

polari e idrofobici

4. una rappresentazione grafica della possibile disposizione della catena polipeptidica nella

membrana.

La prima elica rappresenta il primo picco del

grafico di pag. 5 cioè i primi 40 amminoacidi del

segnale leader.

La terza elica mostra una buona amfipaticità;

confronta gli amminoacidi qui rappresentati con la

nomenclatura ad una lettera con quelli dello

schema di pag. 5 che mostra gli amminoacidi

raggruppati in base alla loro polarità e alla loro non

polarità.

8

Esercizio:

osserva la quarta elica; cosa puoi dedurre dalla distribuzione degli amminoacidi (per aiutarti segui la

legenda sopraevidenziata)

1.5 Previsione della struttura secondaria

Avendo a disposizione la sequenza aminoacidica di una proteina è anche possibile cercare di

prevederne la struttura secondaria, ovvero quali regioni della catena assumeranno conformazione ad

alfa elica o a foglietto beta. Questo tipo di previsioni si basa sul fatto che ogni tipo di aminoacido ha

una maggiore o minore tendenza a partecipare a regioni di struttura alfa o beta. Per effettuare una

previsione della struttura secondaria utilizzeremo il sito:

http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_seccons.html

Ricorda che l’a.a. indicato come 1 nella prima stringa (s= serina) in realtà è il 25° della proteina.

Nella schermata vedrai tre diverse previsioni nelle successive tre stringhe (DSC, MLRC, PHD);

puoi notare che non sono identiche anche se esiste una buona concordanza, le discordanze sono

eveidenziate con un punto di domanda nella quarta e ultima stringa.

Con la lettera h sono rappresentate le regioni ad alfa elica mentre con la lettera c sono rappresentate

le regioni coiled e con la lettera e le regioni a filamento beta.

In generale la previsione più attendibile è la prima DSC con i tratti ad alfa elica, coiled, e a

filamento beta più estesi, senza interruzioni.

9

2. VISUALIZZAZIONE DELLA STRUTTURA 3D DELLA PROTEINA

Le strutture tridimensionali delle proteine possono essere determinate con una serie di approcci

sperimentali, fra i quali i più utilizzati e in grado di fornire le informazioni più dettagliate sono la

cristallografia ai raggi X e la risonanza magnetica nucleare. E’ inoltre possibile effetture delle

previsioni di struttura per proteine che mostrino un sufficiente livello di identità di sequenza con

proteine la cui struttura sia stata determinata sperimentalmente. Questo tipo di analisi è ovviamente

molto meno accurato ma può fornire informazioni molto importanti sulla struttura e sulla funzione

di una proteina. Le coordinate tridimensionali di ogni singolo atomo vengono scritte in un file che è

poi possibile visualizzare mediante diversi software. In particolare noi utilizzeremo il software

Deep View. I file contenenti le coordinate molecolari delle molecole la cui struttura 3D è già stata

risolta sono raccolti (in diversi formati utilizzabili con diversi tipi di software) in un database

chiamato PDB (“Protein Data Bank”).

Scaricare il file (con estensione “.pdb” o “.ent”) contenente la struttura tridimensionale della

proteina in esame dal sito “Protein Data Bank” (http://www.rcsb.org/pdb/) 2bg9

Aprire il file con il software di visualizzazione “DeepView” (disponibile su

http://www.expasy.org/spdbv/)

Osservare la struttura terziaria della proteina, identificare domini e strutture secondarie

Familiarizzare con le diverse visualizzazioni: ribbon diagram, backbone and sidechains,

CA trace only

Colorare i residui in funzione: (a) delle caratteristiche chimico-fisiche, (b) della struttura

secondaria cui appartengono, (c) dell’accessibilità e (d) della catena polipeptidica (solo nel

caso di proteine composte da più catene polipeptidiche)

2.1 Deep View

Deep View è un potente programma di grafica, ottenibile da Expert Protein Analysis System

(ExPASy) Molecular Biology Server di Ginevra.

Deep View è semplice da usare e consente di vedere la struttura di una proteina e creare modelli

dando una sequenza di amminoacidi, inoltre esso è anche un ottimo mezzo analitico.

Permette di vedere diverse proteine contemporaneamente e sovrapporle per comparare la loro

struttura e sequenza. Per le proteine con sequenza nota ma struttura sconosciuta, Deep View

sottomette la sequenza a ExPASy per trovare le analogie con altre proteine, con cui potete allineare

la vostra sequenza per costruire un modello preliminare in tre dimensioni. Deep View sottopone il

vostro allineamento a ExPASy, SWISS_MODEL costruirà un modello finale, chiamato homology

model, che sarà inviato al vostro indirizzo e.mail.

Aprite DeepView, comparirà la seguente finestra.

Barra strumenti

Barra menu

10

Per inserire la proteina da analizzare, andate su File cliccate su Open PDB File scegliete un file con

estensione .pdb e apritelo. Automaticamente la struttura della proteina verrà inserita in una finestra

posta sotto la precedente.

La finestra superiore dà accesso al menu e ai più comuni strumenti utili per manipolare la proteina

mentre la finestra posta in basso mostra la struttura della proteina.

Naturalmente le singole finestre possono essere chiuse cliccando sulla X nel quadratino rosso posto

in alto a destra, così come possono essere ampliate o ridotte agendo sui loro bordi tenendo premuto

il tasto del mouse.

Manipolazione della proteina

Le 13 icone poste sotto il menu della prima finestra consentono di manipolare la proteina.

L’icona posta all’estrema sinistra consente di portare la proteina al centro dello schermo.

Le tre icone successive, poste sopra la scritta Move all, servono a trascinare,

zoomare e ruotare la proteina. Una volta che l’icona è selezionata, (cliccando su di essa con il

mouse) si può manipolare la proteina, mostrata nella finestra sottostante, muovendo il mouse

tenendo premuto il pulsante destro.

Il terzo gruppo di 9 icone, poste sulla destra, permettono

di compiere alcune operazioni di misura come ad esempio la distanza tra atomi, gli angoli tra atomi,

ecc. di cui però non ci occupiamo.

Cliccando sull’icona a forma di pagina scritta, situata in basso, vicino alla scritta Move all, si

apre un’altra finestra dove sono elencate molte informazioni sulla proteina, compresa la sua

sequenza amminoacidica.

Control Panel

Si può aprire la finestra del Control Panel andando sul menu, cliccando su Window e su Control

Panel, vi si aprirà, sulla sinistra dello schermo, una nuova finestra.

Trascina

Centra

zoom ruota

Informazioni

sulla proteina

Finestra in cui viene mostrata la

struttura della proteina

11

Con il mouse potete trascinare la finestra del Control Panel

dove meglio ritenete più opportuno e cambiare le sue

dimensioni agendo sui bordi della finestra stessa.

Si usa il Contro Panel per selezionare, osservare e/o nascondere

parte del modello agendo sui singoli amminoacidi che sono

elencati sulla sinistra della finestra.

Il primo click sulla finestra la rende attiva senza cambiare

nulla. Quando si selezionano gli amminoacidi (group), essi

diventano rossi e risultano così selezionati. Si possono

selezionare cliccando su ciascuno di essi o cliccando e

trascinando il mouse su di essi tenendo premuto il pulsante

destro del mouse. Premendo Invio sulla tastiera, gli

amminoacidi scompariranno tranne quelli selezionati (in rosso).

Da notare che appare, nella colonna show del Contro Panel,

una v accanto a ciascun amminoacido selezionato, che indica

quali sono resi visibili. C’è una v anche nella colonna side indicando che i residui R degli

amminoacidi che sono visibili.

Invio

12

A sinistra della colonna group ci sono altre due strette colonne, la prima è vuota se la proteina è

formata da un unica catena, mentre se è formata da più catene in questa colonna compariranno delle

lettere A, B ecc. ad indicare le varie catene che formano la proteina; la seconda colonna contiene

una h se il residuo fa parte di un alfa elica o una s se il residuo costituisce il beta sheet. Si può

selezionare la catena A semplicemente cliccando su una A qualsiasi, tutti i gruppi a diventeranno

rossi, premendo Invio la catena A comparirà nella finestra a fondo nero. La stessa cosa vale per le h

o le s, premendo su di una qualsiasi verranno selezionate le alfa eliche (o le beta sheet). Se si vuole

selezionare due gruppi diversi, staccati tra loro, basta selezionare un gruppo e poi selezionare il

secondo gruppo tenendo premuto il tasto Control, una volta selezionati premere Invio per

visualizzarli.

Selezionate alcuni amminoacidi e provate a cliccare sulle colonne show, side, labl, surface (un

quadrato di puntini) e ribn e guardate l’effetto.

Sempre tenendo premuto il pulsante del mouse e trascinandolo lungo le colonne del Control Panel

si possono selezionare o deselezionare i gruppi e si può ottenere lo stesso risultato cliccando in cima

alla colonna.

Ricordate che potete centrare, spostare, zoomare, ruotare la figura nella finestra del display

utilizzando le apposite icone.

Click su

qualsiasi A

Click su

qualsiasi h

Click su qualsiasi h, e

tenendo premuto

Control click su

qualsiasi s

13

Labl: mostra il nome degli amminoacidi selezionati.

Surface: mostra per ogni amminoacido, attraverso dei puntini, la superficie di van der Waals.

Altri tipi di superficie sono ottenibili nel piccolo menu posto sotto il simbolo

(rettangolino nero).

Ribn: disegna la struttura tridimensionale della proteina?

Colorazione (menu Color)

Deep View consente di dare diversi tipi di colorazione al modello. La colorazione consente di

evidenziare e rivelare le configurazioni strutturali e chimiche della proteina.

Andare su menu Color e cliccate su:

Catene A di

una proteina

Tipo di elica

amminoacidi

Rbn Rbn + Surface

14

Secondary Structure: le alfa-eliche verranno colorate di rosso e le beta-scheet in giallo e le altre in

grigio. Contemporaneamente la colorazione apparirà anche sul Contro Panel, nella colonna in cui

compaiono piccoli quadrati.

Secondary Structure Succession: colora le eliche e i folglietti ma l’ordine dei colori riflette

l’ordine attraverso cui le varie strutture compaiono nella proteina. Risulta così più facile seguire la

formazione di strutture secondarie lungo la catena polipeptidica.

Chain: colorerà di colore diversi le singole catene che possono costituire una proteina.

Naturalmente se una proteina è formata da una singola catena apparirà colorata uniformemente.

Type: gli amminoacidi vengono colorati in base alle proprietà chimiche, i gruppi non polari in

grigio (da notare che molti gruppi non polari sono verso l’interno perchè sono idrofobici), i gruppi

acidi in rossi e basici in blu.

Accessibility: questa operazione richiede qualche secondo, gli amminoacidi verranno colorati in

base alla loro accessibilità al solvente, più alta è l’accessibilità e più alto sarà il valore della

lunghezza d’onda utilizzato per colorarli. Si va dal violetto (400 nm) al rosso (700 nm). Il colore

rosso indica quindi i residui più esposti.

CPK: questa operazione riporta i gruppi ai colori standard: bianco per il carbonio, rosso per

l’ossigeno, blu per l’azoto e giallo per lo zolfo

N.B. Potete cambiare i colori scelti dal programma per indicare gli atomi, gli amminoacidi, le

strutture secondarie, le catene o lo sfondo andando su Preferences e cliccando su color, si

apriranno nuove finestre attraverso cui potete selezionare i colori che preferite.

15

Menu Select

Da menu Select si possono selezionare i sottomenu:

All: seleziona tutti gli amminoacidi della proteina, premendo invio verranno mostrati

Secondary structure: permette di selezionare e mostrare premendo Invio varie parti della proteina.

- Helices: seleziona e mostra gli amminoacidi che formano un alfa elica,

- Strand: seleziona e mostra solo le beta sheet

- Coil: seleziona e mostra il resto degli amminoacidi

Group property: permette di selezionare e mostrare, sempre premendo Invio, solo gli

amminoacidi basici, acidi, polari o non polari

Menu Window

Dal menu Window si possono selezionare i sottomenu:

Ramachandran Plot: Si usa questa finestra per giudicare la qualità del modello, consente di

visualizzare i residui i cui angoli conformazionali stanno fuori dal range permesso. Si possono

anche cambiare gli angoli conformazionali del modello.

16

Layer Infos: questa tavola permette il controllo di molteplici modelli proteici, permettendo di

scegliere quale modello rendere visibile, quale muovere ecc.

Alignment: la finestra alignment appare in basso, mostra la sequenza di amminoacidi delle

proteina. Si usa questa finestra quando si confrontano due o più proteine.

“Sperimenta il BioLab”

Documents

Transcript of “Sperimenta il BioLab”