Il registro delle imprese e la comunicazione unica per lavvio dellattività dimpresa.
Dottorato di ricerca in Biologia Computazionale (XVI ciclo) Dott.ssa Costantini Susan 20 dicembre...
-
Upload
vanda-pinna -
Category
Documents
-
view
219 -
download
0
Transcript of Dottorato di ricerca in Biologia Computazionale (XVI ciclo) Dott.ssa Costantini Susan 20 dicembre...
Dottorato di ricerca in Biologia Computazionale (XVI ciclo)
Dott.ssa Costantini Susan
20 dicembre 2004
Basi molecolari dell’attività biologica delle proteine:
l’approccio computazionale e bioinformaticoalla comprensione della relazione
Struttura-Funzione
Basi molecolari dell’attività biologica delle proteine:
l’approccio computazionale e bioinformaticoalla comprensione della relazione
Struttura-Funzione
Sequenza – Struttura - Funzione
Strutture-proteineGenoma
MYSFPNSFRFGWSQAGFQSEMGTPGSEDPNTDWYKWVHDPENMAAGLVSGDLPENGPGYWGNYKTFHDNAQKMGLKIARLNVEWSRIFPNPLPRPQNFDESKQDVTEVEINENELKRLDEYANKDALNHYREIFKDLKSRGLYFILNMYHWPLPLWLHDPIRVRRGDFTGPSGWLSTRTVYEFARFSAYIAWKFDDLVDEYSTMNEPNVVGGLGYVGVKSGFPPGYLSFELSRRHMYNIIQAHARAYDGIKSVSKKPVGIIYANSSFQPLTDKDMEAVEMAENDNRWWFFDAIIRGEITRGNEKIVRDDLKGRLDWIGVNYYTRTVVKRTEKGYVSLGGYGHGCERNSVSLAGLPTSDFGWEFFPEGLYDVLTKYWNRYHLYMYVTENGIADDADYQRPYYLVSHVYQVHRAINSGADVRGYLHWSLADNYEWASGFSMRFGLLKVDYNTKRLYWRPSALVYREIATNGAITDEIEHLNSVPPVKPLRH
Sequenze-proteine
Funzioni
• Meccanismo d’azione
• Specificità per ligandi
• Interazioni proteina-proteina
20 dicembre 2004
Struttura tridimensionale delle proteine
Metodi Sperimentali
• Diffrazione ai Raggi X (RX)
• Risonanza Magnetica Nucleare (NMR)
Metodi Computazionali
• Riconoscimento di fold
• Folding ab-initio
• Modellamento Comparativo Modellamento Comparativo
20 dicembre 2004
Modellamento Comparativo
Alta identità di sequenza
buon allineamento delle sequenze
buoni modelli ottenuti per omologia
Permette di costruire il modello 3D di una proteina (‘target’) a partire da proteine omologhe (‘template’), la cui struttura è stata caratterizzata sperimentalmente.
La percentuale di identità di sequenza tra la proteina target e quelle template deve essere superiore al 20-40%20-40%..
20 dicembre 2004
Il modellamento per omologia richiede l’utilizzo di numerosi strumenti bioinformatici e computazionali:
- per l’estrazione di informazioni da banche dati di sequenze (UNIPROT) e di strutture tridimensionali (PDB)
- per il confronto e l’allineamento delle sequenze (BLAST e CLUSTAL)
- per la costruzione dei modelli strutturali per la proteina in esame (MODELER,QUANTA, INSIGHT)
- per la valutazione della loro qualità (PROCHECK e PROSA).
Modellamento Comparativo
20 dicembre 2004
RICERCA DEL TEMPLATE
ALLINEAMENTO MULTIPLO TARGET-TEMPLATE
Modellamento comparativo
PROTEINA TARGET
BLAST
CLUSTALW
MODELLER
VALUTAZIONE DEL MODELLO
PROCHECK
---VPIRQLHYRLRDEQQKSLVLSDP-YELKALHLNGQNINQQVIF AQYSKRREVQCSVTDSEKRSLVLVPNSMELHAVMLQGGSDRCKVQL SMSFVQ--GEPSNDKIPVALGLKGKNLYLSCVMKDGTPTLQLESVD NMSTYLDRTP-SAEAQTVALGIKGTNYYLSCHKDGEEPTLHLEVVD PKQYPKKKM----EKRFVFNKIEV-KSKVEFESAEFPNWYISTSQA -KASLANITSDSDMVRFLFYKQDSGLNISTLTSVPFSNWYISTAEE EHKPVFLGNNSG-QDIIDKFTMESVS NNRPVQMCQESAR-RHRAFNIDNLKV
TARGET: AQYSKRREVQCSVTDSEKRSLVLVPNSMELHAVM……
TEMPLATE: VPIRQLHYRLRDEQQKSLVLSDPYELKALHLNGQN…
MODELLO DELLA PROTEINA TARGET A PARTIRE DALLA
STRUTTURA TEMPLATE
20 dicembre 2004
Scopo della tesi
20 dicembre 2004
Applicazioni di metodi computazionali, già noti, per
studiare le proprietà strutturali e funzionali delle
proteine.
Sviluppo di nuovi strumenti di analisi e predizione, al
fine di migliorare quelli già esistenti.
Applicazioni dei metodi computazionali
1. Modellamento di complessi tra interleuchine-1 ed i loro recettori.
2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca.
3. Simulazioni, mediante l’utilizzo del modellamento comparativo, dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro.
20 dicembre 2004
Interleuchina-1 (IL-1) è un mediatore della risposta immunitaria
IL-1 IL-1 , IL-1, IL-1ra
Esistono due recettori: IL-1RI e IL-1RII
L’attività biologica di IL-1
conseguenza del “binding” con il proprio recettore
formazione del complesso IL-1/IL-1R.
1. Modellamento di complessi tra interleuchine-1 ed i loro recettori
20 dicembre 2004
Simulazione dei complessi IL-1/IL-1RI in trota e topo.
Predizione della struttura tridimensionale
- di IL-1 di spigola e di trota
- dei recettori di tipo I (IL-1RI) di trota e topo.
Simulazione del complesso IL-1 (trota)/IL-1RI (topo)
al fine di dare una interpretazione a livello molecolare dei dati sperimentali circa l’attività biologica di rIL-1 di trota.
1. Modellamento di complessi tra interleuchine-1 ed i loro recettori
20 dicembre 2004
IL-1 di spigola e trota
Ricerca dei template con BLAST: IL-1 umana [PDB: 1IOB]
IL-1 topo [PDB: 2MIB]
IL-1IL-1 uomouomo topotopo trotatrota spigolaspigola
uomouomo 100100 78 (86)78 (86) 34 (49)34 (49) 37 (51)37 (51)
topotopo 100100 36 (49)36 (49) 32 (50)32 (50)
trotatrota 100100 54 (71)54 (71)
spigolaspigola 100100
In tabella sono riportate le % di identità di sequenza e tra parentesi le similarità.
20 dicembre 2004
N-end
C-end-bulge loop
IL-1 di trota
N-end
C-end-bulge loop
IL-1 di spigola
Entrambi sono caratterizzati da una piccola -elica (5% della sequenza) e da 12 -strand antiparalleli (40% della sequenza), definendo la struttura come “mainly-beta” con topologia di tipo -trefoil, in accordo con la classificazione di CATH e SCOP.
20 dicembre 2004
PDB: 1K5L PDB: 1OOX
IL-1RI di topo e trota
Ricerca del template con BLAST: IL-1RI umano [catena B in 1ITB dove è presente il complesso umano]
IL-1RI uomo topo trota
uomo 100 64 (81) 22 (40)
topo 100 20 (39)
trota 100
In tabella sono riportate le % di identità di sequenza e tra parentesi le similarità.
20 dicembre 2004
C-end
N-end
Dominio III
Dominio II
Dominio I
a
b IL-1
IL-1RI
IL-1/IL-1RI trota
……anche per topo: è stato simulato il complesso utilizzando IL-1 caratterizzato ai RX [PDB: 2MIB] ed IL-1RI modellato per omologia [PDB: 1OU3]. 20 dicembre 2004
IL-1RI di trota
PDB: 1OU1
Da dati bibliografici ……
IL-1 di trota è stata prodotta come proteina ricombinante in Escherichia coli.
Test di attività biologica:
rIL-1 è risultata capace di aumentare la proliferazione cellulare nelle cellule murine D10.G4.1.
Lo stesso livello di proliferazione è stato indotto da rIL-1 umana utilizzandone una quantità 1000 volte più bassa di quella necessaria per rIL-1 di trota.
Questo fatto può essere una conseguenza delle differenze strutturali tra IL-1 nei mammiferi e nei pesci.
Ciò rende rIL-1 di trota meno affine al recettore (IL-1RI) di topo.
Obiettivo: comprensione a livello molecolare del fenomeno biologico.
20 dicembre 2004
Complesso IL-1 trota/IL-1RI topo
* Le Energie sono espresse in Kcal/mol
ComplessiComplessi Van der Van der WaalsWaals ElettrostaticoElettrostatico Energia Energia
totaletotale
IL-1IL-1 ((trotatrota) ) / IL-1R/ IL-1RII ( (trotatrota)) - 164.85- 164.85 - 951.09- 951.09 - 1115.94- 1115.94
IL-1IL-1 ((topotopo) /IL-1R) /IL-1RII ( (topotopo)) - 129.69- 129.69 - 1039.57- 1039.57 - 1169.26- 1169.26
IL-1IL-1 ((trotatrota) / IL-1R) / IL-1RII ((topotopo)) - 155.45- 155.45 - 583.54- 583.54 - 738.99- 738.99IL-1IL-1 ((trotatrota) / IL-1R) / IL-1RII ( (topotopo)) - 155.45- 155.45 - 583.54- 583.54 - 738.99- 738.99
20 dicembre 2004
IL-1
IL-1RI
Esposizione al solvente degli AA dell’IL-1 di trota nei due complessi
AAAA PosizionePosizione % esposizione con % esposizione con IL-1R diIL-1R di trotatrota
% esposizione con % esposizione con IL-1R diIL-1R di topotopo DifferenzeDifferenze
ALAALA 153153 36,536,5 93,393,3 -56,8-56,8
SERSER 66 7,27,2 47,747,7 -40,5-40,5
GLUGLU 1111 6,96,9 37,837,8 -30,9-30,9
THRTHR 117117 41,6 69,8 -28,2
METMET 138138 14,814,8 42,442,4 -27,6-27,6
SERSER 55 6,26,2 33,733,7 -27,5-27,5
GLUGLU 9191 6868 91,891,8 -23,8-23,8
GLYGLY 3939 64,364,3 87,687,6 -23,3-23,3
.......... ........ ...... .... ........
ASPASP 141141 27,227,2 10,910,9 16,316,3
GLUGLU 6161 39,739,7 23,323,3 16,416,4
PROPRO 5555 82,982,9 65,465,4 17,517,5
ASNASN 166166 69,869,8 50,850,8 1919
ILEILE 5858 23,723,7 3,53,5 20,220,2
THRTHR 8686 31,531,5 11,311,3 20,220,2
THRTHR 6060 38,638,6 15,715,7 22,922,9
METMET 2525 25,425,4 0,90,9 24,524,5
ASNASN 2626 62,462,4 29,629,6 32,832,8
20 dicembre 2004
- Risultati -
Le interazioni elettrostatiche sono risultate molto ridotte nell’eterocomplesso e questa è probabilmente una conseguenza delle differenze amminoacidiche, che provocano una perdita di catene laterali cariche e, quindi, di ponti salini.
L’energia di interazione nell’eterocomplesso tra IL-1 (trota) e IL-1RI (topo) è risultata più alta di quella nell’omocomplesso, indicando che il legame tra IL-1 di trota ed IL-1RI di topo è molto debole.
Misurando l’esposizione al solvente degli amminoacidi di IL-1 di trota nell’omocomplesso e nell’eterocomplesso, abbiamo anche verificato come alcuni residui hanno valori completamente differenti
una diversa capacità dell’IL-1 di trota di legarsi ai due recettori, in accordo con quanto riportato in letteratura.
20 dicembre 2004
Scapigliati G, Costantini S, Colonna G, Facchiano A, Buonocore F, Bossù P, Cunningham C, Holland JW and Secombes CJ. (2004) Modelling of fish interleukin-1 and its receptor. Dev. Comp. Immunol. 28, 429-441.
La celiachia si manifesta, in individui geneticamente predisposti, in seguito ad ingestione di gliadina, il maggiore costituente del glutine del grano.
2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca
Queste molecole legano in
modo non covalente i peptidi di
gliadina ( ) e li espongono al
riconoscimento dei linfociti T
(CD4+).
Essa è associata ai geni dell’HLA codificanti per gli eterodimeri DQ2 e DQ8, che sono esposti sulla superficie delle cellule APC (Cellule Presentanti l’Antigene).
20 dicembre 2004
Un peptide antigenico (peptide di gliadina) si lega in modo più efficace alle molecole DQ2 o DQ8 quando possiede dei residui amminocidici con carica negativa in determinate posizioni di ancoraggio.
Sollid LM Ann Rev Immunol 2000: 53-81
I peptidi di gliadina non hanno molti amminoacidi carichi negativamente. Ma se sono sottoposti a reazioni di deammidazione o nell’ambiente acido dello stomaco o ad opera della transglutaminasi tissutale, alcuni residui di glutammina sono convertiti in acido glutammico.
Recettore Cellule T
DQ2
Peptide
20 dicembre 2004
2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca
Modellamento per omologia della struttura 3D del dimero DQ2, presente in individui celiaci.
Simulazione del complesso con vari peptidi di glutine per investigare le basi molecolari di questa interazione.
Simulazione degli effetti della deammidazione di residui di glutammina nelle posizioni di ancoraggio e di altre modifiche al fine di dare una spiegazione a livello molecolare di risultati sperimentali relativi all’affinità di questi peptidi per il dimero DQ2.
20 dicembre 2004
Domini C-terminali
Dominio N-terminale – catena
Sito di legame
Dominio N-terminale – catena
Dimero DQ2
20 dicembre 2004
Le sequenze delle due catene del DQ2 sono state modellate per omologia utilizzando come riferimento quelle del dimero DQ8 (percentuale di identità di sequenza del 91%).
PDB: 1NBN
P1 P9 | |Peptide PDB LVEALYLVCGERGGAlfa-I QLQPFPQPQLPYAlfa-II PQPQLPYPQPQAlfa-III PYPQPQLPYGlia-a20 FRPQQPYPQGlia-g2 PYPQQPQQPGamma-I PQQPQQSFPQQQRPGamma-II IIQPQQPAQGamma-III FPQQPQQPYPQQPGamma-IV FSQPQQQFPQPQGlt-156 PFSQQQQSPFGlt-17 PFSQQQQPV
Peptidi di glutine usati nelle simulazioni
I residui di glutammina che vengono deammidati sono riportati in rosso.
Le sequenze dei peptidi di glutine usati nelle simulazioni sono allineate a quella del peptide di insulina presente nel modello del DQ8 usato come riferimento (template) [PDB: 1JK8].
20 dicembre 2004
Energie di interazione tra il dimero DQ2 ed i peptidi di glutine
Le barre rappresentano la differenza di energia di interazione tra il peptide naturale e quelli modificati.
-600 -500 -400 -300 -200 -100 0
---E-E--------E------E-----PFSQQQQPV Glt-17
---E--E---------E------E------PFSQQQQSPF Glt-156
----E-E-----------E---------E-------FSQPQQQFPQPQ Gamma-IV
--E--E------------E---------E----------FPQQPQQPYPQQP Gamma-III
----G--------K--------E----IIQPQQPAQ Gamma-II
-E------GE-E---E------KE-E---E-------E-K---E-------K-E---E-------E-E---E---------------------E-E-------------G-------------K-------------E-----------G-------------K-------------E----PQQPQQSFPQQQRP Gamma-I
---E--E--------E-----E-----PYPQQPQQP Glia-g2
---G--------K--------E-----FRPQQPYPQ Glia-a20
-----G--------K--------E------G--------K--------E-----PYPQPQLPY Alfa-III
---EE-----E---EG-----E---EK-----E---E------E----G----------K----------E---------G----------K----------E-------PQPQLPYPQPQ Alfa-II (62-72)
--------G-----------K-----------E---QLQPFPQPQLPY Alfa-I
Alfa-I
Alfa-II
Alfa-III
Glia-a20
Glia-g2
Gamma-I
Gamma-II
Gamma-III
Glt-156
Gamma-IV
Glt-17
20 dicembre 2004
-600 -500 -400 -300 -200 -100 0
---E-E--------E------E-----PFSQQQQPV Glt-17
---E--E---------E------E------PFSQQQQSPF Glt-156
----E-E-----------E---------E-------FSQPQQQFPQPQ Gamma-IV
--E--E------------E---------E----------FPQQPQQPYPQQP Gamma-III
----G--------K--------E----IIQPQQPAQ Gamma-II
-E------GE-E---E------KE-E---E-------E-K---E-------K-E---E-------E-E---E---------------------E-E-------------G-------------K-------------E-----------G-------------K-------------E----PQQPQQSFPQQQRP Gamma-I
---E--E--------E-----E-----PYPQQPQQP Glia-g2
---G--------K--------E-----FRPQQPYPQ Glia-a20
-----G--------K--------E------G--------K--------E-----PYPQPQLPY Alfa-III
---EE-----E---EG-----E---EK-----E---E------E----G----------K----------E---------G----------K----------E-------PQPQLPYPQPQ Alfa-II (62-72)
--------G-----------K-----------E---QLQPFPQPQLPY Alfa-IAlfa-I
P6
-600 -500 -400 -300 -200 -100 0
---E-E--------E------E-----PFSQQQQPV Glt-17
---E--E---------E------E------PFSQQQQSPF Glt-156
----E-E-----------E---------E-------FSQPQQQFPQPQ Gamma-IV
--E--E------------E---------E----------FPQQPQQPYPQQP Gamma-III
----G--------K--------E----IIQPQQPAQ Gamma-II
-E------GE-E---E------KE-E---E-------E-K---E-------K-E---E-------E-E---E---------------------E-E-------------G-------------K-------------E-----------G-------------K-------------E----PQQPQQSFPQQQRP Gamma-I
---E--E--------E-----E-----PYPQQPQQP Glia-g2
---G--------K--------E-----FRPQQPYPQ Glia-a20
-----G--------K--------E------G--------K--------E-----PYPQPQLPY Alfa-III
---EE-----E---EG-----E---EK-----E---E------E----G----------K----------E---------G----------K----------E-------PQPQLPYPQPQ Alfa-II (62-72)
--------G-----------K-----------E---QLQPFPQPQLPY Alfa-I
Gamma-I
P-2 P7 P9Q Q Q
-600 -500 -400 -300 -200 -100 0
---E-E--------E------E-----PFSQQQQPV Glt-17
---E--E---------E------E------PFSQQQQSPF Glt-156
----E-E-----------E---------E-------FSQPQQQFPQPQ Gamma-IV
--E--E------------E---------E----------FPQQPQQPYPQQP Gamma-III
----G--------K--------E----IIQPQQPAQ Gamma-II
-E------GE-E---E------KE-E---E-------E-K---E-------K-E---E-------E-E---E---------------------E-E-------------G-------------K-------------E-----------G-------------K-------------E----PQQPQQSFPQQQRP Gamma-I
---E--E--------E-----E-----PYPQQPQQP Glia-g2
---G--------K--------E-----FRPQQPYPQ Glia-a20
-----G--------K--------E------G--------K--------E-----PYPQPQLPY Alfa-III
---EE-----E---EG-----E---EK-----E---E------E----G----------K----------E---------G----------K----------E-------PQPQLPYPQPQ Alfa-II (62-72)
--------G-----------K-----------E---QLQPFPQPQLPY Alfa-I
Alfa-IIP4Q
Dettaglio della superficie del sito di legame del dimero DQ2 con il peptide alfa II.
Lys 71 Posizione P7Posizione P4
Region N-terminale del peptide Regione C-terminale del peptide
20 dicembre 2004
- Risultati (1) -
La deammidazione dei peptidi nelle posizioni p4, p6 e p7 rende i complessi più stabili.
I nostri risultati confermano in gran parte i dati sperimentali riportati in letteratura.
La presenza di una carica positiva (Lys) in p6 e p7 nei peptidi riduce la loro affinità per il dimero.
I nostri risultati ci danno delle informazioni riguardo altri peptidi (gamma-III, gamma-IV e glt-156) per i quali non ci sono analoghi dati sperimentali:
1. le loro probabili posizioni di ancoraggio.
2. la sostituzione glutammina-glutammico può migliorare l’interazione DQ2/peptide per questi peptidi
20 dicembre 2004
- Risultati (2) -
S. Costantini, G. Colonna, M. Rossi, A.M. Facchiano: “Binding of gluten peptides to the coeliac disease-associated HLA-DQ2 molecule by computational methods”, In Proceedings of the 8th Gluten Workshop, edited by D. La Fiandra, S. Masci and R. D’Ovidio, The Royal Society of Chemistry, Cambridge, UK, 2004, pp.391-394.
Susan Costantini, Mauro Rossi, Giovanni Colonna, and Angelo M. Facchiano: "Modelling of HLA-DQ2 and of its interaction with gluten peptides to explain molecular recognition in celiac disease”, submitted
20 dicembre 2004
3. Simulazioni mediante l’utilizzo del modellamento comparativo dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro
Ad esempio le IL-1
IL-1 umana da sola
[PDB: 1IOB]
IL-1 umana complessata con il suo recettore
[PDB: 1ITB]
20 dicembre 2004
Differenze tra i modelli ottenuti per omologia usando template diversi.
20 dicembre 2004
Se usiamo come template l’IL-1 da sola
Se usiamo come template l’IL-1 complessata
Se usiamo come template entrambi i modelli sperimentali di
IL-1
● Confronto tra le due strutture umane di IL-1 riportate nella banca dati PDB.
● Modello teorico umano ottenuto per omologia utilizzando entrambe le strutture sperimentali (indicato come h-ThM).
● Simulazione dei complessi del modello sperimentale [PDB: 1IOB] e di quello teorico h-ThM con il recettore, sulla base del complesso sperimentale umano [PDB: 1ITB].
3. Simulazioni mediante l’utilizzo del modellamento comparativo dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro
● Confronto tra i due complessi teorici e quello sperimentale.
20 dicembre 2004
1 20 40 60 | | | | | | |human APVRSLNCTLRDSQQKSLVMSGPYELKALHLQGQDMEQQVVFSMSFVQGEESNDKIPVAL1IOB
1ITBA
61 80 100 120 | | | | | | |human GLKEKNLYLSCVLKDDKPTLQLESVDPKNYPKKKMEKRFVFNKIEINNKLEFESAQFPNW1IOB
1ITBA
121 140 | | | | human YISTSQAENMPVFLGGTKGGQDITDFTMQFVSS 1IOB 1ITBA
Complessi ASA
all’interfaccia (Å2)
Numero di legami
ad idrogeno
1IOB/1ITBB 2157.62 31
1ITB 2337.15 36
h-ThM/1ITBB 2240.38 33
Energie di interazione tra IL-1 e IL-1RI
Complessi ASA
all’interfaccia (Å2)
Numero di legami
ad idrogeno
1IOB/1ITBB 2157.62 31
1ITB 2337.15 36
h-ThM/1ITBB 2240.38 33
* ASA è l’area di superficie accessibile al solvente all’interfaccia per l’interleuchina
20 dicembre 2004
- Risultati (1) -
Le differenze conformazionali tra i due modelli sperimentali di IL-1 hanno effetto sull’interazione con il recettore.
Il complesso con h-ThM risente del fatto che è stato ottenuto da entrambe le strutture sperimentali.
La migliore interazione è quella relativa al complesso sperimentale.
L’ interazione nel complesso con h-ThM è migliore di quella nel complesso con 1IOB.
20 dicembre 2004
Simulazione dell’interazione IL-1/IL-1RI in trota e topo:
● Modellamento per omologia delle sequenze di IL-1 di topo e trota usando come template i due modelli sperimentali umani, 1IOB e 1ITBA.
trota
t-ThF e t-ThC
topo
m-ThF e m-ThC
● Simulazione per ciascun organismo dei complessi tra il recettore ed i due modelli di IL-1 ottenuti.
trota
t-ThCOMPL-F e t-ThCOMPL-C
topo
m-ThCOMPL-F e m-ThCOMPL-C
20 dicembre 2004
Energie di interazione IL-1/IL-1RI nei complessi in topo e trota
I complessi ottenuti usando l’IL-1 umana nella forma complessata
(t-ThCOMPL-C e m-ThCOMPL-C) hanno valori di energia di
interazione più favorevoli.
m-ThCOMPL-F
t-ThCOMPL-F
t-ThCOMPL-C
m-ThCOMPL-C
20 dicembre 2004
ASA all’interfaccia
(Å2)
Numero di legami
ad idrogeno
Complessi in topo
m-ThCOMPL-F 2121.84 26
m-ThCOMPL-C 2259.20 32
Complessi in trota
t-ThCOMPL-F 2394.40 40
t-ThCOMPL-C 2764.61 41
Complessi in topo e trota
Le conformazioni di IL-1 di topo e trota, ottenute utilizzando come riferimento la struttura sperimentale della proteina umana nella sua forma complessata, sono quelle più adatta ad interagire con il recettore.
20 dicembre 2004
Il modellamento comparativo può essere applicato
con migliori risultati per predire i modelli di proteine,
che devono essere utilizzati per approfondire studi di
interazione proteina-proteina,
quando come riferimento viene utilizzata la struttura
tridimensionale di una proteina omologa nello stato
complessato.
- Risultati (2) -
20 dicembre 2004
Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling simulates conformational changes occurring in protein-protein interaction”, submitted.
Scopo della tesi
20 dicembre 2004
Sviluppo di nuovi strumenti di analisi e predizione, al
fine di migliorare quelli già esistenti.
Applicazioni di metodi computazionali, già noti, per
studiare le proprietà strutturali e funzionali delle
proteine.
Sviluppo di nuovi strumenti di analisi e predizione
a. Propensità degli amminoacidi per i vari tipi di struttura secondaria in proteine che appartengono a differenti classi strutturali.
b. Frequenze di coppie di amminoacidi nelle proteine.
20 dicembre 2004
a. Propensità degli amminoacidi
La struttura secondaria è stata assegnata mediante il programma DSSP considerando “H”, “G” ed “I” come eliche, “B” ed “E” come struttura beta e le altre come “coil”.
Set di 2168 proteine derivato dalla lista PDBselect (non ridondante e con percentuale di identità di sequenza minore del 25%).
Le propensità degli amminoacidi nei differenti tipi di struttura secondaria (Pij) rapporto tra la frequenza con cui un dato residuo si trova in eliche, -strand e “coil” rispetto alla frequenza con cui tale residuo si trova nel set di proteine considerato.
dove nij è il numero dei residui di tipo i in struttura di tipo j, ni è il numero totale di residui di tipo i, Nj è il numero totale di residui in struttura di tipo j ed NT è il numero totale di residui.
T
j
i
ij
ij
NN
nn
P
20 dicembre 2004
Predizione della struttura secondaria
AELMDPRSTWMNALEATGFQE …………AELMDPRSTWMNALEATGFQE …………AELMDPRSTWMNALEATGFQE …………AELMDPRSTWMNALEATGFQE …………
valore più alto tra <P>, <P>, <Pc>
A partire dalla regione N-terminale di ogni sequenza proteica, noi abbiamo considerato una running window di n amminoacidi
Queste propensità sono state calcolate usando finestre di lunghezza differente per i tre tipi di struttura secondaria (w, w, wc), che sono state, poi, moltiplicate per differenti coefficienti (coeff, coeff, coeffc).
Per n=7
con <P>, <P> e <Pc> indichiamo il valore medio delle propensità in elica, -strand e coil.
20 dicembre 2004
Resubstitution test
Gli elementi di struttura secondaria per ciascuna proteina nel set studiato vengono predetti usando le propensità derivate dallo stesso set.
Jackknife test
Gli elementi di struttura secondaria per ciascuna “proteina test” vengono predetti dalle propensità calcolate da un set di proteine che include tutte tranne la stessa “proteina test”.
La qualità delle nostre predizioni è stata valutata ……..
20 dicembre 2004
MetodiMetodi QQ QQ QQcoilcoil QQ33
Resubstitution testResubstitution test 60.060.0 52.752.7 55.955.9 56.756.7
Jackknife testJackknife test 60.160.1 52.552.5 55.955.9 56.756.7
Chou e FasmanChou e Fasman 55.355.3 48.248.2 50.950.9 51.951.9
Accuratezza predittiva
dove Q, Q e Qcoil sono rispettivamente le percentuali di residui predetti correttamente in eliche, -strand e “coil”; Q3 è la percentuale totale di residui predetti correttamente.
MetodiMetodi
60.060.0 52.752.7 55.955.9 56.756.7
60.160.1 52.552.5 55.955.9 56.756.7
55.355.3 48.248.2 50.950.9 51.951.9
dove k rappresenta le regioni in elica, beta e “coil” nella proteina, nk è il numero di residui predetti correttamente nello stato k e Nk è il numero totale di residui nello stato conformazionale k nella proteina.
dove NT è il numero totale di residui nella proteina ed Nx è il numero totale di residui predetti in modo non corretto nella proteina.
k
kkk N
nQ 100%
T
xTN N
NNQ
100%3
20 dicembre 2004
Assegnazione classe strutturale
Secondo Nakashima et al.(1986)
Proteine alfa: contenuto di eliche >15% e -strand <10%
Proteine beta: contenuto di eliche <15% e -strand >10%
Proteine alfa-beta: contenuto di eliche >15% e -strand >10%
Secondo Chou (1995)
Proteine alfa: contenuto di eliche >40% e -strand <5%
Proteine beta: contenuto di eliche <5% e -strand >40%
Proteine alfa-beta: contenuto di eliche >15% e -strand >15%
20 dicembre 2004
Per ogni classe:
● Propensità degli amminoacidi nei tre tipi di struttura secondaria (eliche, -strand e coil).
● Predizione degli elementi di struttura secondaria:
resubstitution test
jackknife test
● Valutazione dell’accuratezza predittiva.
● Confronto con le predizioni di Chou e Fasman.
20 dicembre 2004
Accuratezza predittiva
Classificazione secondo Nakashima et al. (1986)
ClassiClassi QQ QQ QQcoilcoil QQ33
AlfaAlfa
Resubstitution Resubstitution testtest
69.69.77
47.347.3 49.249.2 62.262.2
Jackknife testJackknife test 69.69.55
47.047.0 49.249.2 62.062.0
Chou e FasmanChou e Fasman 54.54.77
45.345.3 47.747.7 52.152.1
ClassiClassi QQ QQ QQcoilcoil QQ33
Alfa Alfa (627)(627)
Resubstitution Resubstitution testtest
69.69.77
47.347.3 49.249.2 62.262.2
Jackknife testJackknife test 69.69.55
47.047.0 49.249.2 62.062.0
Chou e FasmanChou e Fasman 54.54.77
45.345.3 47.747.7 52.152.1BetaBeta
Resubstitution Resubstitution testtest
44.44.22
58.058.0 58.658.6 57.157.1
Jackknife testJackknife test 43.43.99
58.058.0 58.658.6 57.057.0
Chou e FasmanChou e Fasman 47.47.22
46.846.8 55.355.3 51.151.1
Beta Beta (552)(552)
Resubstitution Resubstitution testtest
44.44.22
58.058.0 58.658.6 57.157.1
Jackknife testJackknife test 43.43.99
58.058.0 58.658.6 57.057.0
Chou e FasmanChou e Fasman 47.47.22
46.846.8 55.355.3 51.151.1Alfa-betaAlfa-beta
Resubstitution Resubstitution testtest
60.60.22
55.155.1 55.255.2 57.057.0
Jackknife testJackknife test 60.60.11
55.155.1 55.255.2 57.057.0
Chou e FasmanChou e Fasman 56.56.55
49.449.4 49.849.8 52.252.2
Alfa-beta Alfa-beta (912)(912)
Resubstitution Resubstitution testtest
60.60.22
55.155.1 55.255.2 57.057.0
Jackknife testJackknife test 60.60.11
55.155.1 55.255.2 57.057.0
Chou e FasmanChou e Fasman 56.56.55
49.449.4 49.849.8 52.252.220 dicembre 2004
Accuratezza predittiva
Classificazione secondo Chou (1995)
ClassiClassi QQ QQ QQcoilcoil QQ33
AlfaAlfa
Resubstitution Resubstitution testtest
70.70.55
47.047.0 43.143.1 62.262.2
Jackknife testJackknife test 70.70.55
43.943.9 42.742.7 62.162.1
Chou e FasmanChou e Fasman 54.54.66
41.841.8 46.346.3 52.152.1
ClassiClassi QQ QQ QQcoilcoil QQ33
Alfa Alfa (470)(470)
Resubstitution Resubstitution testtest
70.70.55
47.047.0 43.143.1 62.262.2
Jackknife testJackknife test 70.70.55
43.943.9 42.742.7 62.162.1
Chou e FasmanChou e Fasman 54.54.66
41.841.8 46.346.3 52.152.1BetaBeta
Resubstitution Resubstitution testtest
35.35.99
66.366.3 57.857.8 61.361.3
Jackknife testJackknife test 33.33.33
66.066.0 57.457.4 61.061.0
Chou e FasmanChou e Fasman 40.40.22
46.246.2 57.357.3 50.950.9
Beta Beta (167)(167)
Resubstitution Resubstitution testtest
35.35.99
66.366.3 57.857.8 61.361.3
Jackknife testJackknife test 33.33.33
66.066.0 57.457.4 61.061.0
Chou e FasmanChou e Fasman 40.40.22
46.246.2 57.357.3 50.950.9Alfa-betaAlfa-beta
Resubstitution Resubstitution testtest
59.59.22
55.355.3 56.556.5 57.257.2
Jackknife testJackknife test 59.59.11
55.355.3 56.556.5 57.157.1
Chou e FasmanChou e Fasman 57.57.00
49.249.2 50.150.1 52.352.3
Alfa-beta Alfa-beta (696)(696)
Resubstitution Resubstitution testtest
59.59.22
55.355.3 56.556.5 57.257.2
Jackknife testJackknife test 59.59.11
55.355.3 56.556.5 57.157.1
Chou e FasmanChou e Fasman 57.57.00
49.249.2 50.150.1 52.352.320 dicembre 2004
- Risultati (1) -
● Le propensità degli amminoacidi sono differenti nelle tre classi strutturali (alfa, beta ed alfa-beta).
● Se per una data proteina può essere assegnata la classe strutturale, gli elementi di struttura secondaria per quella proteina possono essere predetti con migliori risultati, usando le propensità degli amminoacidi calcolate per la sua stessa classe e valori ottimizzati di coefficienti e finestre.
20 dicembre 2004
Nell’ambito di questo studio è stato necessario sviluppare dei software che automaticamente e velocemente fossero in grado di analizzare un numero così alto di proteine.
20 dicembre 2004
- Risultati (2) -
Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “The amino acid conformation potentials in proteins belonging to different secondary structural classes”, in preparation.
● Frequenza dei doppietti valutata come rapporto tra il numero di volte in cui il residuo x si trova vicino a quello a, x(a), ed il numero totale di coppie possibili (ntot)
b. Frequenze di coppie di amminoacidi nelle proteine
Utilizzando il set di 2168 proteine, suddiviso nelle tre classi strutturali
Per le proteine, classificate secondo Nakashima et al. (1986),
alfa AA, AL, EL, LA, LE ed LK,beta SG, GK, DG, VT e GS alfa-beta AA, AL, LA, LL
100)(
)( tot
ax
n
axF
20 dicembre 2004
È possibile sfruttare questa informazione per predire la Classe Strutturale di proteine?
I doppietti AA, AL, LA, LE ed LL sono più frequenti nelle proteine alfa che in quelle beta ed alfa-beta.
I doppietti GS, SG, SS, VT, TV sono più presenti nelle proteine beta.
20 dicembre 2004
Confrontando le frequenze dei doppietti nelle tre classi:
Predizione della Classe Strutturale
Per ciascuna proteina è stata predetta la classe strutturale, utilizzando il metodo della regressione lineare.
Sono stati calcolati i coefficienti di correlazione tra l’insieme dei valori relativi alle frequenze delle coppie di residui per la proteina in esame e per le proteine classificate come alfa, beta ed alfa-beta.
Frequenze dei doppietti:
Alfa
Beta
Alfa-beta
Proteina in esame
rx/alfa
rx/beta
rx/alfa-beta
La classe strutturale è assegnata in base al valore più alto tra i tre coefficienti.
20 dicembre 2004
65%
Accuratezza predittiva
Proteineclass Proteinepred Q% jackknife
Nakashima
alfaalfa 627 444 71 68
betabeta 552 375 68 65
alfa-betaalfa-beta 912 538 59 56
Chou
alfaalfa 470 361 77 73
betabeta 167 124 74 64
alfa-betaalfa-beta 696 445 64 61
70%
20 dicembre 2004
I risultati ottenuti dalle predizioni di classe strutturale sono incoraggianti, anche perché si basano solo sulle frequenze dei doppietti nelle proteine.
- Risultati -
Dalla sola sequenza amminoacidica di una proteina, è possibile ottenere sempre più informazioni riguardo il suo fold.
Questo studio può essere molto utile per migliorare l’accuratezza dei metodi di predizione di struttura secondaria.
20 dicembre 2004
Il lavoro svolto suggerisce come l’applicazione dei metodi computazionali sia ormai diventata di estrema utilità per fornire chiarimenti strutturali e funzionali riguardo le proteine e per formulare ipotesi sulla loro attività biologica, anche se qualunque applicazione pratica di quanto ipotizzato può essere realizzata solo mediante ulteriori studi di tipo sperimentale.
- Conclusioni -
Questo lavoro mostra la necessità di sviluppare sempre nuovi strumenti di analisi e di predizioni, capaci di migliorare quelli esistenti, anche nella prospettiva di dover gestire l’impressionante quantità di informazioni, derivate dalla ricerca genomica e proteomica.
20 dicembre 2004
Comunicazioni a Congressi♦ Susan Costantini, Angelo M. Facchiano, Giovanni Colonna: “Prediction of the three-dimensional structures of proteins by Homology Modelling”, Gruppo di Cooperazione Bioinformatica tra il 15 e il 17 marzo 2002.♦ S. Costantini, A.M. Facchiano, G. Colonna: “Metodi computazionali e bioinformatici per la predizione della struttura tridimensionale di proteine”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2002. ♦ S. Costantini, G. Colonna, A.M. Facchiano: “Coeliac disease: studying the interaction of HLA-DQ2 molecule with gluten peptides by computational methods”, Meeting “Gruppo di Cooperazione Bioinformatica” - Frascati – March 28-29, 2003.♦ Costantini S., Facchiano A.M. and Colonna G.: “Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca mediante metodi computazionali”, Giornate Scientifiche della Facoltà di Medicina, 4-6 giugno 2003.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Folding ab-initio di proteine: un approccio topologico”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2003.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: ““Computational issues of a topological approach to protein folding”, Sheffield, 20-22 July 2003.♦ Susan Costantini, Giovanni Colonna, Mauro Rossi and Angelo M. Facchiano: “Binding of gluten peptides to the celiac disease associated HLA-DQ2 molecule by computational methods”, 8th Gluten Workshop, Viterbo, 8-10 settembre 2003.♦ Costantini S., Facchiano A.M. and Colonna G.: “Analysis of the three-dimensional structure of Il-1beta/IL-1 receptor complexes by computational methods”, SIB2003, Ferrara, 15-18 Settembre 2003.♦ Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, Bits 2004, Padova 26-27 March 2004.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “A geometrical approach for protein secondary structure simulations: computational issues”, 2-5 April 2004, Neuchatel, Switzerland.♦ S. Costantini, G. Colonna and A.M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, SIB-Proteine 2004, Viterbo 20-22 May 2004.♦ E. Randelli, M. Forlenza, S. Meloni, S. Benedetti, C.J. Secombes, J. Zou, G. Scapigliati, S. Costantini, A. Facchiano, F. Buonocore: “Potential application of sea bass recombinant interleukin-1 in fish vaccination”, SIB-Proteine 2004.♦ Costantini S., Facchiano A.M., Rossi M., Colonna G.: “Metodi computazionali per lo studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Un approccio ab-initio per la simulazione di strutture secondarie di proteine”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004.♦ Angelo M. Facchiano, Susan Costantini, Mauro Rossi, Giovanni Colonna: “Simulation of the Interaction of Gluten Peptides with HLA-DQ2 Molecule to Investigate the Molecolar Basis of Coeliac Disease” ISMB-ECCB 2004, Glasgow, Scotland, UK, July 31-August 4, 2004.♦ Susan Costantini, Giovanni Colonna, Angelo M. Facchiano: “Prediction of the secondary structure of proteins: the amino acid propensities in proteins belonging to deifferent secondary structural classes”, Nettab 2004 – Network Tools and Applications in Biology, Camerino, Italy, September 5-7, 2004.
Comunicazioni a Congressi♦ Susan Costantini, Angelo M. Facchiano, Giovanni Colonna: “Prediction of the three-dimensional structures of proteins by Homology Modelling”, Gruppo di Cooperazione Bioinformatica tra il 15 e il 17 marzo 2002.♦ S. Costantini, A.M. Facchiano, G. Colonna: “Metodi computazionali e bioinformatici per la predizione della struttura tridimensionale di proteine”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2002. ♦ S. Costantini, G. Colonna, A.M. Facchiano: “Coeliac disease: studying the interaction of HLA-DQ2 molecule with gluten peptides by computational methods”, Meeting “Gruppo di Cooperazione Bioinformatica” - Frascati – March 28-29, 2003.♦ Costantini S., Facchiano A.M. and Colonna G.: “Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca mediante metodi computazionali”, Giornate Scientifiche della Facoltà di Medicina, 4-6 giugno 2003.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Folding ab-initio di proteine: un approccio topologico”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2003.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: ““Computational issues of a topological approach to protein folding”, Sheffield, 20-22 July 2003.♦ Susan Costantini, Giovanni Colonna, Mauro Rossi and Angelo M. Facchiano: “Binding of gluten peptides to the celiac disease associated HLA-DQ2 molecule by computational methods”, 8th Gluten Workshop, Viterbo, 8-10 settembre 2003.♦ Costantini S., Facchiano A.M. and Colonna G.: “Analysis of the three-dimensional structure of Il-1beta/IL-1 receptor complexes by computational methods”, SIB2003, Ferrara, 15-18 Settembre 2003.♦ Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, Bits 2004, Padova 26-27 March 2004.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “A geometrical approach for protein secondary structure simulations: computational issues”, 2-5 April 2004, Neuchatel, Switzerland.♦ S. Costantini, G. Colonna and A.M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, SIB-Proteine 2004, Viterbo 20-22 May 2004.♦ E. Randelli, M. Forlenza, S. Meloni, S. Benedetti, C.J. Secombes, J. Zou, G. Scapigliati, S. Costantini, A. Facchiano, F. Buonocore: “Potential application of sea bass recombinant interleukin-1 in fish vaccination”, SIB-Proteine 2004.♦ Costantini S., Facchiano A.M., Rossi M., Colonna G.: “Metodi computazionali per lo studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004.♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Un approccio ab-initio per la simulazione di strutture secondarie di proteine”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004.♦ Angelo M. Facchiano, Susan Costantini, Mauro Rossi, Giovanni Colonna: “Simulation of the Interaction of Gluten Peptides with HLA-DQ2 Molecule to Investigate the Molecolar Basis of Coeliac Disease” ISMB-ECCB 2004, Glasgow, Scotland, UK, July 31-August 4, 2004.♦ Susan Costantini, Giovanni Colonna, Angelo M. Facchiano: “Prediction of the secondary structure of proteins: the amino acid propensities in proteins belonging to deifferent secondary structural classes”, Nettab 2004 – Network Tools and Applications in Biology, Camerino, Italy, September 5-7, 2004.
Tutor:
Prof. Giovanni Colonna Dott. Angelo Facchiano
- SUN - ISA-CNR, Avellino
Dott. Francesco Buonocore
Università della Tuscia
- Ringraziamenti -
Dott. Mauro Rossi
ISA – CNR, Avellino
20 dicembre 2004
Marilù Chiusano
Gruppo di Bioinformatica dell’ISA-CNR, Avellino
Gruppo di ricerca del prof. Malorni del CESMA-ProBio, Avellino
Marilù Chiusano
Gruppo di Bioinformatica dell’ISA-CNR, Avellino
Gruppo di ricerca del prof. Malorni del CESMA-ProBio, Avellino