Romano, Portale Web 1
WP 5 – Attività 1WP 5 – Attività 1
Il portale WebIl portale Webwww.hrbc-genomics.netwww.hrbc-genomics.net
Paolo RomanoIstituto Nazionale per la Ricerca sul Cancro
Romano, Portale Web 2
Sommario Sommario
Motivazioni e obiettivi del portale
Panoramica dei contenuti
Qualche parola in più su:• SRS• questionari• databases
Romano, Portale Web 3
Motivazioni Motivazioni strumenti bioinformatici distribuiti su siti diversi:
difficoltà nella ricerca e nella scelta degli strumenti, interfacce, metodi di ricerca, strutture dati
eterogenei: difficoltà nell’utilizzo degli strumenti disponibili
post-genomica in continua evoluzione: strumenti bioinformatici poco numerosi e interfacce
primitive, elevata partecipazione nel progetto:
difficoltà di coordinamento e messa in comune dei dati sinergie e ottimizzazione risorse
Romano, Portale Web 4
Obiettivi Obiettivi Realizzare un portale che: ospiti servizi e strumenti di tipo bioinformatico, utili
ai ricercatori coinvolti nel progetto e non, dia visibilità al progetto e ai partner (parte
accessibile a tutti) serva come strumento di lavoro e coordinamento
per le unità di ricerca (parte ad accesso riservato) rimanga un riferimento alla fine del progetto
Romano, Portale Web 5
Organizzazione Organizzazione
non solo portale, contenuti proprigestione comunesiti mirror per garantire servizio e
prestazionisoftware “ingombranti” non replicati
Romano, Portale Web 6
Risultati attesiRisultati attesi Disponibilità di strumenti di tipo generale (banche
dati, sistemi di ricerca, programmi per analisi delle sequenze, strumenti bioinformatici di uso comune)
SRS per interrogazione di banche dati di pubblico dominio (GenBank, LocusLink, OMIM, SwissProt, ecc.) e strumenti di analisi di pubblico dominio (BLAST, FASTA, ecc.)
Disponibilità di strumenti di analisi e banche dati di specifico interesse ai fini del progetto HRBC
Nuovi strumenti specificamente sviluppati da questa unità
Romano, Portale Web 7
RiferimentiRiferimenti Lingua:
inglese (e italiano nella parte riservata) Nome:
Hormone Responsive Breast Cancer (HRBC) Genomics Network
Dominio: hrbc-genomics.net(e hrbc-genomics.org e hrbc-genomics.info)
Indirizzo:www.hrbc-genomics.net
Logo:da definire
Romano, Portale Web 8
Logo attualeLogo attuale
Romano, Portale Web 9
Contenuti (area pubblica)Contenuti (area pubblica)Presentazione del progetto sintesi del progetto di ricerca responsabili unità operative e altri contatti elenco articoli/documenti vari prodotti nell’ambito del
progetto
Romano, Portale Web 10
Contenuti (area pubblica)Contenuti (area pubblica) sito SRS (con accesso a software d’analisi, se
collegato a SRS)– elenco database da definire– possibile inserimento di nuovi database– elenco software a definire– limitazione d’accesso (per progetto, per utente)– riferimento iniziale SRS @ ISA/CNR
Romano, Portale Web 11
Contenuti (area pubblica)Contenuti (area pubblica) link a siti unità operative e partner link a siti di interesse scientifico affine al progetto link a corsi di formazione on-line (free) selezionati
tra quelli esistenti per la loro attinenza al progetto e agli strumenti del progetto
elenchi da definire
Romano, Portale Web 12
Contenuti (area pubblica)Contenuti (area pubblica) Materiale didattico corsi organizzati dal progetto
– Sull’accesso e utilizzo degli strumenti– Sulle tecnologie (microarray)
Materiale didattico corsi organizzati dai partner– Biology for dummies– Perl
Mirror di corsi creati da altri ricercatori– BioComputing Division VSNS
Romano, Portale Web 13
Contenuti (area pubblica)Contenuti (area pubblica) analisi dei risultati dei questionari
– Quali tools installare e perché– Quali tools sviluppare e perché
dati estratti dinamicamente da db
Romano, Portale Web 14
Contenuti (area riservata)Contenuti (area riservata) progetto di ricerca dettagliato, elenco dettagliato partner, documenti prodotti nell’ambito del progetto:
– presentazioni a meetings (questo!)– relazioni annuali
Romano, Portale Web 15
Contenuti (area riservata)Contenuti (area riservata) archivio mailing list di progetto
– coordinamento– annunci interni– annunci pubblici (?)– unità operative
Romano, Portale Web 16
Contenuti (area riservata)Contenuti (area riservata)
Database dati sperimentali del progetto– Database microarray– Database overall del progetto
Interfacce per accesso a software di analisi dei dati di espressione genica e proteomica– Sviluppati nel progetto– Sottoposti a licenza– Computazionalmente onerosi
Romano, Portale Web 17
Contenuti (area riservata)Contenuti (area riservata)Questionari
Esempi:– Quali software esistenti si desiderano sul sito– Quali analisi sarebbe utile implementare
Implementazione:– Compilazione tramite form– Inserimento dati in db– Estrazione dati riassuntivi
Romano, Portale Web 18
Contenuti (area riservata)Contenuti (area riservata)Sviluppo cooperativo di documenti
Esempi:– Preparazione materiale corsi– Redazione relazioni/articoli
Strumenti– Wiki?
Romano, Portale Web 19
SRS - SRS - Sequence Retrieval SoftwareSequence Retrieval Software SRS è un esempio di integrazione locale di
banche dati eterogenee in maniera semplice ed efficiente
L’approccio originale di SRS consiste ino Banche dati disponibili localmente come “flat file”o Definizione di sintassi specifiche per l’estrazione
dei datio Utilizzo di link interni espliciti e impliciti tra
banche datio L’integrazione trasparente con applicazionio L’integrazione esterna tramite link HTML
Romano, Portale Web 20
SRS – I linksSRS – I links
• I collegamenti (links) tra banche dati possono essere definiti in maniera o Esplicita, quando un termine è
appositamente inserito in un field come riferimento a una entry di un’altra banca dati
o Implicita, cercando termini comuni all’interno di fields predefiniti di banche dati diverse
Romano, Portale Web 21
SRS – I links esplicitiSRS – I links espliciti
• Esplicito riferimento a un’altra banca dati
Other_collection_numbers CCUG 34964; NCIB 12128
Literature DSM ref.no. 72; DSM ref.no. 1300
EMBL: X52289
Romano, Portale Web 22
SRS – I links implicitiSRS – I links impliciti
• Termini comuni in banche dati diverse
TargetGene: APOE
Constructed_from pMB1, pSC101 and Tn3
Name Gluconacetobacter xylinus subsp. xylinus, (Brown 1886) Yamada, Hoshino and Ishikawa 1998 VL
Literature Nucleic Acids Res 1990;18:4967 [PMID: 2395673]
Romano, Portale Web 23
SRS – Possibili estensioniSRS – Possibili estensioni
• SRS è facilmente estendibileo Nuove banche dati possono essere aggiunte
dando una descrizione della loro sintassi nel linguaggio Icarus o fornendo il DTD
o È possibile stabilire nuovi collegamenti tra banche dati inserendo xrefs o lasciando che siano identificati da SRS, specificando i fields
o Molte banche dati sono distribuite in formato “flat file” e con relative sintassi Icarus (qualche DTD)
Romano, Portale Web 24
SRS: operatori linkSRS: operatori link
• SRS consente di utilizzare i link esistenti per le ricerche tramite un apposito operatore: <o swissprot < EMBLo EMBL < swissproto swissprot < [EMBL-id: X52289]o [EMBL-organism:human]
< [medline-pmid:3137981]
Romano, Portale Web 25
Gestione di un sito SRSGestione di un sito SRS Aggiornamento del software
o Nuove releases (3-4 / anno)o Modifiche software / nuove funzioni
Aggiornamento banche datio Nuove releases (3-4 / anno)o Modifica contenuto / struttura file
Controllo processio Directory temporaneeo Problemi memoria/discoo Analisi degli accessi
Romano, Portale Web 26
Nuove banche datiNuove banche dati
Definizione delle informazioni e analisi delle sorgenti
Analisi dei link con banche dati esistenti Definizione di una struttura dati e di un
formato “flat file” o DTD Creazione di un’analizzatore di sintassi Indicizzazione
Romano, Portale Web 27
Con la collaborazione di…..Con la collaborazione di…..
Idee raccolte e discusse con:
Assunta Manniello, Istituto Nazionale per la Ricerca sul Cancro, Genova
Elda Rossi e Francesco Falciano, CINECA, Bologna
Angelo Facchiano, ISA/CNR, Avellino
Romano, Portale Web 28
Stato del sito prototipoStato del sito prototipo
http://www.hrbc-genomics.net/http://www.hrbc-genomics.net/internal/
(user: hrbc, password: testpwd)
Contenuti: Struttura definita, pagine riservate protette Link a vari strumenti su siti dei partner (ISA/CNR,
CINECA) Corso Biocomputing Division (BCD) della Virtual
School of Natural Sciences (VSNS)
Top Related