Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi...

14
Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno Accademico: 2007/2008 Università degli Studi di Modena e Reggio Emilia

Transcript of Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi...

Page 1: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Relatore:Prof. Sonia BergamaschiCorrelatore:Alexandre Passant

Tesi di Laurea di:Fabrizio Orlandi

Laurea specialistica in Ingegneria Informatica Anno Accademico: 2007/2008

Università degli Studi di Modena e Reggio Emilia

Page 2: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Attività progettuale

• Svolta presso l’istituto di ricerca: DERI (Digital Enterprise Research Institute)

“Il più importante centro di ricerca sul Web Semantico al mondo”• Situato a Galway in Irlanda• Più di 30 progetti di ricerca internazionali• Obiettivo:

Estensione dell’ontologia del progetto SIOC (Semantically-Interlinked Online Communities) per poter

interconnettere semanticamente i wiki distribuiti sul Web e separati tra loro

2tesi di laurea di: Fabrizio Orlandi

Page 3: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Cos’è il Web Semantico?

• “Un’estensione del Web attuale” [Tim Berners-Lee et al.]

• Obiettivo: fornire significato all’informazione sul Webrendendola interpretabile dai computer per una migliore cooperazione uomo-macchina

• Comunemente identificato come Web 3.0

• Prevede di aggiungere metadati alle pagine Web basati su sottostanti schemi o ontologie (specificazione di una concettualizzazione)

3tesi di laurea di: Fabrizio Orlandi

Page 4: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

SIOC project(Semantically-Interlinked Online Communities)

4

Obiettivi: • Interconnettere semanticamente le comunità online• Descrivere contenuto e struttura di siti sociali• Risolvere i problemi di interoperabilità del Social Web• Ricercare e navigare informazioni prodotte dalle comunitàonline sociali in modi innovativi e più interessanti

Ontologia adottata in più di 50 applicazioni Web e centinaia di sitihttp://sioc-project.org

Pubblicata come W3C Member Submission (Agosto 2007)

tesi di laurea di: Fabrizio Orlandi

Page 5: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

5tesi di laurea di: Fabrizio Orlandi

FOAF + SSL(Per privacy e autenticazione)

Page 6: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Ontologia SIOC

Il nucleo dell’ontologia, con classi e proprietà principali:

6tesi di laurea di: Fabrizio Orlandi

Page 7: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Wiki Semantici

Combinano la capacità espressiva di:

7

Web Semantico:•Processabile dalle macchine•Integrazione dei dati•Interrogazioni complesse

Wiki:•Facili da usare e contribuire•Fortemente interconnessi•Collaborativi

• Permettono agli utenti di annotare semanticamente, attraverso semplici interfacce, i contenuti creati all’interno del wiki

• Consentono l’esecuzione di query complesse sui dati strutturati,quindi vanno oltre alla semplice ricerca di keyword

• Facilitano la manutenzione del wiki (grazie alla propagazione degli update)

• Possono essere usati anche come strumenti di Ontology Engineering

tesi di laurea di: Fabrizio Orlandi

Page 8: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Wiki Semantici - ontologie

Molti utilizzano una propria ontologia per definire la struttura del wiki

8

Ad esempio:

Esistono ontologie specifiche utilizzabili per la modellazione dei wiki

tesi di laurea di: Fabrizio Orlandi

SweetWikiINRIA (FR)

IkeWiki (Salzburg Research)

Semantic MediaWiki(Wikimedia Foundation)

Ad esempio: WikiOnt e WIF (Wiki Interchange Format)

Estensione dell’ontologia SIOC

Page 9: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Estensione di SIOC

Caratteristiche fondamentali dei wiki esaminate:

9

Multi-authoring: diversi utenti collaborano anche contemporaneamente Categorie: gli articoli dei wiki sono suddivisi e catalogati in gerarchieSocial Tagging: aggiunta di tag ai contenuti delle pagineDiscussioni: ad ogni pagina viene associato uno spazio di discussione tra gli utentiBacklinks: link entranti in una paginaVersioning: per ogni pagina viene mantenuta la storia delle versioni precedenti

tesi di laurea di: Fabrizio Orlandi

Modifiche all’ontologia SIOC:

• Definita la classe sioct:Category come sottoclasse di skos:Concept• Aggiunta la proprietà sioc:has_discussion• Aggiunta la proprietà sioc:latest_version• Aggiunte due proprietà inverse transitive earlier_version e later_version• Definite sioc:previous/next_version sotto-proprietà di earlier/later_version

Page 10: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Applicazioni

Create due applicazioni (una in Java e una in PHP) che esportano e traducono le informazioni strutturali di un qualsiasi wiki di tipo

MediaWiki (es. Wikipedia) in dati RDF basati sul nuovo modello SIOC

10tesi di laurea di: Fabrizio Orlandi

L’applicazione in PHP è stata sviluppata come webservice liberamente accessibile: http://ws.sioc-project.org/mediawiki/

Page 11: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Browsing dei dati generati

Una volta che vengono esportati e generati i dati RDF corrispondenti ad una pagina di un wiki, è possibile visualizzare i

risultati utilizzando ad esempio Tabulator

11tesi di laurea di: Fabrizio Orlandi

Il browsing è particolarmente efficace perché la modellazione è stata effettuata seguendo i principi del “Linked Data”

Per questo motivo è possibile anche il crawling di un intero wiki semplicemente partendo da una singola pagina

e seguendo i link rdfs:seeAlso

Page 12: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Query sui dati raccolti

Circa 1GB di dati RDF sono stati raccolti esportando 3 wiki diversiutilizzando il webservice PHP e un crawler

12tesi di laurea di: Fabrizio Orlandi

I dati estratti sono stati inseriti in un RDF Store con supporto per inferenza OWL (utilizzato Sesame + OWLIM)

Sono state eseguite query SPARQL sul triple-store per testare le possibilità offerte dalla modellazione proposta

Esempi di query inter-wiki:“Seleziona tutti gli utenti con stesso username”

“Seleziona le pagine che appartengono alla stessa categoria”“Seleziona le coppie di utenti che collaborano su wiki diversi”

Page 13: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Conclusioni e Sviluppi Futuri

• Il modello proposto rispetta appieno le aspettative, e permette di definire la struttura di un qualsiasi wiki

• Permette inoltre l’interconnessione e lo scambio di informazioni tra wiki differenti e tra le rispettive comunità sociali

• Articolo accettato al 4° Semantic Wiki workshop presso la conferenza ESWC (European Semantic Web Conference) 2009 a Creta, Grecia

13tesi di laurea di: Fabrizio Orlandi

• Le applicazioni create applicano il modello ai wiki di tipo MediaWiki, in futuro ulteriori esportatori possono essere implementati per aumentare la diffusione e l’interoperabilità

• Un ulteriore sviluppo può essere quello di fornire maggiore dettaglio sul contenuto di un articolo wiki, come nel caso dell’integrazione con il progetto DBPedia

Page 14: Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Tesi di Laurea di: Fabrizio Orlandi Laurea specialistica in Ingegneria Informatica Anno.

Grazie per l’attenzione!

14tesi di laurea di: Fabrizio Orlandi