Post on 02-May-2015
••• ITIS Lab
Progetti per KR
Matteo Palmonari
••• ITIS Lab
Ontology module extraction +
Semantic Distance
••• ITIS Lab
Context
••• ITIS Lab
Service Ontology Builder
• Design time: • Indicizzazione di Web service semantici (SWS)
descritti in OWL-S.• Costruzione della Service Ontology Core (SOC)
tramite i termini individuati in fase di indicizzazione.
• Costruzione della Global Light Service Ontology (GLSO) estendendo SOC con l’import di (parti di) ontologie definite nella descrizione dei Web service.
••• ITIS Lab
Service Finder
• Discovery time:• Ricerca dei servizi attraverso query basate su
parole chiave.
••• ITIS Lab
Design time
• Accesso ad un repository contente le descrizioni semantiche (files OWL-S) dei Web services.
• Indicizzazione dei Web services• Viene considerato unicamente il
sottoinsieme significativo di informazioni contenute nella descrizione: profilo/input/output.
• Il risultato è un “Inverted index file” (IIF) contenente i termini indicizzati e alcune caratteristiche utili in fase di ricerca (es. Frequenza, Peso).SWS
SWSSWS
IIF
Service Ontology Builder
(Indicizzazione)
<Profilo, Input, Output>
Repository di
servizi
--------------------------------------------------
••• ITIS Lab
Fase di indicizzazione
<service:isPresentedBy rdf:resource="#EXPEDIA_SERVICE"/><profile:serviceName xml:lang="en"> Expedia</profile:serviceName><profile:textDescription xml:lang="en">
This service returns information of a hotel of a given city.</profile:textDescription><profile:hasInput rdf:resource="#_CITY"/><profile:hasOutput rdf:resource="#_HOTEL"/><profile:has_process rdf:resource="CITY_HOTEL_PROCESS" /></profile:Profile>….<process:Input rdf:ID="_CITY"><process:parameterType rdf:datatype="http://www.w3.org/2001/XMLSchema#anyURI">
http://www.owl-ontologies.com/City.owl#City</process:parameterType><rdfs:label></rdfs:label></process:Input>
<process:Output rdf:ID="_HOTEL"><process:parameterType rdf:datatype="http://www.w3.org/2001/XMLSchema#anyURI">
http://127.0.0.1/ontology/travel.owl#Hotel</process:parameterType><rdfs:label></rdfs:label></process:Output>….
Termini indicizzatiTermini arricchiti semanticamente attraverso un’ontologia di riferimento
Servizio: Expedia
••• ITIS Lab
Costruzione Global Light Service Ontology
• Import delle ontologie locali costruite a partire dal termini individuato nella descrizione del servizio (es. hotel e city)
• Import dei termini indicizzati (SOC) nell’inverted index file (es. information, hotel, city)
SWS
GLSO
IIF
--------------------------------------------------
Termini indicizzati
Ontologie locali
importa
SOC
••• ITIS Lab
Global Light Service Ontology
• Ontologia costruita dal Service Ontology Builder e visualizzata in Protege
SOC
Ontologie locali importate a partire dal termine: Hotel e city
••• ITIS Lab
Discovery time
• Ricerca dei termini specifica nella query interrogando la GLSO.
• Ricerca pesata secondo le seguenti politiche: • Se il termine ha matching esatto con il
termini indicizzato (SOC) il peso restituito è 1.
• Se il termine non ha matching esatto con il termine indicizzato, il peso è calcolato secondo la distanza semantica tra il termine ricercato e il più vicino termine indicizzato.
• Il termine indicizzato e il relativo peso vengono utilizzati per interrogare l’index inverted file.
• Tale interrogazione restituirà una lista ordinata di Web services.
GLSO
Query
--------------------------------------------------
SWS
SWS
SWS
••• ITIS Lab
Progetto I: Ontology Module Extraction
••• ITIS Lab
Costruzione Global Light Service Ontology
SWS
GLSO
IIF
--------------------------------------------------
Termini indicizzati
Ontologie locali
importa
SOC
• Global Light Service Ontology (GSO) Creation. • An ontology module
relevant to the CSO signature is extracted from the GSO exploiting the approach developed in [49];
• Approach defined by Univ. Manchester
••• ITIS Lab
Ontology Module Extraction in the GLSO builder
• Formal Background:• Bernardo Cuenca Grau, Ian Horrocks, Yevgeny Kazakov, and
Ulrike Sattler. Just the right amount: Extracting modules from ontologies. In Proceedings of WWW-2007: the 16th International World Wide Web Conference, Banff, Alberta, Canada, May 8–12, 2007, 2007.
• Approach Documentation:• A section of Nep4B D2.2
• Technical Aspects:• Integration project:
• Module Extraction Algorithm (already implemented) to be integrated in the GLSO Builder component (already implemented)
• Programming language: JAVA (a bit of XML)• Ontology repository: Jena (Protegè?)
• Evaluation: evaluate and test against the OWLSTC benchmark• Major difficulties:
• Understanding the Module Extraction Approach/Algorithm
••• ITIS Lab
Progetto II:Distance matrix creation
••• ITIS Lab
Semantic Distance Matrix Implementation
SWS
GLSO
IIF
--------------------------------------------------
Termini indicizzati
Ontologie locali
importa
SOC • Distance Matrix:• Xs= OIT + NLIT
(Ontology Index Terms // Natural Language Index Terms)
• Ys= GLSO concepts• Represent semantic
distance between Xs and Ys elements
Hotel Reservation City region
Hotel 3.2 1 0.5
City
....
...
Distance Matrix
••• ITIS Lab
Ontology Module Extraction in the GLSO builder
• Formal Background:• Find out some standard approaches in the literature
• Approach Documentation:• Find out some standard approaches in the literature
• Technical Aspects:• Modeling: choose an approach, and possibly a set available
API• Implementation: implementing the approach• Evaluation: test the approach against subsets of the
OWLSTC benchmark
• Major difficulties:• Implementation (semantic distance techniques are not
difficult to understand)
••• ITIS Lab
Semantic Metadata Management Framework
Bring the “repository approach” to semantics
••• ITIS Lab
Context
••• ITIS Lab
Towards a Semantic EMM framework
Repository of Schema and Vocabulary:Technological Level
••• ITIS Lab
EMM Framework:Motivation and Goal
• Provide an integrated view on the knowledge stored, managed and administered within the enterprise.
• Goals:• Support management of knowledge stored in
data sourced and – implicitly - in the users expertise
• Support navigation of knowledge• Support collaborative editing and maintainment
of the knowledge• Support knowledge exchange within the
enterprise, and, possibly outside the enterprise
••• ITIS Lab
Semantic EMM Framework:Models and technologies
• Provide an integrated view on the knowledge stored, managed and administered within the enterprise.
• Goals:• Support management of knowledge stored in
data sourced and – implicitly - in the users expertise
• Support navigation of knowledge• Support collaborative editing and maintainment
of the knowledge• Support knowledge exchange within the
enterprise, and, possibly outside the enterprise
Repository of schema GlossarySemantic Technologies
RDF/OWL
Wiki
+
••• ITIS Lab
Repository Structure
Abstract Schemas
Basic schemas
••• ITIS Lab
DTDogAE
An DichCFS Cont Reg Dog1 Dog2 Dog3 Dog4 Dem Terr
Sal
Sal
Struttura del Repository
del Sistema Informativo della Fiscalita’
CU CT
Con
Esempio di Repository di Schemi Concettuali (Sistema informativo della Fiscalità)
••• ITIS Lab
Semantic EMM Framework:Architecture
Descrizione della
Termine glossa
Descrizione della
Termine glossa
Descrizione della
Termine glossa
Semantic Wiki
Repository of schema Glossary
users
Knowledge sources
••• ITIS Lab
ERDIA
Semantic EMM Framework:
Languages and Models
Descrizione della
Termine glossa
Descrizione della
Termine glossa
Descrizione della
Termine glossa
Semantic Wiki
Repository of schema Glossary
users
Knowledge sources
SKOS
Linguaggio di rappresentazione semplificato basato su ER con relazioni orientate e relazioni di
astrazione e integrazione
Linguaggio di rappresentazione semplificato basato su ER con relazioni orientate e relazioni di
astrazione e integrazione
Linguaggio standard per la rappresentazione di vocabolari e thesauri
Linguaggio standard per la rappresentazione di vocabolari e thesauri
••• ITIS Lab
Semantic EMM Framework: Application-layer software components
Descrizione della
Termine glossa
Descrizione della
Termine glossa
Descrizione della
Termine glossa
Semantic Wiki
Repository of schema Glossary
users
Knowledge sources
SKOS
RDF
Semantic Media Wiki
RDF RDF
ERDIA
••• ITIS Lab
SEMMF - Projects
••• ITIS Lab
Semantic EMM Framework: Application-layer software components
users
RDF/OWL
AER ERDIA
RDFS
OWL-DL
RDB
ERDIA-UN
OWL-DL
RDFS
www.example.org/
RDF/OWL
SE
MA
NTIC
S
T1
T2
T3T4
I2
SYNTAX
SEM-WIKI
A1 ASP
••• ITIS Lab
Progetti
SEMMF-T1,T2,T3,T4
••• ITIS Lab
Translation projects
• Translations • ER RDF-OWL (erdia)• RDF-OWL (erdia) OWL-DL• RDF-OWL (erdia) RDF-OWL (erdia-un)• RDF-OWL (erdia-un) RDFS
RDF/OWL
AER ERDIA
RDFS
OWL-DL
RDB
ERDIA-UN
OWL-DL
RDFS
RDF/OWL
SE
MA
NTIC
S
T1
T2
T3T4
SYNTAX
••• ITIS Lab
SEMMF-T1, T2, T3, T4 – Semantic Web
• Formal Background:• M. Palmonari / C. Batini, + other approaches to ER 2 OWL
• Approach Documentation:• M. Palmonari – C. Batini – SEMMF draft
• Technical Aspects:• Modeling: given• Implementation: implementing the translation• Evaluation: test the approach on the repository of schema
• Programming framework and skills:• Java and Jena API
• Major difficulties:• Implementation (modeling part is given)
••• ITIS Lab
Progetti
SEMMF-A1
••• ITIS Lab
SEMMF-A1 – Logic Programming
• Automatic Abstraction Generator using AnswerSet Prolog
• Multiple model generation according to basic abstraction primitives
• Outline some ideas for improve abstraction generations
AER
RDB
A1 ASP
••• ITIS Lab
SEMMF-A1 – Logic Programming
• Formal Background:• C. Batini, B. Pernici + to find
• Approach Documentation:• To outline
• Technical Aspects:• Modeling: major problem• Implementation: under ASP• Evaluation: test the approach on the USE CASE for
repository of schemas
• Programming framework and skills:• ASP
• Major difficulties:• Modeling abstraction mechanisms with ASP
••• ITIS Lab
Progetti
SEMMF-I1
••• ITIS Lab
SEMMF-I1 – Semantic Web (GUI)
• Web-based visualization for ER-dia schemas/graphs
RDF/OWL
ERDIA
www.example.org/
I2
SYNTAX
••• ITIS Lab
SEMMF-I1 – Semantic Web (GUI)
• Formal Background:• Low, RDF and graph visualization, tool review and
evaluation
• Approach Documentation:• Not required
• Technical Aspects:• Modeling: no, tools and libraries review• Implementation: adptation of existent frameworks, links
between ontologies to evaluate• Evaluation: test the approach on given ERdia RDF schemas
• Programming framework and skills:• JAVA
• Major difficulties:• Choose the tool that is more suitable for the scope at hand
••• ITIS Lab
Progetti
SEMMF-EE1
••• ITIS Lab
SEMMF - Evaluation
• Develop the USE CASE presented with Protegè, exploiting ER-dia language
• Evaluate costs of the approach and compare them with costs of other translation defined• How much (time) to understand the language? • How much (time) to write down abstractions
from protegè? • What size would the ontology have under the
other approaches?• ...
••• ITIS Lab
SEMMF-EE1 – Semantic Web
• Formal Background:• M. Palmonari / C. Batini, + other approaches to ER 2 OWL
• Approach Documentation:• Not required
• Technical Aspects:• Modeling: understand differences between formal
languages, engineering perspective, evaluation• Implementation: none• Evaluation: is the purpose
• Programming framework and skills:• None (familiarity with Protegè)
• Major difficulties:• Establishing some evaluation criteria, make some
calculation
••• ITIS Lab
Milano Antica - Semantic Web Application
Semantic Web-driven Data Integration and Service MashUps
••• ITIS Lab
Context
••• ITIS Lab
Il progetto “Milano Antica”
• Progetto complessivo di studio e applicazione di tecniche innovative per la datazione e la certificazione del materiale di scavo
• Obiettivo specifico: fruizione e valorizzazione dei beni archeologici nel territorio di Milano
• Rilevanza degli strumenti di supporto alla fruizione via web:• Disseminazione dei risultati della
ricerca (informazioni e dati) tramite un canale di crescente importanza ed utilizzo
• Possibilità di definire accessi differenziati in base a differenti profili di utenti
• Stimolo/supporto alla visita dei beni nel territorio
••• ITIS Lab
Caratteristiche delle informazioni
• Differenti aspetti rilevanti del bene:• Location (spazio e tempo)• Aspetti classificatori (tipologie,
materiali, funzionalità, stili etc.)
• Differenti livello di approfondimento:• In merito alla descrizione del
bene• … ma anche al processo di
scoperta, studio e conservazione
• Molteplici aspetti da integrare per offrire una navigabilità ricca all’interno delle informazioni e dei dati
••• ITIS Lab
Integrazione e riuso
• Perché sviluppare una soluzione ad hoc (costi, tempi) quando disponiamo di servizi efficienti?• componente spaziale: Open Layers, Google
Maps, Open Street Maps• componente temporale: Simile Timeline (MIT)• faceted browsing: Simile Exhibit (MIT)
• Sviluppo vs configurazione (e.g. API)
••• ITIS Lab
Integrazione e riuso
faceted browsing +interactive timeline(SIMILE Proj, MIT)
OpenLayers +Goggle Maps +Open Street Maps
••• ITIS Lab
Perché andiamo verso la semantica?
• Descrizione di datistrutturati o semistrutturati con linguaggi ben definiti (es. RDF) per:• definire criteri di
aggregazione• condividere i dati con
studiosi che possano importarli nelle loro Knowledge Base(s)
• utilizzare dati da altre applicazioni per riaggregarli e metterli a disposizione
• Definire differenti criteri di presentazione all’utente (personalizzazione):• meccanismi di
attraversamento di grafi sfruttando la semantica delle relazioni
••• ITIS Lab
MA
-CID
OC SIR
BE
C
••• ITIS Lab
• Sviluppo approccio GAV, integrazione di dati on the fly basata su tecniche di Semantic Web• Ontologia che descrive SIRBeC• Ontologia (?) Flickr• Mapping CIDOC-MA SIRBeC• Mapping CIDOC-MA Flickr• Estrazione on the fly su base di query su CIDOC-
MA (vedi seminario Della Valle)