ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

49
••• ITIS Lab Progetti per KR Matteo Palmonari

Transcript of ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

Page 1: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Progetti per KR

Matteo Palmonari

Page 2: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Ontology module extraction +

Semantic Distance

Page 3: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Context

Page 4: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Service Ontology Builder

• Design time: • Indicizzazione di Web service semantici (SWS)

descritti in OWL-S.• Costruzione della Service Ontology Core (SOC)

tramite i termini individuati in fase di indicizzazione.

• Costruzione della Global Light Service Ontology (GLSO) estendendo SOC con l’import di (parti di) ontologie definite nella descrizione dei Web service.

Page 5: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Service Finder

• Discovery time:• Ricerca dei servizi attraverso query basate su

parole chiave.

Page 6: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Design time

• Accesso ad un repository contente le descrizioni semantiche (files OWL-S) dei Web services.

• Indicizzazione dei Web services• Viene considerato unicamente il

sottoinsieme significativo di informazioni contenute nella descrizione: profilo/input/output.

• Il risultato è un “Inverted index file” (IIF) contenente i termini indicizzati e alcune caratteristiche utili in fase di ricerca (es. Frequenza, Peso).SWS

SWSSWS

IIF

Service Ontology Builder

(Indicizzazione)

<Profilo, Input, Output>

Repository di

servizi

--------------------------------------------------

Page 7: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Fase di indicizzazione

<service:isPresentedBy rdf:resource="#EXPEDIA_SERVICE"/><profile:serviceName xml:lang="en"> Expedia</profile:serviceName><profile:textDescription xml:lang="en">

This service returns information of a hotel of a given city.</profile:textDescription><profile:hasInput rdf:resource="#_CITY"/><profile:hasOutput rdf:resource="#_HOTEL"/><profile:has_process rdf:resource="CITY_HOTEL_PROCESS" /></profile:Profile>….<process:Input rdf:ID="_CITY"><process:parameterType rdf:datatype="http://www.w3.org/2001/XMLSchema#anyURI">

http://www.owl-ontologies.com/City.owl#City</process:parameterType><rdfs:label></rdfs:label></process:Input>

<process:Output rdf:ID="_HOTEL"><process:parameterType rdf:datatype="http://www.w3.org/2001/XMLSchema#anyURI">

http://127.0.0.1/ontology/travel.owl#Hotel</process:parameterType><rdfs:label></rdfs:label></process:Output>….

Termini indicizzatiTermini arricchiti semanticamente attraverso un’ontologia di riferimento

Servizio: Expedia

Page 8: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Costruzione Global Light Service Ontology

• Import delle ontologie locali costruite a partire dal termini individuato nella descrizione del servizio (es. hotel e city)

• Import dei termini indicizzati (SOC) nell’inverted index file (es. information, hotel, city)

SWS

GLSO

IIF

--------------------------------------------------

Termini indicizzati

Ontologie locali

importa

SOC

Page 9: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Global Light Service Ontology

• Ontologia costruita dal Service Ontology Builder e visualizzata in Protege

SOC

Ontologie locali importate a partire dal termine: Hotel e city

Page 10: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Discovery time

• Ricerca dei termini specifica nella query interrogando la GLSO.

• Ricerca pesata secondo le seguenti politiche: • Se il termine ha matching esatto con il

termini indicizzato (SOC) il peso restituito è 1.

• Se il termine non ha matching esatto con il termine indicizzato, il peso è calcolato secondo la distanza semantica tra il termine ricercato e il più vicino termine indicizzato.

• Il termine indicizzato e il relativo peso vengono utilizzati per interrogare l’index inverted file.

• Tale interrogazione restituirà una lista ordinata di Web services.

GLSO

Query

--------------------------------------------------

SWS

SWS

SWS

Page 11: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Progetto I: Ontology Module Extraction

Page 12: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Costruzione Global Light Service Ontology

SWS

GLSO

IIF

--------------------------------------------------

Termini indicizzati

Ontologie locali

importa

SOC

• Global Light Service Ontology (GSO) Creation. • An ontology module

relevant to the CSO signature is extracted from the GSO exploiting the approach developed in [49];

• Approach defined by Univ. Manchester

Page 13: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Ontology Module Extraction in the GLSO builder

• Formal Background:• Bernardo Cuenca Grau, Ian Horrocks, Yevgeny Kazakov, and

Ulrike Sattler. Just the right amount: Extracting modules from ontologies. In Proceedings of WWW-2007: the 16th International World Wide Web Conference, Banff, Alberta, Canada, May 8–12, 2007, 2007.

• Approach Documentation:• A section of Nep4B D2.2

• Technical Aspects:• Integration project:

• Module Extraction Algorithm (already implemented) to be integrated in the GLSO Builder component (already implemented)

• Programming language: JAVA (a bit of XML)• Ontology repository: Jena (Protegè?)

• Evaluation: evaluate and test against the OWLSTC benchmark• Major difficulties:

• Understanding the Module Extraction Approach/Algorithm

Page 14: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Progetto II:Distance matrix creation

Page 15: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Semantic Distance Matrix Implementation

SWS

GLSO

IIF

--------------------------------------------------

Termini indicizzati

Ontologie locali

importa

SOC • Distance Matrix:• Xs= OIT + NLIT

(Ontology Index Terms // Natural Language Index Terms)

• Ys= GLSO concepts• Represent semantic

distance between Xs and Ys elements

Hotel Reservation City region

Hotel 3.2 1 0.5

City

....

...

Distance Matrix

Page 16: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Ontology Module Extraction in the GLSO builder

• Formal Background:• Find out some standard approaches in the literature

• Approach Documentation:• Find out some standard approaches in the literature

• Technical Aspects:• Modeling: choose an approach, and possibly a set available

API• Implementation: implementing the approach• Evaluation: test the approach against subsets of the

OWLSTC benchmark

• Major difficulties:• Implementation (semantic distance techniques are not

difficult to understand)

Page 17: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Semantic Metadata Management Framework

Bring the “repository approach” to semantics

Page 18: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Context

Page 19: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Towards a Semantic EMM framework

Repository of Schema and Vocabulary:Technological Level

Page 20: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

EMM Framework:Motivation and Goal

• Provide an integrated view on the knowledge stored, managed and administered within the enterprise.

• Goals:• Support management of knowledge stored in

data sourced and – implicitly - in the users expertise

• Support navigation of knowledge• Support collaborative editing and maintainment

of the knowledge• Support knowledge exchange within the

enterprise, and, possibly outside the enterprise

Page 21: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Semantic EMM Framework:Models and technologies

• Provide an integrated view on the knowledge stored, managed and administered within the enterprise.

• Goals:• Support management of knowledge stored in

data sourced and – implicitly - in the users expertise

• Support navigation of knowledge• Support collaborative editing and maintainment

of the knowledge• Support knowledge exchange within the

enterprise, and, possibly outside the enterprise

Repository of schema GlossarySemantic Technologies

RDF/OWL

Wiki

+

Page 22: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Repository Structure

Abstract Schemas

Basic schemas

Page 23: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

DTDogAE

An DichCFS Cont Reg Dog1 Dog2 Dog3 Dog4 Dem Terr

Sal

Sal

Struttura del Repository

del Sistema Informativo della Fiscalita’

CU CT

Con

Esempio di Repository di Schemi Concettuali (Sistema informativo della Fiscalità)

Page 24: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Semantic EMM Framework:Architecture

Descrizione della

Termine glossa

Descrizione della

Termine glossa

Descrizione della

Termine glossa

Semantic Wiki

Repository of schema Glossary

users

Knowledge sources

Page 25: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

ERDIA

Semantic EMM Framework:

Languages and Models

Descrizione della

Termine glossa

Descrizione della

Termine glossa

Descrizione della

Termine glossa

Semantic Wiki

Repository of schema Glossary

users

Knowledge sources

SKOS

Linguaggio di rappresentazione semplificato basato su ER con relazioni orientate e relazioni di

astrazione e integrazione

Linguaggio di rappresentazione semplificato basato su ER con relazioni orientate e relazioni di

astrazione e integrazione

Linguaggio standard per la rappresentazione di vocabolari e thesauri

Linguaggio standard per la rappresentazione di vocabolari e thesauri

Page 26: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Semantic EMM Framework: Application-layer software components

Descrizione della

Termine glossa

Descrizione della

Termine glossa

Descrizione della

Termine glossa

Semantic Wiki

Repository of schema Glossary

users

Knowledge sources

SKOS

RDF

Semantic Media Wiki

RDF RDF

ERDIA

Page 27: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF - Projects

Page 28: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Semantic EMM Framework: Application-layer software components

users

RDF/OWL

AER ERDIA

RDFS

OWL-DL

RDB

ERDIA-UN

OWL-DL

RDFS

www.example.org/

RDF/OWL

SE

MA

NTIC

S

T1

T2

T3T4

I2

SYNTAX

SEM-WIKI

A1 ASP

Page 29: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Progetti

SEMMF-T1,T2,T3,T4

Page 30: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Translation projects

• Translations • ER RDF-OWL (erdia)• RDF-OWL (erdia) OWL-DL• RDF-OWL (erdia) RDF-OWL (erdia-un)• RDF-OWL (erdia-un) RDFS

RDF/OWL

AER ERDIA

RDFS

OWL-DL

RDB

ERDIA-UN

OWL-DL

RDFS

RDF/OWL

SE

MA

NTIC

S

T1

T2

T3T4

SYNTAX

Page 31: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF-T1, T2, T3, T4 – Semantic Web

• Formal Background:• M. Palmonari / C. Batini, + other approaches to ER 2 OWL

• Approach Documentation:• M. Palmonari – C. Batini – SEMMF draft

• Technical Aspects:• Modeling: given• Implementation: implementing the translation• Evaluation: test the approach on the repository of schema

• Programming framework and skills:• Java and Jena API

• Major difficulties:• Implementation (modeling part is given)

Page 32: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Progetti

SEMMF-A1

Page 33: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF-A1 – Logic Programming

• Automatic Abstraction Generator using AnswerSet Prolog

• Multiple model generation according to basic abstraction primitives

• Outline some ideas for improve abstraction generations

AER

RDB

A1 ASP

Page 34: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF-A1 – Logic Programming

• Formal Background:• C. Batini, B. Pernici + to find

• Approach Documentation:• To outline

• Technical Aspects:• Modeling: major problem• Implementation: under ASP• Evaluation: test the approach on the USE CASE for

repository of schemas

• Programming framework and skills:• ASP

• Major difficulties:• Modeling abstraction mechanisms with ASP

Page 35: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Progetti

SEMMF-I1

Page 36: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF-I1 – Semantic Web (GUI)

• Web-based visualization for ER-dia schemas/graphs

RDF/OWL

ERDIA

www.example.org/

I2

SYNTAX

Page 37: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF-I1 – Semantic Web (GUI)

• Formal Background:• Low, RDF and graph visualization, tool review and

evaluation

• Approach Documentation:• Not required

• Technical Aspects:• Modeling: no, tools and libraries review• Implementation: adptation of existent frameworks, links

between ontologies to evaluate• Evaluation: test the approach on given ERdia RDF schemas

• Programming framework and skills:• JAVA

• Major difficulties:• Choose the tool that is more suitable for the scope at hand

Page 38: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Progetti

SEMMF-EE1

Page 39: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF - Evaluation

• Develop the USE CASE presented with Protegè, exploiting ER-dia language

• Evaluate costs of the approach and compare them with costs of other translation defined• How much (time) to understand the language? • How much (time) to write down abstractions

from protegè? • What size would the ontology have under the

other approaches?• ...

Page 40: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

SEMMF-EE1 – Semantic Web

• Formal Background:• M. Palmonari / C. Batini, + other approaches to ER 2 OWL

• Approach Documentation:• Not required

• Technical Aspects:• Modeling: understand differences between formal

languages, engineering perspective, evaluation• Implementation: none• Evaluation: is the purpose

• Programming framework and skills:• None (familiarity with Protegè)

• Major difficulties:• Establishing some evaluation criteria, make some

calculation

Page 41: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Milano Antica - Semantic Web Application

Semantic Web-driven Data Integration and Service MashUps

Page 42: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Context

Page 43: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Il progetto “Milano Antica”

• Progetto complessivo di studio e applicazione di tecniche innovative per la datazione e la certificazione del materiale di scavo

• Obiettivo specifico: fruizione e valorizzazione dei beni archeologici nel territorio di Milano

• Rilevanza degli strumenti di supporto alla fruizione via web:• Disseminazione dei risultati della

ricerca (informazioni e dati) tramite un canale di crescente importanza ed utilizzo

• Possibilità di definire accessi differenziati in base a differenti profili di utenti

• Stimolo/supporto alla visita dei beni nel territorio

Page 44: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Caratteristiche delle informazioni

• Differenti aspetti rilevanti del bene:• Location (spazio e tempo)• Aspetti classificatori (tipologie,

materiali, funzionalità, stili etc.)

• Differenti livello di approfondimento:• In merito alla descrizione del

bene• … ma anche al processo di

scoperta, studio e conservazione

• Molteplici aspetti da integrare per offrire una navigabilità ricca all’interno delle informazioni e dei dati

Page 45: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Integrazione e riuso

• Perché sviluppare una soluzione ad hoc (costi, tempi) quando disponiamo di servizi efficienti?• componente spaziale: Open Layers, Google

Maps, Open Street Maps• componente temporale: Simile Timeline (MIT)• faceted browsing: Simile Exhibit (MIT)

• Sviluppo vs configurazione (e.g. API)

Page 46: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Integrazione e riuso

faceted browsing +interactive timeline(SIMILE Proj, MIT)

OpenLayers +Goggle Maps +Open Street Maps

Page 47: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

Perché andiamo verso la semantica?

• Descrizione di datistrutturati o semistrutturati con linguaggi ben definiti (es. RDF) per:• definire criteri di

aggregazione• condividere i dati con

studiosi che possano importarli nelle loro Knowledge Base(s)

• utilizzare dati da altre applicazioni per riaggregarli e metterli a disposizione

• Definire differenti criteri di presentazione all’utente (personalizzazione):• meccanismi di

attraversamento di grafi sfruttando la semantica delle relazioni

Page 48: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

MA

-CID

OC SIR

BE

C

Page 49: ITIS Lab Progetti per KR Matteo Palmonari. ITIS Lab Ontology module extraction + Semantic Distance.

••• ITIS Lab

• Sviluppo approccio GAV, integrazione di dati on the fly basata su tecniche di Semantic Web• Ontologia che descrive SIRBeC• Ontologia (?) Flickr• Mapping CIDOC-MA SIRBeC• Mapping CIDOC-MA Flickr• Estrazione on the fly su base di query su CIDOC-

MA (vedi seminario Della Valle)