Introduzione all’ontology Sommario engineering

9
Feb-26-03 Cesena Introduzione all’ontology engineering Ernesto Damiani Dipartimento di Tecnologie dell’Informazione – Università di Milano Polo di Crema Feb-26-03 Cesena Sommario z Cos’è il Web of Knowledge ? z I metadati z I formati storici z Nuovi formati: da XML a RDF z RDF Schema e il Semantic Web z Ontology Engineering Feb-26-03 Cesena Web of Knowledge z L’educazione moderna incoraggia la specializzazione. Lo storico e il fisico “generico” sono stati sostituiti da figure con competenze più focalizzate (e.g. lo storico del Rinascimento o l’astrofisico) z Però: il progresso della conoscenza nasce dalle interconnessioni “laterali” tra discipline quanto e più che dalla ricerca “verticale”. z Conoscenza=informazione organizzata Feb-26-03 Cesena Un esempio: Frankenstein search (James Burke) Feb-26-03 Cesena Frankenstein search: struttura d’accesso Feb-26-03 Cesena Frankenstein search: i dati

Transcript of Introduzione all’ontology Sommario engineering

Feb-26-03 Cesena

Introduzione all’ontologyengineering

Ernesto DamianiDipartimento diTecnologiedell’Informazione –Università di MilanoPolo di Crema

Feb-26-03 Cesena

Sommario

z Cos’è il Web of Knowledge ?z I metadatiz I formati storiciz Nuovi formati: da XML a RDFz RDF Schema e il Semantic Webz Ontology Engineering

Feb-26-03 Cesena

Web of Knowledge

z L’educazione moderna incoraggia laspecializzazione. Lo storico e il fisico “generico”sono stati sostituiti da figure con competenzepiù focalizzate (e.g. lo storico del Rinascimentoo l’astrofisico)

z Però: il progresso della conoscenza nasce dalleinterconnessioni “laterali” tra discipline quanto epiù che dalla ricerca “verticale”.

z Conoscenza=informazione organizzata

Feb-26-03 Cesena

Un esempio:

Frankenstein search(James Burke)

Feb-26-03 Cesena

Frankenstein search:

struttura d’accesso

Feb-26-03 Cesena

Frankenstein search: i dati

Feb-26-03 Cesena

Frankenstein search: i metadati

vincoli

tipi

relazioni

Feb-26-03 Cesena

Metadati: una visione‘ingenua’

z Dati che descrivono altri datiy e.g. il catalogo di una biblioteca

z Spesso piu’ facili da trattare deidati stessiy Il formato dei metadati è una decisione

del catalogatore, quello dei dati no..

Feb-26-03 Cesena

Quindi:

z Metadati =‘etichettedescrittive’esprimono:y Struttura e semantica dei

datima anche altro:y Autorey Copyrighty Informazioni di

autenticazioney Protezioni e permessi

d’accessoy Prezzo

z Usi dei metadatiy Catalogazione dei datiy Elaborazione automatica

dei dati da parte di agentisoftware

y Controllo degli accessiy Filtraggio dei flussi

informativi

Feb-26-03 Cesena

Il “meaning triangle” (Ogden andRichards, 1923)

Metadati: una visione “colta”

Feb-26-03 Cesena

Esempi ‘storici’

z PICSz Dublin core

Feb-26-03 Cesena

PICS

z Platform for Internet Content Selectionz www.w3.org/PICS/z Recommendation dal 1996z Condivisione e interscambio di valutazioni

su siti e pagine Weby etichette PICS trasportate negli header HTTP

or come marcatori METAx from document serverx or an independent label bureau

y firmati elettronicamente e associati con undigest

Feb-26-03 Cesena

<html> <head> <META http-equiv="PICS-Label" content=' (PICS-1.1 "http://www.gcf.org/v2.5" labels on "1999.11.05T08:15-0500" until ”2001.12.31T23:59-0000" for "http://w3.org/PICS/Overview.html" ratings (suds 0.5 density 0 color/hue 1))'> </head> <body> <p>qui va il documento</p> </body></html>

Esempio

Feb-26-03 Cesena

Applicazioni di PICS

z Protezione dei minoriy CyberPatrol, EvalWeb, NetNanny, …

z Utente genera o ottiene un profiloz L’applicazione confronta rating e profilo e

compie una delle seguenti azioni:y suggesty searchy monitory warny block

Feb-26-03 Cesena

Etichette Recreational SoftwareAdvisory Council (RSAC): Violenza

z (category (transmit-as "v") (name "Violence")(label (name "Conflict") (description "Harmlessconflict; some damage to objects") (value 0))(label (name "Fighting") (description "Creaturesinjured or killed; damage to objects; fighting")(value 1)) (label (name "Killing") (description"Humans injured or killed with small amount ofblood") (value 2)) (label (name "Blood andGore") (description "Humans injured or killed;blood and gore") (value 3)) (label (name"Wanton Violence") (description "Wanton andgratuitous violence; torture; rape") (value 4)))

Feb-26-03 Cesena

Problemi

z Chi sceglie le etichette?z Chi ne definisce la sintassi?z Come determinarne il significato?z A quale dato sono associate?

Feb-26-03 Cesena

Dublin Core

z 15 etichettez Metadati bibliograficiz Campi tipati

y vocabolario controllatoy ISO 8601 (date)y tipi di risorsey URLs, ISBNsy RC 1766 (lingue)

Feb-26-03 Cesena

Elementi Dublin Core (1)

z Titlez Creator (persona,

organizzazione,servizio)

z Subject (lista diparole chiave dalvocabolariocontrollato)

z Publisherz Contributorz Datez Type (e.g.

collezione, evento,immagine, oggettofisico, software,suono, …)

z Format

Feb-26-03 Cesena

Elementi Dublin Core (2)

z Identifierz Sourcez Language (lingua)z Relation

(collegamento a unarisorsa correlata)

z Coverage (es. luogo,tempo, agiurisdizione)

z Rights (proprieta’intellettuale,copyright)

z Description(riassunto, indice, otesto libero)

Feb-26-03 Cesena

Metadati basati su XML

z XML Schema (perchè no?..)z RDF (Resource Description

Framework)z RDF Schema

Feb-26-03 Cesena

Uso di schemi XML come

rappresentazione di metadati

• Problemaprincipale: ilpotereespressivo

•Ambiguità nelsignificatodell’inclusionedi elementi

Feb-26-03 Cesena

RDF

z Resource Description Frameworkz W3C Recommendation, dal Febbraio 1999

y si basa su XML e spazi di denominazione

z Indipendente dalla piattaformaz Eredita’

y PICSy biblioteche digitali, SGML e rappresentazione

della conoscenza

z Scopo principaley rendere le etichette elaborabili da agenti

software oltre che leggibili dall’uomo

Feb-26-03 Cesena

Primi passi con RDF

z I dati sono descritti da asserzioniz Un’asserzione e’ composta da

y Una risorsax Pagina Web o parte di essa, intero sito Web…x …un documento XML …un libro … qualunque cosa

dotata di URI

y una proprieta’x e.g. Titolo, Data, Tipo

y un valorex es. stringa, numero, frammento XML, un’altra risorsa

Feb-26-03 Cesena

Risorse

z Dalla RFC 2396:z “A resource can be anything that has identity. Familiar examples

include an electronic document, an image, a service (e.g.,"today's weather report for Los Angeles"), and a collection ofother resources. Not all resources are network "retrievable"; e.g.,human beings, corporations, and bound books in a library canalso be considered resources. The resource is the conceptualmapping to an entity or set of entities, not necessarily the entitywhich corresponds to that mapping at any particular instance intime. Thus, a resource can remain constant even when itscontent---the entities to which it currently corresponds---changesover time, provided that the conceptual mapping is not changedin the process”.

Feb-26-03 Cesena

Risorse e URI

z Le risorse sono identificate da URIz La risorsa identificata da una URI

puo’ essere astratta = nonrecuperabile in Rete

z Sintassi: [absoluteURI | relativeURI][“#” fragment-id] /

Feb-26-03 Cesena

Altre visioni di RDF

z Sintassi XMLstandard perrappresentare grafietichettati direttiz Sintassi XMLstandard perrappresentare fatti inlogica del primo ordinesenza variabili

soggetto oggettopredicato

Asserzione :=(predicato,soggetto,oggetto)Predicato = URISoggetto = URIOggetto = URI o costanteOggetto =Predicato(Soggetto)

Feb-26-03 Cesena

Esempio dimodello RDF

http://www.crema.unimi.it/Home/Damiani.htm

http:// www.crema.unimi.it /docenti/240

Ernesto Damiani [email protected]

Emailnome

Autore

“La persona id=240, il

cui nome e’ Ernesto

Damiani e l’e-mail

[email protected]

e’ l’autore di

http://www.crema.unimi.

it/Home/Damiani.htm”

Feb-26-03 Cesena

Sintassi

<?xml version="1.0" encoding="UTF-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"><rdf:descriptionabout="http://www.crema.unimi.it/Home/Damiani"> <s:Creator>Ernesto Damiani</s:Creator> </rdf:description></rdf:RDF> RISORSA

PROPRIETA’ - VALORE(in questo caso costante)

SPAZIO DI DENOMINAZIONE = VOCABOLARIO DI DOMINIO =ELENCO DI PROPRIETA’

Feb-26-03 Cesena

Ipertesti e RDF

z xlink semplici: niente semantica!z xlink tipati

y xlink:arcrole := predicatoy xlink:href := oggettoy xlink:role := tipo

Feb-26-03 Cesena

Schemi RDF

z Specificano le proprieta’ che possonocomparire nelle asserzioni RDF

z Non sono solo elenchi di proprieta’y Specificano le relazioni tra le proprieta’y Dichiarano classi (e sottoclassi) di

risorse

z Sviluppo consortile

Feb-26-03 Cesena

Cosa sono gli schemi RDF ?

z Una vecchia idea:le reti semantichey formalismo IA,

circa 1970

z Organizzanoconcetti in modoelaborabile daagenti software

z Primo passoverso ontologie didominio

vertebrato

mammifero uccello

canarino struzzo

cuoreSpina dorsale

peloso

vola

ali

camminare

Non volagiallo

ha

sa

Titti Hugo

E’ unE’ un

E’ un

Feb-26-03 Cesena

Interrogazioni ai metadati

z “Titti sa volare?”z “Hugo ha le ali?”z “Titti ha la spina

dorsale?”z “Quanti canarini vivono

in gabbia?”

Feb-26-03 Cesena

Cosa sono gli schemi RDF ? (2)

z Schemi RDF = Reti semantiche sul Webz Nodi=risorse (URI)z Archi

y rdfs:Classy rdfs:Propertyy rdfs:subClassOfy rdf:type

Feb-26-03 Cesena

Esempio<?xml version="1.0" encoding="UTF-8"?><rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"><rdfs:Class rdf:ID="Sanitario"> <rdfs:subClassOfrdf:resource="#Persona"/></rdfs:Class></rdf:RDF>

Risorsa

Persona

Paziente Sanitario

MedicoInfermiere

Feb-26-03 Cesena

RDFS: : il metaschema

a.k.a. “lo schema degli schemi”

Feb-26-03 Cesena

Ontologie e RDFS

• Ontologie=schemiRDFS scritti inRDFS

• Definiamo Class eProperty con nome ecognome

• Possiamoreificare, cioè direche una property hauna property o cheuna class appartienea una class

Feb-26-03 Cesena

Linguaggi avanzati

OWL=DAML+OILStandard W3C

Schemi RDFS già pronti chedefiniscono propertyinteressanti

Potereespressivouguale a quellodella logicadescrittiva

DARPA AgentMarkupLanguage(DAML)

OntologyInterchangeLanguage(OIL)

Feb-26-03 Cesena

Resource Directory DescriptionLanguage (RDDL)

z Proposto inizialmente (Gennaio 2001) per dare unsignificato ai riferimenti agli URI degli spazi didenominazione

z Identifica classi di risorse a cui si accede attraversocollegamenti ipertestuali dandone scopo e natura (spazi didenominazione: un caso particolare)

z formato leggibile sia dagli utenti umani sia dalle macchinez Adottato da XML Schema, Schematron, RSS, Examplotron,

XSLT Extension framework, SWAG

z Un semplice approccio al “Semantic Web”

Feb-26-03 Cesena

RDDL: Esempio

<?xml version="1.0" encoding="UTF-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rddl="http://www.rddl.org/"><rddl:resource rddl:id=”www.questaURL.org/questodoc.xml"xlink:arcrole="http://www.http://www.rddl.org/purposes#schema-

validation"xlink:role="http://www.w3.org/2001/XMLSchema”xlink:title=”uno schema XML"xlink:href="http://www.crema.unimi.it/loschemadiquestodoc.xsd"><p>Testo descrittivo</p></rddl:resource></rdf:RDF>

Feb-26-03 Cesena

RDDL Esempio (3)

<?xml version="1.0" encoding="UTF-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rddl="http://www.rddl.org/"><rddl:resourcexlink:role="http://www.crema.unimi.it/application/java-archive"xlink:arcrole="http://www.rddl.org/purposes/software#xslt-extension"xl:href="thisNS-xslt-extension.jar"><p>le estensioni XSLT definite in questo namespace sono in questo

JAR</p></rddl:resource></rdf:RDF>

Feb-26-03 Cesena

Ontology Engineering

Feb-26-03 Cesena

Comunicazione intelligente usandoontologie

RDF Schema: linguaggio standard perrappresentare e scambiare ontologie

Feb-26-03 Cesena

Tipi di ontologie

Necessità di progettazione modulare basata su templatee di chiara definizione di interfacce

Feb-26-03 Cesena

http://www.cogsci.princeton.edu/~wn

Dove prendo il vocabolario?

Feb-26-03 Cesena

Passi del progetto di ontologie

• Uso distrumentivisuali (e.g.UML)

• Ambientispecializzatiper l’ontologydesign (e.g.,OntoMaker)

Feb-26-03 Cesena

Waterfall ontology lifecycle

• Ontologie comesoftware artifact• Passi di uno sviluppoindustriale• Tecniche di softwareengineering

Feb-26-03 Cesena

Iterative ontology lifecycle

Problemaaperto:Necessità difar evolverel’ontologiamentre la siusa

Feb-26-03 Cesena

Conclusioni

z Web of Knowledge=Web + metadatiz Shared Web of Knowledge: Web + metadati

espressi in un formato standard di riferimentoBasato sullo spazio delle URI

z Schemi interessanti gia’ disponibiliz Primi passi verso grandi ontologie di dominioz Ci stiamo lavorando, Crema+Leccez Per saperne di più:

http://bingo.crema.unimi.it/ontology/

Feb-26-03 Cesena

Ci sono domande?