Introduzione all’ontology Sommario engineering
Transcript of Introduzione all’ontology Sommario engineering
Feb-26-03 Cesena
Introduzione all’ontologyengineering
Ernesto DamianiDipartimento diTecnologiedell’Informazione –Università di MilanoPolo di Crema
Feb-26-03 Cesena
Sommario
z Cos’è il Web of Knowledge ?z I metadatiz I formati storiciz Nuovi formati: da XML a RDFz RDF Schema e il Semantic Webz Ontology Engineering
Feb-26-03 Cesena
Web of Knowledge
z L’educazione moderna incoraggia laspecializzazione. Lo storico e il fisico “generico”sono stati sostituiti da figure con competenzepiù focalizzate (e.g. lo storico del Rinascimentoo l’astrofisico)
z Però: il progresso della conoscenza nasce dalleinterconnessioni “laterali” tra discipline quanto epiù che dalla ricerca “verticale”.
z Conoscenza=informazione organizzata
Feb-26-03 Cesena
Un esempio:
Frankenstein search(James Burke)
Feb-26-03 Cesena
Frankenstein search:
struttura d’accesso
Feb-26-03 Cesena
Frankenstein search: i dati
Feb-26-03 Cesena
Frankenstein search: i metadati
vincoli
tipi
relazioni
Feb-26-03 Cesena
Metadati: una visione‘ingenua’
z Dati che descrivono altri datiy e.g. il catalogo di una biblioteca
z Spesso piu’ facili da trattare deidati stessiy Il formato dei metadati è una decisione
del catalogatore, quello dei dati no..
Feb-26-03 Cesena
Quindi:
z Metadati =‘etichettedescrittive’esprimono:y Struttura e semantica dei
datima anche altro:y Autorey Copyrighty Informazioni di
autenticazioney Protezioni e permessi
d’accessoy Prezzo
z Usi dei metadatiy Catalogazione dei datiy Elaborazione automatica
dei dati da parte di agentisoftware
y Controllo degli accessiy Filtraggio dei flussi
informativi
Feb-26-03 Cesena
Il “meaning triangle” (Ogden andRichards, 1923)
Metadati: una visione “colta”
Feb-26-03 Cesena
Esempi ‘storici’
z PICSz Dublin core
Feb-26-03 Cesena
PICS
z Platform for Internet Content Selectionz www.w3.org/PICS/z Recommendation dal 1996z Condivisione e interscambio di valutazioni
su siti e pagine Weby etichette PICS trasportate negli header HTTP
or come marcatori METAx from document serverx or an independent label bureau
y firmati elettronicamente e associati con undigest
Feb-26-03 Cesena
<html> <head> <META http-equiv="PICS-Label" content=' (PICS-1.1 "http://www.gcf.org/v2.5" labels on "1999.11.05T08:15-0500" until ”2001.12.31T23:59-0000" for "http://w3.org/PICS/Overview.html" ratings (suds 0.5 density 0 color/hue 1))'> </head> <body> <p>qui va il documento</p> </body></html>
Esempio
Feb-26-03 Cesena
Applicazioni di PICS
z Protezione dei minoriy CyberPatrol, EvalWeb, NetNanny, …
z Utente genera o ottiene un profiloz L’applicazione confronta rating e profilo e
compie una delle seguenti azioni:y suggesty searchy monitory warny block
Feb-26-03 Cesena
Etichette Recreational SoftwareAdvisory Council (RSAC): Violenza
z (category (transmit-as "v") (name "Violence")(label (name "Conflict") (description "Harmlessconflict; some damage to objects") (value 0))(label (name "Fighting") (description "Creaturesinjured or killed; damage to objects; fighting")(value 1)) (label (name "Killing") (description"Humans injured or killed with small amount ofblood") (value 2)) (label (name "Blood andGore") (description "Humans injured or killed;blood and gore") (value 3)) (label (name"Wanton Violence") (description "Wanton andgratuitous violence; torture; rape") (value 4)))
Feb-26-03 Cesena
Problemi
z Chi sceglie le etichette?z Chi ne definisce la sintassi?z Come determinarne il significato?z A quale dato sono associate?
Feb-26-03 Cesena
Dublin Core
z 15 etichettez Metadati bibliograficiz Campi tipati
y vocabolario controllatoy ISO 8601 (date)y tipi di risorsey URLs, ISBNsy RC 1766 (lingue)
Feb-26-03 Cesena
Elementi Dublin Core (1)
z Titlez Creator (persona,
organizzazione,servizio)
z Subject (lista diparole chiave dalvocabolariocontrollato)
z Publisherz Contributorz Datez Type (e.g.
collezione, evento,immagine, oggettofisico, software,suono, …)
z Format
Feb-26-03 Cesena
Elementi Dublin Core (2)
z Identifierz Sourcez Language (lingua)z Relation
(collegamento a unarisorsa correlata)
z Coverage (es. luogo,tempo, agiurisdizione)
z Rights (proprieta’intellettuale,copyright)
z Description(riassunto, indice, otesto libero)
Feb-26-03 Cesena
Metadati basati su XML
z XML Schema (perchè no?..)z RDF (Resource Description
Framework)z RDF Schema
Feb-26-03 Cesena
Uso di schemi XML come
rappresentazione di metadati
• Problemaprincipale: ilpotereespressivo
•Ambiguità nelsignificatodell’inclusionedi elementi
Feb-26-03 Cesena
RDF
z Resource Description Frameworkz W3C Recommendation, dal Febbraio 1999
y si basa su XML e spazi di denominazione
z Indipendente dalla piattaformaz Eredita’
y PICSy biblioteche digitali, SGML e rappresentazione
della conoscenza
z Scopo principaley rendere le etichette elaborabili da agenti
software oltre che leggibili dall’uomo
Feb-26-03 Cesena
Primi passi con RDF
z I dati sono descritti da asserzioniz Un’asserzione e’ composta da
y Una risorsax Pagina Web o parte di essa, intero sito Web…x …un documento XML …un libro … qualunque cosa
dotata di URI
y una proprieta’x e.g. Titolo, Data, Tipo
y un valorex es. stringa, numero, frammento XML, un’altra risorsa
Feb-26-03 Cesena
Risorse
z Dalla RFC 2396:z “A resource can be anything that has identity. Familiar examples
include an electronic document, an image, a service (e.g.,"today's weather report for Los Angeles"), and a collection ofother resources. Not all resources are network "retrievable"; e.g.,human beings, corporations, and bound books in a library canalso be considered resources. The resource is the conceptualmapping to an entity or set of entities, not necessarily the entitywhich corresponds to that mapping at any particular instance intime. Thus, a resource can remain constant even when itscontent---the entities to which it currently corresponds---changesover time, provided that the conceptual mapping is not changedin the process”.
Feb-26-03 Cesena
Risorse e URI
z Le risorse sono identificate da URIz La risorsa identificata da una URI
puo’ essere astratta = nonrecuperabile in Rete
z Sintassi: [absoluteURI | relativeURI][“#” fragment-id] /
Feb-26-03 Cesena
Altre visioni di RDF
z Sintassi XMLstandard perrappresentare grafietichettati direttiz Sintassi XMLstandard perrappresentare fatti inlogica del primo ordinesenza variabili
soggetto oggettopredicato
Asserzione :=(predicato,soggetto,oggetto)Predicato = URISoggetto = URIOggetto = URI o costanteOggetto =Predicato(Soggetto)
Feb-26-03 Cesena
Esempio dimodello RDF
http://www.crema.unimi.it/Home/Damiani.htm
http:// www.crema.unimi.it /docenti/240
Ernesto Damiani [email protected]
Emailnome
Autore
“La persona id=240, il
cui nome e’ Ernesto
Damiani e l’e-mail
e’ l’autore di
http://www.crema.unimi.
it/Home/Damiani.htm”
Feb-26-03 Cesena
Sintassi
<?xml version="1.0" encoding="UTF-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"><rdf:descriptionabout="http://www.crema.unimi.it/Home/Damiani"> <s:Creator>Ernesto Damiani</s:Creator> </rdf:description></rdf:RDF> RISORSA
PROPRIETA’ - VALORE(in questo caso costante)
SPAZIO DI DENOMINAZIONE = VOCABOLARIO DI DOMINIO =ELENCO DI PROPRIETA’
Feb-26-03 Cesena
Ipertesti e RDF
z xlink semplici: niente semantica!z xlink tipati
y xlink:arcrole := predicatoy xlink:href := oggettoy xlink:role := tipo
Feb-26-03 Cesena
Schemi RDF
z Specificano le proprieta’ che possonocomparire nelle asserzioni RDF
z Non sono solo elenchi di proprieta’y Specificano le relazioni tra le proprieta’y Dichiarano classi (e sottoclassi) di
risorse
z Sviluppo consortile
Feb-26-03 Cesena
Cosa sono gli schemi RDF ?
z Una vecchia idea:le reti semantichey formalismo IA,
circa 1970
z Organizzanoconcetti in modoelaborabile daagenti software
z Primo passoverso ontologie didominio
vertebrato
mammifero uccello
canarino struzzo
cuoreSpina dorsale
peloso
vola
ali
camminare
Non volagiallo
ha
sa
Titti Hugo
E’ unE’ un
E’ un
Feb-26-03 Cesena
Interrogazioni ai metadati
z “Titti sa volare?”z “Hugo ha le ali?”z “Titti ha la spina
dorsale?”z “Quanti canarini vivono
in gabbia?”
Feb-26-03 Cesena
Cosa sono gli schemi RDF ? (2)
z Schemi RDF = Reti semantiche sul Webz Nodi=risorse (URI)z Archi
y rdfs:Classy rdfs:Propertyy rdfs:subClassOfy rdf:type
Feb-26-03 Cesena
Esempio<?xml version="1.0" encoding="UTF-8"?><rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"><rdfs:Class rdf:ID="Sanitario"> <rdfs:subClassOfrdf:resource="#Persona"/></rdfs:Class></rdf:RDF>
Risorsa
Persona
Paziente Sanitario
MedicoInfermiere
Feb-26-03 Cesena
RDFS: : il metaschema
a.k.a. “lo schema degli schemi”
Feb-26-03 Cesena
Ontologie e RDFS
• Ontologie=schemiRDFS scritti inRDFS
• Definiamo Class eProperty con nome ecognome
• Possiamoreificare, cioè direche una property hauna property o cheuna class appartienea una class
Feb-26-03 Cesena
Linguaggi avanzati
OWL=DAML+OILStandard W3C
Schemi RDFS già pronti chedefiniscono propertyinteressanti
Potereespressivouguale a quellodella logicadescrittiva
DARPA AgentMarkupLanguage(DAML)
OntologyInterchangeLanguage(OIL)
Feb-26-03 Cesena
Resource Directory DescriptionLanguage (RDDL)
z Proposto inizialmente (Gennaio 2001) per dare unsignificato ai riferimenti agli URI degli spazi didenominazione
z Identifica classi di risorse a cui si accede attraversocollegamenti ipertestuali dandone scopo e natura (spazi didenominazione: un caso particolare)
z formato leggibile sia dagli utenti umani sia dalle macchinez Adottato da XML Schema, Schematron, RSS, Examplotron,
XSLT Extension framework, SWAG
z Un semplice approccio al “Semantic Web”
Feb-26-03 Cesena
RDDL: Esempio
<?xml version="1.0" encoding="UTF-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rddl="http://www.rddl.org/"><rddl:resource rddl:id=”www.questaURL.org/questodoc.xml"xlink:arcrole="http://www.http://www.rddl.org/purposes#schema-
validation"xlink:role="http://www.w3.org/2001/XMLSchema”xlink:title=”uno schema XML"xlink:href="http://www.crema.unimi.it/loschemadiquestodoc.xsd"><p>Testo descrittivo</p></rddl:resource></rdf:RDF>
Feb-26-03 Cesena
RDDL Esempio (3)
<?xml version="1.0" encoding="UTF-8"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rddl="http://www.rddl.org/"><rddl:resourcexlink:role="http://www.crema.unimi.it/application/java-archive"xlink:arcrole="http://www.rddl.org/purposes/software#xslt-extension"xl:href="thisNS-xslt-extension.jar"><p>le estensioni XSLT definite in questo namespace sono in questo
JAR</p></rddl:resource></rdf:RDF>
Feb-26-03 Cesena
Ontology Engineering
Feb-26-03 Cesena
Comunicazione intelligente usandoontologie
RDF Schema: linguaggio standard perrappresentare e scambiare ontologie
Feb-26-03 Cesena
Tipi di ontologie
Necessità di progettazione modulare basata su templatee di chiara definizione di interfacce
Feb-26-03 Cesena
http://www.cogsci.princeton.edu/~wn
Dove prendo il vocabolario?
Feb-26-03 Cesena
Passi del progetto di ontologie
• Uso distrumentivisuali (e.g.UML)
• Ambientispecializzatiper l’ontologydesign (e.g.,OntoMaker)
Feb-26-03 Cesena
Waterfall ontology lifecycle
• Ontologie comesoftware artifact• Passi di uno sviluppoindustriale• Tecniche di softwareengineering
Feb-26-03 Cesena
Iterative ontology lifecycle
Problemaaperto:Necessità difar evolverel’ontologiamentre la siusa
Feb-26-03 Cesena
Conclusioni
z Web of Knowledge=Web + metadatiz Shared Web of Knowledge: Web + metadati
espressi in un formato standard di riferimentoBasato sullo spazio delle URI
z Schemi interessanti gia’ disponibiliz Primi passi verso grandi ontologie di dominioz Ci stiamo lavorando, Crema+Leccez Per saperne di più:
http://bingo.crema.unimi.it/ontology/