Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re [email protected] Anno...

79
Ontologie Ontologie UNIVERSITA’ DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07

Transcript of Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re [email protected] Anno...

Page 1: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

OntologieOntologie

UNIVERSITA’ DI CAMERINOCorso di laurea in Informatica

Barbara [email protected]

Anno Accademico 2006-07

Page 2: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 2

Agenda

Gestione della conoscenza Metadati Ontologie

Page 3: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 3

Dati Informazione Conoscenza

Il DATOè un rozzo numero o fatto

es: la matricola è un dato di tipo integer L’INFORMAZIONE

è il dato contestualizzatoes: dimensione storico-geografica e curriculum dello studente

La CONOSCENZAè l’informazione che è stata autenticata e assunta essere vera

es: percezione soggettiva delle qualità della persona

Page 4: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 4

Dati – informazione - Conoscenza - Saggezza

«L’informazione diventaconoscenza solo dopo esserestata processata dalla mente diun individuo»

CONOSCENZA ESPLICITA Può essere catturata e

codificata nei manuali, nelle procedure e nelle regole e quindi è facile da diffondere

CONOSCENZA TACITA Non può essere facilmente

articolata e quindi esiste solo nelle mani e nella mente degli individui

Page 5: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 5

Conoscenza Tacita ed Esplicita

Page 6: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 6

Processi coinvolti

Page 7: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 7

Modello di Nonaka

Page 8: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 8

La gestione della conoscenza

CONDIVISIONEIl macro processo che consente il mantenimento dei fluissi informativi su cui si basa la gestione della conoscenza, attraverso il supporto strutturato ai processi di comunicazione ed all’agire del sistema sociale

ACQUISIZIONEIl macro processo che consente l’esplicitazione della conoscenza tacita ed implicita (come le razionalità soggiacenti ai comportamenti degli attori), a partire da dati, informazioni e rappresentazioni

ORGANIZZAZIONEIl macro processo che consente la gestione della memoria della conoscenza, sotto forma di rappresentazioni trattabili attraverso strumenti informatici.

ACCESSOIl macro processo che consente il recupero della conoscenza attraverso modalità di ricerca svolte o assistite da elaboratore

SUPPORTOIl macro processo che migliora le condizioni di esercizio dei processi cognitivi in situazione attraverso un uso mirato delle tecnologie digitali

Page 9: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 9

KMS: cos’è?

Cos’è un KMS?

“Un KMS è un ambiente integrato che utilizza le tecnologie di supporto ai processi di gestione della conoscenza per permettere alle organizzazioni di sfruttarne i vantaggi”

KMS o portale?Un portale è un’applicazione web- based che offre un singolo punto d’accesso a informazioni distribuite Un portale è solo il livello più esterno di una struttura che prevede quattro strati funzionali

Page 10: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 10

KMS: funzionalità

Page 11: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 11

Cosa sono i metadati e le ontologie!!

Cosa sono i metadati“Data about data” ?Descrizioni Descrizioni di una risorsa ?Relazioni tra risorse ?Catturano informazione

presente nella risorsa ma non elaborabile in automatico ?presente nel contesto in cui la risorsa è inserita ?

Cosa sono le Cosa sono le ontologie ontologie ontologieontologie??

Specifica di un Specifica di un vocabolario condiviso vocabolario condiviso dei termini utilizzati dei termini utilizzati in in un dominio un dominio applicativo ?applicativo ?

Collezioni di definizioni Collezioni di definizioni di di termini e relazioni termini e relazioni fra questi ?fra questi ?

Schema che cattura il Schema che cattura il significato significato dell’informazione dell’informazione contenuta in un contenuta in un sottostante archivio ?sottostante archivio ?

Page 12: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 12

METADATI: Alcune semplici definizioni …

Machine-understandable information about Web resources or other things.

Tim Berners-Lee, W3C, 1997

Data associated with objects which relieves their potential users of having to have full advance knowledge of their existence or characteristics. A user might be a program or a person.

Lorcan Dempsey & Rachel Heery, 1998

Structured data about resources that can be used to help support a wide range of operations

Michael Day, 2001

Structured data about data.Dublin Core Metadata Initiative FAQ, 2003

Page 13: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 13

Che informazioni contengono i metadati

I record di metadati possono includereDescrizione del materiale archiviatoRecord bibliografici appartenenti a cataloghi o ottenuti da servizi di indicizzazione e creazione di abstractRecord relativi ad oggetti contenuti nella documentazione del museoDescrizione di oggetti digitali (documenti, immagini, video software, …)Descrizione di collezioni di oggetti digitaliDescrizione di servizi in reteDescrizioni di record di metadati

Page 14: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 14

Modelli di metadati

I precursoriMARC – MAchine Readable Cataloguing record

metadati di applicazione generaleDublin Core (DC)Government Information Locator Service [now Global Information Locator Service] (GILS)Digital Object Identifier (DOI)

metadati per specifici domini disciplinariMPEG7Text Encoding Initiative (TEI)Encoded Archival Description (EAD)Consortium for the Interchange of Museum Information (CIMI)Visual Resources Association (VRA) Core CategoriesContent Standard for Digital Geospatial Metadata (CSDGM)Online Information Exchange (ONIX)Friend Of a Friend: metadati per descrivere reti sociali

Page 15: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 15

Modelli di metadati: MARC

Sviluppato alla fine degli anni 60 alla Library of Congress (USA) per promuovere la condivisione di cataloghi tra biblioteche. È diventato un formato quasi standard. Utilizza un sistema di numeri, lettere e simboli all’interno del record per individuare i diversi tipi di informazione

http://www.loc.gov/marc/umb/

Page 16: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 16

Modelli di Modelli di metadati: Dublin core

Un insieme di elementi descrittivi capaci di rappresentare qualsiasi risorsa di informazione accessibile in rete

http://www.dublincore.org

Format Identifier Source Language Relation Coverage Rights Title Creator Subject Description Publisher Contributor Date Type

Page 17: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 17

FOAF "Friend Of A Friend"

The Friend of a Friend (FOAF) project is about creating a Web of machinereadablehomepages describing people, the links between them and the things they create and do

http://www.foaf-project.org/

FOAF BasicsAgentPerson Name NickTitleHomepage Mboxmbox_sha1sumImgdepiction (depicts)Surnamefamily_nameGivennamefirstName

Per provare a scrivere il vostro FOAF [http://www.ldodds.com/foaf/foaf-a-matic.html]

Personal Info weblog knows interest currentProject pastProject plan based_near workplaceHomepage workInfoHomepage schoolHomepage topic_interest publications geekcode myersBriggs dnaChecksum

Page 18: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 18

Modelli di metadati: MPEG7

Standard sviluppato dall’MPEG (Moving Picture Expert Group)

http://www.chiariglione.org/mpeg/

Viene denominato “Multimedia content description interface” Fornisce una descrizione del contenuto di dati multimediali, estraibile attraverso la sua analisi ed elaborazione Strumento generico non finalizzato ad una applicazione specifica, ma adatto a supportare un ampio numero di applicazioni

Digital libraries Description generation Description consumption Description based training Image understanding Intelligent vision Smart cameras/VCRs Information retrieval Information filtering

Page 19: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 19

Caratteristiche dei metadati

Descrittiviper l'identificazione e il recupero degli oggetti digitali; sono costituiti da descrizioni normalizzate dei documenti digitali nativi, risiedono generalmente nelle basi dati dei sistemi di Information Retrieval all'esterno degli archivi degli oggetti digitali e sono collegati a questi ultimi tramite appositi link.

Amministrativi e gestionaliforniscono dati utili per la gestione della risorsa descritta, per le operazioni di gestione degli oggetti digitali all'interno dell'archivio.

Strutturalidescrivono la struttura interna fisica o logica dei documenti (es. introduzione, capitoli, sezioni, indice di un libro) e le loro relazioni fra le varie parti degli oggetti digitali.

Page 20: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 20

Metadati: embedded o esterni

Embeddedsono inclusi nell’oggetto,

Esternisono esterni all’oggetto ed archiviati a parte come link all’oggetto descritto.

Page 21: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 21

Funzioni

Gestire le risorse fornendo la loro l’identificazione a favore della loro presentazione e recupero

Consentire l’organizzazione, la localizzazione, la gestione e le statistiche

Favorire l’interoperabilità e l’integrazione di risorse simili

Facilitare l’archiviazione e la conservazione delle risorse

Page 22: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 22

Tool per la gestione dei metadati (1)

DC/DOT Questo servizio recupera pagine Web ed automaticamente genera metadati Dublin Core o come tag HTML o RDF/XML adatti per esser inseriti nella sezione head delle pagine. I metadati generati possono essere editati usando delle form specifiche che possono convertire i metadati in altri formati (USMARC, SOIF, IAFA/ROADS, TEI headers, GILS, IMS or RDF).

Nordic project Questo servizio è fornito dal “Nordic Metadata Project” al fine di fornire un buon supporto per la creazione di metadati Dublin Core per la comunità “Nordic Net-publisher”.

Reggie L’editor di metadati Reggie fornisce un facile modo di creare metadati da un programma web configurabile. I metadati creati da Reggie possono essere mostrati e in alcuni casi esportati nei seguenti formati HTML 3.2, HTML 4.0 e RDF.

MKDoc MKDoc è un sistema per la gestione dei contenuti nei siti Web che può produrre metadati Dublin Core in formato HTML e RDF per ogni documento.

Editor-Converter Dublin Core metadata Si tratta di un programma on-line che può essere utilizzato per due scopi: come editor di metadati Dublin Core e come convertitore ad UNIMARC.

Page 23: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 23

Tool per la gestione dei metadati (2)

Photo RDF-Gen Questo tool genera RDF per descrivere immagini ed in particolar modo fotografie

DescribeThis Si tratta di un parser automatico ed al tempo stesso di generatore di metadati Dublin Core per le risorse on-line

Scorpion Il progetto “Scorpion Open Source” offre un software in grado di implementare un sistema per la classificazione automatica di documenti di testo accessibili dal Web. Esso viene usato per investigare sulla presenza di uno schema di classificazione o un thesaurus leggibile dalla macchina da incorporare nel sistema di classificazione automatica

Viewer-Generator Dublin Core metadata Rappresenta un form on-line per effetture un test su di un URL e valutare quindi la presenza di metadati Dublin Core. Al tempo stesso esso genera automaticamente metadati Dublin Core da una pagina che contiene tradizionali metadati HTML

Page 24: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 24

Cosa sono i metadati e le ontologie!!

Cosa sono i metadati“Data about data” ?Descrizioni Descrizioni di una risorsa ?Relazioni tra risorse ?Catturano informazione

presente nella risorsa ma non elaborabile in automatico ?presente nel contesto in cui la risorsa è inserita ?

Cosa sono le Cosa sono le ontologieontologie??Specifica di un Specifica di un vocabolario condiviso vocabolario condiviso dei termini utilizzati dei termini utilizzati in in un dominio un dominio applicativo ?applicativo ?

Collezioni di definizioni Collezioni di definizioni di di termini e relazioni termini e relazioni fra questi ?fra questi ?

Schema che cattura il Schema che cattura il significato significato dell’informazione dell’informazione contenuta in un contenuta in un sottostante archivio ?sottostante archivio ?

Page 25: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 25

Cos’è un’ontologia

In termini astratti Sul piano filosofico: area della metafisica che

studia come è realmente fatto l’universo che ci circonda

Sul piano informatico: area dell’intelligenza artificiale che studia i metodi per

rappresentare correttamente l’universo che ci circonda

In termini praticiSpecifica un vocabolario comune tra sistemi

differenti …… basandosi su una descrizione semantica del

dominio dei dati ……che agevoli la comunicazione sia tra agenti

software sia tra agenti software e esseri umani

Page 26: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 26

Definizioni

Philosophy (400BC)Systematic explanation of Existence

Neches (91)Ontology defines basic terms and relations comprising the vocabulary of a topic area as well as the rules for ombining terms and relations to define extensions to the vocabulary

Gruber (93)Explicit specification of a conceptualization

Borst (97)Formal specification of a shared conceptualization

Studer(98)Formal, explicit specification of a shared conceptualization Una specifica esplicita e formale di una concettualizzazione condivisa

Page 27: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 27

Cos’è un’ontologia

In termini formali…“Un’ontologia è una specificazione esplicita e formale di una

concettualizzazione condivisa”in cui si usa… CONCETTUALIZZAZIONE

perché ci si riferisce a modello astratto di fenomeno

CONDIVISA perché cattura conoscenza riconosciuta da un gruppo

FORMALE perché automaticamente decodificabile

ESPLICITA perché basata su strutture di immediata applicazione

Page 28: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 28

Formalmente (1)

Un insieme di concetti (detti anche classi) Le interconnessioni semantiche tra essi (dette relazioni

concettuali, o attributi semantici) Un eventuale livello logico che permetta di inferire nuovi fatti

a partire da quelli codificati all’interno della risorsa (ad esempio, un insieme di assiomi o micro-teorie)

Page 29: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 29

Formalmente (2)

Un’ontologia O può dunque essere definita come una tripla (C, R, A) dove

C è un insieme di concettiR è un insieme di relazioni concettuali tali che ogni relazione in R è definita su CCA è un insieme di assiomi (se A = l’ontologia non è assiomatizzata)

Page 30: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 30

Definizione formale di ontologia (3)

Si osservi che gli insiemi C ed R individuano un grafo G = (V, E) tale che

V CE = { (c1, c2) CC : S R : (c1, c2) S }

e una funzione di etichettatura : CC 2R tale che (c1, c2) = { S R : (c1, c2) S }

Page 31: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 31

Esempio

Un semplice esempio di ontologia è il seguente O’ = (C’, R’, A’) dove:

C’ = {Entità, Oggetto, Persona, Meccanico, Automobile, Motore}R’ = {è-un, ha-un, ripara}A’ = { “a Automobile m Meccanico : ripara(m, a)” })è-un = { (Oggetto, Entità), (Persona, Entità), (Meccanico, Persona), (Automobile, Oggetto), (Motore, Oggetto) }ha-un = { (Automobile, Motore) }ripara = { (Meccanico, Automobile) }

Page 32: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 32

I componenti di un’ontologia

Page 33: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 33

I componenti di un’ontologia

Un concetto……anche noto come classe, può

rappresentare un oggetto, una nozione o un’idea

…può essere astratto o concreto, elementare o composto, reale o fittizio…

…è caratterizzato da un termino o un simbolo, da una “estensione” e da una “intensione”

Page 34: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 34

I componenti di un’ontologia

Un assioma…è un affermazione sempre vera sul

modello

…serve per specificare la semantica dei concetti

…può essere usato per descrivere una relazione: il tipo, la cardinalità, le proprietà algebriche (simmetria, transitività), le proprietà concettuali (esclusività, genericità, identità)

Page 35: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 35

I componenti di un’ontologia

Una relazione…

…è una forma di interazione tra concetti del dominio del tipo R: C1xC2x…xCn

…è caratterizzata da un termine, da una intenzione e da una estensione…

…può essere, ad esempio, “genitore” che lega due concetti o due istanze

Page 36: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 36

I componenti di un’ontologia

Una funzione……è un tipo speciale di

relazione in cui l’n-esimo argomento dipende dagli altri, nella forma F: C1xC2x…xCn-1àCn

…può essere, ad esempio, “madre di”, calcolata a partire da un concetto “genitore” e dall’attributo “sesso”

Page 37: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 37

I componenti di un’ontologia

Un elemento aggiuntivo può essere…

…un’istanza rappresenta i singoli elementi del dominio

…un fatto rappresenta una relazione tra due istanze

…un individuo rappresenta qualsiasi elemento del dominio che non sia un concetto

…una claim rappresenta l’asserzione di un fatto tramite un’istanza

Page 38: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 38

I criteri della progettazione…

Chiarezza: il significato intenzionale deve essereoggettivo

Coerenza: si può inferire solo ciò che è consistente con le definizioni

Estendibilità: successive estensioni o specializzazionidevono essere monotone, senza richiedere revisione

Minima dipendenza dalla codifica: la concettualizzazione non deve dipendere da vincoli del linguaggio dirappresentazione

Minimo commitment ontologico: la conoscenza deveessere rappresentata col minor numero possibile didichiarazioni

Page 39: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 39

Il ciclo di vita della progettazione

Page 40: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 40

Processo di sviluppo di un’ontologia

Studio di Fattibilità

Studio di Fattibilità

Identificazione dominio e campo di applicazione

Identificazione dominio e campo di applicazione

CostruzioneCostruzione

ValutazioneValutazione

DocumentazioneDocumentazione

OntologiaUtenti, Esperti di dominio e Sviluppatori

MantenimentoMantenimento

1) Catturare l’ontologia2) Codificare l’ontologia3) Integrare con ontologie esistenti

• chiarezza• coerenza• estensibilità• min impegno ontologico• min dipendenza codice

Page 41: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 41

Ontologie: Problemi di ricerca

E’ un’area di ricerca che si è molto espansa nell’ultima decade

Ontologie

Costruzione

Traduzione

Aggiornamento

Riuso

Valutazione

Apprendimento

Mapping

Fusione

Gestione

Strumenti Strumenti

Metodologie Metodologie

Linguaggi Linguaggi

Page 42: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 42

I linguaggi per la rappresentazione della conoscenza

Si utilizzano logiche descrittive intese come una famiglia di formalismi utilizzati per rappresentare la conoscenza in un dominio di applicazione detto mondo

Più recentemente le logice descrittive sono state utilizzate come formalismo di base per lo sviluppo degli standard promossi dalla "Semantic Web initiative" del W3C

RDF che però non può essere considerato una logica descrittivaOWL (nato dalle ceneri dei progetti DAML e OIL)

Page 43: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 43

Linguaggi di rappresentazione

Page 44: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 44

RDF: come possibile approccio all’interoperabilità strutturale

RDF si propone come un’hub da usare per gestire i costrutti strutturali al posto di numerose integrazioni ad hoc

Source: Tim Berners Lee

http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/Overview.html

Page 45: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 45

RDF mette a disposizione un modello di dati semplice

… e molto flessibile si possono codificare

Page 46: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 46

Che cos’è RDF

RDFCome HTML, permette di creare dei link tra risorse pubblicati sul WebAl contrario dei comuni ipertesti i link di RDF

Possono essere etichettati, al fine di indicare esplicitamente la relazione che intercorre tra gli oggettiSi riferiscono a oggetti tipizzati, nel senso che RDF standardizza la modalità con cui si assegna un significato alla risorsa

Page 47: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 47

Confronto HTML e RDF

Page 48: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 48

RDF: un esempio guida

Il modello RDF rende disponibile un meccanismo per descrivere in modo machine- processable risorse Web risorse Web, ad esempio, pagine Web

Esempio Immaginiamo di voler tener traccia del fatto

che qualcuno di nome Mario Rossi ha creato una certa pagina Web (http://www.example.org/index.html)

Se dovessimo descrivere questo fatto in linguaggio naturale potremmo utilizzare una semplice frase:

Page 49: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 49

RDF: un esempio guida

Alcune parti della frase sono sottolineate per identificare

ciò che si vuole descrivere (in questo caso la pagina) la specifica proprietà (autore) di ciò che si vuole descrivereciò che vogliamo utilizzare per assegnare un valorealla proprietà (chi è l’autore) di ciò che si vuole descrivere

Page 50: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 50

La terminologia

In RDF per identificareLa frase si usa il termine stantmentLa parte che identifica ciò di cui la frase parla si usa soggettoLa parte che identifica la proprietà del soggetto che la frase specifica si usa predicatoLa parte che identifica il valore assegnato dalla frase alla proprietà si usa oggetto

Page 51: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 51

Machine processability (1)

Delle frasi in linguaggio naturale possono servire uomini per comunicare, ma lo scopo di RDF è rendere queste frasi “machine-processable”

Per rendere frasi simili a quelle precedenti machine processable occorre

degli identificativi “machine-processable” che permettano di identificare il soggetto, l’oggetto e il predicato in una frase senza nessuna possibilità di confusione con un altro identificativo simile usato da qualcun altro sul Webun formato “machine-processable” per rappresentare e scambiare le frasi tra macchine

Page 52: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 52

Machine processability (2)

Il web di oggi dispone di entrambi i meccanismi

gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF

Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF

Page 53: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 53

Machine processability

Il web di oggi dispone di entrambi i meccanismi

gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF

Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF

Page 54: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 54

Tutto deve avere un URI

Per scrivere

Occorre assegnare un URI a tutte (o quasi) le parti sottolineate della frase

Nello stantment RDF di esempio:Il soggetto è già un URIIl valore (l’oggetto) “Mario Rossi” potrebbe essere identificato dall’URI URN:org:example:staffid:85740Per il predicato “autore” si può utilizzre l’URI http://purl.org/dc/element/1.1/creator

Page 55: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 55

Tutto deve avere un URI

Risultato

Page 56: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 56

Predicati come URI

http://purl.org/dc/elements/1.1/Creator

EtichettaCreatore

DefinizioneUn'entità che ha la responsabilità principale della produzione del contenuto della risorsa

DescrizioneEsempi di Creator includono una persona, un'organizzazione o un servizio. In particolare, il nome di un Creator dovrebbe essere usato per indicare l'entità

Page 57: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 57

Uso dei nemespace

E’ possibile abbreviare le URI facendo uso dei prefissi dei namespace di XML

EsempioLo stantment

Introducendo i seguenti prefissi per i tre namespace

diventa

Page 58: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 58

Oggetti come URI (1)

Ci sono molti vantaggi nell’utilizzare gli URI come semplice modalità di identificazione

Invece di Identificare l’autore come la stringa “Mario Rossi”Si può usare l’URI sid:85740

In questo caso1. Possiamo essere più precisi nella nostra idenficazione

dell’autore della paginaNon è una stringa “Mario Rossi” o qualcuna delle migliaia di persone che si chiamano “Mario Rossi”Ma in particolare “Mario Rossi” è associato all’URI

Page 59: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 59

Oggetti come URI (2)

2. Dal momento che l’autore della pagina ha un URI, è a tutti gli effetti una risorsa, e possiamo descriverla ulteriormente assegnandogli, ad esempio, il nome, l’eta, …

Page 60: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 60

Quasi tutto deve avere un URI

Il soggetto e il predicato di ogni stantment devono essere delle risorse, quindi devono avere un URI

L’oggetto può anche essere un valore La terminologia di RDF utilizza il termine Letterale (litteral)

Page 61: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 61

Tipizzare le risorse

Per tipizzare una risorsa si usa la proprietà rdf:type

Page 62: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 62

Machine processability

Il web di oggi dispone di entrambi i meccanismi

gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF

Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF

Page 63: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 63

Sintassi XML di RDF

L’idea di base prevede un elemento XML per ogni nodo (soggetto e oggetto) e arco (predicato)

Page 64: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 64

Sintassi XML di RDF

Una possibile abbreviazione prevede l’uso dell’attributo rdf:resource nei poperty element

Page 65: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 65

Sintassi XML di RDF

Altri stantment

Si possono serializzareSempre di seguito

Nel caso in cui si descriva l’oggetto del primo anche innestandoli

Page 66: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 66

Sintassi XML di RDF

Possibile abbreviazione per risorse tipizzate

Page 67: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 67

Sintassi XML di RDF

Page 68: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 68

Sintassi N-Triple di RDF

La sintassi XML di RDFÈ utile per far leva sui numerosi tool già sviluppati per XMLMa non è semplice distinguere i vari stantment e in particolare isolare soggetto, predicato e oggetto

Per scopi didattici, o in generale quando occorre leggere RDF, si può utilizzare la sintassi N-Triple

Ogni statment si scrive come una tripla

Page 69: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 69

Sintassi N-Triple di RDF: esempio

Es. l’esempio guida in N-triple

Fissando i prefissi

La tripla diventa

Page 70: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 70

Alcuni vocabolari

Page 71: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 71

RDF come Hub

RDF può essere utilizzato come “Hub”Abilita un buon grado di interoperabilità strutturale

Ovvero i vari sistemi informativi, che condividono lo stesso modello RDF, possono scegliere indipendentemente il formato più adatto all’informazione che intendono scambiare

È molto semplice fondere (merge) modelli RDF

Ovvero non ci sono ostacoli nel combinare informazione preveniente da sistemi differenti (quindi anche in formati diversi), purchè questi condividano lo stesso modello RDF

Page 72: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 72

Esempio di interoperabilità strutturale otttenuta via RDF

Page 73: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 73

Esempio di interoperabilità strutturale otttenuta via RDF

Page 74: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 74

Esempio di interoperabilità strutturale otttenuta via RDF

Page 75: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 75

Esempio di fusione (merge)

Page 76: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 76

Esempio di fusione (merge)

Page 77: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 77

Esempio di fusione (merge)

Page 78: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 78

Protegè

http://protege.stanford.edu/

Page 79: Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re barbara.re@unicam.it Anno Accademico 2006-07.

Barbara Re 79

Ci sono domande?