9a. Il web semantico

28
WEB SEMANTICO: Ontologie e RDF Sapienza Università di Roma Anno Accademico 2012 – 2013 Informatica per gli Archivi e le Biblioteche Prof.ssa Linda Giuva Prof. Maurizio Caminito LEZIONE 9a 1

description

Sapienza Università di Roma Anno Accademico 2012 – 2013 Informatica per gli Archivi e le Biblioteche Prof.ssa Linda Giuva Prof. Maurizio Caminito Lezione 9a

Transcript of 9a. Il web semantico

Page 1: 9a. Il web semantico

WEB SEMANTICO: Ontologie e RDF

Sapienza Università di RomaAnno Accademico 2012 – 2013

Informatica per gli Archivi e le BibliotecheProf.ssa Linda Giuva

Prof. Maurizio CaminitoLEZIONE 9a

1

Page 2: 9a. Il web semantico

2

Il Web Semantico ha una architettura a livelli

Il Web Semantico è un sistema controllato di organizzazione di dati.Adotta una serie di standard:

Al livello superiore si pone il livello ontologico. Una ontologia descrive le relazioni tra i tipi di elementi

• lo standard URI (Uniform Resource Identifiers), per la definizione univoca di indirizzi Internet

• l’RDF (Resource Description Framework) e RDF Schema, che costituiscono il linguaggio per descrivere le risorse e i loro tipi (derivano da XML).

Page 3: 9a. Il web semantico

3

La piramide del WEB SEMANTICO

L’architettura del Web Semantico si compone di vari livelli:

• i dati• i metadati • i concetti che esprimono le relazioni fra i dati• un linguaggio che descriva la struttura dei dati

Page 4: 9a. Il web semantico

4

L’architettura del WEB SEMANTICO

E’ importante lo schema utilizzato per archiviare le informazioni.

Lo schema RDF è un insieme di regole sull'organizzazione dei dati. Definisce relazioni fra i dati.

I metadati devono mappare i dati rispetto a classi, o concetti, di questo schema.

In questo modo si hanno strutture in grado di descrivere e automatizzare i collegamenti esistenti fra i dati.

Il Web Semantico è, come l'XML, un ambiente dichiarativo, in cui si specifica il significato dei dati.

La semantica dei dati consiste nel dare alla macchina delle informazioni utili in modo che essa possa utilizzare i dati nel modo corretto.

Page 5: 9a. Il web semantico

5

Gli standard del WEB SEMANTICO

Il consorzio W3C ha prodotto una serie di standard

per descriver e organizzare i metadati semantici:

l’RDF e l’OWL.

Page 6: 9a. Il web semantico

6

Il Web Semantico e i livelli di controllo

Prevede dei livelli di controllo e validazione interna:

• Adotta la firma digitale • Prevede un livello di “proof”• Porta ad un risultato univoco e credibile (livello

“trust”)

Page 7: 9a. Il web semantico

7

WEB SEMANTICOIl Web Semantico ha una architettura a livelli

3

Page 8: 9a. Il web semantico

URI: il primo mattone

L’architettura del Web Semantico si basa su una pila di tecnologie, primo concetto delle quali è il fatto che in rete è possibile assegnare un riferimento univoco – URI - a qualsiasi cosa.

Anche una persona può essere rappresentata tramite l’indirizzo della sua pagina web o quello della sua casella di posta elettronica (o un quadro può essere rappresentato da una foto o dalla documentazione pubblicata sul sito del museo che lo conserva).

8

Page 9: 9a. Il web semantico

9

MEMO: cos’è l’URI

URI è acronimo di Uniform Resource Identifier: un indirizzo che, in forma compatta, consente di

identificare una qualsiasi risposta come una pagina web, un documento, un'immagine, un indirizzo e-mail e così via. Gli URI sono definiti utilizzando una

specifica sintassi, facente riferimento all'uso di differenti protocolli. URL (Uniform Resource

Locator) e URN (Uniform Resource Name) possono essere considerati sottoinsiemi di URI.

Page 10: 9a. Il web semantico

10

L’ONTOLOGIA

• ONTOLOGIA in filosofia:si riferisce alla struttura, all’essenza e alle proprietà dell’ESSERE (ontos + logos), di ciò che esiste.

• ONTOLOGIA in informatica:una descrizione formale di un insieme di concetti e delle relazioni che intercorrono tra essi.

Page 11: 9a. Il web semantico

11

Ontologia: alcune definizioni 1

Un’ONTOLOGIA è una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse, le regole, gli assiomi ed i vincoli specifici del dominio.

Page 12: 9a. Il web semantico

12

Ontologia: alcune definizioni 2

“L’ontologia e’ come un vocabolario (tassonomia) di

concetti, che rappresenta un determinato dominio di

interesse, dotato di un insieme di relazioni tra i concetti

stessi che consentono di capire come sono legati fra

loro” [Josephson&other, 99]

«Un’ontologia e’ una collezione di frasi che definiscono

le relazioni tra concetti e specificano le regole logiche» [Tim Berners-Lee, 99]

Page 13: 9a. Il web semantico

13

WEB SEMANTICO: un esempio di applicazione di ontologie

Si può fare una ricerca del tipo: quali sono… le aziende (soggetto)

che hanno come servizio (predicato) la fornitura di scarpe (oggetto)?

N.B. Questa query è diversa da quella che si potrebbe fare ad un motore di ricerca, a cui si propongono le tre parole: azienda, servizio e scarpe, ma senza mai esprimere il legame fra di essi. Da qui derivano appunto le imprecisioni dei motori di ricerca.

Page 14: 9a. Il web semantico

14

WEB SEMANTICO: le Ontologie

ONTOLOGIE(descritte con l’OWL Web Ontology Language)

sono collezioni di informazioni.

I più comuni tipi di ontologia per il Web:

• tassonomia (definisce classi e sottoclassi di oggetti) • regole di inferenza (definisce relazioni tra di entità)

Page 15: 9a. Il web semantico

15

ONTOLOGIE: Proprieta’ e attributi

Es.: FAMIGLIA Rappresentare le relazioni esistenti tra le classi del dominio (es. “le MADRI sono GENITORI”, “i GENITORI hanno figli che sono PERSONE”…)

FEMMINA

MADRE

DONNA

PERSONA

GENITORE

PADRE

ha_figli

(1,n)

is_a

Page 16: 9a. Il web semantico

16

Elementi delle ontologie

Il contenuto di un’ontologia è rappresentato da:

Un insieme di classi (concetti – astrazioni del mondo reale).

Un insieme di relazioni (tra 2 classi); un esempio è la relazione IS_A

Un insieme di assiomiUn insieme di individui

Page 17: 9a. Il web semantico

17

Ontologie: metodologia per la loro “costruzione”

Steps [1]

Determinare il dominio e lo scopo dell’ontologia Elencare i termini principali dell’ontologia Definire le classi e la gerarchia tra le classi Definire le proprietà delle classi Definire vincoli sulle proprietà Creare le istanze

[1]Noy, McGuinness, “Ontology Development 101: A Guide to Creating Your First Ontology ”,2001

Page 18: 9a. Il web semantico

18

Creare una ontologia

Es.: creare una ontologia del mondo universitario.

Supporre che l’ontologia verrà utilizzata da una segreteria didattica, per tener traccia dei corsi, dei professori che insegnano i corsi e degli studenti che li seguono. Devono essere quindi rappresentate le entità più importanti del mondo (personale docente, professori, professori ordinari, professori associati, ricercatori, studenti, corsi, …) e le relazioni che intercorrono tra di essi

Page 19: 9a. Il web semantico

19

Il WEB SEMANTICO e l’ONTOLOGIA “Star Wars”

Page 20: 9a. Il web semantico

20

WEB SEMANTICO Linguaggi di gestione delle ontologie

Principali linguaggi formali per la definizione di ontologie, per supportare il ragionamento su di esse ed interrogarle:

OWL (Web Ontology Language) è un linguaggio di markup per rappresentare esplicitamente ontologie (semantica formale di termini e relazioni tra i termini).

RDF produce specifiche di contenuto grazie alle triple (soggetto-predicato-oggetto)

Page 21: 9a. Il web semantico

21

OWL: Web Ontology Language

Il Web Ontology Language (OWL) è un linguaggio di markup

per rappresentare esplicitamente le ontologie (ovvero il significato dei termini e relazioni tra i termini).

L'obiettivo è supportare l’elaborazione automatica del contenuto delle informazioni dei documenti scritti in OWL

OWL è un linguaggio di rappresentazione della conoscenza

Page 22: 9a. Il web semantico

22

Principali caratteristiche di OWL

ClassisubClassOf, intersectionOf, unionOf, complementOf,enumeration, equivalence, disjointProprietàsymmetric, transitive, functional, inverse Functionalrange, domain, subPropertyOf, inverseOf,equivalentPropertyAffermazioni sulle istanzesameIndividualAs, differentFrom, AllDifferent

Page 23: 9a. Il web semantico

23

WEB SEMANTICO: la struttura dei dati

lo standard 

Resource Description Framework (RDF)

è una struttura organizzativa dei dati

che standardizza la definizione

di relazioni tra informazioni

Page 24: 9a. Il web semantico

24

WEB SEMANTICO: cos’è l’RDF

RDF ovvero Resource Description Framework

RDF (Resource Description Framework) è uno standard proposto dal W3C come set di linguaggi dichiarativi basato su sintassi XML ed adatto a descrivere la struttura di una parte della realtà. Per realtà intendiamo qualsiasi risorsa sia possibile identificare sulla rete con un indirizzo univoco, mentre per descrizione indichiamo l'insieme delle proprietà, degli attributi e delle relazioni con altre realtà.

RDF è lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati, e consente l'interoperabilità tra applicazioni che si scambiano sul Web informazioni machine-understandable.

Page 25: 9a. Il web semantico

RDF

Resource Description FrameworkUno schema per definire l’informazione.

RDF fornisce la tecnologia per esprimere il significato di termini e concetti in una forma che i computer possono elaborare. RDF utilizza il linguaggio XML per la sua sintassi e gli URI per le specifiche entità, concetti, proprietà e relazioni.

25

Page 26: 9a. Il web semantico

26

Le “triple” RDF

L’RDF è un linguaggio che rappresenta delle relazioni. La rappresentazione più semplice di una relazione è data dalla “tripla” soggetto/predicato/oggetto. Ciò che rende speciale le triple RDF è che ogni loro elemento è associato a un URI.

Page 27: 9a. Il web semantico

27

WEB SEMANTICO. Il modello RDFRDF (Resource Description Framework) e RDF Schema costituiscono il modello più utile per descrivere le risorse e i loro tipi nel web semantico.

Un RDF-based data model è più idoneo ad esprimere certi tipi di rappresentazione della conoscenza di quanto non lo

siano il modello relazionale ed altri modelli ontologici.

Page 28: 9a. Il web semantico

I tre principi dell’RDF

Il Resource Description Framework (RDF) è un framework per la descrizione della conoscenza sul web. Esso è stato specificatamente creato per la descrizione dei metadati relativi alle risorse. RDF è sostanzialmente un modello formale di dati dotato di sintassi di interscambio, un sistema di schemi di tipo ed un linguaggio d’interrogazione

L’RDF si basa su tre principi chiave:• Qualunque cosa può essere identificata da un URI (Universal Resource Identifier)   

• The least power: utilizzare il linguaggio meno espressivo per definire qualunque cosa

• Qualunque cosa può dire qualunque cosa su qualunque cosa28