3c WEB SEMANTICO. Ontologie e RDF

28
WEB SEMANTICO: Ontologie e RDF SAPIENZA UNIVERSITA’ DI ROMA DIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO- FILOLOGICHE E GEOGRAFICHE SCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARI Anno accademico 2012-2013 Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHE Prof. Giovanni Solimine Modulo integrativo INFORMATICA PER LE BIBLIOTECHE Prof. Maurizio Caminito 1

description

SAPIENZA UNIVERSITA’ DI ROMA DIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE E GEOGRAFICHE SCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARI Anno accademico 2012-2013   Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHE Prof. Giovanni Solimine    Modulo integrativo INFORMATICA PER LE BIBLIOTECHE Prof. Maurizio Caminito

Transcript of 3c WEB SEMANTICO. Ontologie e RDF

Page 1: 3c WEB SEMANTICO. Ontologie e RDF

WEB SEMANTICO: Ontologie e RDF

SAPIENZA UNIVERSITA’ DI ROMA DIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE E

GEOGRAFICHESCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARI

Anno accademico 2012-2013

Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHEProf. Giovanni Solimine

Modulo integrativo

INFORMATICA PER LE BIBLIOTECHEProf. Maurizio Caminito

1

Page 2: 3c WEB SEMANTICO. Ontologie e RDF

2

Il Web Semantico ha una architettura a livelli

Il Web Semantico è un sistema controllato di organizzazione di dati.Adotta una serie di standard:

Al livello superiore si pone il livello ontologico. Una ontologia descrive le relazioni tra i tipi di elementi

• lo standard URI (Uniform Resource Identifiers), per la definizione univoca di indirizzi Internet

• l’RDF (Resource Description Framework) e RDF Schema, che costituiscono il linguaggio per descrivere le risorse e i loro tipi (derivano da XML).

Page 3: 3c WEB SEMANTICO. Ontologie e RDF

3

La piramide del WEB SEMANTICO

L’architettura del Web Semantico si compone di vari livelli:

• i dati• i metadati • i concetti che esprimono le relazioni fra i dati• un linguaggio che descriva la struttura dei dati

Page 4: 3c WEB SEMANTICO. Ontologie e RDF

4

L’architettura del WEB SEMANTICO

E’ importante lo schema utilizzato per archiviare le informazioni.

Lo schema RDF è un insieme di regole sull'organizzazione dei dati. Definisce relazioni fra i dati.

I metadati devono mappare i dati rispetto a classi, o concetti, di questo schema.

In questo modo si hanno strutture in grado di descrivere e automatizzare i collegamenti esistenti fra i dati.

Il Web Semantico è, come l'XML, un ambiente dichiarativo, in cui si specifica il significato dei dati.

La semantica dei dati consiste nel dare alla macchina delle informazioni utili in modo che essa possa utilizzare i dati nel modo corretto.

Page 5: 3c WEB SEMANTICO. Ontologie e RDF

5

Gli standard del WEB SEMANTICO

Il consorzio W3C ha prodotto una serie di standard

per descriver e organizzare i metadati semantici:

l’RDF e l’OWL.

Page 6: 3c WEB SEMANTICO. Ontologie e RDF

6

Il Web Semantico e i livelli di controllo

Prevede dei livelli di controllo e validazione interna:

• Adotta la firma digitale • Prevede un livello di “proof”• Porta ad un risultato univoco e credibile (livello

“trust”)

Page 7: 3c WEB SEMANTICO. Ontologie e RDF

7

WEB SEMANTICOIl Web Semantico ha una architettura a livelli

3

Page 8: 3c WEB SEMANTICO. Ontologie e RDF

URI: il primo mattone

L’architettura del Web Semantico si basa su una pila di tecnologie, primo concetto delle quali è il fatto che in rete è possibile assegnare un riferimento univoco – URI - a qualsiasi cosa.

Anche una persona può essere rappresentata tramite l’indirizzo della sua pagina web o quello della sua casella di posta elettronica (o un quadro può essere rappresentato da una foto o dalla documentazione pubblicata sul sito del museo che lo conserva).

8

Page 9: 3c WEB SEMANTICO. Ontologie e RDF

9

MEMO: cos’è l’URI

URI è acronimo di Uniform Resource Identifier: un indirizzo che, in forma compatta, consente di

identificare una qualsiasi risposta come una pagina web, un documento, un'immagine, un indirizzo e-mail e così via. Gli URI sono definiti utilizzando una

specifica sintassi, facente riferimento all'uso di differenti protocolli. URL (Uniform Resource

Locator) e URN (Uniform Resource Name) possono essere considerati sottoinsiemi di URI.

Page 10: 3c WEB SEMANTICO. Ontologie e RDF

10

L’ONTOLOGIA

• ONTOLOGIA in filosofia:si riferisce alla struttura, all’essenza e alle proprietà dell’ESSERE (ontos + logos), di ciò che esiste.

• ONTOLOGIA in informatica:una descrizione formale di un insieme di concetti e delle relazioni che intercorrono tra essi.

Page 11: 3c WEB SEMANTICO. Ontologie e RDF

11

Ontologia: alcune definizioni 1

Un’ONTOLOGIA è una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse, le regole, gli assiomi ed i vincoli specifici del dominio.

Page 12: 3c WEB SEMANTICO. Ontologie e RDF

12

Ontologia: alcune definizioni 2

“L’ontologia e’ come un vocabolario (tassonomia) di

concetti, che rappresenta un determinato dominio di

interesse, dotato di un insieme di relazioni tra i concetti

stessi che consentono di capire come sono legati fra

loro” [Josephson&other, 99]

«Un’ontologia e’ una collezione di frasi che definiscono

le relazioni tra concetti e specificano le regole logiche» [Tim Berners-Lee, 99]

Page 13: 3c WEB SEMANTICO. Ontologie e RDF

13

WEB SEMANTICO: un esempio di applicazione di ontologie

Si può fare una ricerca del tipo: quali sono… le aziende (soggetto)

che hanno come servizio (predicato) la fornitura di scarpe (oggetto)?

N.B. Questa query è diversa da quella che si potrebbe fare ad un motore di ricerca, a cui si propongono le tre parole: azienda, servizio e scarpe, ma senza mai esprimere il legame fra di essi. Da qui derivano appunto le imprecisioni dei motori di ricerca.

Page 14: 3c WEB SEMANTICO. Ontologie e RDF

14

WEB SEMANTICO: le Ontologie

ONTOLOGIE(descritte con l’OWL Web Ontology Language)

sono collezioni di informazioni.

I più comuni tipi di ontologia per il Web:

• tassonomia (definisce classi e sottoclassi di oggetti) • regole di inferenza (definisce relazioni tra di entità)

Page 15: 3c WEB SEMANTICO. Ontologie e RDF

15

ONTOLOGIE: Proprieta’ e attributi

Es.: FAMIGLIA Rappresentare le relazioni esistenti tra le classi del dominio (es. “le MADRI sono GENITORI”, “i GENITORI hanno figli che sono PERSONE”…)

FEMMINA

MADRE

DONNA

PERSONA

GENITORE

PADRE

ha_figli

(1,n)

is_a

Page 16: 3c WEB SEMANTICO. Ontologie e RDF

16

Elementi delle ontologie

Il contenuto di un’ontologia è rappresentato da:

Un insieme di classi (concetti – astrazioni del mondo reale).

Un insieme di relazioni (tra 2 classi); un esempio è la relazione IS_A

Un insieme di assiomiUn insieme di individui

Page 17: 3c WEB SEMANTICO. Ontologie e RDF

17

Ontologie: metodologia per la loro “costruzione”

Steps [1]

Determinare il dominio e lo scopo dell’ontologia Elencare i termini principali dell’ontologia Definire le classi e la gerarchia tra le classi Definire le proprietà delle classi Definire vincoli sulle proprietà Creare le istanze

[1]Noy, McGuinness, “Ontology Development 101: A Guide to Creating Your First Ontology ”,2001

Page 18: 3c WEB SEMANTICO. Ontologie e RDF

18

Creare una ontologia

Es.: creare una ontologia del mondo universitario.

Supporre che l’ontologia verrà utilizzata da una segreteria didattica, per tener traccia dei corsi, dei professori che insegnano i corsi e degli studenti che li seguono. Devono essere quindi rappresentate le entità più importanti del mondo (personale docente, professori, professori ordinari, professori associati, ricercatori, studenti, corsi, …) e le relazioni che intercorrono tra di essi

Page 19: 3c WEB SEMANTICO. Ontologie e RDF

19

Il WEB SEMANTICO e l’ONTOLOGIA “Star Wars”

Page 20: 3c WEB SEMANTICO. Ontologie e RDF

20

WEB SEMANTICO Linguaggi di gestione delle ontologie

Principali linguaggi formali per la definizione di ontologie, per supportare il ragionamento su di esse ed interrogarle:

OWL (Web Ontology Language) è un linguaggio di markup per rappresentare esplicitamente ontologie (semantica formale di termini e relazioni tra i termini).

RDF produce specifiche di contenuto grazie alle triple (soggetto-predicato-oggetto)

Page 21: 3c WEB SEMANTICO. Ontologie e RDF

21

OWL: Web Ontology Language

Il Web Ontology Language (OWL) è un linguaggio di markup

per rappresentare esplicitamente le ontologie (ovvero il significato dei termini e relazioni tra i termini).

L'obiettivo è supportare l’elaborazione automatica del contenuto delle informazioni dei documenti scritti in OWL

OWL è un linguaggio di rappresentazione della conoscenza

Page 22: 3c WEB SEMANTICO. Ontologie e RDF

22

Principali caratteristiche di OWL

ClassisubClassOf, intersectionOf, unionOf, complementOf,enumeration, equivalence, disjointProprietàsymmetric, transitive, functional, inverse Functionalrange, domain, subPropertyOf, inverseOf,equivalentPropertyAffermazioni sulle istanzesameIndividualAs, differentFrom, AllDifferent

Page 23: 3c WEB SEMANTICO. Ontologie e RDF

23

WEB SEMANTICO: la struttura dei dati

lo standard 

Resource Description Framework (RDF)

è una struttura organizzativa dei dati

che standardizza la definizione

di relazioni tra informazioni

Page 24: 3c WEB SEMANTICO. Ontologie e RDF

24

WEB SEMANTICO: cos’è l’RDF

RDF ovvero Resource Description Framework

RDF (Resource Description Framework) è uno standard proposto dal W3C come set di linguaggi dichiarativi basato su sintassi XML ed adatto a descrivere la struttura di una parte della realtà. Per realtà intendiamo qualsiasi risorsa sia possibile identificare sulla rete con un indirizzo univoco, mentre per descrizione indichiamo l'insieme delle proprietà, degli attributi e delle relazioni con altre realtà.

RDF è lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati, e consente l'interoperabilità tra applicazioni che si scambiano sul Web informazioni machine-understandable.

Page 25: 3c WEB SEMANTICO. Ontologie e RDF

RDF

Resource Description FrameworkUno schema per definire l’informazione.

RDF fornisce la tecnologia per esprimere il significato di termini e concetti in una forma che i computer possono elaborare. RDF utilizza il linguaggio XML per la sua sintassi e gli URI per le specifiche entità, concetti, proprietà e relazioni.

25

Page 26: 3c WEB SEMANTICO. Ontologie e RDF

26

Le “triple” RDF

L’RDF è un linguaggio che rappresenta delle relazioni. La rappresentazione più semplice di una relazione è data dalla “tripla” soggetto/predicato/oggetto. Ciò che rende speciale le triple RDF è che ogni loro elemento è associato a un URI.

Page 27: 3c WEB SEMANTICO. Ontologie e RDF

27

WEB SEMANTICO. Il modello RDFRDF (Resource Description Framework) e RDF Schema costituiscono il modello più utile per descrivere le risorse e i loro tipi nel web semantico.

Un RDF-based data model è più idoneo ad esprimere certi tipi di rappresentazione della conoscenza di quanto non lo

siano il modello relazionale ed altri modelli ontologici.

Page 28: 3c WEB SEMANTICO. Ontologie e RDF

I tre principi dell’RDF

Il Resource Description Framework (RDF) è un framework per la descrizione della conoscenza sul web. Esso è stato specificatamente creato per la descrizione dei metadati relativi alle risorse. RDF è sostanzialmente un modello formale di dati dotato di sintassi di interscambio, un sistema di schemi di tipo ed un linguaggio d’interrogazione

L’RDF si basa su tre principi chiave:• Qualunque cosa può essere identificata da un URI (Universal Resource Identifier)   

• The least power: utilizzare il linguaggio meno espressivo per definire qualunque cosa

• Qualunque cosa può dire qualunque cosa su qualunque cosa28