Post on 01-May-2015
Modulo3 Modulo3 Linguaggi: RDFLinguaggi: RDF
UNIVERSITA’ DI CAMERINOCorso di laurea in Informatica (classe 23/S)
Barbara Rebarbara.re@unicam.it
Anno Accademico 2007-08
2
Agenda
RDF – overview RDF – costrutti del linguaggio
3
I linguaggi per la rappresentazione della conoscenza
Si utilizzano logiche descrittive intese come una famiglia di formalismi utilizzati per rappresentare la conoscenza in un dominio di applicazione detto mondo
Più recentemente le logiche descrittive sono state utilizzate come formalismo di base per lo sviluppo degli standard promossi dalla Semantic Web initiative group del W3C
4
Linguaggi di rappresentazione
5
Linguaggi
I linguaggi forniscono meccanismi base che possono essere usati per rappresentare la semantica delle informazioni necessarie per il Semantic Web
XML RDF RDF(S) OWL …
XML
RDF
RDF(S)
OWL AN
NO
TA
ZIO
NE
INTEG
RA
ZIO
NE
INFE
REN
ZA
6
Formal Languages
Il grado di formalità dei linguaggi ontologici cambia sostanzialmente
Tanto più si è formali tanto più il linguaggio è suscettibile di “processamento” automatico
La semantica formale fornisce una interpretazione non ambigua delle descrizioni
7
RDF
RDF sta per Resource Description Framework
E’ una raccomandazione W3Chttp://www.w3.org/RDF
RDF è un formalismo grafico (+ sintassi xml + semantica)
Per rappresentare metadatiPer rappresentare la semantica delle informazioni in modalità accessibili dalla macchina
Fornisce un semplice data model basato su triple
8
RDF: come possibile approccio all’interoperabilità strutturale
RDF si propone come un’hub da usare per gestire i costrutti strutturali al posto di numerose integrazioni ad hoc
Source: Tim Berners Lee
http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/Overview.html
9
RDF – modello di dati
RDF mette a disposizione un modello di dati semplice <soggetto, predicato, oggetto>
<Barbara, ha collega, Francesco> Può essere rappresentato come grafo
… e molto flessibile si possono codificare
10
Che cos’è RDF
RDFCome HTML, permette di creare dei link tra risorse pubblicati sul WebAl contrario dei comuni ipertesti i link di RDF
Possono essere etichettati, al fine di indicare esplicitamente la relazione che intercorre tra gli oggettiSi riferiscono a oggetti tipizzati, nel senso che RDF standardizza la modalità con cui si assegna un significato alla risorsa
11
RDF: un esempio guida
Il modello RDF rende disponibile un meccanismo per descrivere in modo machine- processable risorse Web, ad esempio, pagine Web
Esempio Immaginiamo di voler tener traccia del fatto
che qualcuno di nome Mario Rossi ha creato una certa pagina Web (http://www.example.org/index.html)
Se dovessimo descrivere questo fatto in linguaggio naturale potremmo utilizzare una semplice frase:
12
La terminologia
In RDF per identificareLa frase si usa il termine stantmentLa parte che identifica ciò di cui la frase parla si usa soggettoLa parte che identifica la proprietà del soggetto che la frase specifica si usa predicatoLa parte che identifica il valore assegnato dalla frase alla proprietà si usa oggetto
13
Machine processability (1)
Delle frasi in linguaggio naturale possono servire uomini per comunicare, ma lo scopo di RDF è rendere queste frasi “machine-processable”
Per rendere frasi simili a quelle precedenti machine processable occorre
degli identificativi “machine-processable” che permettano di identificare il soggetto, l’oggetto e il predicato in una frase senza nessuna possibilità di confusione con un altro identificativo simile usato da qualcun altro sul Webun formato “machine-processable” per rappresentare e scambiare le frasi tra macchine
14
Machine processability (2)
Il web di oggi dispone di entrambi i meccanismi
gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF
Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF
15
Machine processability
Il web di oggi dispone di entrambi i meccanismi
gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF
Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF
16
Tutto deve avere un URI
Per scrivere
Occorre assegnare un URI a tutte (o quasi) le parti sottolineate della frase
Nello stantment RDF di esempio:Il soggetto è già un URIIl valore (l’oggetto) “Mario Rossi” potrebbe essere identificato dall’URI URN:org:example:staffid:85740Per il predicato “autore” si può utilizzre l’URI http://purl.org/dc/element/1.1/creator
17
Tutto deve avere un URI
Risultato
19
Uso dei namespace
E’ possibile abbreviare le URI facendo uso dei prefissi dei namespace di XML
EsempioLo stantment
Introducendo i seguenti prefissi per i tre namespace
diventa
20
Oggetti come URI (1)
Ci sono molti vantaggi nell’utilizzare gli URI come semplice modalità di identificazione
Invece di Identificare l’autore come la stringa “Mario Rossi”Si può usare l’URI sid:85740
In questo caso1. Possiamo essere più precisi nella nostra idenficazione
dell’autore della paginaNon è una stringa “Mario Rossi” o qualcuna delle migliaia di persone che si chiamano “Mario Rossi”Ma in particolare “Mario Rossi” è associato all’URI
21
Oggetti come URI (2)
2. Dal momento che l’autore della pagina ha un URI, è a tutti gli effetti una risorsa, e possiamo descriverla ulteriormente assegnandogli, ad esempio, il nome, l’eta, …
22
Quasi tutto deve avere un URI
Il soggetto e il predicato di ogni stantment devono essere delle risorse, quindi devono avere un URI
L’oggetto può anche essere un valore La terminologia di RDF utilizza il termine Letterale (litteral)
23
Tipizzare le risorse
Per tipizzare una risorsa si usa la proprietà rdf:type
24
Machine processability
Il web di oggi dispone di entrambi i meccanismi
gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF
Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF
25
Sintassi XML di RDF
L’idea di base prevede un elemento XML per ogni nodo (soggetto e oggetto) e arco (predicato)
26
Sintassi XML di RDF
Una possibile abbreviazione prevede l’uso dell’attributo rdf:resource nei poperty element
27
Sintassi XML di RDF
Altri stantment
Si possono serializzareSempre di seguito
Nel caso in cui si descriva l’oggetto del primo anche innestandoli
28
Sintassi XML di RDF
Risorse tipizzate
29
Sintassi XML di RDF
30
RDF -
<rdf:Description rdf:about=“ex:index.html”>
<dc:creator rdf:resource=“sid:85740”/>
<rdf:type rdf:resource=“ex:pagina_web”/>
</rdf:Description>
<rdf:Description rdf:about=“sid:85740”>
<foaf:email rdf:resource=“mailto:mrossi@example.org”>
<rdf:type rdf:resource=“ex:impiegato”>
</rdf:Description>
----------------------------------------------------------------------------------------------------------------------------------------------------------
<rdf:Description rdf:about=“ex:index.html”>
<dc:creator>
<rdf:Description rdf:about=“sid:85740”>
<foaf:email rdf:resource=“mailto:mrossi@example.org”>
<rdf:type rdf:resource=“ex:impiegato”>
</rdf:Description>
</dc:creator>
<rdf:type rdf:resource=“ex:pagina_web”>
</rdf:Description>
31
Attenzione i letterali
<rdf:Description rdf:about=“ex:index.html”>
<dc:creator> Mario Rossi </dc:creator>
</rdf:Description>
32
Documento RDF completo
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:s="http://description.org/schema/">
<rdf:Description about="http://www.w3.org/Home/Lassila">
<s:Creator>Ora Lassila</s:Creator>
</rdf:Description> </rdf:RDF>
33
Sintassi N-Triple di RDF
La sintassi XML di RDFÈ utile per far leva sui numerosi tool già sviluppati per XMLMa non è semplice distinguere i vari stantment e in particolare isolare soggetto, predicato e oggetto
Per scopi didattici, o in generale quando occorre leggere RDF, si può utilizzare la sintassi N-Triple
Ogni statment si scrive come una tripla
34
Sintassi N-Triple di RDF: esempio
Es. l’esempio guida in N-triple
Fissando i prefissi
La tripla diventa
35
Alcuni vocabolari
36
RDF come Hub
RDF può essere utilizzato come “Hub”Abilita un buon grado di interoperabilità strutturale
Ovvero i vari sistemi informativi, che condividono lo stesso modello RDF, possono scegliere indipendentemente il formato più adatto all’informazione che intendono scambiare
È molto semplice fondere (merge) modelli RDF
Ovvero non ci sono ostacoli nel combinare informazione preveniente da sistemi differenti (quindi anche in formati diversi), purchè questi condividano lo stesso modello RDF
37
Esempio di interoperabilità strutturale otttenuta via RDF
38
Esempio di interoperabilità strutturale otttenuta via RDF
39
Esempio di interoperabilità strutturale otttenuta via RDF
40
Esempio di fusione (merge)
41
Esempio di fusione (merge)
42
Esempio di fusione (merge)
43
Protegè
http://protege.stanford.edu/
44
Ci sono domande?
45
Qualche dettaglio in più!
46
RDF:Sintassi di serializzazione di base
[1] RDF ::= ['<rdf:RDF>'] description* ['</rdf:RDF>']
[2] description ::= '<rdf:Description' idAboutAttr? '>' propertyElt* '</rdf:Description>'
[3] idAboutAttr ::= idAttr | aboutAttr
[4] aboutAttr ::= 'about="' URI-reference '"'
[5] idAttr ::= 'ID="' IDsymbol '"'
[6] propertyElt ::='<' propName '>' value '</' propName '>' | '<' propName resourceAttr '/>'
[7] propName ::= Qname
[8] value ::= description | string
[9] resourceAttr ::= 'resource="' URI-reference '"'
[10] Qname ::= [ NSprefix ':' ] name
[11] URI-reference ::= string, interpreted per [URI]
[12] IDsymbol ::= (any legal XML name symbol)
[13] name ::= (any legal XML name symbol)
[14] NSprefix ::= (any legal XML namespace prefix)
[15] string ::= (any XML text, with "<", ">", and "&" escaped)
47
Elemento RDF
L'elemento RDF è un semplice involucro che delimita i confini in un documento XML entro cui il contenuto è esplicitamente da intendere mappabile in una istanza di modello di dati RDF
L'elemento RDF è opzionale se il contenuto può essere riconosciuto come RDF dal contesto dell'applicazione
48
Elemento Description
Raramente una singola asserzione RDF compare isolata; più comunemente diverse proprietà di una risorsa saranno date insieme
La sintassi XML di RDF è stata progettata per compiere questo facilmente raggruppando le molteplici asserzioni riguardanti la stessa risorsa all'interno di un elemento Description
L'elemento Description indica, tramite l'attributo about, la risorsa alla quale si applicano tutte le asserzioni
Se la risorsa non esiste ancora (ovvero, non ha ancora un identificatore), allora l'elemento Description può fornire l'identificatore della risorsa usando un attributo ID
49
Description e propertyElt
L'attributo ID indica la creazione di una nuova risorsa e l'attributo about si riferisce ad una risorsa esistente
In Description è possibile specificare o ID o about, ma non entrambi contemporaneamente nello stesso elemento
I valori per ogni attributo ID non devono apparire in più di un attributo ID all'interno del singolo documento
Un elemento Description può contenere più di un elemento propertyElt con lo stesso nome di proprietà
Ciascuno di questi propertyElt aggiunge un arco al grafoL'interpretazione di questo grafo è definita da chi progetta lo schema
50
propertyElt
All'interno di un propertyElt, l'attributo resource specifica che un'altra risorsa è il valore di questa proprietà
l'oggetto della asserzione, piuttosto che un letterale è un'altra risorsa identificata da un URI
L'identificatore di risorsa dell'oggetto è ottenuto risolvendo il riferimento-URI dell'attributo resource in modo analogo a quanto indicato sopra per l'attributo about
51
Contenitori
Spesso è necessario riferirsi ad una collezione di risorse
Per esempio per dire che un'opera è stata creata da più di una persona, o per elencare gli studenti di un corso, o i moduli di un pacchetto software
Si usano i contenitori RDFBag Sequence Alternative
52
Bag
Lista non ordinata di risorse o letterali Si usano per dichiarare che una proprietà ha valori
multipli e che l'ordine con cui questi valori sono inseriti non ha alcun significato
Il contenitore bag potrebbe essere usato per fornire una lista di numeri di sezioni dove l'ordine di elaborazione di queste sezioni non è importante
Sono ammessi valori duplicati
53
Sequence
Lista ordinata di risorse o letterali Il contenitore Sequence si usa per dichiarare che
una proprietà ha valori multipli e che l'ordine dei valori è significativo
Il contenitore Sequence potrebbe essere usato, per esempio, per conservare un ordine alfabetico dei valori
Sono ammessi valori duplicati
54
Alternative
Una lista di risorse o letterali che rappresentano delle alternative al valore (singolo) di una proprietà
Il contenitore Alternative potrebbe essere impiegato
per indicare traduzioni in altre lingue del titolo di un'operaper fornire una lista di siti Internet mirror nei quali è reperibile la risorsa
Un'applicazione che usa una proprietà il cui valore è un raccolta di tipo Alternative sa di poter selezionare uno fra gli oggetti presenti nella lista
55
Collezione di risorse
Per rappresentare una collezione di risorse, RDF adopera una risorsa aggiuntiva che identifica la collezione specifica
Questa risorsa deve essere dichiarata Per formulare questa dichiarazione si utilizza la proprietà
type La relazione di appartenenza fra questa risorsa-
contenitore e le risorse che fanno parte della collezione è definita attraverso un insieme di proprietà espressamente definite per questo scopo
Queste proprietà di appartenenza sono indicate semplicemente con "_1", "_2", "_3", etc.
Le risorse contenitore possono anche avere altre proprietà, oltre alla proprietà di appartenenza e alla proprietà tipo
56
Esempio: Bag
Gli studenti del corso 6.001 sono Amy, Tim, John, Mary, e Sue
57
Esempio: alternative
Il codice sorgente per X11 può essere trovato a ftp.x.org, ftp.cs.purdue.edu, o ftp.eu.net
58
… esempi
<rdf:RDF> <rdf:Description about="http://mycollege.edu/courses/6.001"> <s:students>
<rdf:Bag> <rdf:li resource="http://mycollege.edu/students/Amy"/> <rdf:li resource="http://mycollege.edu/students/Tim"/> <rdf:li resource="http://mycollege.edu/students/John"/> <rdf:li resource="http://mycollege.edu/students/Mary"/> <rdf:li resource="http://mycollege.edu/students/Sue"/> </rdf:Bag>
</s:students> </rdf:Description> </rdf:RDF>
Nota che RDF/XML usa l'elemento li per evitare di dover numerare esplicitamente ciascun componente
L'elemento li assegna - se necessario - le proprietà _1, _2, etc
Il nome dell'elemento li è stato scelto per richiamare il termine "list item" di HTML
Gli studenti del corso 6.001 sono Amy, Tim, John, Mary, e Sue.
59
… esempi
Il codice sorgente per X11 può essere trovato a ftp.x.org, ftp.cs.purdue.edu, o ftp.eu.net
<rdf:RDF> <rdf:Description about="http://x.org/packages/X11"> <s:DistributionSite> <rdf:Alt> <rdf:li resource="ftp://ftp.x.org"/> <rdf:li resource="ftp://ftp.cs.purdue.edu"/> <rdf:li resource="ftp://ftp.eu.net"/> </rdf:Alt> </s:DistributionSite> </rdf:Description> </rdf:RDF>
60
Contenitori versus proprietà ripetute
Una risorsa può avere asserzioni multiple con lo stesso predicato
Ciò non equivale ad avere una singola asserzione il cui oggetto sia un contenitore con molti componenti
La scelta sul sistema da adottare in ogni circostanza particolare è in parte fatta dalle persone che progettano lo schema e in parte dalle persone che scrivono le specifiche asserzioni RDF
61
Esempio: proprietà ripetute
Consideriamo, ad esempio, la relazione fra una scrittrice e le sue pubblicazioni
Sue ha scritto "Anthology of Time", "Zoological Reasoning", "Gravitational Reflections"
Non viene dichiarata nessuna relazione tra le pubblicazioni, se non quella che sono tutte state scritte dalla stessa persona
62
Esempio: meglio Bug
Il comitato composto da Fred, Wilma, e Dino ha approvato la risoluzione
Afferma che i tre membri del comitato, considerati come un unico insieme, hanno votato in una certa maniera
Non si afferma, ovvero, necessariamente che ciascun membro del comitato ha votato a favore della risoluzione
Sarebbe scorretto modellare questa proposizione con tre separate asserzioni "approvedBy", una per ciascuno dei membri del comitato, quindi come tre voti individuali di approvazione
Piuttosto, è meglio modellare come una singola asserzione di "approvedBy" il cui oggetto è un contenitore Bag che ha come componenti le tre identità dei membri del comitato
63
Graficamente
La scelta su quale rappresentazione adoperare, Bag o ripetizione di proprietà, è fatta da colui che crea i metadati dopo aver considerato lo schema
64
Asserzioni su asserzioni
Oltre che per creare asserzioni su risorse Web, RDF può essere usato per fare asserzioni su altre asserzioni RDF
Ci riferiremo a queste come asserzioni di ordine maggiore
Per fare un asserzione su un'altra asserzione, in effetti abbiamo la necessità di costruire un modello dell'asserzione originale
questo modello è una nuova risorsa alla quale possiamo aggiungere altre proprietà
65
Costruzione di un modello di asserzioni
Le asserzioni sono fatte su risorse Un modello di un'asserzione è la risorsa di cui
abbiamo bisogno per poter fare nuove asserzioni (asserzioni di ordine maggiore) sull'asserzione modellata
66
Modello di asserzioni: esempi
Per esempio, consideriamo la frase Ora Lassila è il creatore della risorsa
http://www.w3.org/Home/Lassila. RDF considererebbe questa frase come un fatto Se, invece, scriviamo la frase Ralph Swick dice che Ora Lassila è il creatore della
risorsa http://www.w3.org/Home/Lassila. Non abbiamo detto nulla della risorsa
http://www.w3.org/Home/Lassila, ma abbiamo espresso un fatto circa un'asserzione fatta da Ralph
Per esprimere questo fatto a RDF, dobbiamo modellare l'asserzione originale come una risorsa con quattro proprietà
Questo processo è formalmente chiamato reificazione nella comunità della Rappresentazione della Conoscenza
Un modello di un'asserzione è detto asserzione reificata
67
Proprietà per asserzioni
Per modellare asserzioni RDF definisce le seguenti proprietà
Soggetto PredicatoOggettoTipo
68
Soggetto e predicato
La proprietà soggetto identifica la risorsa che viene descritta dall'asserzione modellata
il valore della proprietà soggetto è la risorsa su cui è stata fatta l'asserzione originale (nel nostro esempio, http://www.w3.org/Home/Lassila)
La proprietà predicato identifica il valore della proprietà nella asserzione modellata
il valore della proprietà predicato è una risorsa che rappresenta la specifica proprietà nell'asserzione originale (nel nostro esempio, creatore)
69
Oggetto e tipo
La proprietà oggetto identifica il valore della proprietà nell'asserzione modellata
Il valore della proprietà oggetto è l'oggetto nell'asserzione originale (nel nostro esempio, "Ora Lassila")
Il valore della proprietà tipo descrive il tipo della nuova risorsa
Tutte le asserzioni reificate sono istanze di RDF:Statement; ovvero, hanno una proprietà tipo il cui oggetto è RDF:StatementLa proprietà tipo è usata anche più generalmente per dichiarare il tipo di una qualsiasi risorsa
70
Asserzioni RDF
Una nuova risorsa con queste quattro proprietà rappresenta l'asserzione originale e può essere usata
come oggetto di altre asserzioni può avere asserzioni addizionali fatte su essa
La risorsa con queste quattro proprietà non è una sostituzione dell'asserzione originale, è un modello dell'asserzione
Un'asserzione e la sua corrispondente asserzione reificata esistono indipendentemente in un grafo RDF ed entrambi possono essere presenti senza l'altra
Si dice che il grafo RDF contiene il fatto dato nell'asserzione se e solo se l'asserzione è presente nel grafo, senza preoccuparsi della presenza della corrispondente asserzione reificata
71
Esempio…
Ralph Swick dice che OraLassila è il creatore dellaRisorsahttp://www.w3.org/Home/Lassila
72
Ci sono domande?