SEMANTIC WEB
Antonio BucchiaroneFBK-IRSTTrento, Italy
13 Novembre 2009
Il web semantico - I
In un certo senso abbiamo bisogno di un web che sia computer-friendly per essere più user-friendly
Più le macchine saranno in grado di interpretare autonomamente le informazioni della rete più efficaci saranno i loro servizi a: trovare informazioni pertinenti prendere decisioni
Il web semantico - II
[WIKIPEDIA]: Con il termine web semantico, termine coniato dal suo ideatore, Tim Berners-Lee, si intende la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e così via) siano associati ad informazioni e dati (metadati) che ne specifichino il contesto semantico in un formato adatto all'interrogazione, all'interpretazione e, più in generale, all'elaborazione automatica.
Con l'interpretazione del contenuto dei documenti che il Web Semantico propone, saranno possibili ricerche molto più evolute delle attuali, basate sulla presenza nel documento di parole chiave, ed altre operazioni specialistiche come la costruzione di reti di relazioni e connessioni tra documenti secondo logiche più elaborate del semplice link ipertestuale.
Metadati per il web semantico Una risorsa dovrebbe fornire informazioni
su se stessa queste sono anche chiamate "metadati" i metadati sono conservati in XML, o in un'altra
forma leggibile dalle macchine dovrebbero essere definiti i vocabolari di
metadati gli agenti dovrebbero essere in grado di
"ragionare" sui (meta)dati Il "Web Semantico" è un'infrastruttura
basata sui metadati per ragionare sul Web Esso estende il Web attuale (e non lo
sostituisce)
Relazione tra documenti
con XML è possibile descrivere adeguatamente i contenuti di un documento ma la sintassi XML non definisce alcun meccanismo esplicito per qualificare le relazioni tra documenti.
In questo non è di aiuto neppure il meccanismo dei collegamenti ipertestuali reso popolare dall'HTML in quanto non prevede la possibilità di descrivere il legame definito.
In altre parole, sebbene in un documento (ad es. una pagina HTML) sia possibile parlare di un Signor Ciampi ed esprimere semanticamente questo con opportuni tag, è poi difficile capire se due documenti che parlano di un Signor Ciampi si riferiscono alla stessa persona con conseguente scarsa qualità dei risultati restituiti dai motore di ricerca.
Le tecnologie per il web
Il sw utilizza una serie di tecnologie di cui alcune sono ancora in fase sperimentale
Alcune tecnologie sono XML RDF DTD XSL XPATH XHTML …
XML è …
XML = eXtensible Markup Language XML può essere definito in molti modi diversi XML è una sintassi per marcare i documenti XML è una famiglia di tecnologie correlate XML consente di
aggiungere metadati (semantica) ai propri dati separare il contenuto dalla presentazione definire in maniera rigorosa il linguaggio di
markup utilizzato utilizzare un formato neutrale e testuale
… ma da solo XML non è sufficiente ...
XML è troppo flessibile mentre è necessario un modello estremamente semplice per esprimere delle conoscenze processabili automaticamente
HTML è estremamente semplice ma non flessibile e perciò può solo rappresentare informazioni senza tener conto della semantica
XML non è facile come HTML
Può essere un limite? Con HTML chiunque poteva pubblicare in
Web XML è complesso e non tutti saranno in
grado di utilizzarlo Ritorno all’epoca pre-Web? O selezione obbligata di ciò che verrà
pubblicato?
Resource Description Framework (RDF)
RDF è un modello di metadati RDF è una piattaforma per il trattamento
dei metadati RDF costituisce una ipotesi di soluzione
individuata dal W3C al problema della rappresentazione dei metadati
RDF è complementare a XML <http://www.w3.org/RDF/>
RDF
Resource Description Framework W3C Recommendation, dal Febbraio 1999
si basa su XML e spazi di denominazione
Indipendente dalla piattaforma
Scopo principale rendere le etichette elaborabili da agenti
software oltre che leggibili dall’uomo
Primi passi con RDF
I dati sono descritti da asserzioni Un’asserzione e’ composta da
Una risorsa Pagina Web o parte di essa, intero sito Web… …sottoalbero XML …un libro … qualunque cosa dotata
di URI una proprieta’
e.g. Titolo, Data, Tipo un valore
es. stringa, numero, frammento XML, un’altra risorsa
Scopo e finalità di RDF realizzare un meccanismo per la descrizione
di risorse definizione di un meccanismo
neutrale rispetto ai domini adattabile alla descrizione di informazioni di
qualsiasi dominio permettere la definizione di semantiche per
dati in formato XML secondo modalità standardizzate e che
mirano l'interoperabilità
Cosa offre RDF
RDF offre l'interoperabilità tra applicazioni che scambiano sul Web informazioni comprensibili dalle macchine
il modello RDF consente di rappresentare metadati in una sintassi per la codifica e la trasmissione di metadati
scambio secondo modalità che favoriscano l'interoperabilità fra server e client Web, sviluppati in modo indipendente
RDF può essere usato
da agenti software intelligenti per facilitare la condivisione e lo scambio di conoscenza
nella valutazione di contenuto nel descrivere collezioni di pagine che
rappresentano un unico "documento" logico per descrivere i diritti di proprietà intellettuale di
pagine Web per esprimere le preferenze sulla riservatezza da
parte di un utente così come le politiche di riservatezza di un sito Web
Il modello RDF
L'evoluzione del web in web semantico inizia con la definizione, da parte del W3C, dello standard Resource Description Framework (RDF), una particolare applicazione XML che standardizza la definizione di relazioni tra informazioni ispirandosi ai principi della logica dei predicati e ricorrendo agli strumenti tipici del Web (ad es. URI) e dell'XML (namespace).
le informazioni sono esprimibili con asserzioni costituite da triple formate da soggetto, predicato e valore
il soggetto, l'oggetto e il predicato
Il Soggetto è la risorsa descritta, L’Oggetto è quell'affermazione che
attribuisce ad una caratteristica della risorsa descritta un determinato valore.
Il Predicato è la caratteristica o l'aspetto specifico utilizzato per la descrizione del soggetto, che determina la proprietà della risorsa descritta.
Esempio di RDF - I
Ad esempio, le seguenti affermazioni sul Presidente della Repubblica del in carica nel 2005: Il Signor Ciampi vive a Roma. Il Signor Ciampi ha codice fiscale
CMPCLZ20T09E625V. possono essere schematicamente
scomposte comeAsserzione 1 Asserzione 2
Soggetto Il Signor Ciampi Il Signor Ciampi
Predicato Vive a Ha codice fiscale
Valore Roma CMPCLZ20T09E625V
Esempio di RDF - II
Asserzione 1 Asserzione 2
Soggetto Il Signor Ciampi Il Signor Ciampi
Predicato Vive a Ha codice fiscale
Valore Roma CMPCLZ20T09E625V
Alcuni di questi elementi è possibile reperirli arbitrariamente sul Web URI (risorse) che li identificano univocamente quali:
Il Signor Ciampi http://www.quirinale.it/qrnw/statico/ex-presidenti/Ciampi/cia-biografia.htm
vive a http://it.wiktionary.org/wiki/vivere Roma http://www.comune.roma.it/index.asp Ha codice fiscale http://it.wikipedia.org/wiki/codice_fiscale
Esempio di RDF - IV
In questo caso, per Il Signor Ciampi si è scelto di referenziare la
relativa biografia disponibile sul sito ufficiale del Quirinale
Roma si è scelto di utilizzare il sito istituzionale del Comune di Roma
vive a si è scelto di referenziare la definizione del verbo vivere disponibile su wikidizionario
ha codice fiscale si è scelto di referenziare la definizione di codice fiscale disponibile su wikipedia
Il linguaggio RDF
E’ una delle più importanti raccomandazioni del W3C. Molti motori di ricerca stanno già usando RDF per descrivere il contenuto dei loro motori di ricerca. Tuttavia RDF ha senso se c’è attiva partecipazione da parte degli autori di siti, e ad oggi non esistono software ragionevoli per esprimere gradevolmente queste informazioni. RDF è composto da due documenti:
Model and Syntax Specification (W3C Recommendation del 25 marzo 2002): espone la struttura fondamentale del modello RDF, e descrive una possibile sintassi basata su XML.
RDF Schema (W3C Candidate Recommendation 27 March 2000): espone la sintassi per definire schemi e vocabolari di meta-informazioni.
Il modello di RDF
Il modello di RDF è basato su tre concetti: Risorse: tutto ciò che viene descritto. Ogni risorsa è
indentificata da un URI; può quindi essere anche un oggetto non accessibile da web.
Proprietà: un attributo che voglio associare alla risorsa. E’ una coppia attributo-valore. Ogni proprietà ha un significato specifico, una serie di valori leciti, è associabile ad uno o più tipi di risorsa.
Asserzioni (statement): l’associazione di una proprietà ad una risorsa. Ogni asserzione ha una struttura obbligata del tipo “soggetto”, “predicato”, “oggetto”.
Soggetto (risorsa) http://www.host.org/~mrossi
Predicato (proprietà) Autore
Oggetto (letterale) “Mario Rossi”
Rappresentazione grafica (1)
http://www.host.org/~mrossi Mario Rossi
La proprietà “Autore” della risorsa “http://www.host.org/~mrossi” vale “Mario Rossi”
Autore
Risorsa(ovale)
Proprietà(freccia)
Letterale(rettangolo)
Rappresentazione grafica (2)
Mario Rossi
Autore
http://people.com/id/1375
Nome Email
La proprietà “Autore” della risorsa “http://www.host.org/~mrossi” è “Mario Rossi”, che ha e-mail “[email protected]”.
http://www.host.org/~mrossi
Sintassi estesa (1)
Il primo caso diventa in sintassi estesa: <rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore>Mario Rossi</s:Autore></rdf:Description>
Il secondo caso:<rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore rdf:resource=”http://people.com/id/1375"/></rdf:Description>
<rdf:Description rdf:about=”http://people.com/id/1375"> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email></rdf:Description>
Sintassi estesa (2)
Il secondo esempio è equivalente alla seguente forma:
<rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore> <rdf:Description rdf:about=”http://people.com/id/1375"> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email> </rdf:Description> </s:Autore></rdf:Description>
Tipizzazione
E’ possibile assegnare ad ogni risorsa un tipo appartenente ad uno schema di meta informazioni:
<rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore> <rdf:Description rdf:about=”http://people.com/id/1375"> <rdf:type rdf:resource="/myschema.rdf#Persona"/> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email> </rdf:Description> </s:Autore></rdf:Description>
L’attributo rdf:type specifica l’URI della definizione del tipo.
Prima sintassi abbreviata Esistono alcune forme equivalenti ma più compatte. Il primo esempio è equivalente alla seguente forma:
<rdf:Description rdf:about="http://www.host.org/~mrossi” s:Autore=“Mario Rossi” />
I predicati (s:Autore) che hanno come oggetto elementi di tipo stringa (“Mario Rossi”) e non sono ripetuti vengono direttamente inseriti come attributi di “rdf:Description”.
Seconda sintassi abbreviata
Applicando la seconda sintassi abbreviata al secondo esempio si ottiene:
<rdf:Description rdf:about="http://www.host.org/~mrossi”> <s:Autore rdf:about=“http://people.com/id/1375” s:Nome=“Mario Rossi” s:[email protected]/></rdf:Description>
E’ applicabile quando l’oggetto di un’asserzione è una risorsa le cui proprietà hanno come valore un letterale.
Terza sintasi abbreviata
E’ possibile usare il valore del tipo come predicato:
<rdf:Description about="http://www.host.org/~mrossi"> <s:Autore> <s:Persona rdf:about=“http://people.com/id/1375”> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email> </s:Persona> </s:Autore></rdf:Description>
Software utili
Validatore e visualizzatore di documenti RDF: http://www.w3.org/RDF/Validator/
Riferimenti Tim Berners-Lee. Semantic Web - XML2000
http://www.w3.org/2000/Talks/1206-xml2k-tbl Tim Berners-Lee, James Hendler, and Ora Lassila. The Semantic
Web, http://www.scientificamerican.com/2001/0501issue/0501-berners-lee.html.
Ora Lassila, Ralph R. Swick, Resource Description Framework (RDF), Model and Syntax Specification, W3C Recommendation 22 February 1999, http://www.w3.org/TR/REC-rdf-syntax
Dave Beckett, RDF/XML Syntax Specification (Revised), W3C Recommendation 25 March 2002, http://www.w3.org/TR/2002/WD-rdf-syntax-grammar-20020325
Dan Brickley, R.V. Guha, Resource Description Framework (RDF) Schema Specification 1.0, W3C Candidate Recommendation 27 March 2000, http://www.w3.org/TR/rdf-schema
Patrick Hayes, RDF Model Theory, http://www.w3.org/TR/2002/WD-rdf-mt-20020214
Top Related