SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

32
SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009

Transcript of SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Page 1: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

SEMANTIC WEB

Antonio BucchiaroneFBK-IRSTTrento, Italy

13 Novembre 2009

Page 2: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Il web semantico - I

In un certo senso abbiamo bisogno di un web che sia computer-friendly per essere più user-friendly

Più le macchine saranno in grado di interpretare autonomamente le informazioni della rete più efficaci saranno i loro servizi a: trovare informazioni pertinenti prendere decisioni

Page 3: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Il web semantico - II

[WIKIPEDIA]: Con il termine web semantico, termine coniato dal suo ideatore, Tim Berners-Lee, si intende la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e così via) siano associati ad informazioni e dati (metadati) che ne specifichino il contesto semantico in un formato adatto all'interrogazione, all'interpretazione e, più in generale, all'elaborazione automatica.

Con l'interpretazione del contenuto dei documenti che il Web Semantico propone, saranno possibili ricerche molto più evolute delle attuali, basate sulla presenza nel documento di parole chiave, ed altre operazioni specialistiche come la costruzione di reti di relazioni e connessioni tra documenti secondo logiche più elaborate del semplice link ipertestuale.

Page 4: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Metadati per il web semantico Una risorsa dovrebbe fornire informazioni

su se stessa queste sono anche chiamate "metadati" i metadati sono conservati in XML, o in un'altra

forma leggibile dalle macchine dovrebbero essere definiti i vocabolari di

metadati gli agenti dovrebbero essere in grado di

"ragionare" sui (meta)dati Il "Web Semantico" è un'infrastruttura

basata sui metadati per ragionare sul Web Esso estende il Web attuale (e non lo

sostituisce)

Page 5: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Relazione tra documenti

con XML è possibile descrivere adeguatamente i contenuti di un documento ma la sintassi XML non definisce alcun meccanismo esplicito per qualificare le relazioni tra documenti.

In questo non è di aiuto neppure il meccanismo dei collegamenti ipertestuali reso popolare dall'HTML in quanto non prevede la possibilità di descrivere il legame definito.

In altre parole, sebbene in un documento (ad es. una pagina HTML) sia possibile parlare di un Signor Ciampi ed esprimere semanticamente questo con opportuni tag, è poi difficile capire se due documenti che parlano di un Signor Ciampi si riferiscono alla stessa persona con conseguente scarsa qualità dei risultati restituiti dai motore di ricerca.

Page 6: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Le tecnologie per il web

Il sw utilizza una serie di tecnologie di cui alcune sono ancora in fase sperimentale

Alcune tecnologie sono XML RDF DTD XSL XPATH XHTML …

Page 7: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

XML è …

XML = eXtensible Markup Language XML può essere definito in molti modi diversi XML è una sintassi per marcare i documenti XML è una famiglia di tecnologie correlate XML consente di

aggiungere metadati (semantica) ai propri dati separare il contenuto dalla presentazione definire in maniera rigorosa il linguaggio di

markup utilizzato utilizzare un formato neutrale e testuale

Page 8: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

… ma da solo XML non è sufficiente ...

XML è troppo flessibile mentre è necessario un modello estremamente semplice per esprimere delle conoscenze processabili automaticamente

HTML è estremamente semplice ma non flessibile e perciò può solo rappresentare informazioni senza tener conto della semantica

Page 9: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

XML non è facile come HTML

Può essere un limite? Con HTML chiunque poteva pubblicare in

Web XML è complesso e non tutti saranno in

grado di utilizzarlo Ritorno all’epoca pre-Web? O selezione obbligata di ciò che verrà

pubblicato?

Page 10: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Resource Description Framework (RDF)

RDF è un modello di metadati RDF è una piattaforma per il trattamento

dei metadati RDF costituisce una ipotesi di soluzione

individuata dal W3C al problema della rappresentazione dei metadati

RDF è complementare a XML <http://www.w3.org/RDF/>

Page 11: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

RDF

Resource Description Framework W3C Recommendation, dal Febbraio 1999

si basa su XML e spazi di denominazione

Indipendente dalla piattaforma

Scopo principale rendere le etichette elaborabili da agenti

software oltre che leggibili dall’uomo

Page 12: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Primi passi con RDF

I dati sono descritti da asserzioni Un’asserzione e’ composta da

Una risorsa Pagina Web o parte di essa, intero sito Web… …sottoalbero XML …un libro … qualunque cosa dotata

di URI una proprieta’

e.g. Titolo, Data, Tipo un valore

es. stringa, numero, frammento XML, un’altra risorsa

Page 13: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Scopo e finalità di RDF realizzare un meccanismo per la descrizione

di risorse definizione di un meccanismo

neutrale rispetto ai domini adattabile alla descrizione di informazioni di

qualsiasi dominio permettere la definizione di semantiche per

dati in formato XML secondo modalità standardizzate e che

mirano l'interoperabilità

Page 14: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Cosa offre RDF

RDF offre l'interoperabilità tra applicazioni che scambiano sul Web informazioni comprensibili dalle macchine

il modello RDF consente di rappresentare metadati in una sintassi per la codifica e la trasmissione di metadati

scambio secondo modalità che favoriscano l'interoperabilità fra server e client Web, sviluppati in modo indipendente

Page 15: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

RDF può essere usato

da agenti software intelligenti per facilitare la condivisione e lo scambio di conoscenza

nella valutazione di contenuto nel descrivere collezioni di pagine che

rappresentano un unico "documento" logico per descrivere i diritti di proprietà intellettuale di

pagine Web per esprimere le preferenze sulla riservatezza da

parte di un utente così come le politiche di riservatezza di un sito Web

Page 16: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Il modello RDF

L'evoluzione del web in web semantico inizia con la definizione, da parte del W3C, dello standard Resource Description Framework (RDF), una particolare applicazione XML che standardizza la definizione di relazioni tra informazioni ispirandosi ai principi della logica dei predicati e ricorrendo agli strumenti tipici del Web (ad es. URI) e dell'XML (namespace).

le informazioni sono esprimibili con asserzioni costituite da triple formate da soggetto, predicato e valore

Page 17: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

il soggetto, l'oggetto e il predicato

Il Soggetto è la risorsa descritta, L’Oggetto è quell'affermazione che

attribuisce ad una caratteristica della risorsa descritta un determinato valore.

Il Predicato è la caratteristica o l'aspetto specifico utilizzato per la descrizione del soggetto, che determina la proprietà della risorsa descritta.

Page 18: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Esempio di RDF - I

Ad esempio, le seguenti affermazioni sul Presidente della Repubblica del in carica nel 2005: Il Signor Ciampi vive a Roma. Il Signor Ciampi ha codice fiscale

CMPCLZ20T09E625V. possono essere schematicamente

scomposte comeAsserzione 1 Asserzione 2

Soggetto Il Signor Ciampi Il Signor Ciampi

Predicato Vive a Ha codice fiscale

Valore Roma CMPCLZ20T09E625V

Page 19: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Esempio di RDF - II

Asserzione 1 Asserzione 2

Soggetto Il Signor Ciampi Il Signor Ciampi

Predicato Vive a Ha codice fiscale

Valore Roma CMPCLZ20T09E625V

Alcuni di questi elementi è possibile reperirli arbitrariamente sul Web URI (risorse) che li identificano univocamente quali:

Il Signor Ciampi http://www.quirinale.it/qrnw/statico/ex-presidenti/Ciampi/cia-biografia.htm

vive a http://it.wiktionary.org/wiki/vivere Roma http://www.comune.roma.it/index.asp Ha codice fiscale http://it.wikipedia.org/wiki/codice_fiscale

Page 20: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Esempio di RDF - IV

In questo caso, per Il Signor Ciampi si è scelto di referenziare la

relativa biografia disponibile sul sito ufficiale del Quirinale

Roma si è scelto di utilizzare il sito istituzionale del Comune di Roma

vive a si è scelto di referenziare la definizione del verbo vivere disponibile su wikidizionario

ha codice fiscale si è scelto di referenziare la definizione di codice fiscale disponibile su wikipedia

Page 21: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Il linguaggio RDF

E’ una delle più importanti raccomandazioni del W3C. Molti motori di ricerca stanno già usando RDF per descrivere il contenuto dei loro motori di ricerca. Tuttavia RDF ha senso se c’è attiva partecipazione da parte degli autori di siti, e ad oggi non esistono software ragionevoli per esprimere gradevolmente queste informazioni. RDF è composto da due documenti:

Model and Syntax Specification (W3C Recommendation del 25 marzo 2002): espone la struttura fondamentale del modello RDF, e descrive una possibile sintassi basata su XML.

RDF Schema (W3C Candidate Recommendation 27 March 2000): espone la sintassi per definire schemi e vocabolari di meta-informazioni.

Page 22: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Il modello di RDF

Il modello di RDF è basato su tre concetti: Risorse: tutto ciò che viene descritto. Ogni risorsa è

indentificata da un URI; può quindi essere anche un oggetto non accessibile da web.

Proprietà: un attributo che voglio associare alla risorsa. E’ una coppia attributo-valore. Ogni proprietà ha un significato specifico, una serie di valori leciti, è associabile ad uno o più tipi di risorsa.

Asserzioni (statement): l’associazione di una proprietà ad una risorsa. Ogni asserzione ha una struttura obbligata del tipo “soggetto”, “predicato”, “oggetto”.

Soggetto (risorsa) http://www.host.org/~mrossi

Predicato (proprietà) Autore

Oggetto (letterale) “Mario Rossi”

Page 23: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Rappresentazione grafica (1)

http://www.host.org/~mrossi Mario Rossi

La proprietà “Autore” della risorsa “http://www.host.org/~mrossi” vale “Mario Rossi”

Autore

Risorsa(ovale)

Proprietà(freccia)

Letterale(rettangolo)

Page 24: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Rappresentazione grafica (2)

Mario Rossi

Autore

[email protected]

http://people.com/id/1375

Nome Email

La proprietà “Autore” della risorsa “http://www.host.org/~mrossi” è “Mario Rossi”, che ha e-mail “[email protected]”.

http://www.host.org/~mrossi

Page 25: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Sintassi estesa (1)

Il primo caso diventa in sintassi estesa: <rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore>Mario Rossi</s:Autore></rdf:Description>

Il secondo caso:<rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore rdf:resource=”http://people.com/id/1375"/></rdf:Description>

<rdf:Description rdf:about=”http://people.com/id/1375"> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email></rdf:Description>

Page 26: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Sintassi estesa (2)

Il secondo esempio è equivalente alla seguente forma:

<rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore> <rdf:Description rdf:about=”http://people.com/id/1375"> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email> </rdf:Description> </s:Autore></rdf:Description>

Page 27: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Tipizzazione

E’ possibile assegnare ad ogni risorsa un tipo appartenente ad uno schema di meta informazioni:

<rdf:Description rdf:about="http://www.host.org/~mrossi"> <s:Autore> <rdf:Description rdf:about=”http://people.com/id/1375"> <rdf:type rdf:resource="/myschema.rdf#Persona"/> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email> </rdf:Description> </s:Autore></rdf:Description>

L’attributo rdf:type specifica l’URI della definizione del tipo.

Page 28: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Prima sintassi abbreviata Esistono alcune forme equivalenti ma più compatte. Il primo esempio è equivalente alla seguente forma:

<rdf:Description rdf:about="http://www.host.org/~mrossi” s:Autore=“Mario Rossi” />

I predicati (s:Autore) che hanno come oggetto elementi di tipo stringa (“Mario Rossi”) e non sono ripetuti vengono direttamente inseriti come attributi di “rdf:Description”.

Page 29: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Seconda sintassi abbreviata

Applicando la seconda sintassi abbreviata al secondo esempio si ottiene:

<rdf:Description rdf:about="http://www.host.org/~mrossi”> <s:Autore rdf:about=“http://people.com/id/1375” s:Nome=“Mario Rossi” s:[email protected]/></rdf:Description>

E’ applicabile quando l’oggetto di un’asserzione è una risorsa le cui proprietà hanno come valore un letterale.

Page 30: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Terza sintasi abbreviata

E’ possibile usare il valore del tipo come predicato:

<rdf:Description about="http://www.host.org/~mrossi"> <s:Autore> <s:Persona rdf:about=“http://people.com/id/1375”> <s:Nome>Mario Rossi</s:Nome> <s:Email>[email protected]</s:Email> </s:Persona> </s:Autore></rdf:Description>

Page 31: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Software utili

Validatore e visualizzatore di documenti RDF: http://www.w3.org/RDF/Validator/

Page 32: SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.

Riferimenti Tim Berners-Lee. Semantic Web - XML2000

http://www.w3.org/2000/Talks/1206-xml2k-tbl Tim Berners-Lee, James Hendler, and Ora Lassila. The Semantic

Web, http://www.scientificamerican.com/2001/0501issue/0501-berners-lee.html.

Ora Lassila, Ralph R. Swick, Resource Description Framework (RDF), Model and Syntax Specification, W3C Recommendation 22 February 1999, http://www.w3.org/TR/REC-rdf-syntax

Dave Beckett, RDF/XML Syntax Specification (Revised), W3C Recommendation 25 March 2002, http://www.w3.org/TR/2002/WD-rdf-syntax-grammar-20020325

Dan Brickley, R.V. Guha, Resource Description Framework (RDF) Schema Specification 1.0, W3C Candidate Recommendation 27 March 2000, http://www.w3.org/TR/rdf-schema

Patrick Hayes, RDF Model Theory, http://www.w3.org/TR/2002/WD-rdf-mt-20020214