Semantic Web. I problemi della ricerca in Web Querying Ambiguità della formula Browsing ...

35
Semantic Web

Transcript of Semantic Web. I problemi della ricerca in Web Querying Ambiguità della formula Browsing ...

Page 1: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Semantic Web

Page 2: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

I problemi della ricerca in Web

Querying Ambiguità della formula

Browsing Arbitrarietà nei criteri di classificazione dei dati

= Web Documenti debolmente collegati tra loro

Occorrerebbero dei collegamenti semantici Che riconoscano i domini (=contesti) entro i quali sono

disponibili risorse

Page 3: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Domini, schemi e dati

Dominio è costituito da Dati

Informazione elementare Metadati

classificano i dati Schema (Ontologia)

mettono in relazione le classi

Page 4: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Web Semantic

2001, Tim Barners LeeRappresentare web come un insieme di

ontologie Progetto irrealistico

Ontologie specifiche Secondo settori di interesse Costruzione di ontologie: campo del Knowledge

Management:

Page 5: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

La struttura del Web semantico

Il Semantic Web si candida ad essere una architettura universale della scambio di informazione e conoscenza

Ogni applicazione, ogni intenzione di scopo applicata ad un dominio, utilizzerà una sua propria ontologia

L'operazione di collegare ontologie che definiscono stessi oggetti con una semantica differente è chiamata Mapping

Impensabile un mapping globale ogni diverso schema dovrebbe mapparsi all'ontologia globale

che funzionerebbe così come una lingua universale Si lavorerà su una architettura federativa.

Page 6: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Mapping

Implica l’identificazione di soluzioni tecniche e transazioni comunicative

Potrà essere di due tipi: automatico o manuale, forse misto In una prima fase dei tool leggeranno grosse quantità di

dati e realizzeranno dei cluster, un esperto poi dovrà validare le scelte dei tool

Si adotterà il modello dell’interlingua Inizialmente alcuni gruppi di organizzazioni si

accordano per creare un standard condiviso, quando questo standard si consolida e afferma altre realtà si associano allo standard.

Page 7: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

E-learning semantico

Due progetti http://edutella.jxta.org http://www.merlot.org

Learning objects collegati secondo schemi ontologici

Page 8: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

I linguaggi del web semantico

Il W3C propone RDF(S) set di linguaggi dichiarativi basati su sintassi

XML

Gli schemi si scrivono in linguaggio RDF(S) e producono file *.RDFS

Page 9: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

RDF

Resource Description Framework (RDF). per la descrizione delle risorse sul Web,

La descrizione si basa su tre tipi di oggetti: Risorse (resources)

una pagina, un gruppo di pagine, un’immagine, un server o una qualsiasi altro elemento che abbia un Universal Resource Identifier (URI), cioè un meccanismo di identificazione come l’indirizzo Web

Proprietà (properties) Una proprietà è una specifica caratteristica o attributo di una risorsa una proprietà può anche descrivere relazioni con altre risorse.

Asserzioni (statements) Una asserzione è costituita dall’insieme di una risorsa, una proprietà

e uno specifico valore per quella proprietà e descrive le caratteristiche di una risorsa e le relazioni con altre risorse

Page 10: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Asserzione la pagina all’indirizzo www.html.it/rdf.html ha per argomento

RDF asserzione costituita dalla

risorsa pagina all’indirizzo www.html.it/rdf.html, dalla proprietà argomento, dal valore RDF.

Per ragioni pratiche, la definizione formulata del W3C propone XML come metalinguaggio per la rappresentazione del modello RDF, mediante alcuni tags predefiniti (<rdf:descxription>…) e altra tags liberi per la descrizione

Ecco la asserzione espressa in xml:

Page 11: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Namespace

Nella descrizione RDF si fa uso della tecnica dei namespace di XML

Un namespace è un contesto che definisce un insieme di tag da utilizzare in un documento XML Nel precedente esempio, il tag <rdf:RDF>

indica che tale tag è definito nel namespace identificato dal prefisso rdf, la cui dichiarazione si trova nella prima riga del documento XML

Page 12: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Schemi RDF

La creazione libera di tags genera ambiguità

Gli schemi RDF sono vocabolari di tags concordati insiemi di proprietà ed elementi che definiscono

un contesto per la descrizione di determinate categorie di risorse

Es.: il Dublin Core Metadata: esso definisce i tag da utilizzare per la descrizione di documenti elettronici

Page 13: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Sviluppi

L’uso di RDF è agli inizi e non sono ancora apprezzabili gli effetti che questa tecnologia porterà sul Web.

Page 14: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di un’ontologia 1)

Dichiarazione iniziale

Page 15: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Corso sottoclasse di “resource” (elemento radice generico)

RESOURCE

CORSO

Costruzione di un’ontologia 2)

Page 16: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di un’ontologia 3)

“Argomento” sottoclasse di “corso”

RESOURCE

CORSO

ARGOMENTO

Page 17: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di un’ontologia 4)

“Specializzazione” sottoclasse di ““resource” (elemento radice generico)

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

Page 18: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di un’ontologia 5)

“Titolo” proprietà di “Corso” esprimibile in formato stringa (codominio#Literal)

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

titolo

Page 19: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di un’ontologia 6)

“Livello di specializzazione” proprietà di “Corso” e di “Specializzazione”

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONEtitolo Livello dispecializz.

Page 20: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di un’ontologia 7)

“Utenti” proprietà di “Specializzazione” e di “Utenti”

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

titoloLivello di

specializz. Utenti

Page 21: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di un’ontologia 8)

“Preparazione Utenti” proprietà di “Specializzazione”

RESOURCE

CORSO

ARGOMENTO

SPECIALIZZAZIONE

titoloLivello di

specializz.

Utenti

Preparazione utenti

Classe 1°

Classe 2°

Classe 1°

classe radice

proprietà proprietà

proprietà

proprietà

Page 22: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

I metadati

I metadati dovrebbero esprimere relazioni di un documento con un certo contesto, dovrebbero definire relazioni trasversali al documento

Non può esserci un sistema di navigazione semantica senza i metadati

Non esistono ancora sistemi solidi per l'archiviazione e l'interrogazione di metadati Non si è ancora consolidata una pratica Esistono diversi sistemi

Page 23: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Indicizzazione automatica di metadati

Limiti: un estrattore automatico non capisce il contesto: si basa sui tesauri di cui dispone…

Text Zoner suddivide il testo in parti strutturali (title, body, etc...)

Preprocessor fa una analisi morfologica delle frasi, stabilisce cioè di che parti è

costruita una frase (soggetto, predicato, oggetto). Filter

Elimina dal testo le frasi e le sentenze irrilevanti Named Entity Recognizer

identifica strutture lessicali minime (nomi, date, numeri..) Lexical Disambiguation

assicura che i termini con più significati siano tradotti in un unico modo Semantic Interpreter

riporterà gli elementi significativi riscontrati su strutture ontologiche possedute a priori

Page 24: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Raccomandazioni

I metadati non sono dati non possono limitarsi a riportare in modo stringato i

contenuti di un testo I metadati possono avere valore diverso

La proprietà di una classe può essere un valore es.: “Paolo”

O puntare ad un Uri: “quel” Paolo Volatilità dei metadati Essere e asserire

Mediante la reificazione: asserzioni di asserzioni

Page 25: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di metadati

Dall’ontologia ai metadati http://www.nomesito.it/nomecorso/nomecorso.html Indichiamo come si relazionano allo schema

I metadati si definiscono mediante asserzioni: Soggetto: Classe dello schema

Esprimibile come Url Lo schema è esprimibile come spacename

Predicato: Attributi della classe Oggetto: Dati

I metadati si scrivono in file *.RDF

Page 26: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di metadati 1)

Qui la dichiarazione iniziale non necessita del namespace rdfs

Page 27: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di metadati 2)

Prima asserzione: la prima risorsa è un corso dal titolo “nomecorso“

Page 28: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Costruzione di metadati 3)

Questa stessa risorsa (“Nomecorso) è legata a due argomenti diversi: nomeargomento1 e nomeargomento2

La classe “argomento” potrebbe essere espansa come http://miosito/rdfs/nomeschema/Argomento sostituendo il cancelletto con lo schema dichiarato in cima al documento

Page 29: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Flessibilità delle asserzioni

Gli elementi sintattici delle asserzioni possono essere sostituiti da Uri Soggetto

Generalmente la classe di uno schema anche diverso Predicato

Un attributo, ma che può puntare ad un’altra classe Oggetto

Una stringa, o un’altra classe, o classi di schemi diversi

Le asserzioni si possono collegare tra loro Tramite ID

Page 30: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Reificazione delle asserzioni

Inserimento di un’asserzione entro un’altra dico che in una certa pagina si dice che c'è

un corso che ha titolo nomecorso.

<rdf:Description rdf:about="http://www.nomesito.it/nomecorso/nomesito.html"> <a:assert rdf:resource="http://www.nomesito.it/data/nomeontologia/model.rdf#ST_168_sp"/> </rdf:Description> <rdf:statement rdf:about="http://www.nomesito.it/data/nomeontologia/model.rdf#ST_168_sp">  <rdf:subject rdf:resource="#Corso"/><rdf:predicate rdf:resource="#Titolo"/> <rdf:object rdf:resource="nomecorso"/></rdf:statement>

Page 31: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

RDF oltre XML

RDF(S) è pensato per i metadati Descrive dati ma non ha dati Xml contiene dati

XML si presta poco alle relazioni tra classi Ha carattere inclusivo: nidifica bene le relazioni

parentali, ma fatica ad esprimere quelle associative

Page 32: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Ontologia

Delinea le strade che collegano gli oggetti del dominio

Ontologie di scopo rappresentano la struttura dei processi

Ontologie di dominio forniscono gli oggetti specifici

Page 33: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Ontologia di scopo: Archiviazione di e-learning

Ontologia “Archiviazione” Attributi (stringhe o puntati ad altre classi)

Contenuto Data Locazione Archiviatore

Page 34: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Ontologia di dominio

I concetti di scopo permettono di pensare agli oggetti che compongono il dominio

La modellazione avviene per classiGli attributi sono ereditati dal padre delle

classi dello stesso livello Il valore di un attributo può essere definito

da un’altra classe

Page 35: Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Criteri di modellazione

Dare alle classi nomi al singolareL'albero dell'ontologia deve essere

bilanciato nella granularità I rami devono avere un numero di classi simile