La Semantica e il Web dei Dati

17
Convegno “La socialità dopo il Web 2.0” Milano, 2 aprile 2009 La semantica e il Web dei dati - Irene Celino © CEFRIEL 2009 La semantica e il Web dei dati: quando uno più uno non fa solo due Irene Celino CEFRIEL – ICT Institute Politecnico di Milano email: [email protected]

description

La "semantica" e il Web dei dati: quando uno più uno non fa solo due (April 2nd, 2009)

Transcript of La Semantica e il Web dei Dati

Page 1: La Semantica e il Web dei Dati

Convegno “La socialità dopo il Web 2.0” – Milano, 2 aprile 2009 La semantica e il Web dei dati - Irene Celino – © CEFRIEL 2009

La semantica e il Web dei dati: quando uno più uno non fa solo due

Irene Celino CEFRIEL – ICT Institute Politecnico di Milano

email: [email protected]

Page 2: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20092La semantica e il Web dei dati - Irene Celino

Semantica?Semantica? In filosofia, la semanticasemantica è lo studio del significato

Ogni giorno, in ogni momento, siamo sommersi di dati, informazioni, contenuti e tanti tipi diversi di media

Tutti questi dati però, per essere di qualche utilità, necessitano di essere interpretati dalle persone

La crescita esponenziale della quantità di dati spinge tutti a cercare soluzioni tecnologiche per ovviare a questi problemi

Page 3: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20093La semantica e il Web dei dati - Irene Celino

Quali sono le capacità delle macchineQuali sono le capacità delle macchine I sistemi informaticisistemi informatici che utilizziamo tutti i giorni

rappresentano l’informazione attraverso Il linguaggio naturale (italiano, inglese, cinese, …) Grafici, multimedia, …

Gli esseri umaniesseri umani elaborano facilmente questa informazione Possono dedurre fatti da informazione parziale Possono creare associazioni mentali Sono abituati a interagire con diversi tipi di media (problemi di

accessibilità a parte…)

Invece le macchinemacchine sono “ignorantiignoranti” L’informazione parziale è inutilizzabile Difficoltà di estrarre il significato ad es. da un’immagine Trovare automaticamente analogie è difficile Difficoltà di combinare automaticamente le informazioni

Page 4: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20094La semantica e il Web dei dati - Irene Celino

L’evoluzione del WebL’evoluzione del Web

1 – il Web delle origini1 – il Web delle origini1 – il Web delle origini1 – il Web delle origini

2 – il Social Web2 – il Social Web2 – il Social Web2 – il Social Web 3 – il Semantic Web3 – il Semantic Web3 – il Semantic Web3 – il Semantic Web

4 – l’Ubiquitous Web4 – l’Ubiquitous Web4 – l’Ubiquitous Web4 – l’Ubiquitous Web

Connette i documentiConnette i documentiConnette i documentiConnette i documenti

Connette le personeConnette le personeConnette le personeConnette le persone Connette la conoscenzaConnette la conoscenzaConnette la conoscenzaConnette la conoscenza

Connette le intelligenzeConnette le intelligenzeConnette le intelligenzeConnette le intelligenze

Concetto rielaborato tratto da: Nova Spivak, John Breslin, Mills Davis (2008)

Page 5: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20095La semantica e il Web dei dati - Irene Celino

“The Semantic Web Semantic Web is a vision: the idea of having datadata on the Web defined and linkedlinked in a way that it can be usedused byby machinesmachines not just for display purposes, but for automationautomation, integrationintegration and reusereuse of data acrossacross applicationsapplications”

– Tim Berners-Lee (2003)

“The Semantic WebSemantic Web is not a separate Web but an extension of the currentextension of the current one, in which information is given well-defined well-defined meaningmeaning, better enabling computerscomputers and peoplepeople to work in cooperationcooperation”

– Tim Berners-Lee (2001)

Perchè il Semantic WebPerchè il Semantic Web

Page 6: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20096La semantica e il Web dei dati - Irene Celino

L’integrazione dei datiL’integrazione dei dati Il problema dell’integrazione:

Enormi quantità di dati che crescono ed evolvono in continuazione

problema di scalascala Tante diverse tipologie di dato (documenti, media, email,

risultati Web, contatti, ecc.) problema di eteroge-eteroge-

neità dei datineità dei dati Tanti diversi sistemi

informativi (DB, applica-zioni legacy, ERP, ecc.)

problema di eteroge-eteroge-neità dei sistemineità dei sistemi

Page 7: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20097La semantica e il Web dei dati - Irene Celino

Quando 1 + 1 > 2 ?Quando 1 + 1 > 2 ? L’integrazione dei dati dà sempre un valore aggiuntovalore aggiunto

Visione d’insieme: “e pluribus unum”

Condividere la conoscenza: “l’unione fa la forza”

Opportunità di business

Business Intelligence

Resta il problema tecnologicoproblema tecnologico: Chi è riuscito a trarre vantaggio

dall’integrazione?

Come riconciliare l’eterogeneità dei dati?

La semantica può essere d’aiuto?

Page 8: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20098La semantica e il Web dei dati - Irene Celino

La lezione del Web 2.0La lezione del Web 2.0 La politica della partecipazionepolitica della partecipazione e la

“saggezza delle folle”

Il grande successo dei mash-upmash-up Mash-up: applicazioni realizzate

dall’integrazione “light” di artefatti forniti da altri (spesso API o servizi REST)

Nuovo paradigma di integrazione per la realizzazione di applicazioni

Pubblicazione e accesso via Webvia Web È sempre più semplice “memorizzare”

l’informazione sul Web È sempre più diffuso accedere

all’informazione sul Web, facendo affidamento ai motori di ricerca per recuperarla

Page 9: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 20099La semantica e il Web dei dati - Irene Celino

Per integrare dati provenienti da sorgenti diverse è necessario capire come “incastrare” tra loro i daticome “incastrare” tra loro i dati

Per fare questo è necessario guardare al significato dei significato dei datidati e passare “dalla sintassi alla semantica”

Bisogna riconciliare datiriconciliare dati solo in apparenza diversi, facendo leva su alcuni possibili approcci/metriche:

Distanza semantica: “lontananza” in termini di significato

Similarità semantica: somiglianza in termini di significato e di “ampiezza”

La semantica per l’integrazioneLa semantica per l’integrazione

Page 10: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 200910La semantica e il Web dei dati - Irene Celino

Il Web come piattaforma di integrazioneIl Web come piattaforma di integrazione E se l’integrazioneintegrazione si facesse sul Websul Web?

Web come piattaforma Data prosumer (producer + consumer)

“Web of DataWeb of Data” Passare dall’attuale “Web of Documents” ad un Web dei dati Non più solo information retrieval, ma anche data retrieval

Esporre i propri datiEsporre i propri dati sul Web Convertire/tradurre in formato opportuno “Wrap” della sorgente dati

D2RD2RVirtuosoVirtuoso

SquirrelRDFSquirrelRDF

SPASQLSPASQL

Relational.OWLRelational.OWL

DartGridDartGridSPOONSPOON

TriplifyTriplify

R2OR2OTalisTalis

Page 11: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 200911La semantica e il Web dei dati - Irene Celino

Linked DataLinked Data La concretizzazione del “Web of Data” (e del Semantic Web) Tim Berners-Lee: http://www.w3.org/DesignIssues/LinkedData

Linking Open Data InitiativeInitiative Una comunità che pubblica e “linka” i dati sul Web http://linkeddata.org/

Data cloudData cloud Oggi si parla molto di

cloud computing

Spesso però non è di solacomputazione che si tratta,ma di gestione dei dati e della conoscenza

Linked data e data cloudLinked data e data cloud

Page 12: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 200912La semantica e il Web dei dati - Irene Celino

www.flickr.com/photos/_-amy-_/3167333250/

““Stop hugging Stop hugging your data”your data”

Tim Berners-Lee, 2009Tim Berners-Lee, 2009

I linked data visti dall’inventore del WebI linked data visti dall’inventore del Web

Non lasciare che considerazioni sulla

sicurezza o sulla proprietà dei dati

ostacolino opportunità e innovazione

Page 13: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 200913La semantica e il Web dei dati - Irene Celino

Sfide per i linked dataSfide per i linked data Distributed queryingDistributed querying

Interrogare dati distribuiti su diverse sorgenti sul Web disinteressandosi della “posizione” dei dati e ottenendo i risultati già aggregati

Automatic linkageAutomatic linkage Trovare meccanismi per identificare i punti di contatto tra dati

provenienti da fonti diverse e creare i “link” che permettono di passare da una fonte all’altra senza soluzione di continuità

Distributed reasoningDistributed reasoning Applicare tecniche di inferenza e di

ragionamento automatico a dati distri-buiti sul Web, preservando consisten-za e correttezza del ragionamento

Page 14: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 200914La semantica e il Web dei dati - Irene Celino 14

LarKC platform

Interface

Mobile Data Mashup Environment

SPARQL

query

SPARQL

result

REST

request

JSONresponse

Request data Data

PipelineConfig.

PROBLEM: Which Milano monuments or events or friends can I quickly get to from here?

TrafficMonumentsEventsPeople

La ricerca e i linked data:La ricerca e i linked data:_________

http://www.larkc.eu

Page 15: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 200915La semantica e il Web dei dati - Irene Celino

SemanticsKnowledge Representation

& Reasoning

Web ServicesAs a basic tool to implementa Service Oriented Architecture

Semantic Web ServicesAs a means to realize

Service Oriented Architecture

Web 2.0User clusteringUser-Resource correlation

Semantic Search Conceptual Indexing Semantic Matching

AutomaticSemantic Annotation

Combining smart-machine and smart-data

Service-Finder aims at developing a platform for service discovery in which

Web Services are embedded in a Web 2.0 environment

Service-Finder aims at developing a platform for service discovery in which

Web Services are embedded in a Web 2.0 environment

Realizing Web Service Discovery at Web Scale

http://www.service-finder.eu

La ricerca e i linked data:La ricerca e i linked data:_____________

Page 16: La Semantica e il Web dei Dati

Milano, 2 aprile 2009 – © CEFRIEL 200916La semantica e il Web dei dati - Irene Celino

Se non vi ho convinto io…Se non vi ho convinto io…http://www.ted.com/index.php/talks/tim_berners_lee_on_the_next_web.html

Page 17: La Semantica e il Web dei Dati

Convegno “La socialità dopo il Web 2.0” – Milano, 2 aprile 2009 La semantica e il Web dei dati - Irene Celino – © CEFRIEL 2009

Grazie dell’attenzione!

Irene Celino

email: [email protected]: http://www.cefriel.it, http://swa.cefriel.it

Semantic Web PracticeCEFRIEL – ICT Institute Politecnico di Milano