La Semantica e il Web dei Dati
-
Upload
irene-celino -
Category
Technology
-
view
2.120 -
download
2
description
Transcript of La Semantica e il Web dei Dati
Convegno “La socialità dopo il Web 2.0” – Milano, 2 aprile 2009 La semantica e il Web dei dati - Irene Celino – © CEFRIEL 2009
La semantica e il Web dei dati: quando uno più uno non fa solo due
Irene Celino CEFRIEL – ICT Institute Politecnico di Milano
email: [email protected]
Milano, 2 aprile 2009 – © CEFRIEL 20092La semantica e il Web dei dati - Irene Celino
Semantica?Semantica? In filosofia, la semanticasemantica è lo studio del significato
Ogni giorno, in ogni momento, siamo sommersi di dati, informazioni, contenuti e tanti tipi diversi di media
Tutti questi dati però, per essere di qualche utilità, necessitano di essere interpretati dalle persone
La crescita esponenziale della quantità di dati spinge tutti a cercare soluzioni tecnologiche per ovviare a questi problemi
Milano, 2 aprile 2009 – © CEFRIEL 20093La semantica e il Web dei dati - Irene Celino
Quali sono le capacità delle macchineQuali sono le capacità delle macchine I sistemi informaticisistemi informatici che utilizziamo tutti i giorni
rappresentano l’informazione attraverso Il linguaggio naturale (italiano, inglese, cinese, …) Grafici, multimedia, …
Gli esseri umaniesseri umani elaborano facilmente questa informazione Possono dedurre fatti da informazione parziale Possono creare associazioni mentali Sono abituati a interagire con diversi tipi di media (problemi di
accessibilità a parte…)
Invece le macchinemacchine sono “ignorantiignoranti” L’informazione parziale è inutilizzabile Difficoltà di estrarre il significato ad es. da un’immagine Trovare automaticamente analogie è difficile Difficoltà di combinare automaticamente le informazioni
Milano, 2 aprile 2009 – © CEFRIEL 20094La semantica e il Web dei dati - Irene Celino
L’evoluzione del WebL’evoluzione del Web
1 – il Web delle origini1 – il Web delle origini1 – il Web delle origini1 – il Web delle origini
2 – il Social Web2 – il Social Web2 – il Social Web2 – il Social Web 3 – il Semantic Web3 – il Semantic Web3 – il Semantic Web3 – il Semantic Web
4 – l’Ubiquitous Web4 – l’Ubiquitous Web4 – l’Ubiquitous Web4 – l’Ubiquitous Web
Connette i documentiConnette i documentiConnette i documentiConnette i documenti
Connette le personeConnette le personeConnette le personeConnette le persone Connette la conoscenzaConnette la conoscenzaConnette la conoscenzaConnette la conoscenza
Connette le intelligenzeConnette le intelligenzeConnette le intelligenzeConnette le intelligenze
Concetto rielaborato tratto da: Nova Spivak, John Breslin, Mills Davis (2008)
Milano, 2 aprile 2009 – © CEFRIEL 20095La semantica e il Web dei dati - Irene Celino
“The Semantic Web Semantic Web is a vision: the idea of having datadata on the Web defined and linkedlinked in a way that it can be usedused byby machinesmachines not just for display purposes, but for automationautomation, integrationintegration and reusereuse of data acrossacross applicationsapplications”
– Tim Berners-Lee (2003)
“The Semantic WebSemantic Web is not a separate Web but an extension of the currentextension of the current one, in which information is given well-defined well-defined meaningmeaning, better enabling computerscomputers and peoplepeople to work in cooperationcooperation”
– Tim Berners-Lee (2001)
Perchè il Semantic WebPerchè il Semantic Web
Milano, 2 aprile 2009 – © CEFRIEL 20096La semantica e il Web dei dati - Irene Celino
L’integrazione dei datiL’integrazione dei dati Il problema dell’integrazione:
Enormi quantità di dati che crescono ed evolvono in continuazione
problema di scalascala Tante diverse tipologie di dato (documenti, media, email,
risultati Web, contatti, ecc.) problema di eteroge-eteroge-
neità dei datineità dei dati Tanti diversi sistemi
informativi (DB, applica-zioni legacy, ERP, ecc.)
problema di eteroge-eteroge-neità dei sistemineità dei sistemi
Milano, 2 aprile 2009 – © CEFRIEL 20097La semantica e il Web dei dati - Irene Celino
Quando 1 + 1 > 2 ?Quando 1 + 1 > 2 ? L’integrazione dei dati dà sempre un valore aggiuntovalore aggiunto
Visione d’insieme: “e pluribus unum”
Condividere la conoscenza: “l’unione fa la forza”
Opportunità di business
Business Intelligence
Resta il problema tecnologicoproblema tecnologico: Chi è riuscito a trarre vantaggio
dall’integrazione?
Come riconciliare l’eterogeneità dei dati?
La semantica può essere d’aiuto?
Milano, 2 aprile 2009 – © CEFRIEL 20098La semantica e il Web dei dati - Irene Celino
La lezione del Web 2.0La lezione del Web 2.0 La politica della partecipazionepolitica della partecipazione e la
“saggezza delle folle”
Il grande successo dei mash-upmash-up Mash-up: applicazioni realizzate
dall’integrazione “light” di artefatti forniti da altri (spesso API o servizi REST)
Nuovo paradigma di integrazione per la realizzazione di applicazioni
Pubblicazione e accesso via Webvia Web È sempre più semplice “memorizzare”
l’informazione sul Web È sempre più diffuso accedere
all’informazione sul Web, facendo affidamento ai motori di ricerca per recuperarla
Milano, 2 aprile 2009 – © CEFRIEL 20099La semantica e il Web dei dati - Irene Celino
Per integrare dati provenienti da sorgenti diverse è necessario capire come “incastrare” tra loro i daticome “incastrare” tra loro i dati
Per fare questo è necessario guardare al significato dei significato dei datidati e passare “dalla sintassi alla semantica”
Bisogna riconciliare datiriconciliare dati solo in apparenza diversi, facendo leva su alcuni possibili approcci/metriche:
Distanza semantica: “lontananza” in termini di significato
Similarità semantica: somiglianza in termini di significato e di “ampiezza”
La semantica per l’integrazioneLa semantica per l’integrazione
Milano, 2 aprile 2009 – © CEFRIEL 200910La semantica e il Web dei dati - Irene Celino
Il Web come piattaforma di integrazioneIl Web come piattaforma di integrazione E se l’integrazioneintegrazione si facesse sul Websul Web?
Web come piattaforma Data prosumer (producer + consumer)
“Web of DataWeb of Data” Passare dall’attuale “Web of Documents” ad un Web dei dati Non più solo information retrieval, ma anche data retrieval
Esporre i propri datiEsporre i propri dati sul Web Convertire/tradurre in formato opportuno “Wrap” della sorgente dati
D2RD2RVirtuosoVirtuoso
SquirrelRDFSquirrelRDF
SPASQLSPASQL
Relational.OWLRelational.OWL
DartGridDartGridSPOONSPOON
TriplifyTriplify
R2OR2OTalisTalis
Milano, 2 aprile 2009 – © CEFRIEL 200911La semantica e il Web dei dati - Irene Celino
Linked DataLinked Data La concretizzazione del “Web of Data” (e del Semantic Web) Tim Berners-Lee: http://www.w3.org/DesignIssues/LinkedData
Linking Open Data InitiativeInitiative Una comunità che pubblica e “linka” i dati sul Web http://linkeddata.org/
Data cloudData cloud Oggi si parla molto di
cloud computing
Spesso però non è di solacomputazione che si tratta,ma di gestione dei dati e della conoscenza
Linked data e data cloudLinked data e data cloud
Milano, 2 aprile 2009 – © CEFRIEL 200912La semantica e il Web dei dati - Irene Celino
www.flickr.com/photos/_-amy-_/3167333250/
““Stop hugging Stop hugging your data”your data”
Tim Berners-Lee, 2009Tim Berners-Lee, 2009
I linked data visti dall’inventore del WebI linked data visti dall’inventore del Web
Non lasciare che considerazioni sulla
sicurezza o sulla proprietà dei dati
ostacolino opportunità e innovazione
Milano, 2 aprile 2009 – © CEFRIEL 200913La semantica e il Web dei dati - Irene Celino
Sfide per i linked dataSfide per i linked data Distributed queryingDistributed querying
Interrogare dati distribuiti su diverse sorgenti sul Web disinteressandosi della “posizione” dei dati e ottenendo i risultati già aggregati
Automatic linkageAutomatic linkage Trovare meccanismi per identificare i punti di contatto tra dati
provenienti da fonti diverse e creare i “link” che permettono di passare da una fonte all’altra senza soluzione di continuità
Distributed reasoningDistributed reasoning Applicare tecniche di inferenza e di
ragionamento automatico a dati distri-buiti sul Web, preservando consisten-za e correttezza del ragionamento
Milano, 2 aprile 2009 – © CEFRIEL 200914La semantica e il Web dei dati - Irene Celino 14
LarKC platform
Interface
Mobile Data Mashup Environment
SPARQL
query
SPARQL
result
REST
request
JSONresponse
Request data Data
PipelineConfig.
PROBLEM: Which Milano monuments or events or friends can I quickly get to from here?
TrafficMonumentsEventsPeople
La ricerca e i linked data:La ricerca e i linked data:_________
http://www.larkc.eu
Milano, 2 aprile 2009 – © CEFRIEL 200915La semantica e il Web dei dati - Irene Celino
SemanticsKnowledge Representation
& Reasoning
Web ServicesAs a basic tool to implementa Service Oriented Architecture
Semantic Web ServicesAs a means to realize
Service Oriented Architecture
Web 2.0User clusteringUser-Resource correlation
Semantic Search Conceptual Indexing Semantic Matching
AutomaticSemantic Annotation
Combining smart-machine and smart-data
Service-Finder aims at developing a platform for service discovery in which
Web Services are embedded in a Web 2.0 environment
Service-Finder aims at developing a platform for service discovery in which
Web Services are embedded in a Web 2.0 environment
Realizing Web Service Discovery at Web Scale
http://www.service-finder.eu
La ricerca e i linked data:La ricerca e i linked data:_____________
Milano, 2 aprile 2009 – © CEFRIEL 200916La semantica e il Web dei dati - Irene Celino
Se non vi ho convinto io…Se non vi ho convinto io…http://www.ted.com/index.php/talks/tim_berners_lee_on_the_next_web.html
Convegno “La socialità dopo il Web 2.0” – Milano, 2 aprile 2009 La semantica e il Web dei dati - Irene Celino – © CEFRIEL 2009
Grazie dell’attenzione!
Irene Celino
email: [email protected]: http://www.cefriel.it, http://swa.cefriel.it
Semantic Web PracticeCEFRIEL – ICT Institute Politecnico di Milano