Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data geografici

28
Valorizzare le IDT conformi agli standard OGC ® per produrre Linked Open Data geografici Massimo Zotti Roma, 27 Settembre 2012

description

I dati e più in generale l'informazione geografica condivisa dalle Infrastrutture di Dati Territoriali (IDT) possono arricchire il patrimonio che i cataloghi di Open Data rendono accessibile. Introdurre la dimensione semantica ai dati geografici, passando da OpenData a Linked Open Data, crea un valore aggiunto determinato dalla possibilità di collegare l'informazione territoriale, una delle più importanti poiché costituisce una variabile essenziale a definire il contesto di altri dati, alle innumerevoli informazioni esistenti nella "nuvola" dei Linked Open Data ("LOD Cloud"). La presentazione illustra un caso applicativo di estrazione di LOD geografici da Infrastrutture di Dati Territoriali, ed esempi sul potenziale utilizzo di queste applicazioni.

Transcript of Valorizzare le IDT conformi agli standard OGC® per produrre Linked Open Data geografici

  • 1. Valorizzare le IDT conformi agli standard OGC per produrre Linked Open Data geografici Massimo Zotti Roma, 27 Settembre 2012

2. AgendaOpen DataOpen Data Geografici e GeoportaliUn caso applicativo: Regione Emilia-Romagna 3. Open DataOpen Data una filosofia, una pratica secondo cui Alcune tipologie di dati devono essere liberamente accessibili a tutti, senza restrizioni di copyright, brevetti o altre forme di controllo che ne limitino la riproduzione. (fonte Wikipedia) 4. Open Data Il dato pubblico stato prodotto con denaro pubblico: ,quindi, della collettivit. Il dato deve essere restituito allacollettivit. Liberare i dati e fare in modo che tutti possano utilizzarlicome ritengono opportuno. Idee innovative Impulso alla crescita economica 5. Open DataMolteplici le iniziative dapertura del patrimonio informativoavviate in Italia da parte di pubbliche amministrazioni centrali elocali:dati.piemonte.itdati.emilia-romagna.itdati.veneto.itdati.gov.itecc 6. Open Data: le 5 stelle di Tim Berners-Lee (*) Una Stella. il livello base, costituito da file nonstrutturati: ad esempio unimmagine in formato grezzo(formati come .gif, .jpg, .png), un documento in formatoMicrosoft Word, un file in formato Adobe Pdf. Una sola stella indica la semplice disponibilit di una informazione e di undato on line, in un formato qualsiasi, purch distribuito con licenza aperta.I dati distribuiti in questo formato sono leggibili e stampabili dagli utenti,possono essere conservati localmente su un PC e sono semplici dapubblicare. Tuttavia non sono un formato aperto in quanto non possibileeffettuare su di essi alcuna elaborazione. 7. Open Data: le 5 stelle di Tim Berners-Lee (**) Due Stelle. Questo livello indica dati strutturati macodificati con un formato proprietario. Ad esempio undocumento in formato Microsoft Excel.Due stelle indicano, oltre alle possibilit offerte dai dati contraddistinti dauna sola stella, la possibilit di effettuare elaborazioni sui dati, a patto didisporre del software necessario a gestire un file codificato con unformato proprietario. I dati caratterizzati dalle due stelle non sono unformato aperto in quanto per elaborarli necessario un softwareproprietario, tuttavia di norma possono essere convertiti essendo datistrutturati in dati aperti. 8. Open Data: le 5 stelle di Tim Berners-Lee (***) Tre Stelle. Questo livello indica dati strutturati ecodificati in un formato non proprietario. Ad esempio ilformato .csv (Comma Separated Values) al posto adesempio del formato Microsoft Excel utilizzato nel casoprecedente.Tre stelle indicano, oltre alle possibilit offerte dai dati contraddistinti dadue sole stelle, la possibilit di effettuare elaborazioni sui dati senza essercostretti ad utilizzare software proprietario. Quello caratterizzato dalle trestelle il formato pi semplice di dati aperti. 9. Open Data: le 5 stelle di Tim Berners-Lee (****) Quattro Stelle. Questo livello indica dati strutturati ecodificati in un formato non proprietario che sono dotati di unURI che li rende indirizzabili sulla rete e quindi utilizzabilidirettamente online, attraverso linclusione in una strutturabasata sul modello RDF (Resource Description Framework) . Quattro stelle indicano quindi il fatto che il singolo dato di un dataset,disponibile on line in un formato aperto (tipicamente XML/RDF) pu essererichiamato attraverso unURL (Uniform Resource Locator) specifico. Ciconsente di puntare al dato o ad un insieme di dati da una applicazione oaccedervi dallinterno di un programma che pu poi elaborarlo in vari modi . 10. Open Data: le 5 stelle di Tim Berners-Lee (*****) Cinque Stelle. Questo livello indica quelli che vengonodefiniti Linked Open Data (LOD). Quei dati aperti, cio, che dal punto di vista del formato oltre a risponderealle caratteristiche indicate al punto precedente (classificazione a quattrostelle) presentano anche, nella struttura del dataset, collegamenti ad altridataset. In altri termini, grazie al ricorso al gi citato modello di descrizionedei dati RDF, possibile collegare dinamicamente tra loro pi dataset,incrociando cos informazioni provenienti da fonti diverse, eventualmentegestite da diverse Amministrazioni. 11. Open Data: panorama italiano * (*fonte datigov.it) 12. Open Data: panorama italiano * (*fonte datigov.it) 13. Open Data: panorama italiano * (*fonte datigov.it) 14. Open Data e Geoportali Nellottica di una forte integrazione con il portale Open Data,un GeoPortale rappresenta un provider di (geo)dati open afavore del portale Open Data Un Geoportale deve alimentare con i propri dati, in manieramanuale o automatica, il portale Open Data Lideale per evitare disallineamentitra Portale Open Data e Geoportale lutilizzo di soluzioni automatiche di conferimento dati 15. Open Data e Geoportali: cosa fareEsporre servizi standard OGC: CS-W e WFSAssociare le licenze ai datiDefinire e/o selezionare ontologie sui dati e metadatiSeguire i passi definiti nel LOD Life CycleGetLOD: soluzione che implementa lintero LOD Life Cycle 16. Open Data e Geoportali: ontologieHanno lo scopo di organizzare un dominioServono a delineare le strade che collegano gli oggetti deldominio, e consentono di sapere meglio come fare amuoversi tra questi oggettiSuperano i limiti degli RDF, dove non possibile, ad esempio,definire due classi come equivalenti, magari perch realizzateda autori diversi (che quindi possono avere utilizzato diversiidentificatori per definire il medesimo concetto).Quando modelliamo una ontologia chiediamoci sempre: Cosa vogliamo dire o fare dei nostri oggetti, come lichiamiamo in causa 17. Open Data e Geoportali: Linked Open DataI dati, se isolati, hanno poco valore; viceversa, il loro valoreaumenta sensibilmente quando data set differenti, prodotti epubblicati in modo indipendente da diversi soggetti, possonoessere incrociati liberamente da terze parti.(fonte http://www.linkedopendata.it)Generare dataset in formato RDF (Linked Data) , contenenticonnessioni fra loro e con dataset esterni, accresce il valore deldato 18. Regione Emilia-Romagna: GetLOD GetLOD rende disponibili come Open Data (con particolareattenzione per il formato RDF/XML e quindi come LinkedOpen Data o LOD) dati e metadati gestiti da unInfrastrutturadi Dati Territoriali GetLOD una soluzione openrealizzata da Planetek Italia s.r.l. e SINERGIS s.r.l 19. Regione Emilia-Romagna: GetLODSoluzione OPEN e riusabile che: Si integra alle Infrastrutture di Dati Territoriali grazie aglistandard definiti dallOpen Geospatial Consortium (OGC)WFS e CS-W. Consente di pubblicare i dati geografici aperti sia in formatoRDF (Linked Open Data), sia in altri formati di interscambionon linkabili (Shapefile e GML). 20. Regione Emilia-Romagna: GetLOD Consente di estrarre le triple RDF dai servizi OGC:WFS Consente di accedere al dato in modalit remota e standard Aggancia ai dati, i metadati mediante chiamate ai serviziOGC:CS-W Pu popolare un Triple Store,il CKAN(Comprehensive Knowledge Archive Network),o un Portale Dati Open regionale 21. Regione Emilia-Romagna: GetLOD 22. GetLOD: caso applicativoEdifici e terremoti 23. GetLOD: caso applicativo estrazione WFS centro storico di Mirandola: 3181 edifici da ISIDE (Ingv): estrazione CSV 69 scosse dal 19/05 al 28/06 nellintorno di 20km 24. GetLOD: caso applicativoModellata unontologia per gli edifici che riusa ontologie diffuse e standard.Per i terremoti utilizzata ontologia SWEET (NASA) 25. GetLOD: caso applicativo La geometria quella del centroide, ed replicata sia in W3C WGS84 che in OGC GeoSPARQL 26. GetLOD: caso applicativoLa geometria completa non contenuta nel triple store, ma raggiungibile attraversoun link che contiene la richiesta WFS relativa 27. GetLOD: caso applicativo Selezione edifici di tipologia specifica pi vicini di x km dagliepicentri con magnitudine maggiore di M Individuazione delle date dei sisma pi vicini a edificiindustrialiTutte analisi che si possono fare bene allinterno di strumenti GIS desktop e weba disposizione di tutti!Le cose sarebbero ben diverse se esistessero come LOD anche: dati comunali adempimento obblighi L.R. 19/2008 (schede L0, L1 ) che siriferiscono agli URI degli edifici anagrafe comunale degli immobili riferita ai medesimi URI DB attivit economiche (sempre riferite agli edifici) anagrafe residenti terremoti da INGV 28. SDI, Geoportali e Open Data Geografici Grazie per lattenzione [email protected]