Gabriele Gattiglia - Progettare la pubblicazione dei dati

38
Gabriele Gattiglia (con la fondamentale collaborazione di Francesca Anichini) PROGETTARE LA PUBBLICAZIONE DEI DATI

Transcript of Gabriele Gattiglia - Progettare la pubblicazione dei dati

Gabriele Gattiglia (con la fondamentale collaborazione di Francesca Anichini) PROGETTARE LA PUBBLICAZIONE DEI DATI

Provare NO! Fare o non fare! Non c’è provare Quanti di voi producono o hanno prodotto dati grezzi? Di che tipo? Con quali formati? Aperti o proprietari? Pubblichereste i dati dei vostri lavori come open data?

Il mondo archeologico italiano ravvisa una serie di rischi insiti nell'apertura dei dati alcuni veri, alcuni presunti

Dati sondaggio MAPPA 2013 http://mappaproject.arch.unipi.it/wp-content/uploads/2011/08/2013_05_31_csv.csv

OK, OK….non arrabbiamoci… ripartiamo da due cose banali, pratiche e (forse) innovative

La pubblicazione dei dati deve essere pianificata già nella fase di progettazione della ricerca

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Progettare ? Ma come? Vediamo: facciamo un TEST

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

A quale pubblico ti rivolgi?

SCIENTIFICO GENERALISTA (cittadinanza)

Vai alla slide n.10 Vai alla slide n.10

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Quali dati vuoi pubblicare?

TUTTI SOLO ALCUNI

Vai alla slide n.11 Vai alla slide n.16

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Devi scegliere come pubblicare: CARTACEO DIGITALE

SLIDE 11

Vai alla slide 12 Vai alla slide n.14

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Hai valutato, tempi, costi, diffusione, possibilità di riuso…..

SLIDE 12

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Devi scegliere come pubblicare: CARTACEO DIGITALE

Vai alla slide n.12 Vai alla slide n.14

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

OK! Comincia ad organizzare i tuoi Dataset!

SLIDE 14

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Quali dati vuoi pubblicare?

TUTTI SOLO ALCUNI

Vai alla slide n.11 Vai alla slide n.16

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Allora devi fare una selezione.

• Con quali criteri selezionerai i dati? • Sei proprio convinto che sia sufficiente pubblicare solo alcuni dati?

Vai alla slide n.17 Vai alla slide n.13

• Dove finiranno tutti i dati che non pubblicherai?

Tranquillo ho già previsto tutto

Mmm…non ci avevo pensato…

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Hai scelto il lato oscuro della forza

SLIDE 17

…e di tenerti il tuo tessoro

Il tuo Profilo:

Allora devi fare una selezione.

• Con quali criteri selezionerai i dati? • Sei proprio convinto che sia sufficiente pubblicare solo alcuni dati?

Vai alla slide n.17 Vai alla slide n.19

• Dove finiranno tutti i dati che non pubblicherai?

Tranquillo ho già previsto tutto

Mmm…non ci avevo pensato…

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

La forza scorre nelle tue vene: i dubbi dimostrano che c’è sempre da imparare, ma ti diamo ragione, seguendo l’abitudine (e la consuetudine) spesso non si cercano soluzioni nuove. L’importante è accorgersene in tempo e aggiustare il tiro. Puoi ancora tirare fuori i tuoi dati dal cassetto: il mondo (archeologico) te ne sarà grato!

SLIDE 19

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Il tuo profilo:

Iniziamo a ragionare seriamente, perché progettare la pubblicazione dei dati di un intervento archeologico vuol dire pensare a molte cose. È necessario organizzarsi …

o si fa una brutta ‘figura’…

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Ragioniamo su un intervento di scavo «tipo»

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

- rendersi conto della mole di dati che si producono. - pensare fin dall’inizio a come produrre i dati (formati) e a come archiviarli, in modo da facilitarne la gestione. Guarda qui per farti un’idea

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Istruzioni per l’uso ØPENDATÅR

Non essendosi mai posti il problema di condividere i dati, gli archeologi non si sono mai posti il problema di come crearli. Per questo motivo oggi troviamo dati prodotti in formati diversi e moltissimi dati prodotti in formati testuali, quindi non machine readable se non tramite trasformazioni o data mining. Inoltre, un dato per essere veramente open dovrebbe essere disseminato attraverso un formato aperto che consenta all’utente di non utilizzare software proprietari. È questa una lunga strada che solo partendo dal basso, cioè dall’apertura dei dati, può giungere a soluzioni condivise, passando anche per soluzioni pragmatiche, come l’utilizzo di formati di larga diffusione anche se proprietari.

Formati

.pdf

.xls/.xlsx

.doc

.mdb

.csv

.json

.shp

.dwg .geojson

- Facilitare il riuso: oltre ai formati è necessario avere chiaro i possibili riutilizzatori dei dati prodotti che non sono necessariamente e unicamente gli addetti ai lavori e quindi con quali licenze disseminare i dati

ØPENDATÅR

- Digitalizzare non vuol dire datificare: la digitalizzazione di solito è la migrazione su formati digitali, per la disseminazione e il riutilizzo, la datificazione è, invece la trasformazione, direttamente all’origine, di oggetti, processi, ecc. in un formato quantificato in modo che possano essere tabulati e analizzati.

ØPENDATÅR

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Competenze: includere tutte le professionalità necessarie a garantire la corretta produzione dei dati e la loro pubblicazione : • project manager • digital information manager • rilevatore/disegnatore/grafico • responsabile reperti • responsabile archivio fotografico • responsabile DB informatico (o persona

con elevate competenze informatiche) • web designer (opzionale ?) • addetto ai social media (opzionale ?) • eventuali competenze per settori

specifici (analisi…) • traduttore (credibile?)

ØPENDATÅR

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

- valutare le competenze necessarie - valutare le attrezzature necessarie - valutare i tempi - valutare i costi - valutare se è necessario avere preventivamente degli accordi di carattere istituzionale: Soprintendenza, Enti locali, Committenti, ecc…

IKEA stonehenge infographic by justin pollard

- è importante che tutto lo staff condivida il progetto (e le modalità di pubblicazione) -è importante che il lavoro fatto sia pubblicizzato perché raggiunga tutto il pubblico al quale è destinato (o almeno buona parte di esso)

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

IKEA stonehenge infographic by justin pollard

L’esempio di Massaciuccoli romana

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Cosa è stato fatto: • Pubblicazione in progress dei risultati su sito e FB

• Pubblicazione di carattere scientifico (preliminare) sia

cartacea sia pdf scaricabile gratuitamente

• Pubblicazione «divulgativa» sia cartacea sia pdf

scaricabile gratuitamente

• Pubblicazione di tutti i dati prodotti sul sito dell’area

archeologica

• Promozione on-line e off-line

http://www.massaciuccoliromana.it/

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Come ci si è riusciti?

• Si è fatto un progetto della ricerca (è stata pagata la fase di progettazione) per concorrere ad un bando di finanziamenti pubblici

• La time-line dettata dal progetto ha permesso di portare

a termine tutte le fasi nei termini previsti (pena perdita del finanziamento)

• Si è costituito uno staff competente e affiatato • Si è preteso che venissero rispettati i diritti (e i doveri) di

tutti: di chi ha lavorato, di chi ha pagato il progetto (pubblico), di chi ha ricoperto ruoli scientifico-istituzionali (soprintendenza)

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

I limiti riscontrati:

• Produzione di formati realmente aperti

• Difficoltà di conciliare i tempi professionali con

quelli «istituzionali»

• Relativa diffusione a carattere internazionale

(lingua)

• Inaffidabilità del server comunale

Fonte: Francesca Anichini Progettare la pubblicazione dei dati

Altre idee?

IKEA stonehenge infographic by justin pollard

Pubblicare i dati contestualmente agli articoli di sintesi

Open by Default Il capitolato d’appalto dell’intervento archeologico collegato ai lavori di ristrutturazione de ‘La Sapienza’ di Pisa, redatto dal laboratorio MAPPA di UNIPI, prevede sia la produzione dei dati archeologici direttamente in formato aperto, dal GIS di scavo, alle quantificazioni dei reperti, sia la pubblicazione come open data degli stessi entro 4 mesi dalla fine dei lavori e ne stima i relativi costi.

6.5 open data: utta la documentazione prodotta confluirà nell’archivio open data MOD (www.mappaproject.org/mod) secondo le modalità di pubblicazione riportate al seguente indirizzo http://mappaproject.arch.unipi.it/mod/pubblicare-nel-mod.php, sarà pubblicata on-line come dati aperti a nome degli autori della documentazione e corredata da apposite licenze (CC-BY o CC-BY-SA) e codice DOI, atti a garantire la paternità intellettuale degli autori stessi.

Per essere chiari E’ necessario non improvvisare, ma progettare e riconoscere come lavoro la progettazione

Fare Open Data ha un costo nella preservazione dei dati a lungo termine che assicura. Questa serve a garantire l'autenticità, l'affidabilità e l'integrità logica dei dati, attraverso le seguenti soluzioni: normalizzazione, ovvero la migrazione verso gli standard aperti maggiormente supportati; migrazione di versione, cioè la migrazione attraverso versioni successive di un formato, in molti casi è l'unica opzione per preservare formati proprietari che non migrano verso standard aperti; migrazione di formato, cioè la migrazione verso formati che consentano una maggiore diffusione; refreshment, ovvero il trasferimento di dati tra due supporti digitali dello stesso tipo. In pratica i costi vengono trasferiti sui repositories.

Fare Open Data non vuol dire costo ZERO Fare Open Data ha un costo nella creazione dei dati

IKEA stonehenge infographic by justin pollard