Processi decisionali data-driven: la valorizzazione del ... · Riflessi della rivoluzione dei dati...
Transcript of Processi decisionali data-driven: la valorizzazione del ... · Riflessi della rivoluzione dei dati...
Processi decisionali data-driven:
la valorizzazione del dato e dei
patrimoni informativi
a cura di Pasquale Sarnacchiaro
24 settembre 2018
Definizione Data Driven Economy
Piano Triennale per l’informatica nella PA
Gli Open Data nella PA in Italia
Aspetti fondamentali della Linea guida per la valorizzazione degli Open Data
nella PA
Riflessi della rivoluzione dei dati sulla statistica ufficiale
Casi
Indice
3
Quand’è che la complessità genera valore?
Quando siamo in grado di mettere a sistema tutti i dati a disposizione, porli al centro
dei processi di conoscenza, utilizzarli per misurare un territorio e, attraverso questo
processo, governarlo.
Il ruolo delle tecnologie è naturalmente centrale in questo processo, ancora una volta
le tecnologie sono lo strumento che abilita la trasformazione
La data-driven economy è semplicemente un’economia in cui l’uso dei dati è centrale
nelle strategie e nella gestione del business, nello sviluppo di nuovi prodotti e servizi, nei
processi decisionali, nella creazione di innovazione e nella diffusione della conoscenza
Data Driven Economy
Fenomeno Complesso
4
I dati sono tanti, sono ovunque e sono una grande ricchezza:
per le aziende che possono utilizzarli per avviare nuove opportunità di business,
per le amministrazioni che grazie alla conoscenza e all’analisi dei dati possono
prendere decisioni mirate,
per i cittadini che possono trovare nei dati, soprattutto quando questi vengono
rilasciati sotto forma di dati aperti, un incredibile strumento di partecipazione.
I dati possono essere un potente acceleratore per la crescita dei territori, ma non hanno
valore in sé. Infatti è necessario che siano
raccolti,
sistematizzati,
messi a confronto,
elaborati,
analizzati.
Data Driven Economy
…in tal caso ci supportano per
la Misura e la
Rendicontazione
5
Data Driven Economy
Misura
Maggiori produttori di dati
Istat
PA nello svolgimento delle proprie funzioni
bilanci comunali e delle spese regionali
social media
web scraping
Imprese (dati di rendicontazione sociale e ambientale e dati di consumo di prodotti, media e
tecnologie).
IOT (Secondo l’Osservatorio Internet of Things del Politecnico di Milano, nonostante
difficoltà di vario tipo negli ultimi 3 anni il 51% dei Comuni italiani sopra i 15mila abitanti
ha avviato almeno un progetto IOT in ambito smart city (38% gestione del traffico, 37%
illuminazione, 35% gestione parcheggi)).
Ogni fenomeno può essere conosciuto incrociando fonti di dati enormi e molto diverse tra loro
6
Data Driven EconomyValutazione (Rendicontazione)
I cittadini sono fruitori ma anche produttori di dati, non sono più soggetti passivi che
subiscono le scelte delle amministrazioni. Queste ultime, quindi, oltre a fare le proprie scelte
sulla base di richieste e bisogni reali (dopo aver analizzato attraverso i dati ciò che avviene
nel proprio territorio), devono anche rendere chiari i motivi delle scelte, soprattutto in un
contesto di risorse limitate.
Mettere in evidenza le diverse alternative e le loro conseguenze è l’unico modo per sperare
di ottenere non un consenso puramente elettorale, ma un reale e duraturo coinvolgimento
nei processi di cambiamento e d’innovazione.
Per fare questo si devono condividere indicatori fin dalla fase di programmazione delle
iniziative
I vantaggi di un percorso di data driven
migliore gestione della spesa pubblica, investendo in settori in cui c’è davvero bisogno e
richiesta;
instaurazione di un nuovo rapporto fiduciario con i cittadini, basato sulla trasparenza e la
partecipazione.
7
Data Driven Decision per tracciare percorsi migliori
Metafora del Navigatore del passato che non aveva dati per elaborare le sue rotte e
navigava sostanzialmente a vista.
Adesso con il GPS il capitano sa collocare precisamente la nave e sulla base di tale
informazione stabilire/aggiornare la rotta (minimizzando tempo e costo)
Adesso il decisore politico può decidere come indirizzare la sua azione
Utilizzando i dati avrà la possibilità di disegnare le “rotte” migliori per scegliere
le policy, raggiungere obiettivi, migliorare le performance, ottimizzare processi.
8
Data Driven Decision per tracciare percorsi migliori
Criticità Materiali
1. Difficoltà ad accedere a dati di altre PA
2. Difficoltà ad utilizzare, combinare e mettere assieme dati provenienti da altre
fonti.
In questa ottica un valido strumento
Data Analytics Framework
Il DAF è una delle attività previste dal Piano Triennale per l’Informatica nella PA ed è un
progetto che va proprio nella direzione di raccogliere alcuni dati prodotti dalle PA su un’unica
piattaforma Big Data al fine di valorizzarli e renderli funzionali anche al monitoraggio e al
supporto alle decisioni.
Obiettivo:
Infrastruttura digitale del Paese
9
Importanza del ruolo delle tecnologie
Il ruolo delle tecnologie è naturalmente centrale in questo processo, ancora una volta
le tecnologie sono lo strumento che abilita la trasformazione
I dati, come le tecnologie che li sottendono, devono diventare uno strumento
abilitante di un nuovo modo di amministrare il territorio che si basa sulla conoscenza
per prendere decisioni (data driven decision) e sul coinvolgimento di cittadini e
aziende nel processo decisionale.
Quando siamo in grado di mettere a sistema tutti questi dati, porli al centro dei
processi di conoscenza, utilizzarli per misurare un territorio e, attraverso questo
processo, governarlo.
10
Data Driven per tracciare percorsi migliori
Criticità Culturale – Fiducia nei dati
I dati sono utilizzati per verifiche successive e non in fase di programmazione
L’azione di chi amministra il territorio è ancora prevalentemente quella che potremmo
chiamare “opportunità politica”.
È un po’ come continuare a navigare guardando le stelle in un mare che nel frattempo
si è popolato di cargo, yacht e transatlantici.
Serve una cultura del dato
Serve personale competente
…sarà possibile capire, controllare e gestire sistemi caotici e complessi
11
Il Piano Triennale è un documento di indirizzo strategico ed economico attraverso il quale
viene declinato Il Modello strategico di evoluzione del sistema informativo della Pubblica
amministrazione
Previsto dallo statuto di AgID e dalla Legge di stabilità 2016 (l. 28 dicembre 2015, n. 208)
Il Piano nasce per guidare operativamente la trasformazione digitale della PA e diventa
riferimento per le amministrazioni centrali e locali nello sviluppo dei propri sistemi
informativi.
Definisce le linee guida della strategia operativa di sviluppo dell’informatica pubblica,
fissa i principi architetturali fondamentali, le regole di usabilità e interoperabilità, precisa
la logica di classificazione delle spese ICT e chiarisce il modello per lo sviluppo del
digitale.
PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19
12
I principali obiettivi del Piano Triennale sono:
definire le linee della strategia di sviluppo e realizzazione del sistema informativo
della Pubblica amministrazione in un quadro organico in base a quanto previsto dagli
obiettivi dell’Agenda Digitale italiana, dunque del Piano Crescita Digitale;
razionalizzare, dunque riqualificare la spesa ICT delle amministrazioni in coerenza
con gli obiettivi della Legge di stabilità 2016.
PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19
13
PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19
PARTE PRIMA - QUADRO DI RIFERIMENTO
PARTE SECONDA - COMPONENTI DEL MODELLO STRATEGICO DI
EVOLUZIONE DELL’ICT
PARTE TERZA - CONSIDERAZIONI FINALI E NOTE DI INDIRIZZO
14
PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19
PARTE SECONDA - COMPONENTI DEL MODELLO STRATEGICO DI EVOLUZIONE DELL’ICT
4. Infrastrutture immateriali
4.1. Dati della Pubblica amministrazione
4.1.1. Basi di dati di interesse nazionale
4.1.2. Open data
4.1.3. Vocabolari controllati e modelli dati
4.2. Piattaforme abilitanti
4.2.1. Scenario attuale
4.2.2. Obiettivi strategici
4.2.3. Linee di azione
…….
9. Data & Analytics Framework
9.1. Scenario attuale
9.2. Obiettivi strategici
9.3. Linee di azione
PARTE TERZA - CONSIDERAZIONI FINALI E NOTE DI INDIRIZZO
12.3. Indicazioni sui Dati della Pubblica amministrazione e sul DAF
15
4. Infrastrutture immaterialiI dati delle Pubbliche amministrazioni, insieme ai meccanismi e alle piattaforme create
per offrire servizi ai cittadini, costituiscono uno dei principali patrimoni digitali della PA.
Le direttrici del Piano
la razionalizzazione e la valorizzazione del patrimonio informativo della PA mediante il
superamento della “logica a silos”, ancor oggi troppo spesso adottata e retaggio di
processi amministrativi e scelte organizzative effettuate nel passato;
la messa a fattor comune delle componenti software che sono utili a tutte le Pubbliche
amministrazioni e che possono considerarsi sia acceleratori del processo di
digitalizzazione sia strumenti utili alla omogeneizzazione dei servizi offerti.
Le Infrastrutture immateriali sono suddivise in due macro-gruppi, così come mostrato
nella Figura 6:
i Dati della PA, ovvero le attività relative alle basi di dati di interesse
nazionale, gli open data e i vocabolari controllati;
le Piattaforme abilitanti, ovvero le piattaforme condivise a livello nazionale
dalle PA.
17
4.1. Dati della Pubblica amministrazione
Obiettivo Strategico per la PA
Valorizzazione del patrimonio
informativo pubblico
Superamento del paradigma di gestione del dato della “logica a silos” in
favore di una visione sistemica.
Il dato deve essere inteso come bene comune, condiviso gratuitamente tra
Pubbliche amministrazioni per scopi istituzionali]e, salvo casi
documentati e propriamente motivati, utilizzabile dalla società civile
Come
Efficienza amministrativa,
riuso dei dati a vantaggio del
cittadino
ampliamento delle possibilità di
analisi, ivi incluse la
comprensione e la predizione di
fenomeni sociali a supporto del
processo di policy making e dello
sviluppo di servizi al cittadino.
Perché
18
4.1. Dati della Pubblica amministrazione
Il Piano prevede tre aree:
basi di dati di interesse nazionale, ovvero basi di dati affidabili, omogenee per
tipologia e contenuto, rilevanti per lo svolgimento delle funzioni istituzionali delle
Pubbliche amministrazioni e per fini di analisi. Esse costituiscono l’ossatura del
patrimonio informativo pubblico, da rendere disponibile a tutte le PA, facilitando lo
scambio di dati ed evitando di chiedere più volte la stessa informazione al cittadino
o all’impresa;
open data, ovvero “dati di tipo aperto”. Essi comportano un processo finalizzato a
rendere i dati della Pubblica amministrazione liberamente usabili, riutilizzabili e
ridistribuibili, da parte di chiunque e per qualunque scopo, anche commerciale,
purché non siano soggetti a particolari restrizioni;
vocabolari controllati e modelli dei dati, che costituiscono un modo comune e
condiviso per organizzare codici e nomenclature ricorrenti in maniera standardizzata
e normalizzata (vocabolari controllati) e una concettualizzazione esaustiva e
rigorosa nell’ambito di un dato dominio (ontologia o modello dei dati condiviso).
19
4.1.2. Open dataGli open data sono definiti “dati di tipo aperto” nell’art. 68 del CAD e sono considerati
elementi fondanti nel recepimento della Direttiva europea sull’informazione nel settore
pubblico [49].
I dati pubblici sono aperti se:
• non sono riferibili a singole persone;
• sono resi disponibili in formato aperto, ovvero non proprietario, corredati dei relativi
metadati;
• hanno associata una licenza che ne consente a chiunque il più ampio riutilizzo.
Vincoli:
indicare la fonte di provenienza dei dati,
riutilizzarli secondo gli stessi termini per cui sono stati licenziati originariamente;
sono resi disponibili gratuitamente o ai soli costi marginali per la loro riproduzione e
divulgazione, salvo casi eccezionali che siano trasparentemente e chiaramente identificati
dalle PA titolari.
20
4.2. Piattaforme abilitanti
Le Piattaforme abilitanti sono soluzioni che offrono funzionalità fondamentali, trasversali
e riusabili nei singoli progetti, uniformandone le modalità di erogazione.
Riduzione dei costi di acquisto software, di progettazione (riducendo i tempi e i costi di
realizzazione di nuovi servizi e garantendo maggiore sicurezza informatica).
Alcuni esempi rivolti ai cittadini e alle imprese sono i servizi di identificazione, di
fatturazione e di pagamento.
Altre piattaforme sono rivolte in via principale alla PA ma sono ugualmente abilitanti,
come ad esempio l’Anagrafe nazionale della popolazione residente (ANPR).
In questo modo sarà più facile per le amministrazioni offrire al cittadino e alle imprese un
modo uniforme e più semplice di interazione e collaborazione.
21
9. Data & Analytics Framework
Il Data & Analytics Framework (DAF) fa parte delle attività atte a valorizzare il
patrimonio informativo pubblico nazionale.
Obiettivi:
sviluppare e semplificare l’interoperabilità dei dati pubblici tra PA
standardizzare e promuovere la diffusione degli open data
ottimizzare i processi di analisi dati e generazione di conoscenza.
Come
Utilizzo di moderne piattaforme per la gestione e l’analisi dei big data agendo lungo
le seguenti direttrici principali:
22
1. amplificare sensibilmente il valore del patrimonio informativo della PA mediante
l’utilizzo delle tecnologie big data che consentono di creare conoscenza per i decision
maker e ridurre drasticamente i tempi di analisi.
2. favorire e ottimizzare lo scambio dei dati tra PA minimizzandone i costi transattivi per
l’accesso e l’utilizzo.
3. incentivare la diffusione degli open data e renderne più efficace l’utilizzo
(Centralizzazione e redistribuire i dati pubblici attraverso API, garantendo
standardizzazione di formati e modalità di riutilizzo su dati sempre aggiornati);
4. favorire l’analisi esplorativa dei dati da parte di team di data scientist, sia in seno alle
singole PA che a livello centrale, al fine di migliorare la conoscenza dei fenomeni sociali
5. infine, il framework consentirà la promozione di iniziative di ricerca scientifica su
tematiche di interesse specifico per la PA, favorendo la collaborazione con università ed
enti di ricerca.
9. Data & Analytics Framework
23
Stato dei risultati previsti per le infrastrutture e prossimi obiettivi*Nelle prossime versioni del Piano (il nuovo aggiornamento dovrebbe essere prodotto
entro la fine di settembre) sarebbe opportuno focalizzare con maggior precisione tutti i
risultati da ottenere anche per le restanti componenti, il cui sviluppo in caso contrario
potrebbe essere rallentato. Ovviamente sulle infrastrutture fisiche e immateriali è di
vitale importanza non accumulare ritardi. Questi, infatti, potrebbero propagarsi sulle
altre componenti del modello, rallentandone l’attuazione.
A questo proposito è interessante analizzare lo stato dei risultati previsti per le
infrastrutture fisiche e immateriali. Come mostrato in Figura 2, dei 73 risultati relativi
a tali componenti:
25 sono stati completati;
14 sono in corso di completamento;
19 sono in ritardo rispetto alle scadenze;
15 non hanno scadenze esplicitate.
24
Stato dei risultati previsti per le infrastrutture e prossimi obiettivi*
A cura di Luca Gastaldi (direttore osservatorio Agenda Digitale Politecnico di Milano) e
Paola Olivares (Osservatorio Fatturazione Elettronica & eCommerce B2b, Politecnico di
Milano)
25
Stato dei risultati previsti per le infrastrutture e prossimi obiettivi*
Un quadro tutto sommato positivo
Tale risultato può essere in parte spiegato da una semplificazione del coordinamento
tra attori preposti alla definizione e attuazione dell’impianto regolatorio. Gli attori che
hanno in capo una quota maggiore di risultati previsti sono: AgID che deve essere
coinvolta per l’attuazione di 87 risultati previsti, le PA locali (72) e il Team Digitale
(22). Tutti gli altri attori (ad es. Funzione Pubblica, i Ministeri, ANAC) hanno invece
un coinvolgimento minore, mediamente su 3 risultati.
Il quadro è quindi positivo e i presupposti per dare continuità a quanto fatto in questi
ultimi anni ci sono. Certo, tornando alle parole della Bongiorno, serve “credibilità”. La
trasformazione digitale della nostra PA non si realizzerà in pochi mesi. Serve tenacia,
un commitment centrale forte e un altrettanto forte coinvolgimento degli enti locali,
che devono beneficiare di quanto realizzato a livello centrale e scaricarlo a terra,
grazie al loro contatto diretto con i cittadini.
26
Gli Open data nella Pubblica Amministrazione
I dati aperti (open data) sono dati liberamente accessibili a tutti le cui eventuali restrizioni sono
l'obbligo di citare la fonte o di mantenere la banca dati sempre aperta.
L'open data si richiama alla più ampia disciplina dell'open government, cioè una dottrina in base
alla quale la pubblica amministrazione dovrebbe essere aperta ai cittadini, tanto in termini di
trasparenza quanto di partecipazione diretta al processo decisionale, anche attraverso il ricorso alle
nuove tecnologie dell'informazione e della comunicazione. (wikipedia)
Partiamo dalla definizione di Open data
…da non confondere con i Big data
27
Il termine Big data ("grandi dati" in inglese) descrive l'insieme delle tecnologie e delle metodologie di
analisi di dati massivi[1], ovvero la capacità di estrapolare, analizzare e mettere in relazione un'enorme
mole di dati eterogenei, strutturati e non strutturati, per scoprire i legami tra fenomeni diversi e
prevedere quelli futuri. (wikipedia.it)
Big data rappresenta anche l'interrelazione di dati provenienti potenzialmente da fonti eterogenee,
quindi non soltanto i dati strutturati, come i database, ma anche non strutturati, come immagini,
email, dati GPS, informazioni prese dai social network.
Definizione di big data (dataskill.it)
I big data sono dati che superano i limiti degli strumenti database tradizionali, ma con questo
termine si intendono anche le tecnologie finalizzate ad estrarre da essi conoscenze e valore. In
pratica, potremmo definire big data l'analisi di quantità incredibilmente grandi di informazioni.
In considerazione della loro enorme estensione in termini di volume, ma anche delle loro
intrinseche caratteristiche velocità e varietà, i big data richiedono tecnologie e metodi analitici
specifici che possano portare all'estrazione di valori di interesse.
4,6 miliardi gli smartphone attivi al mondo
2 miliardi di persone utilizzano internet è facile comprendere quante informazioni di
incredibile importanza possano essere estratte dai big data.
Definizione di Big data
Open Data dalla definizione agli aspetti giuridici
28
Open Data
Dati Aperti
Bene Comune
Dati appartengono al genere umano
Dati prodotti dalla PA, in quanto
finanziati da denaro pubblico, devono
ritornare ai contribuenti, e alla
comunità in generale, sotto forma di
dati aperti e universalmente
disponibili
Open Data nella Pubblica Amministrazione
Dato aperto
….si intende quel formato di dati reso pubblico, documentato esaustivamente e
neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati
stessi.(CAD art.68)
Nello stesso articolo si specifica inoltre che i dati sono considerati “open” se:
a) sono disponibili secondo i termini di una licenza che ne permetta l'utilizzo da
parte di chiunque, anche per finalità commerciali, in formato disaggregato;
b) sono accessibili attraverso le tecnologie dell'informazione e della
comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati
aperti ai sensi della lettera a), sono adatti all'utilizzo automatico da parte di
programmi per elaboratori e sono provvisti dei relativi metadati;
c) sono resi disponibili gratuitamente attraverso le tecnologie dell'informazione e
della comunicazione, ivi comprese le reti telematiche pubbliche e private,
oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione
e divulgazione.
29
Le Pubbliche Amministrazioni hanno la responsabilità di aggiornare, divulgare e
permettere la valorizzazione dei dati pubblici secondo principi di open government
(CAD, Capo V - Dati delle pubbliche amministrazioni e servizi in rete)
La normativa che prevede l’obbligatorietà della pubblicazione dei dati aperti, in
particolare, è stata introdotta con l’art. 9 comma 1 lett. a) del DL 179/2012, che
ha modificato l’art. 52 del CAD, con questo nuovo testo:
Open Data della Pubblica Amministrazione, responsabilità obbligatorietà
30
Open Data nella P.A.: I Benefici
Fare open data garantisce che tutti i dati a disposizione dell’ente siano facilmente
reperibili da tutti coloro che intendono utilizzarli: ciò è vero sia per i soggetti esterni,
quali cittadini e imprese, che per altri enti così come per i referenti interni all’ente
stesso di altri settori o servizi. I vantaggi derivanti da questo sistema sono molteplici:
MIGLIORAMENTO ORGANIZZATIVO – GESTIONALE: è possibile evitare costi superflui
derivanti dalla duplicazione degli sforzi per produrre informazioni già condivise da
un altro ente;
MIGLIORAMENTO DELLA QUALITA’ DEI DATI: è possibile instaurare un processo
virtuoso di omogeneizzazione che conduca ad avere informazioni più aggiornate e
complete; Inoltre i nuovi utilizzatori possono segnalare all'ente eventuali errori o
imprecisioni nei dataset, consentendo di migliorarli.
MAGGIORE TRASPARENZA, CONDIVISIONE E PARTECIPAZIONE: i riutilizzatori dei
dati possono reperire con maggior semplicità e immediatezza le informazioni di cui
necessitano, permettendo all’ente detentore del dato di liberare le risorse
impiegate fino a quel momento nella gestione delle richieste, per impiegarle in altri
tipi di attività.
31
Open Data nella P.A.: I Benefici
32
L’accesso ai dati consente agli individui
e alle organizzazioni di sviluppare
nuove idee e innovazioni
TRASPARENZA
la PA dovrebbe essere aperta ai
cittadini, in termini di trasparenza e
partecipazione diretta al processo
decisionale
CREAZIONE DI VALORE
i dati aperti possono essere usati in modi
innovativi per creare strumenti e prodotti utili
che contribuiscano alla creazione di nuovi
mercati, imprese e lavoro; infatti l’utilizzo dei
dati in formato aperto può dar luogo a nuove
applicazioni, anche mischiando dati
provenienti da fonti diverse (mash-up) e quindi
creando valore per gli utenti finali e anche
potenziali fonti di reddito per gli sviluppatori.
Rapporto Annuale (anno 2016)
Disponibilità di banche dati pubbliche in formato aperto
Versione
33
Indicatore“
# di banche dati PA disponibili in formato aperto in percentuale
sulle banche dati pubbliche di un paniere selezionato”,
62 data set componente nazionale
48 data set componente regionale
Anno 2015 Anno 2016
40% 59,68%
(37 su 62)
Normativa di Riferimento
Dati della Pubblica Amministrazione
Modello per i dati aperti e i metadati
Aspetti organizzativi e di qualità per i dati
Architettura dell’informazione del settore pubblico
Aspetti legali e di costo
Pubblicazione e dati.gov.it
38
Come può una Pubblica Amministrazione implementare un progetto di Open Data
Linee Guida Nazionali per la Valorizzazione del Patrimonio Informativo Pubblico (2016)
Normativa di Riferimento
Codice dell’Amministrazione Digitale (CAD)
Articolo 50 “Disponibilità dei dati delle pubbliche amministrazioni”,
Articolo 52 “Accesso telematico e riutilizzo dei dati delle pubbliche amministrazioni”
Articolo 68 - comma 3 per la definizione di dato aperto.
D.lgs 24 gennaio 2006, n.36, come modificato dal
D.lgs 18 maggio 2015 n. 102 - Attuazione della direttiva 2013/37/UE (che modifica
la direttiva 2003/98/CE relativa al ”Riutilizzo dell'informazione
del settore pubblico)
Statuto internazionale degli open data
Linee guida europee su licenze standard e dataset raccomandati e tariffe da
applicare nel riutilizzo di dati pubblici
39
Dati della Pubblica Amministrazione
Dato pubblico – dato conoscibile da Chiunque
Dati Aperto - un formato reso pubblico, documentato esaustivamente e neutro
rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi
Dato aperto (risponde a tre requisiti):
Disponibile (requisito giuridico)
Accessibile (requisito tecnologico)
Gratuito (requisito economico):
40
Modello per i dati aperti e i metadati
Si adotta il modello qualitativo per i dati aperti sul Web, noto come modello a cinque stelle
I livelli del modello per i dati aperti
Informazione: Dati disponibili tramite una licenza aperta e inclusi in documenti leggibili e
interpretabili solo grazie a un significativo intervento umano (e.g., PDF).
Dati disponibili in forma strutturata e con licenza aperta. Tuttavia, i formati sono
proprietari (e.g., Excel) e un intervento umano è fortemente necessario per un’elaborazione dei
dati.
41
Informazione: Dati con caratteristiche del livello precedente ma in un formato non proprietario
(e.g., CSV, JSON, geoJSON). I dati sono leggibili da un programma ma
l'intervento umano è necessario per una qualche elaborazione degli stessi.
Dati con caratteristiche del livello precedente ma esposti usando standard W3C
quali RDF e SPARQL I dati sono descritti semanticamente tramite metadati e ontologie
Dati con caratteristiche del livello precedente ma collegati a quelli esposti da altre persone e
organizzazioni (i.e., Linked Open Data2). I dati sono descritti semanticamente tramite metadati
e ontologie. I dati sono detti “linked” per la possibilità di referenziarsi (i.e., “collegarsi”) tra loro.
Nei caso dei Linked Open Data l'intervento umano si può ridurre al minimo e
talvolta addirittura eliminare.
Aspetti organizzativi e di qualità per i dati
INDIVIDUA UNA DATA GOVERNANCE E ASSICURATI CHE I PROCESSI INTEGRINO IL RILASCIO
DI DATI APERTI E IL COINVOLGIMENTO DEGLI UTENTI
Per attuare il modello è necessario
(i) definire una chiara data governance interna con l’individuazione di ruoli e
relative responsabilità; (Gruppo di lavoro Open data, Responsabile Open Data,
Responsabile e Referente tecnico della Banca dati, Ufficio Statistica, Ufficio
Giuridico Amministrativo, Gruppo di Comunicazione).
(ii) integrare le sue fasi sia verticalmente, rispetto ai processi interni già consolidati,
che orizzontalmente rispetto alle necessità delle diverse amministrazioni.
L’applicazione del modello deve avvenire in maniera costante: le attività non si
esauriscono con la mera pubblicazione dei dati, ove questo sia possibile, ma
devono prevedere un costante aggiornamento, monitoraggio e coinvolgimento
con gli utenti finali.
42
Queste quattro caratteristiche sono:
• accuratezza (sintattica e semantica) - il dato, e i suoi attributi, rappresenta
correttamente il valore reale del concetto o evento cui si riferisce
• coerenza - il dato, e i suoi attributi, non presenta contraddittorietà rispetto ad altri
dati del contesto d’uso dell'amministrazione titolare
• completezza – il dato risulta esaustivo per tutti i suoi valori attesi e rispetto alle
entità relative (fonti) che concorrono alla definizione del procedimento.
• attualità (o tempestività di aggiornamento) - il dato, e i suoi attributi, è del “giusto
tempo” (è aggiornato) rispetto al procedimento cui si riferisce.
43
Caratteristiche di Qualità del Dato Aperto
Aspetti legali e di costo
44
Premesse le azioni di condivisione dei dati tra pubbliche amministrazioni per finalità
istituzionali (artt. 50 e 58 del CAD), che avvengono esclusivamente a titolo gratuito, nel
caso dell’Open Data si suggerisce azioni volte a renderli disponibili esclusivamente a
titolo gratuito. Tuttavia, è prevista la possibilità di richiedere per il riutilizzo dei dati un
corrispettivo specifico, limitato ai costi sostenuti effettivamente per la riproduzione,
messa a disposizione e divulgazione dei dati. In tali casi le tariffe standard da
applicare, pubblicandole sul proprio sito istituzionale, sono calcolate sulla base del
“Metodo dei costi marginali”
L’informazione sul tipo di licenza è metadato indispensabile per determinare come
poter riutilizzare il dataset. Deve pertanto essere sempre specificata indicando, il
nome, la versione e fornendo il riferimento al testo della licenza.
45
La cultura dell’Open data
Esperienza del comune di Palermo
Oltre all’esigenza di rispetto di una normativa, lo spirito dell’esperienza è stato
quello di creare una nuova atmosfera di lavoro volta a
Stimolare lo scambio di idee
Condividere i lavori di gruppo
Andando oltre la PA ovvero aprendosi al confronto con il mondo esterno che
supporta e stimola il processo di pubblicazione dei dati pubblici.
Open data
come imposizione
normativa
Esposizione del
lavoro quotidiano
Collaborazione
vantaggiosa
per la PA, che migliora
la qualità dei dati,
Per la società civile
attiva nella creazione di
servizi utili a tutti a
partire dal riuso dei
dati.
46
La cultura dell’Open data
Esperienza del comune di Palermo
Grazie a questi confronti costanti tra i referenti degli uffici e i soggetti attivi della società
civile, grazie a questa contaminazione culturale si genera a cascata un processo virtuoso di
pubblicazione dei dati con i quali gli uffici lavorano quotidianamente, e che una volta messi
a disposizione della società possono cambiare status da dati a servizio. La disponibilità
pubblica di mappe, ad esempio, sta contribuendo negli ultimi anni a sviluppare una cultura
del marketing di prossimità. La nuova modalità di comunicazione “geografica” sta
avviando un nuovo modo di fruire l’informazione, con vantaggi non soltanto economici ma
anche culturali e dalle potenzialità ancora da esplorare. Il riuso dei dati comunali oggi attira
l’interesse di diversi dirigenti per la possibilità di effettuare analisi approfondite negli
ambiti di competenza: il paradigma della “città guidata dai dati” diventa operativo e sentito
fortemente per monitorare l’efficacia delle politiche di governo del territorio.
47
Riflessi della rivoluzione dei dati sulla statistica ufficiale
Con la diffusione delle tecnologie digitali le fonti si moltiplicano, la mole di dati (i big data)
a disposizione anche, metterli insieme e trarne informazione utile richiede nuovi strumenti e
nuove competenze.
Questi dati hanno caratteristiche nuove rispetto ai precedenti infatti sono:
Capillari
Tempestivi
Consentendo di fotografare situazioni molto più dettagliate di quanto possono fare le
indagini campionarie (sia a livello di territorio che di popolazione)
Dati da anonimizzati (la protezione
dell’informazione individuale e la privacy dei
rispondenti è la principale preoccupazione degli
istituti di statistica)
48
Riflessi della rivoluzione dei dati sulla statistica ufficiale
Quale modello utilizzare ?
Affiancare le fonti tradizionali con le nuove:
le fonti di indagine (indagini statistiche tradizionali)
i dati amministrativi
nuove fonti di dati.
L’utilizzo congiunto delle varie fonti consente anche di ridurre il disturbo statistico sul
cittadino, impegnando meno tempo e risorse nella risposta a questionari”.
49
Riflessi della rivoluzione dei dati sulla statistica ufficiale
“La caratteristica principale di queste fonti eterogenee di dati è che possono essere integrati
attraverso tecnologie semantiche e, quindi, possono essere letti congiuntamente.
Questo nuovo approccio può quindi generare maggior coinvolgimento dei cittadini nei
processi decisionali fino ad arrivare a potenziali processi codecisionali.
“In campo statistico usiamo ormai la parola prosumer cioè l’utilizzatore del dato diventa
esso stesso un produttore di dati perché l’informazione che viene ricevuta dal cittadino
può essere poi, attraverso strumenti software, coniugata con altri tipi di dati che sono
magari dati personali o dati relativi alla collocazione geografica e temporale
dell’individuo su un territorio e consentire quindi in questo modo all’individuo di essere
un fruitore attivo dell’informazione e in questo senso costruire un’informazione che è
sempre più personalizzata” (Baldacci)
50
Riflessi della rivoluzione dei dati sulla statistica ufficiale
Qualità del dato
che si fonda sia sulla provenienza delle fonti su cui si formano le statistiche, sia sulla
solidità scientifica dei metodi con i quali vengono effettuate le produzioni delle
statistiche
Settori di Maggiore sviluppo
Analisi degli indicatori sociali (usufruiscono massivamente dell’utilizzo integrato di
fonti tradizionali, fonti amministrative e fonti di big data)
Esempi indice di povertà, di distribuzione del reddito, di coesione sociale sono aree
nelle quali si può fare un lavoro molto più rapido e di qualità maggiore utilizzando
queste fonti
51
Riflessi della rivoluzione dei dati sulla statistica ufficialeEurostat ha attivato un hackathon europeo
Team nazionali composti da statistici e ricercatori provenienti dal settore privato e
dall’accademia
Basi dati molto diverse: dati statistici, amministrativi e fonti derivanti dall’osservazione di
dati pubblicamente disponibili sulla rete attraverso un sistema di web scraping.
Oggetto dell’analisi erano la differenza tra domanda e offerta di skills nel mercato del lavoro
europeo con una dimensione prettamente regionale e subregionale.
I Risultati hanno consentito di individuare le fonti di questa distanza tra domanda e offerta di
conoscenze, competenze e skills nel mercato del lavoro e soprattutto un’enorme
differenziazione, all’interno dei territori nazionali e regionali, tra sottomercati del lavoro.
Questa informazione può essere molto importante per attivare servizi di supporto alle
politiche attive del lavoro, supporto alla formazione e anche interventi di protezione sociale
qualora questi fossero necessari a livelli subnazionali e subregionali”.
52
Riflessi della rivoluzione dei dati sulla statistica ufficiale
La situazione Italina
In Italia c’è una forte propensione ad avvicinarsi alle tecnologie dell’informazione
soprattutto per quanto riguarda il lato consumo e il lato intrattenimento, mentre tutti gli
indicatori ci dicono che sul fronte dei servizi offerti ai cittadini il livello di
digitalizzazione è ancora basso.
In sintesi
le competenze e le conoscenze dei cittadini
servizi basati sulle tecnologie e sui dati che oggi abbiamo a disposizione
Pasquale Sarnacchiaro
I materiali didattici saranno disponibili su
www.fondazioneifel.it/formazione