Processi decisionali data-driven: la valorizzazione del ... · Riflessi della rivoluzione dei dati...

53
Processi decisionali data-driven: la valorizzazione del dato e dei patrimoni informativi a cura di Pasquale Sarnacchiaro 24 settembre 2018

Transcript of Processi decisionali data-driven: la valorizzazione del ... · Riflessi della rivoluzione dei dati...

Processi decisionali data-driven:

la valorizzazione del dato e dei

patrimoni informativi

a cura di Pasquale Sarnacchiaro

24 settembre 2018

Definizione Data Driven Economy

Piano Triennale per l’informatica nella PA

Gli Open Data nella PA in Italia

Aspetti fondamentali della Linea guida per la valorizzazione degli Open Data

nella PA

Riflessi della rivoluzione dei dati sulla statistica ufficiale

Casi

Indice

3

Quand’è che la complessità genera valore?

Quando siamo in grado di mettere a sistema tutti i dati a disposizione, porli al centro

dei processi di conoscenza, utilizzarli per misurare un territorio e, attraverso questo

processo, governarlo.

Il ruolo delle tecnologie è naturalmente centrale in questo processo, ancora una volta

le tecnologie sono lo strumento che abilita la trasformazione

La data-driven economy è semplicemente un’economia in cui l’uso dei dati è centrale

nelle strategie e nella gestione del business, nello sviluppo di nuovi prodotti e servizi, nei

processi decisionali, nella creazione di innovazione e nella diffusione della conoscenza

Data Driven Economy

Fenomeno Complesso

4

I dati sono tanti, sono ovunque e sono una grande ricchezza:

per le aziende che possono utilizzarli per avviare nuove opportunità di business,

per le amministrazioni che grazie alla conoscenza e all’analisi dei dati possono

prendere decisioni mirate,

per i cittadini che possono trovare nei dati, soprattutto quando questi vengono

rilasciati sotto forma di dati aperti, un incredibile strumento di partecipazione.

I dati possono essere un potente acceleratore per la crescita dei territori, ma non hanno

valore in sé. Infatti è necessario che siano

raccolti,

sistematizzati,

messi a confronto,

elaborati,

analizzati.

Data Driven Economy

…in tal caso ci supportano per

la Misura e la

Rendicontazione

5

Data Driven Economy

Misura

Maggiori produttori di dati

Istat

PA nello svolgimento delle proprie funzioni

bilanci comunali e delle spese regionali

social media

web scraping

Imprese (dati di rendicontazione sociale e ambientale e dati di consumo di prodotti, media e

tecnologie).

IOT (Secondo l’Osservatorio Internet of Things del Politecnico di Milano, nonostante

difficoltà di vario tipo negli ultimi 3 anni il 51% dei Comuni italiani sopra i 15mila abitanti

ha avviato almeno un progetto IOT in ambito smart city (38% gestione del traffico, 37%

illuminazione, 35% gestione parcheggi)).

Ogni fenomeno può essere conosciuto incrociando fonti di dati enormi e molto diverse tra loro

6

Data Driven EconomyValutazione (Rendicontazione)

I cittadini sono fruitori ma anche produttori di dati, non sono più soggetti passivi che

subiscono le scelte delle amministrazioni. Queste ultime, quindi, oltre a fare le proprie scelte

sulla base di richieste e bisogni reali (dopo aver analizzato attraverso i dati ciò che avviene

nel proprio territorio), devono anche rendere chiari i motivi delle scelte, soprattutto in un

contesto di risorse limitate.

Mettere in evidenza le diverse alternative e le loro conseguenze è l’unico modo per sperare

di ottenere non un consenso puramente elettorale, ma un reale e duraturo coinvolgimento

nei processi di cambiamento e d’innovazione.

Per fare questo si devono condividere indicatori fin dalla fase di programmazione delle

iniziative

I vantaggi di un percorso di data driven

migliore gestione della spesa pubblica, investendo in settori in cui c’è davvero bisogno e

richiesta;

instaurazione di un nuovo rapporto fiduciario con i cittadini, basato sulla trasparenza e la

partecipazione.

7

Data Driven Decision per tracciare percorsi migliori

Metafora del Navigatore del passato che non aveva dati per elaborare le sue rotte e

navigava sostanzialmente a vista.

Adesso con il GPS il capitano sa collocare precisamente la nave e sulla base di tale

informazione stabilire/aggiornare la rotta (minimizzando tempo e costo)

Adesso il decisore politico può decidere come indirizzare la sua azione

Utilizzando i dati avrà la possibilità di disegnare le “rotte” migliori per scegliere

le policy, raggiungere obiettivi, migliorare le performance, ottimizzare processi.

8

Data Driven Decision per tracciare percorsi migliori

Criticità Materiali

1. Difficoltà ad accedere a dati di altre PA

2. Difficoltà ad utilizzare, combinare e mettere assieme dati provenienti da altre

fonti.

In questa ottica un valido strumento

Data Analytics Framework

Il DAF è una delle attività previste dal Piano Triennale per l’Informatica nella PA ed è un

progetto che va proprio nella direzione di raccogliere alcuni dati prodotti dalle PA su un’unica

piattaforma Big Data al fine di valorizzarli e renderli funzionali anche al monitoraggio e al

supporto alle decisioni.

Obiettivo:

Infrastruttura digitale del Paese

9

Importanza del ruolo delle tecnologie

Il ruolo delle tecnologie è naturalmente centrale in questo processo, ancora una volta

le tecnologie sono lo strumento che abilita la trasformazione

I dati, come le tecnologie che li sottendono, devono diventare uno strumento

abilitante di un nuovo modo di amministrare il territorio che si basa sulla conoscenza

per prendere decisioni (data driven decision) e sul coinvolgimento di cittadini e

aziende nel processo decisionale.

Quando siamo in grado di mettere a sistema tutti questi dati, porli al centro dei

processi di conoscenza, utilizzarli per misurare un territorio e, attraverso questo

processo, governarlo.

10

Data Driven per tracciare percorsi migliori

Criticità Culturale – Fiducia nei dati

I dati sono utilizzati per verifiche successive e non in fase di programmazione

L’azione di chi amministra il territorio è ancora prevalentemente quella che potremmo

chiamare “opportunità politica”.

È un po’ come continuare a navigare guardando le stelle in un mare che nel frattempo

si è popolato di cargo, yacht e transatlantici.

Serve una cultura del dato

Serve personale competente

…sarà possibile capire, controllare e gestire sistemi caotici e complessi

11

Il Piano Triennale è un documento di indirizzo strategico ed economico attraverso il quale

viene declinato Il Modello strategico di evoluzione del sistema informativo della Pubblica

amministrazione

Previsto dallo statuto di AgID e dalla Legge di stabilità 2016 (l. 28 dicembre 2015, n. 208)

Il Piano nasce per guidare operativamente la trasformazione digitale della PA e diventa

riferimento per le amministrazioni centrali e locali nello sviluppo dei propri sistemi

informativi.

Definisce le linee guida della strategia operativa di sviluppo dell’informatica pubblica,

fissa i principi architetturali fondamentali, le regole di usabilità e interoperabilità, precisa

la logica di classificazione delle spese ICT e chiarisce il modello per lo sviluppo del

digitale.

PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19

12

I principali obiettivi del Piano Triennale sono:

definire le linee della strategia di sviluppo e realizzazione del sistema informativo

della Pubblica amministrazione in un quadro organico in base a quanto previsto dagli

obiettivi dell’Agenda Digitale italiana, dunque del Piano Crescita Digitale;

razionalizzare, dunque riqualificare la spesa ICT delle amministrazioni in coerenza

con gli obiettivi della Legge di stabilità 2016.

PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19

13

PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19

PARTE PRIMA - QUADRO DI RIFERIMENTO

PARTE SECONDA - COMPONENTI DEL MODELLO STRATEGICO DI

EVOLUZIONE DELL’ICT

PARTE TERZA - CONSIDERAZIONI FINALI E NOTE DI INDIRIZZO

14

PIANO TRIENNALE PER L’INFORMATICA NELLA PUBBLICA AMMINISTRAZIONE 2017-19

PARTE SECONDA - COMPONENTI DEL MODELLO STRATEGICO DI EVOLUZIONE DELL’ICT

4. Infrastrutture immateriali

4.1. Dati della Pubblica amministrazione

4.1.1. Basi di dati di interesse nazionale

4.1.2. Open data

4.1.3. Vocabolari controllati e modelli dati

4.2. Piattaforme abilitanti

4.2.1. Scenario attuale

4.2.2. Obiettivi strategici

4.2.3. Linee di azione

…….

9. Data & Analytics Framework

9.1. Scenario attuale

9.2. Obiettivi strategici

9.3. Linee di azione

PARTE TERZA - CONSIDERAZIONI FINALI E NOTE DI INDIRIZZO

12.3. Indicazioni sui Dati della Pubblica amministrazione e sul DAF

15

4. Infrastrutture immaterialiI dati delle Pubbliche amministrazioni, insieme ai meccanismi e alle piattaforme create

per offrire servizi ai cittadini, costituiscono uno dei principali patrimoni digitali della PA.

Le direttrici del Piano

la razionalizzazione e la valorizzazione del patrimonio informativo della PA mediante il

superamento della “logica a silos”, ancor oggi troppo spesso adottata e retaggio di

processi amministrativi e scelte organizzative effettuate nel passato;

la messa a fattor comune delle componenti software che sono utili a tutte le Pubbliche

amministrazioni e che possono considerarsi sia acceleratori del processo di

digitalizzazione sia strumenti utili alla omogeneizzazione dei servizi offerti.

Le Infrastrutture immateriali sono suddivise in due macro-gruppi, così come mostrato

nella Figura 6:

i Dati della PA, ovvero le attività relative alle basi di dati di interesse

nazionale, gli open data e i vocabolari controllati;

le Piattaforme abilitanti, ovvero le piattaforme condivise a livello nazionale

dalle PA.

16

4. Infrastrutture immateriali

17

4.1. Dati della Pubblica amministrazione

Obiettivo Strategico per la PA

Valorizzazione del patrimonio

informativo pubblico

Superamento del paradigma di gestione del dato della “logica a silos” in

favore di una visione sistemica.

Il dato deve essere inteso come bene comune, condiviso gratuitamente tra

Pubbliche amministrazioni per scopi istituzionali]e, salvo casi

documentati e propriamente motivati, utilizzabile dalla società civile

Come

Efficienza amministrativa,

riuso dei dati a vantaggio del

cittadino

ampliamento delle possibilità di

analisi, ivi incluse la

comprensione e la predizione di

fenomeni sociali a supporto del

processo di policy making e dello

sviluppo di servizi al cittadino.

Perché

18

4.1. Dati della Pubblica amministrazione

Il Piano prevede tre aree:

basi di dati di interesse nazionale, ovvero basi di dati affidabili, omogenee per

tipologia e contenuto, rilevanti per lo svolgimento delle funzioni istituzionali delle

Pubbliche amministrazioni e per fini di analisi. Esse costituiscono l’ossatura del

patrimonio informativo pubblico, da rendere disponibile a tutte le PA, facilitando lo

scambio di dati ed evitando di chiedere più volte la stessa informazione al cittadino

o all’impresa;

open data, ovvero “dati di tipo aperto”. Essi comportano un processo finalizzato a

rendere i dati della Pubblica amministrazione liberamente usabili, riutilizzabili e

ridistribuibili, da parte di chiunque e per qualunque scopo, anche commerciale,

purché non siano soggetti a particolari restrizioni;

vocabolari controllati e modelli dei dati, che costituiscono un modo comune e

condiviso per organizzare codici e nomenclature ricorrenti in maniera standardizzata

e normalizzata (vocabolari controllati) e una concettualizzazione esaustiva e

rigorosa nell’ambito di un dato dominio (ontologia o modello dei dati condiviso).

19

4.1.2. Open dataGli open data sono definiti “dati di tipo aperto” nell’art. 68 del CAD e sono considerati

elementi fondanti nel recepimento della Direttiva europea sull’informazione nel settore

pubblico [49].

I dati pubblici sono aperti se:

• non sono riferibili a singole persone;

• sono resi disponibili in formato aperto, ovvero non proprietario, corredati dei relativi

metadati;

• hanno associata una licenza che ne consente a chiunque il più ampio riutilizzo.

Vincoli:

indicare la fonte di provenienza dei dati,

riutilizzarli secondo gli stessi termini per cui sono stati licenziati originariamente;

sono resi disponibili gratuitamente o ai soli costi marginali per la loro riproduzione e

divulgazione, salvo casi eccezionali che siano trasparentemente e chiaramente identificati

dalle PA titolari.

20

4.2. Piattaforme abilitanti

Le Piattaforme abilitanti sono soluzioni che offrono funzionalità fondamentali, trasversali

e riusabili nei singoli progetti, uniformandone le modalità di erogazione.

Riduzione dei costi di acquisto software, di progettazione (riducendo i tempi e i costi di

realizzazione di nuovi servizi e garantendo maggiore sicurezza informatica).

Alcuni esempi rivolti ai cittadini e alle imprese sono i servizi di identificazione, di

fatturazione e di pagamento.

Altre piattaforme sono rivolte in via principale alla PA ma sono ugualmente abilitanti,

come ad esempio l’Anagrafe nazionale della popolazione residente (ANPR).

In questo modo sarà più facile per le amministrazioni offrire al cittadino e alle imprese un

modo uniforme e più semplice di interazione e collaborazione.

21

9. Data & Analytics Framework

Il Data & Analytics Framework (DAF) fa parte delle attività atte a valorizzare il

patrimonio informativo pubblico nazionale.

Obiettivi:

sviluppare e semplificare l’interoperabilità dei dati pubblici tra PA

standardizzare e promuovere la diffusione degli open data

ottimizzare i processi di analisi dati e generazione di conoscenza.

Come

Utilizzo di moderne piattaforme per la gestione e l’analisi dei big data agendo lungo

le seguenti direttrici principali:

22

1. amplificare sensibilmente il valore del patrimonio informativo della PA mediante

l’utilizzo delle tecnologie big data che consentono di creare conoscenza per i decision

maker e ridurre drasticamente i tempi di analisi.

2. favorire e ottimizzare lo scambio dei dati tra PA minimizzandone i costi transattivi per

l’accesso e l’utilizzo.

3. incentivare la diffusione degli open data e renderne più efficace l’utilizzo

(Centralizzazione e redistribuire i dati pubblici attraverso API, garantendo

standardizzazione di formati e modalità di riutilizzo su dati sempre aggiornati);

4. favorire l’analisi esplorativa dei dati da parte di team di data scientist, sia in seno alle

singole PA che a livello centrale, al fine di migliorare la conoscenza dei fenomeni sociali

5. infine, il framework consentirà la promozione di iniziative di ricerca scientifica su

tematiche di interesse specifico per la PA, favorendo la collaborazione con università ed

enti di ricerca.

9. Data & Analytics Framework

23

Stato dei risultati previsti per le infrastrutture e prossimi obiettivi*Nelle prossime versioni del Piano (il nuovo aggiornamento dovrebbe essere prodotto

entro la fine di settembre) sarebbe opportuno focalizzare con maggior precisione tutti i

risultati da ottenere anche per le restanti componenti, il cui sviluppo in caso contrario

potrebbe essere rallentato. Ovviamente sulle infrastrutture fisiche e immateriali è di

vitale importanza non accumulare ritardi. Questi, infatti, potrebbero propagarsi sulle

altre componenti del modello, rallentandone l’attuazione.

A questo proposito è interessante analizzare lo stato dei risultati previsti per le

infrastrutture fisiche e immateriali. Come mostrato in Figura 2, dei 73 risultati relativi

a tali componenti:

25 sono stati completati;

14 sono in corso di completamento;

19 sono in ritardo rispetto alle scadenze;

15 non hanno scadenze esplicitate.

24

Stato dei risultati previsti per le infrastrutture e prossimi obiettivi*

A cura di Luca Gastaldi (direttore osservatorio Agenda Digitale Politecnico di Milano) e

Paola Olivares (Osservatorio Fatturazione Elettronica & eCommerce B2b, Politecnico di

Milano)

25

Stato dei risultati previsti per le infrastrutture e prossimi obiettivi*

Un quadro tutto sommato positivo

Tale risultato può essere in parte spiegato da una semplificazione del coordinamento

tra attori preposti alla definizione e attuazione dell’impianto regolatorio. Gli attori che

hanno in capo una quota maggiore di risultati previsti sono: AgID che deve essere

coinvolta per l’attuazione di 87 risultati previsti, le PA locali (72) e il Team Digitale

(22). Tutti gli altri attori (ad es. Funzione Pubblica, i Ministeri, ANAC) hanno invece

un coinvolgimento minore, mediamente su 3 risultati.

Il quadro è quindi positivo e i presupposti per dare continuità a quanto fatto in questi

ultimi anni ci sono. Certo, tornando alle parole della Bongiorno, serve “credibilità”. La

trasformazione digitale della nostra PA non si realizzerà in pochi mesi. Serve tenacia,

un commitment centrale forte e un altrettanto forte coinvolgimento degli enti locali,

che devono beneficiare di quanto realizzato a livello centrale e scaricarlo a terra,

grazie al loro contatto diretto con i cittadini.

26

Gli Open data nella Pubblica Amministrazione

I dati aperti (open data) sono dati liberamente accessibili a tutti le cui eventuali restrizioni sono

l'obbligo di citare la fonte o di mantenere la banca dati sempre aperta.

L'open data si richiama alla più ampia disciplina dell'open government, cioè una dottrina in base

alla quale la pubblica amministrazione dovrebbe essere aperta ai cittadini, tanto in termini di

trasparenza quanto di partecipazione diretta al processo decisionale, anche attraverso il ricorso alle

nuove tecnologie dell'informazione e della comunicazione. (wikipedia)

Partiamo dalla definizione di Open data

…da non confondere con i Big data

27

Il termine Big data ("grandi dati" in inglese) descrive l'insieme delle tecnologie e delle metodologie di

analisi di dati massivi[1], ovvero la capacità di estrapolare, analizzare e mettere in relazione un'enorme

mole di dati eterogenei, strutturati e non strutturati, per scoprire i legami tra fenomeni diversi e

prevedere quelli futuri. (wikipedia.it)

Big data rappresenta anche l'interrelazione di dati provenienti potenzialmente da fonti eterogenee,

quindi non soltanto i dati strutturati, come i database, ma anche non strutturati, come immagini,

email, dati GPS, informazioni prese dai social network.

Definizione di big data (dataskill.it)

I big data sono dati che superano i limiti degli strumenti database tradizionali, ma con questo

termine si intendono anche le tecnologie finalizzate ad estrarre da essi conoscenze e valore. In

pratica, potremmo definire big data l'analisi di quantità incredibilmente grandi di informazioni.

In considerazione della loro enorme estensione in termini di volume, ma anche delle loro

intrinseche caratteristiche velocità e varietà, i big data richiedono tecnologie e metodi analitici

specifici che possano portare all'estrazione di valori di interesse.

4,6 miliardi gli smartphone attivi al mondo

2 miliardi di persone utilizzano internet è facile comprendere quante informazioni di

incredibile importanza possano essere estratte dai big data.

Definizione di Big data

Open Data dalla definizione agli aspetti giuridici

28

Open Data

Dati Aperti

Bene Comune

Dati appartengono al genere umano

Dati prodotti dalla PA, in quanto

finanziati da denaro pubblico, devono

ritornare ai contribuenti, e alla

comunità in generale, sotto forma di

dati aperti e universalmente

disponibili

Open Data nella Pubblica Amministrazione

Dato aperto

….si intende quel formato di dati reso pubblico, documentato esaustivamente e

neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati

stessi.(CAD art.68)

Nello stesso articolo si specifica inoltre che i dati sono considerati “open” se:

a) sono disponibili secondo i termini di una licenza che ne permetta l'utilizzo da

parte di chiunque, anche per finalità commerciali, in formato disaggregato;

b) sono accessibili attraverso le tecnologie dell'informazione e della

comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati

aperti ai sensi della lettera a), sono adatti all'utilizzo automatico da parte di

programmi per elaboratori e sono provvisti dei relativi metadati;

c) sono resi disponibili gratuitamente attraverso le tecnologie dell'informazione e

della comunicazione, ivi comprese le reti telematiche pubbliche e private,

oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione

e divulgazione.

29

Le Pubbliche Amministrazioni hanno la responsabilità di aggiornare, divulgare e

permettere la valorizzazione dei dati pubblici secondo principi di open government

(CAD, Capo V - Dati delle pubbliche amministrazioni e servizi in rete)

La normativa che prevede l’obbligatorietà della pubblicazione dei dati aperti, in

particolare, è stata introdotta con l’art. 9 comma 1 lett. a) del DL 179/2012, che

ha modificato l’art. 52 del CAD, con questo nuovo testo:

Open Data della Pubblica Amministrazione, responsabilità obbligatorietà

30

Open Data nella P.A.: I Benefici

Fare open data garantisce che tutti i dati a disposizione dell’ente siano facilmente

reperibili da tutti coloro che intendono utilizzarli: ciò è vero sia per i soggetti esterni,

quali cittadini e imprese, che per altri enti così come per i referenti interni all’ente

stesso di altri settori o servizi. I vantaggi derivanti da questo sistema sono molteplici:

MIGLIORAMENTO ORGANIZZATIVO – GESTIONALE: è possibile evitare costi superflui

derivanti dalla duplicazione degli sforzi per produrre informazioni già condivise da

un altro ente;

MIGLIORAMENTO DELLA QUALITA’ DEI DATI: è possibile instaurare un processo

virtuoso di omogeneizzazione che conduca ad avere informazioni più aggiornate e

complete; Inoltre i nuovi utilizzatori possono segnalare all'ente eventuali errori o

imprecisioni nei dataset, consentendo di migliorarli.

MAGGIORE TRASPARENZA, CONDIVISIONE E PARTECIPAZIONE: i riutilizzatori dei

dati possono reperire con maggior semplicità e immediatezza le informazioni di cui

necessitano, permettendo all’ente detentore del dato di liberare le risorse

impiegate fino a quel momento nella gestione delle richieste, per impiegarle in altri

tipi di attività.

31

Open Data nella P.A.: I Benefici

32

L’accesso ai dati consente agli individui

e alle organizzazioni di sviluppare

nuove idee e innovazioni

TRASPARENZA

la PA dovrebbe essere aperta ai

cittadini, in termini di trasparenza e

partecipazione diretta al processo

decisionale

CREAZIONE DI VALORE

i dati aperti possono essere usati in modi

innovativi per creare strumenti e prodotti utili

che contribuiscano alla creazione di nuovi

mercati, imprese e lavoro; infatti l’utilizzo dei

dati in formato aperto può dar luogo a nuove

applicazioni, anche mischiando dati

provenienti da fonti diverse (mash-up) e quindi

creando valore per gli utenti finali e anche

potenziali fonti di reddito per gli sviluppatori.

Rapporto Annuale (anno 2016)

Disponibilità di banche dati pubbliche in formato aperto

Versione

33

Indicatore“

# di banche dati PA disponibili in formato aperto in percentuale

sulle banche dati pubbliche di un paniere selezionato”,

62 data set componente nazionale

48 data set componente regionale

Anno 2015 Anno 2016

40% 59,68%

(37 su 62)

34

Situazione per Regione sui 48 data set di componente regionale

35

Situazione per Regione sui 64 data set di componente nazionale

36

Dove possiamo trovare gli Open Data – il sito dati.gov.it

22468 Dataset

13 Tematiche

21 formati (xls,

pdf, zip ecc.)

37

Normativa di Riferimento

Dati della Pubblica Amministrazione

Modello per i dati aperti e i metadati

Aspetti organizzativi e di qualità per i dati

Architettura dell’informazione del settore pubblico

Aspetti legali e di costo

Pubblicazione e dati.gov.it

38

Come può una Pubblica Amministrazione implementare un progetto di Open Data

Linee Guida Nazionali per la Valorizzazione del Patrimonio Informativo Pubblico (2016)

Normativa di Riferimento

Codice dell’Amministrazione Digitale (CAD)

Articolo 50 “Disponibilità dei dati delle pubbliche amministrazioni”,

Articolo 52 “Accesso telematico e riutilizzo dei dati delle pubbliche amministrazioni”

Articolo 68 - comma 3 per la definizione di dato aperto.

D.lgs 24 gennaio 2006, n.36, come modificato dal

D.lgs 18 maggio 2015 n. 102 - Attuazione della direttiva 2013/37/UE (che modifica

la direttiva 2003/98/CE relativa al ”Riutilizzo dell'informazione

del settore pubblico)

Statuto internazionale degli open data

Linee guida europee su licenze standard e dataset raccomandati e tariffe da

applicare nel riutilizzo di dati pubblici

39

Dati della Pubblica Amministrazione

Dato pubblico – dato conoscibile da Chiunque

Dati Aperto - un formato reso pubblico, documentato esaustivamente e neutro

rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi

Dato aperto (risponde a tre requisiti):

Disponibile (requisito giuridico)

Accessibile (requisito tecnologico)

Gratuito (requisito economico):

40

Modello per i dati aperti e i metadati

Si adotta il modello qualitativo per i dati aperti sul Web, noto come modello a cinque stelle

I livelli del modello per i dati aperti

Informazione: Dati disponibili tramite una licenza aperta e inclusi in documenti leggibili e

interpretabili solo grazie a un significativo intervento umano (e.g., PDF).

Dati disponibili in forma strutturata e con licenza aperta. Tuttavia, i formati sono

proprietari (e.g., Excel) e un intervento umano è fortemente necessario per un’elaborazione dei

dati.

41

Informazione: Dati con caratteristiche del livello precedente ma in un formato non proprietario

(e.g., CSV, JSON, geoJSON). I dati sono leggibili da un programma ma

l'intervento umano è necessario per una qualche elaborazione degli stessi.

Dati con caratteristiche del livello precedente ma esposti usando standard W3C

quali RDF e SPARQL I dati sono descritti semanticamente tramite metadati e ontologie

Dati con caratteristiche del livello precedente ma collegati a quelli esposti da altre persone e

organizzazioni (i.e., Linked Open Data2). I dati sono descritti semanticamente tramite metadati

e ontologie. I dati sono detti “linked” per la possibilità di referenziarsi (i.e., “collegarsi”) tra loro.

Nei caso dei Linked Open Data l'intervento umano si può ridurre al minimo e

talvolta addirittura eliminare.

Aspetti organizzativi e di qualità per i dati

INDIVIDUA UNA DATA GOVERNANCE E ASSICURATI CHE I PROCESSI INTEGRINO IL RILASCIO

DI DATI APERTI E IL COINVOLGIMENTO DEGLI UTENTI

Per attuare il modello è necessario

(i) definire una chiara data governance interna con l’individuazione di ruoli e

relative responsabilità; (Gruppo di lavoro Open data, Responsabile Open Data,

Responsabile e Referente tecnico della Banca dati, Ufficio Statistica, Ufficio

Giuridico Amministrativo, Gruppo di Comunicazione).

(ii) integrare le sue fasi sia verticalmente, rispetto ai processi interni già consolidati,

che orizzontalmente rispetto alle necessità delle diverse amministrazioni.

L’applicazione del modello deve avvenire in maniera costante: le attività non si

esauriscono con la mera pubblicazione dei dati, ove questo sia possibile, ma

devono prevedere un costante aggiornamento, monitoraggio e coinvolgimento

con gli utenti finali.

42

Queste quattro caratteristiche sono:

• accuratezza (sintattica e semantica) - il dato, e i suoi attributi, rappresenta

correttamente il valore reale del concetto o evento cui si riferisce

• coerenza - il dato, e i suoi attributi, non presenta contraddittorietà rispetto ad altri

dati del contesto d’uso dell'amministrazione titolare

• completezza – il dato risulta esaustivo per tutti i suoi valori attesi e rispetto alle

entità relative (fonti) che concorrono alla definizione del procedimento.

• attualità (o tempestività di aggiornamento) - il dato, e i suoi attributi, è del “giusto

tempo” (è aggiornato) rispetto al procedimento cui si riferisce.

43

Caratteristiche di Qualità del Dato Aperto

Aspetti legali e di costo

44

Premesse le azioni di condivisione dei dati tra pubbliche amministrazioni per finalità

istituzionali (artt. 50 e 58 del CAD), che avvengono esclusivamente a titolo gratuito, nel

caso dell’Open Data si suggerisce azioni volte a renderli disponibili esclusivamente a

titolo gratuito. Tuttavia, è prevista la possibilità di richiedere per il riutilizzo dei dati un

corrispettivo specifico, limitato ai costi sostenuti effettivamente per la riproduzione,

messa a disposizione e divulgazione dei dati. In tali casi le tariffe standard da

applicare, pubblicandole sul proprio sito istituzionale, sono calcolate sulla base del

“Metodo dei costi marginali”

L’informazione sul tipo di licenza è metadato indispensabile per determinare come

poter riutilizzare il dataset. Deve pertanto essere sempre specificata indicando, il

nome, la versione e fornendo il riferimento al testo della licenza.

45

La cultura dell’Open data

Esperienza del comune di Palermo

Oltre all’esigenza di rispetto di una normativa, lo spirito dell’esperienza è stato

quello di creare una nuova atmosfera di lavoro volta a

Stimolare lo scambio di idee

Condividere i lavori di gruppo

Andando oltre la PA ovvero aprendosi al confronto con il mondo esterno che

supporta e stimola il processo di pubblicazione dei dati pubblici.

Open data

come imposizione

normativa

Esposizione del

lavoro quotidiano

Collaborazione

vantaggiosa

per la PA, che migliora

la qualità dei dati,

Per la società civile

attiva nella creazione di

servizi utili a tutti a

partire dal riuso dei

dati.

46

La cultura dell’Open data

Esperienza del comune di Palermo

Grazie a questi confronti costanti tra i referenti degli uffici e i soggetti attivi della società

civile, grazie a questa contaminazione culturale si genera a cascata un processo virtuoso di

pubblicazione dei dati con i quali gli uffici lavorano quotidianamente, e che una volta messi

a disposizione della società possono cambiare status da dati a servizio. La disponibilità

pubblica di mappe, ad esempio, sta contribuendo negli ultimi anni a sviluppare una cultura

del marketing di prossimità. La nuova modalità di comunicazione “geografica” sta

avviando un nuovo modo di fruire l’informazione, con vantaggi non soltanto economici ma

anche culturali e dalle potenzialità ancora da esplorare. Il riuso dei dati comunali oggi attira

l’interesse di diversi dirigenti per la possibilità di effettuare analisi approfondite negli

ambiti di competenza: il paradigma della “città guidata dai dati” diventa operativo e sentito

fortemente per monitorare l’efficacia delle politiche di governo del territorio.

47

Riflessi della rivoluzione dei dati sulla statistica ufficiale

Con la diffusione delle tecnologie digitali le fonti si moltiplicano, la mole di dati (i big data)

a disposizione anche, metterli insieme e trarne informazione utile richiede nuovi strumenti e

nuove competenze.

Questi dati hanno caratteristiche nuove rispetto ai precedenti infatti sono:

Capillari

Tempestivi

Consentendo di fotografare situazioni molto più dettagliate di quanto possono fare le

indagini campionarie (sia a livello di territorio che di popolazione)

Dati da anonimizzati (la protezione

dell’informazione individuale e la privacy dei

rispondenti è la principale preoccupazione degli

istituti di statistica)

48

Riflessi della rivoluzione dei dati sulla statistica ufficiale

Quale modello utilizzare ?

Affiancare le fonti tradizionali con le nuove:

le fonti di indagine (indagini statistiche tradizionali)

i dati amministrativi

nuove fonti di dati.

L’utilizzo congiunto delle varie fonti consente anche di ridurre il disturbo statistico sul

cittadino, impegnando meno tempo e risorse nella risposta a questionari”.

49

Riflessi della rivoluzione dei dati sulla statistica ufficiale

“La caratteristica principale di queste fonti eterogenee di dati è che possono essere integrati

attraverso tecnologie semantiche e, quindi, possono essere letti congiuntamente.

Questo nuovo approccio può quindi generare maggior coinvolgimento dei cittadini nei

processi decisionali fino ad arrivare a potenziali processi codecisionali.

“In campo statistico usiamo ormai la parola prosumer cioè l’utilizzatore del dato diventa

esso stesso un produttore di dati perché l’informazione che viene ricevuta dal cittadino

può essere poi, attraverso strumenti software, coniugata con altri tipi di dati che sono

magari dati personali o dati relativi alla collocazione geografica e temporale

dell’individuo su un territorio e consentire quindi in questo modo all’individuo di essere

un fruitore attivo dell’informazione e in questo senso costruire un’informazione che è

sempre più personalizzata” (Baldacci)

50

Riflessi della rivoluzione dei dati sulla statistica ufficiale

Qualità del dato

che si fonda sia sulla provenienza delle fonti su cui si formano le statistiche, sia sulla

solidità scientifica dei metodi con i quali vengono effettuate le produzioni delle

statistiche

Settori di Maggiore sviluppo

Analisi degli indicatori sociali (usufruiscono massivamente dell’utilizzo integrato di

fonti tradizionali, fonti amministrative e fonti di big data)

Esempi indice di povertà, di distribuzione del reddito, di coesione sociale sono aree

nelle quali si può fare un lavoro molto più rapido e di qualità maggiore utilizzando

queste fonti

51

Riflessi della rivoluzione dei dati sulla statistica ufficialeEurostat ha attivato un hackathon europeo

Team nazionali composti da statistici e ricercatori provenienti dal settore privato e

dall’accademia

Basi dati molto diverse: dati statistici, amministrativi e fonti derivanti dall’osservazione di

dati pubblicamente disponibili sulla rete attraverso un sistema di web scraping.

Oggetto dell’analisi erano la differenza tra domanda e offerta di skills nel mercato del lavoro

europeo con una dimensione prettamente regionale e subregionale.

I Risultati hanno consentito di individuare le fonti di questa distanza tra domanda e offerta di

conoscenze, competenze e skills nel mercato del lavoro e soprattutto un’enorme

differenziazione, all’interno dei territori nazionali e regionali, tra sottomercati del lavoro.

Questa informazione può essere molto importante per attivare servizi di supporto alle

politiche attive del lavoro, supporto alla formazione e anche interventi di protezione sociale

qualora questi fossero necessari a livelli subnazionali e subregionali”.

52

Riflessi della rivoluzione dei dati sulla statistica ufficiale

La situazione Italina

In Italia c’è una forte propensione ad avvicinarsi alle tecnologie dell’informazione

soprattutto per quanto riguarda il lato consumo e il lato intrattenimento, mentre tutti gli

indicatori ci dicono che sul fronte dei servizi offerti ai cittadini il livello di

digitalizzazione è ancora basso.

In sintesi

le competenze e le conoscenze dei cittadini

servizi basati sulle tecnologie e sui dati che oggi abbiamo a disposizione

Pasquale Sarnacchiaro

[email protected]

I materiali didattici saranno disponibili su

www.fondazioneifel.it/formazione