Linee guida web PA: formati, licenze, classificazione, open data
-
Upload
gianfranco-andriola -
Category
Technology
-
view
2.718 -
download
0
description
Transcript of Linee guida web PA: formati, licenze, classificazione, open data
Linee Guida per i siti web della PACriteri di indirizzo e strumenti per il trattamento dei
dati, della documentazione pubblica e per la loro reperibilità
(Capitolo 5 )
Argomenti
Contesto
Classificazione e semantica (5.1)
Reperibilità dei contenuti (5.1)
Formati aperti (5.2)
Contenuti aperti (5.3)
Scenari e approfondimenti: open government e open data
2
Contesto
3
I dati e i contenuti prodotti e gestiti dalla pubblica amministrazione nell'esercizio delle proprie attività, rappresentano una risorsa strategica da un punto di vista sociale, politico, economico e culturale.
Si tratta di un patrimonio di conoscenza, che non sempre è facilmente accessibile da parte degli utenti.
L'adeguata diffusione di queste informazioni (dati statistici e territoriali, rapporti socio-economici e ambientali , normativa, ecc.) può rappresentare un importante elemento per favorire la crescita economica e produttiva, la ricerca, l'innovazione, la competitività e per incoraggiare la partecipazione dei cittadini alla vita pubblica, dando loro la possibilità di valutare l'efficacia dell'attività dell'ente, nel rispetto dei principi di buon andamento e imparzialità
Cosa dicono le linee guida?
ContestoCosa dicono le linee guida?
I siti web delle pubbliche amministrazioni rappresentano potenzialmente il luogo privilegiato di diffusione.
Con il web le pubbliche amministrazioni hanno reso disponibile parte di questo patrimonio, ma con modalità diverse e non sempre facilmente riconoscibili.
Vi è quindi la necessità anche per la grande quantità di informazioni a disposizione di definire principi e regole per la loro archiviazione e diffusione.
4
5
Contesto
L’informazione pubblica come infrastruttura
Introduzione ai temi
Prima di pubblicare on line un qualunque contenuto (es. pagina web, modulo, db, ecc) bisognerebbe chiedersi:
Come lo archivio?
Come lo descrivo?
Quale formato utilizzo per diffonderlo?
Con quale licenza è opportuno rilasciarlo?
(e inoltre: è accessibile?, ecc..)
6
Introduzione ai temi
Contenuto
(es pagina web, modulo, db,
ecc)
Classificazione
Formati Licenza
Perché farlo?
7
Accesso
Reperibilità sui motori di ricerca
Riuso delle informazioni
Attendibilità
Interoperabilità
Tracciabilità
ecc
Classificazione
8
La difficoltà nella reperibilità delle informazioni disponibili on line, dovuta per lo più alle diverse logiche organizzative dei siti da parte delle singole amministrazioni, deve indurre a definire con maggiore chiarezza le modalità di offerta dei contenuti prodotti, classificati secondo standard e finalizzati al loro riuso.
I sistemi di classificazione utilizzati per le risorse dei siti web della pubblica amministrazione devono consentire l'interoperabilità semantica, ovvero la possibilità di individuare in modo omogeneo gli attributi che caratterizzano una risorsa (metadati) e i valori che gli attributi possono assumere (vocabolari) quando si descrivono i contenuti.
Cosa dicono le linee guida?
Classificazione
9
I metadati (o meta tag) sono presenti nel linguaggio HTML utilizzati per fornire informazioni sulle pagine agli utenti o ai motori di ricerca. A differenza di ogni altro tag inseribile in una pagina web (es title, font, ecc) , i meta tag non forniscono al browser alcun dato di formattazione della pagina, per cui il loro influsso sul layout finale è praticamente nullo.
DescriptionIl metadato “description” è destinato a contenere una breve descrizione dei contenuti della pagina, che può essere utile sia all'indicizzazione della pagina che ai potenziali visitatori in quanto sono riportati da molti motori nella visualizzazione della ricerca al posto del testo della pagina in cui sono state rintracciate le parole
KeywordsIl metadato “keywords” contiene di solito una serie di parole chiave, rappresentative del contenuto della pagina, che sarebbero indirizzati ai motori di ricerca non per il posizionamento del sito ma per l'individuazione dell'argomento trattato nella pagina.
10
ClassificazioneEsempio: description e keywords
11
Classificazione
RobotsIl metatag “robots” è indirizzato esclusivamente agli spider fornendo due tipologie distinte di direttive: se indicizzare o meno la pagina, o se seguire o meno i collegamenti da questa ad altre pagine per indicizzarle; può contenere solo determinate variabili che sono:
index: per indicare che la pagina può essere indicizzata.noindex: per indicare invece di non indicizzare la pagina.follow: per indicare di seguire i link a altre pagine collegatenofollow: per indicare di non seguire le pagine linkate
Il funzionamento dei motori di ricerca si divide principalmente in tre fasi:
1)1) analisianalisi del web attraverso l’uso di appositi software (crawler/spider/robot);
2)2) copia e catalogazionecopia e catalogazione del materiale ottenuto;
3)3) restituiscerestituisce all’utente una selezione di risposte sulla base della richiesta
Classificazione
13
ClassificazioneIl Dublin Core è un sistema di metadati costituito da un nucleo di elementi essenziali ai fini della descrizione di qualsiasi materiale digitale accessibile via internet.
Nome TAG
Titolo Title
Autore Creator
Soggetto Subject
Descrizione Description
Editore Publisher
Autore di contributo
subordinatoContributor
Data Data
Nome TAG
Formato Format
Identificatore Identifier
Fonte Source
Lingua Language
Relazione Relation
Copertura Coverage
Gestione dei diritti Rights
Management
14
Classificazione
Un vocabolario controllato è un sottoinsieme di termini del linguaggio naturale, esistono diverse forme di vocabolari controllati e tra questi la lista dei sinonimi, ovvero una lista di termini equivalenti utilizzati per facilitare la ricerca di informazioni.
Come si realizza?
Per costruire un lista di sinonimi si possono analizzare i termini inseriti dagli utenti nel motore di ricerca
Successivamente si crea una lista di termini da associare ad una parola
Quando l'utente utilizzerà di nuovo il motore, ampliato con la lista dei sinonimi, alla ricerca di una parola visualizzerà nei risultati anche tutte le parole equivalenti
é necessario, in fine, presentare i risultati tenendo conto della ricerca fatta dall'utente e dei suoi bisogni affinché egli si ritrovi.
Vocabolari controllati e Thesaurus
Classificazione
Emicrania
Cefalgia
Cefalea
mal di testa
Sinonimi
Caso studio nella PAIl Thesaurus regionale toscano è un vocabolario controllato, sviluppato sulla base della normativa internazionale per la costruzione di thesauri monolingue (ISO 2788/86), a partire dalla terminologia concretamente usata dalle strutture bibliotecarie e documentarie della Regione. l Trt comprende attualmente oltre 9800 termini ognuno dei quali è definito dalle sue relazioni con gli altri termini del vocabolario. La struttura gerarchica è organizzata sulla base di 14 categorie (o faccette), insiemi di termini aventi in comune lo stesso elemento semantico di suddivisione.
Portatore di handicap
Diversamente abile
persona con disabilità
disabile
Formati aperti Cosa sono i formati aperti?
vengono solitamente gestiti da un enti di standardizzazione non proprietari,
le relative specifiche sono a disposizione di una comunità di sviluppo che a loro volta contribuiscono all'evoluzione degli standard.
16
i formati aperti, differenza dei formati proprietari, non hanno misure di restrizioni legale per il loro utilizzo
Formati aperti
hanno il vantaggio di poter essere gestiti sia da software proprietari, open source o da software libero, ciascuno con le proprie modalità di licenza, lasciando a l'utente la possibilità di utilizzare la piattaforma che preferisce.
rappresentano una opportunità preziosa per garantire l'accesso a lungo termine alla documentazione e ai dati prodotti dalla Pubblica amministrazione
favorire l’innovazione e il valore della condivisione della conoscenza
l'importanza dell'utilizzo di formati aperti assume particolare rilevanza anche a fronte del processo di dematerializzazione che è attualmente in atto
Perché utilizzarli in ambito pubblico?
17
Formati aperti
HTML/XHTML per la pubblicazione di informazioni pubbliche su Internet
PDF con marcatura (secondo standard ISO/IEC 32000-1:2008)
XML e CVS per la realizzazione di database di pubblico accesso ai dati
ODF e OOXML per documenti di testo
PNG per le immagini
OGG per i file audio
Theora per file video
I formati aperti, standardizzati e interoperabili raccomandati dalle linee guida:
18
Formati aperti
Formati Esempio Programma
HTML/XHTML Pagine web explorer, Firefox, Safari, ecc
PDF Direttive, circolari, leggi, atti, ecc Adobe Reader, Skim, ecc
XML RSS, aggiornamenti news, ecc Google reader,
CVS Data baseExcel, Openoffice, notepad,
ecc
ODF/OOXML Moduli MS Office, Openoffice, iWork
PNG Foto, Grafici, ecc FotoShop, Paint, ecc
OGG Convegni, interviste VLC, ecc
Theora video introduttivi/tutorial VLC, Quick Time X, ecc
19
Contenuti aperti
La pubblica amministrazione, intesa come soggetto unico, è uno di maggiori detentori e produttori di dati.
A tutti i livelli amministrativi vengono prodotti ogni giorno dati di diversa tipologia e natura tematica (es. anagrafici, socioeconomici, catastali, ecc.), così come una consistente quantità contenuti (articoli, rapporti, analisi, norme, ecc.).
Questo insieme di informazioni rappresenta un patrimonio comune di conoscenza che, in quanto tale, deve essere messo a disposizione degli utenti e più in generale di tutti gli attori economici e sociali.
20
Cosa dicono le linee guida?
Contenuti aperti
l'eventuale rilascio attraverso licenze l'uso che ne favoriscano la diffusione verso i cittadini e incoraggino il loro riutilizzo presso le imprese (es. Creative Commons);
l'utilizzo di Internet come canale di comunicazione primario,
in quanto il più accessibile e meno oneroso, attraverso il quale
diffondere i flussi informativi;
la sicurezza e la riservatezza dei dati;
21
Divulgazione di dati e contenuti
Nella divulgazione dei dati e dei contenuti prodotti le PA italiane devono considerare:
Contenuti apertiLe 6 licenze Creative Commons sono definite dalla combinazione di 4 attributi:
Attribuzione
(by)
Bisogna sempre indicare l'autore dell'opera (attributo obbligatorio) in modo che sia possibile attribuirne la paternità
Non uso commerciale
(nc)
Non sono consentiti usi commerciali dell'opera creativa
Non opere derivate
(nd)
Non sono consentite elaborazioni dell'opera creativa
Condividi allo stesso modo
(sa)
Si può modificare l'opera ma l'opera modificata deve essere rilasciata secondo le stesse condizioni scelte dall'autore originale
22
Contenuti aperti
Consente di:
A condizione che:
http://creativecommons.org/licenses/by-nc/2.5/deed.it
di riprodurre, distribuire, comunicare al pubblico, esporre in pubblico, rappresentare, eseguire e recitare quest'opera
di modificare quest'opera
Attribuzione — Devi attribuire la paternità dell'opera nei modi indicati dall'autore o da chi ti ha dato l'opera in licenza e in modo tale da non suggerire che essi avallino te o il modo in cui tu usi l'opera.
Non commerciale — Non puoi usare quest'opera per fini commerciali.
23
Linee Guida CiVITIl CIVIT (Commissione per la Valutazione, Trasparenza e l'Integrità delle amministrazione pubbliche) ha emanato la delibera n. 150 del 2010, contenente il testo provvisorio, sottoposto a consultazione, delle linee guida per la predisposizione del programma triennale per la trasparenza e l'integrità, ai sensi dell'art. 13, comma 6, lettera e, del decreto legislativo 27 ottobre 2009, n. 150.
Linee guida CIVIT Linee guida WEB PA
trasparenza comunicazione web
Indicazioni relative al formato di pubblicazione e alla classificazione dei contenuti
24
Linee Guida CiVIT
1) Programma triennale per la trasparenza e l’integrità e relativo stato di attuazione
2) Piano e relazione sulla performance
3) Dati sull’organizzazione e i procedimenti
4) Dati relativi al personale
5) Dati relativi a incarichi e consulenze
6) Dati sulla gestione economico-finanziaria dei servizi pubblici
7) Dati sulla gestione dei pagamenti
8) Dati relativi alle buone prassi
9) Dati su sovvenzioni, contributi, crediti, sussidi e benefici di natura economica
10) Dati sul public procurement
25
Il CiVIT per la sezione “Trasparenza, valutazione e merito” prevede la pubbliczione on line dei i seguenti contenuti:
Linee Guida CiVIT
Il CiVIT per la sezione “Trasparenza, valutazione e merito” i seguenti contenuti, articolai come segue:
26
Open data
27
Al momento sono presenti 2.951 data set prodotti da PA statunitensi di ogni livello, rilasciati in formato aperto e riutilizzabile anche a fini commerciali
Open dataQuando un dato è aperto?Si possono individuare alcuni aspetti che caratterizzano un insieme di dati come "aperto":
1) I dati aperti devono essere indicizzati dai motori di ricerca
2) I dati aperti devono essere disponibili in un formato aperto, standardizzato
e leggibile da una applicazione informatica per facilitare la loro
consultazione ed incentivare il il loro riutilizzo anche in modo creativo
3) I dati aperti devono essere rilasciati attraverso licenze libere che non
impediscano la diffusione e il riutilizzo da parte di tutti i soggetti interessati
Open data
29
MyCityWay, App multi-piattaforma
L’applicazione riutilizza in maniera creativa i dati rilasciati in formato open data dalla città di New York
Open data
30
Utilizza i dati aperti messi a disposizione dal Governo americano sul portale data.gov per offrire agli utenti un servizio di orientamento nella pianificazione dei fondi pensione. L’attività è stata lanciata nel 2008 e quest’anno ha chiuso con un utile di 3 milioni di dollari e con un previsionale di 10 milioni per il prossimo anno.
Bright Scope, applicazione on line
Open data
MiaPA utilizza la rubrica della PA italiane messa a disposizione da FormezPA in formato open data per geolocalizzare ed esprimere il proprio giudizio sugli uffici della pubblica amministrazione
Un esempio italiano: MiaPA
Italian Open Data Licence
32
Sviluppata da Formez PA nell’ambito del processo di realizzaizone di MiaPA, la licenza Italian Open Data Licence (IODL) v1.0 è la prima licenza italiana dedicata ai dati pubblici aperti
Licenze per i dati
La IODL è stata sviluppata partendo dalla licenza Open Government Licence 1.0, pensata ad hoc per i dati del settore pubblico del Regno Unito e da subito utilizzata per il portale che raccoglie tutti i dati governativi inglesi data.gov.uk. E inoltre la licenza Italian Open Data Licence è compatibile con le altre principali licenze aperte: Creative Commons e Open Data Commons