L'informazione giuridica nella società
della conoscenza:
la rappresentazione del sapere giuridico nell'era digitale
Monica Palmirani, Università di Bologna, CIRSFIDMilano
3 giugno 2015
Agenda
• Società della conoscenza e open data
• Le caratteristiche dell’informazione giuridica nella società della conoscenza
• Sentenze, trattamento dei dati personali e open data giuridici
• Soluzioni tecniche
Internet e la “Società della conoscenza” condivisa
Dati/informazioni + Esperienza = Conoscenza
Open Source INTelligence
Un nuovo paradigma
• “Raw Data now” – TED 2009
»Reuse data and create new markets
»Access, transparency, control,
monitoring, evaluation, partecipation
Obama’s Open Gov Initiative 2009http://www.data.gov/
“an unprecedented level of openness in government”
“the public trust and establish a system of transparency, public participation, and collaboration.”
“an unprecedented level of openness in government”
“the public trust and establish a system of transparency, public participation, and collaboration.”
L’Italia e l’Open Data:Art. 52 CAD
Accesso telematico e riutilizzo dei dati delle pubbliche amministrazioni
Le pubbliche amministrazioni pubblicano nel proprio sito web, all'interno della sezione "Trasparenza, valutazione e merito", il catalogo dei dati, dei metadati e delle relative banche dati in loro possesso ed i regolamenti che ne disciplinano l'esercizio della facolta' di accesso telematico e il riutilizzo, fatti salvi i dati presenti in Anagrafe tributaria
I dati e i documenti che le amministrazioni titolari pubblicano, con qualsiasi modalita', senza l'espressa adozione di una licenza di cui all'articolo 2, comma 1, lettera h), del decreto legislativo 24 gennaio 2006, n. 36, si
intendono rilasciati come dati di tipo aperto ai sensi all'articolo 68, comma 3, del presente Codice.
Le attivita' volte a garantire l'accesso telematico e il riutilizzo dei dati delle pubbliche amministrazioni rientrano tra i parametri di valutazione della performance dirigenziale ai sensi dell'articolo 11, comma 9, del decreto legislativo 27 ottobre 2009, n. 150.
d.l. 179/2012
Art. 50 CADDisponibilità dei dati delle pubbliche
amministrazioni
1. I dati delle pubbliche amministrazioni sono formati, raccolti, conservati, resi disponibili e accessibili con l'uso delle tecnologie dell'informazione e della comunicazione che ne consentano la fruizione e riutilizzazione, alle condizioni fissate dall'ordinamento, da parte delle altre pubbliche amministrazioni e dai privati; restano salvi i limiti alla conoscibilità dei dati previsti dalle leggi e dai regolamenti, le norme in materia di protezione dei dati personali ed il rispetto della normativa comunitaria in materia di riutilizzo delle informazioni del settore pubblico.
2. Qualunque dato trattato da una pubblica amministrazione, con le esclusioni di cui all'articolo 2, comma 6, salvi i casi previsti dall'articolo 24 della legge 7 agosto 1990, n. 241, e nel rispetto della normativa in materia di protezione dei dati personali, è reso accessibile e fruibile alle altre amministrazioni quando l'utilizzazione del dato sia necessaria per lo svolgimento dei compiti istituzionali dell'amministrazione richiedente, senza oneri a carico di quest'ultima, salvo per la prestazione di elaborazioni aggiuntive è fatto comunque salvo il disposto dell'articolo 43, comma 4, deldecreto del Presidente della Repubblica 28 dicembre 2000, n. 445.
Art. 68 CAD(per la prima volta la definizione di open data)
Agli effetti del presente decreto legislativo si intende per:
a) formato dei dati di tipo aperto, un formato di dati reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi;
b) dati di tipo aperto, i dati che presentano le seguenti caratteristiche:a) sono disponibili secondo i termini di una licenza che ne permetta l'utilizzo da parte di
chiunque, anche per finalita' commerciali, in formato disaggregato;
b) sono accessibili attraverso le tecnologie dell'informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati aperti ai sensi della lettera a), sono adatti all'utilizzo automatico da parte di programmi per elaboratori e sono provvisti dei relativi metadati;
c) sono resi disponibili gratuitamente attraverso le tecnologie dell'informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione. L'Agenzia per l'Italia digitale deve stabilire, con propria deliberazione, i casi eccezionali, individuati secondo criteri oggettivi, trasparenti e verificabili, in cui essi sono resi disponibili a tariffe superiori ai costi marginali. In ogni caso, l'Agenzia, nel trattamento dei casi eccezionali individuati, si attiene alle indicazioni fornite dalla direttiva 2003/98/CE del Parlamento europeo e del Consiglio, del 17 novembre 2003, sul riutilizzo dell'informazione del settore pubblico, recepita con il decreto legislativo 24 gennaio 2006, n. 36.
Caratteristiche dell’open government data
• Formati aperti: JSON, XML, RDF, CSV, excel, txt, etc.
• Dotati di licenza aperta con attribuzione (cc0 si usa
limitatamente nell’OGD)
• Con metadati che tracciano la storia del dataset
• A disposizione senza filtri rispetto ai motori di ricerca
• Gratuitamente distribuiti o a costi marginali
Limiti ?
– Tanti: dati personali, dati sensibili, copyright, marchi, segreto statistico, segreto amministrativo, segreto di stato…. e tutto l’art. 24 della L. 241/90
L’informazione giuridica digitaleAccursio
Magna Glossa XI
Corpus iuriscivilisCODEX
AccursioMagna Glossa
XICorpus iuriscivilisCODEX
copia del contenuto
presentazione
annotazione
Caratteristiche da preservare: distinguere chiaramente fra contenuto autorevole, metadati aggiuntivi, presentazione editoriale
L’informazione giuridica digitale:Funzionalità
• Drafting cooperativo• Tagging e annotazioni• Tracciamento della storia del documento giuridico• Anonimizzazione e alterazioni per la pubblicazione
• Autorevolezza, Autenticità, Autorialità, Consistenza, Integrità
• Validità legale e preservazione nel lungo periodo• Provenienza delle asserzioni semantiche
• Ricerche semantiche – problema dell’incrocio dei dati
Motivazioni per l’apertura dell’informazione giuridica
• La libera accessibilità delle sentenze ha lo scopo di rendere un migliore servizio al cittadino e rendere piùtrasparente il sistema della giustizia in Italia:
– per le imprese per sviluppare servizi
– per gli operatori della giustizia: giudici, avvocati, liberi professionisti
– per gli studenti e ricercatori– per le associazioni, cittadini, attivisti.
• L’offerta di servizi su banche di dati d’informazione giuridica è costituita da un piccolo gruppo di soggetti che determinano una situazione di sostanziale oligopolio
Contesto Italiano• Crescita di sentenze nativamente digitali o digitalizzate
• Tribunali ordinari civili (e.g., famiglia, lavoro, commerciale)• Tribunali penali• Corte Cassazione• Corte Costituzionale (XML)• Giustizia amministrativa (e.g., TAR)• Corte dei conti • Giustizia tributaria• Dati Statistici
0
100.000
200.000
300.000
400.000
500.000
600.000
700.000
800.000
900.000
sentenze appello ordinanze decreti decreti ingiuntivi0
50000
100000
150000
200000
250000
300000
civile penale
CASSAZIONE 405.838PROCESSO CIVILE TELEMATICO1.942.000
Contesto Europeo
• CURIA – Corte di Giustizia Europea
http://curia.europa.eu/juris/document/document.jsf?text=hiv&docid=48564&pageI
ndex=0&doclang=IT&mode=req&dir=&occ=first&part=1&cid=602664#ctx1
ECLI:EU:C:2004:262
ECLI: Standard europeo per gli URI persistenti
Quadro normativo italiano per favorire l’apertura delle sentenze
• Trasparenza: d.lgs. 33/2013
• Pubblicità delle sentenze: CAD, art. 56, comma 2bis
“2-bis. I dati identificativi delle questioni pendenti, le sentenze e le altre decisioni depositate in cancelleria o segreteria dell'autorità giudiziaria di ogni ordine e grado sono, comunque, rese accessibili ai sensi dell'articolo 51 del codice in materia di protezione dei dati personali approvato con decreto legislativo n.196 del 2003.”
• Pubblicazione e comunicazione della sentenza: Art. 133 Codice di Procedura Civile
• Linee guida Garante (2 dicembre 2010)
• Privacy artt. 51 e 52, d.lgs. 196/2003 (privacy)
• Anonimizzazione: Linee guida in materia di trattamento dei dati personali nella riproduzione di provvedimenti giurisdizionali per finalità di informazione giuridica (2 dicembre 2010)
• Pena accessoria di pubblicazione per intero o per estratto della sentenza nel penale art. 186 Codice Penale
Linee guida del Garante Privacy
• “La diffusione dei provvedimenti giurisdizionali costituisce fonte preziosa per lo studio e l'accrescimento della cultura giuridica e strumento indispensabile di controllo da parte dei cittadini dell'esercizio del potere giurisdizionale.
• Il Codice favorisce la più ampia diffusione delle sentenze e degli altri provvedimenti dell'Autorità giudiziaria per i quali sia stato assolto, mediante il deposito nella cancellerie e nelle segreterie giudiziarie, l'onere della pubblicazione previsto dalle disposizioni dei codici di procedura civile e penale.”
SentenzeWeb: Corte di Cassazione
ECLI: Standard europeo per gli URI persistenti
Akoma Ntoso: standard per i documenti giuridici XML
mondiale
http://www.italgiure.giustizia.it/xway/application/nif/clean/hc.dll?verbo=attach
&db=snpen&id=./20150212/snpen@s10@a2015@[email protected]
http://www.italgiure.giustizia.it/xway/application/nif/clean/hc.dll?verbo=attach&db=snpen&
id=./Oscurate20150313/snpen@s30@a2014@n39411@[email protected]
Garante Privacy
“E tuttavia, la circostanza della pubblicazione integrale delle pronunce – con anche i nominativi, per esteso, delle parti e dei terzi coinvolti a qualunque titolo – non può non suscitare più di una preoccupazione in ordine alla garanzia del diritto alla protezione dei dati personali (spesso anche sensibili e giudiziari) degli interessati. Questa preoccupazione si fonda, in particolare, sui rischi di indicizzazione, decontestualizzazione, finanche alterazione dei dati stessi, inevitabilmente connessi alla loro indiscriminata accessibilità via web; rischi ben evidenziati dalla sentenza della Corte di giustizia dell'Unione europea del 13 maggio scorso, in re C-131/12 (Google-Spain).”
http://www.garanteprivacy.it/web/guest/home/docweb/-/docweb-
display/docweb/3432529
Punti critici
• Soggetti che hanno diritto ad accedere
• Tutto il documento o solo l’estratto• Finalità del trattamento e pertinenza (non eccedenza)
• Le motivazioni della sentenza o solo il dispositivo• Per quanto tempo
• In che forma e formato (XML??)• Indicizzate dai motori generalistici
• Diritto all’oblio
• Anonimizzazione dei dati di identificazione indiretta• De-anonimizzazione
• Metadati di ricerca• Penale (Indagati, imputati, condannati ????)
OpenSentenze
• Gruppo di lavoro composto da circa 50 esperti, professionisti, accademici:
• favorire la pubblicazione delle sentenze come dati di tipo
aperto, ai sensi dell’art 68 comma 3 del Codice di Amministrazione Digitale (Dlgs. n. 82 del 2005) nel
rispetto delle norme sulla protezione dei dati personali;
• apertura dei dati statistici in open data;
• creare delle linee guida;
• Creare tool per facilitare il compito delle corti.
Soluzioni tecnologiche possibili
• Linee guida per la pubblicazione delle sentenze in formato aperto
• Standard: ECLI and Akoma NtosoECLI/ELI per i riferimenti
Sentenza n. 12/2008 Tribunale di Milano
ECLI:IT:TRBMI:2008:S12LA
– ECLI components under national responsibility
– ECLI : [CountryCode] : [CourtCode] : [Year] : [OrdinalNumber]
(Agnoloni, Bacci, Francesconi, ITTG-CNR)
http://www.cortedicassazione.it/cassazione-resources/resources/cms/documents/20141014_Francesconi.pdf
Akoma Ntoso
• Akoma Ntoso: Standard
XML per i documenti giuridici
• Adottato dal Parlamento EU, Camera, Senato, etc.
• Nel futuro anche dalla Corte di Cassazione
• Non è un semplice strumento sintattico ma
ingloba i principi ontologici
del documento giuridico
Soluzioni tecnologichepossibili
• NLP tools per
– l’anonimizzazione (nomi, indirizzi, ruoli,
contesto)
– Il detecting automatico dei riferimenti
normativi e delle sentenze
• Classificazione automatica degli oggetti/argomenti
Indice di rischio
• Categoria dell’oggetto della sentenza 20% (e.g., diritto di famiglia)• Presenza di minori 30%• Abusi sessuali 15%• Dati sanitari 20%• Dati sullo stato della persona 15%
Anonimizzazione
Hash: ossia un metodo per crittografare i dati personali/sensibili senza cancellarli ma oscurarli a coloro che non hanno le finalità e i permessi per accedervi
Conclusione e considerazioni su JurisWiki
Lati positivi• Difficile bilanciamento fra informazione giuridica /diritto alla conoscenza e trattamento
dei dati personali secondo finalità e pertinenza• Positivo impulso verso il nuovo come sfida alla staticità e al monopolio• Strumenti Web 2.0 per l’annotazione in crowdsourcing delle risorse giuridiche in linea
con l’emergente società della conoscenza• Nuove forme imprenditoriali
Lati oscuri• Problematica ancora aperta sulle licenze nella composizione di fonti eterogenee
provenienti dalle corti: esempio Creative Commons (CC-BY-SA 3.0) Corte Costituzionale combinate con altre risorse del Web
• Problematica aperta sull’indicizzazione dell’informazione da parte di motori di ricerca (Google) e gestione del diritto all’oblio – molti siti delle corti non sono indicizzati mentre JurisWiki espone all’indicizzazione i materiali sottratti precedentemente
• Uso commerciale non autorizzato di dati sensibili – (uso di AdSense)• Gestione della presentazione via Web delle fonti giuridiche per preservare la
semantica inclusa nella forma• Dati sensibili relativamente specie nelle sentenze penali (pena accessoria)
Top Related