Applicazioni del TAL e dell'Information retrieval nel settore giuridico
-
Upload
marco-bianchi -
Category
Technology
-
view
451 -
download
0
description
Transcript of Applicazioni del TAL e dell'Information retrieval nel settore giuridico
Applicazioni del TAL e dell'Information retrieval nel settore giuridico
11 maggio 2009Marco Bianchi
Agenda
• Cosa si intende per Information retrieval
• Casi di studio:– Il prototipo NavigaNorme– Partecipazione alla competizione internazionale
TREC
Cos'è l'Information retrieval?
• Information retrieval
– Area di ricerca interdisciplinare che studia tecniche utilizzate per il recupero mirato dell’informazione in formato elettronico.
– Esempi applicativi:• Motori di ricerca
Genesi del prototipo NavigaNorme
20/02/2008
Il collegio del CNIPA costituisce un GdL per la realizzazione di un prototipo operante su un insieme limitato ma significativo di norme concernenti l'ambito di competenza del CNIPA, ai fini della creazione di un testo coordinato della normativa in materia.
Riferimento: ADUNANZA DEL 20 FE88RAIO 2008 - DELlBERAZIONE N. 15/2008
“Definizione” delle specificheLegge 7 agosto 1990, n. 241 “Nuove norme in materia di procedimento amministrativo e di diritto di accesso ai documenti amministrativi”. Pubblicata nella Gazzetta Ufficiale 18 agosto 1990, n. 192.
IPOTESI DI RELAZIONE
Decreto legislativo 7 marzo 2005, n. 82 “Codice dell'amministrazione digitale.” pubblicato nella Gazzetta Ufficiale n. 112 del 16 maggio 2005 Supplemento Ordinario n. 931
Capo I Princìpi 1. Principi generali dell'attività amministrativa (3). 1. L'attività amministrativa persegue i fini determinati dalla legge ed è retta da criteri di economicità, di efficacia, di pubblicità e di trasparenza secondo le modalità previste dalla presente legge e dalle altre disposizioni che disciplinano singoli procedimenti, nonché dai princìpi dell'ordinamento comunitario (4). 1bis. La pubblica amministrazione, nell'adozione di atti di natura non autoritativa, agisce secondo le norme di diritto privato salvo che la legge disponga diversamente (5). 1ter. I soggetti privati preposti all'esercizio di attività amministrative assicurano il rispetto dei princìpi di cui al comma 1 (6). 2. La pubblica amministrazione non può aggravare il procedimento se non per straordinarie e motivate esigenze imposte dallo svolgimento dell'istruttoria. (3) Rubrica aggiunta dall'art. 21, L. 11 febbraio 2005, n. 15.
(1.1 > 12.1) Specializzazione strumentale – uso dell’ICT per il raggiungimento di scopi più generali (1.1 > 15.1) Specializzazione strumentale – uso dell’ICT per il raggiungimento di scopi più generali (1.2 > 15.2) Specializzazione strumentale – uso dell’ICT per il raggiungimento di scopi più generali
Art. 3 Diritto all'uso delle tecnologie 1.I cittadini e le imprese hanno diritto a richiedere ed ottenere l'uso delle tecnologie telematiche nelle comunicazioni con le pubbliche amministrazioni e con i gestori di pubblici servizi statali nei limiti di quanto previsto nel presente codice. Omissis Art. 12 Norme generali per l'uso delle tecnologie dell'informazione e delle comunicazioni nell'azione amministrativa 1.Le pubbliche amministrazioni nell'organizzare autonomamente la propria attività utilizzano le tecnologie dell'informazione e della comunicazione per la realizzazione degli obiettivi di efficienza, efficacia, economicità, imparzialità, trasparenza, semplificazione e partecipazione. Omissis Art. 15 Digitalizzazione e riorganizzazione 1. La riorganizzazione strutturale e gestionale delle pubbliche amministrazioni volta al perseguimento degli obiettivi di cui all'articolo 12, comma 1, avviene anche attraverso il migliore e più esteso utilizzo delle tecnologie dell'informazione e della comunicazione nell'ambito di una coordinata strategia che garantisca il coerente sviluppo del processo di digitalizzazione. 2. In attuazione del comma 1, le pubbliche amministrazioni provvedono in particolare a razionalizzare e semplificare i procedimenti amministrativi, le attività gestionali, i documenti, la
1 Testo successivamente aggiornato con le modifiche introdotte dal d.lgs. 4 aprile 2006, n. 159 – “Disposizioni integrative e correttive al decreto legislativo 7 marzo 2005, n. 82, recante codice dell’ amministrazione digitale”, pubblicato nel supplemento ordinario n. 105 alla Gazzetta Ufficiale del 29 aprile 2006, serie generale, n. 99.
Area Studi legislativi
Individuazione dei partner scientifici
• Contributi del Laboratorio di sperimentazione – In collaborazione con:
• Fondazione Ugo Bordoni• Univ. Tor Vergata: Laboratorio Art Research Group• Univ. Tor Vergata: Laboratorio Nestor• Univ. Glasgow (collab. indiretta)
– In raccordo con la dott.ssa Lupo per le collaborazioni in corso con il CNR
– In raccordo con il GdL classificazione dei documenti – CNR e Università della Calabria
Ufficio Gestione e condivisione della conoscenza
Funzionalità di “NavigaNorme”
• Rilevanza calcolata in base a:– Grado di “somiglianza” statistica– Riferimenti espliciti tra norme (attivi e passivi)– Presenza di termini del dizionario “amministrativo”– Presenza di termini del dizionario “ICT”– ... estendibile
Comma X
Elenco di commi correlati a X ordinati per rilevanza
Prestazioni di “NavigaNorme”
Configurazione:Riferimenti Attivi: +100Riferimenti Passivi: + 50
Numero commi recuperati: 800Numero commi rilevanti recuperati dal sistema: 450 (+ 11 commi)
% di commi rilevanti nei primi 5: 91% (+20%)% di commi rilevanti nei primi 10: 81% (+17%)% di commi rilevanti nei primi 20: 68% (+6%)% di commi rilevanti nei primi 40: 56% (+2%)
�
Il prototipo è stato reputato estremamente soddisfacente
dagli esperti di dominio che lo hanno provato
“NavigaNorme” oggi... (1/2)
“NavigaNorme” oggi... (2/2)
• Oltre al tool di annotazione semantica, sono in fase di studio tecniche per sfruttare al meglio:– La struttura XML dei testi normativi – Il feedback da parte dell'utente.
Le risorse per “NavigaNorme”
Risorse umane impiegate:• 1 risorsa interna e 1 collaboratore (parttime)• 1 dottoranda in Ingegneria informatica• 1 tesista di Informatica• 3 studenti di master (settore giuridico)• varie collaborazioni con gli esperti
Tempi di realizzazione: • circa 5 mesi solari (NavigaNorme + partecipazione
TREC)
Text REtrieval Conference (TREC)
• Workshop internazionale che ospita una competizione nella risoluzione di problemi complessi di IR
• Gruppi di partecipanti: tra 200 e 250.• Obiettivo principale: incoraggiare lo sviluppo della
ricerca in questo settore – Collezioni di test realistiche– Procedure di valutazione uniformi e “oggettive”
La Legal track
Partecipazione CNIPA a TREC'08
• Squadra italiana composta da:– CNIPA– Fondazione Ugo Bordoni– Università di Roma “Tor Vergata” Laboratorio Nestor
• Risultati:– seconda posizione nella competizione “Legal Track”– verificata efficacia delle tecnologie usate per
NavigaNorme– acquisite conoscenze utili alla realizzazione e valutazione
di NavigaNorme– rafforzati rapporti di collaborazione e gettate le basi per
nuove attività di ricerca e nuove collaborazioni.
Conclusioni
• Le esperienze di NavigaNorme e TREC testimoniano:– Potenzialità delle collaborazioni tra PA e S.P.R.– Efficacia degli approcci multidisciplinari:
• il confronto continuo e faticoso tra gli esperti delle diverse discipline (giuristi, informatici, avvocati)
– Capacità di valorizzare risorse esistenti:• archivi XML, glossari, ...
– Capacità, da parte della PA, di identificare problemi sfidanti presenti nella PA interessanti per il mondo della ricerca.
– Capacità, da parte del S.P.R., di proporre tematiche di ricerca di interesse per la PA.
Bibliografia
• M.Bianchi, M.Draoli, G.Gambosi, G.Stilo, A support system for the analysis and the management of complex ruling documents, in the Proceedings of the 2nd Workshop on Legal Informatics and Legal Information Technology, Poznan (Poland), 2009.
• M.Bianchi, M.Draoli, G.Gambosi, A.L.Petrucci, G.Stilo, ICT tools for the simplification of legislative frameworks, in the Proceedings of the 1st International Conference on eGovernment and eGovernance, Ankara (Turkey), 2009.
• G. Amati, M. Bianchi, A. Celi, M. Draoli, G. Gambosi, G. Stilo, CNIPA, FUB and University of Rome "Tor Vergata" at TREC 2008 Legal Track, in the Proceedings of the 17th Text REtrieval Conference (TREC 2008), Gaithersburg (Mariland – USA), 2008