Applicazioni del TAL e dell'Information retrieval nel settore giuridico

16
Applicazioni del TAL e dell'Information retrieval nel settore giuridico 11 maggio 2009 Marco Bianchi

description

Presentazione fatta a ForumPA 2009 che tratta due sperimentazione sul tema dell'Information retrieval nel contesto giuridico, condotte presso il Laboratorio di sperimentazione di tecnologie e applicazioni dell'Ufficio divisionale Tecnologie innovative del CNIPA.

Transcript of Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Page 1: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Applicazioni del TAL e dell'Information retrieval nel settore giuridico

11 maggio 2009Marco Bianchi

Page 2: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Agenda

• Cosa si intende per Information retrieval

• Casi di studio:– Il prototipo NavigaNorme– Partecipazione alla competizione internazionale 

TREC

Page 3: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Cos'è l'Information retrieval?

• Information retrieval

– Area di ricerca interdisciplinare che studia tecniche utilizzate per il recupero mirato dell’informazione in formato elettronico.

– Esempi applicativi:• Motori di ricerca

Page 4: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Genesi del prototipo NavigaNorme

20/02/2008 

Il collegio del CNIPA costituisce un GdL per la realizzazione di un prototipo operante su un insieme limitato ma significativo di norme concernenti l'ambito di competenza del CNIPA, ai fini della creazione di un testo coordinato della normativa in materia.

Riferimento: ADUNANZA DEL 20 FE88RAIO 2008 - DELlBERAZIONE N. 15/2008

Page 5: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

“Definizione” delle specificheLegge 7 agosto 1990, n. 241 “Nuove  norme  in  materia  di procedimento  amministrativo  e di  diritto  di  accesso  ai documenti amministrativi”.    Pubblicata nella Gazzetta Ufficiale 18 agosto 1990, n.  192. 

IPOTESI  DI RELAZIONE  

Decreto legislativo 7 marzo 2005, n. 82 “Codice dell'amministrazione digitale.” pubblicato nella Gazzetta Ufficiale  n. 112  del 16 maggio 2005 ­ Supplemento Ordinario n. 931  

Capo I ­ Princìpi      1. Principi  generali  dell'attività amministrativa (3). 1.   L'attività  amministrativa persegue  i  fini  determinati  dalla legge  ed  è  retta  da  criteri  di economicità,  di  efficacia,  di pubblicità  e  di  trasparenza secondo  le modalità previste  dalla presente  legge  e  dalle  altre disposizioni  che  disciplinano singoli  procedimenti,  nonché  dai princìpi  dell'ordinamento comunitario (4).  1­bis.  La  pubblica amministrazione,  nell'adozione  di atti  di  natura  non  autoritativa, agisce  secondo le  norme di diritto privato  salvo  che  la  legge disponga diversamente (5).  1­ter.  I  soggetti  privati  preposti all'esercizio  di  attività amministrative  assicurano  il rispetto  dei  princìpi  di  cui  al comma 1 (6).  2.   La  pubblica  amministrazione non può  aggravare il procedimento se non per straordinarie e motivate esigenze  imposte  dallo svolgimento dell'istruttoria.  (3)   Rubrica  aggiunta  dall'art.  21,  L.  11 febbraio 2005, n. 15. 

 (1.1  ­> 12.1)   Specializzazione strumentale – uso dell’ICT per il raggiungimento di scopi più generali  (1.1  ­> 15.1)  Specializzazione strumentale – uso dell’ICT per il raggiungimento di scopi più generali          (1.2  ­> 15.2)  Specializzazione strumentale – uso dell’ICT per il raggiungimento di scopi più generali 

Art. 3 ­ Diritto all'uso delle tecnologie 1.I cittadini e le imprese hanno diritto a richiedere ed ottenere  l'uso  delle  tecnologie  telematiche  nelle comunicazioni  con  le  pubbliche  amministrazioni  e con  i  gestori  di  pubblici  servizi  statali  nei  limiti  di quanto previsto nel presente codice.  Omissis Art.  12    ­  Norme generali per  l'uso  delle  tecnologie dell'informazione  e  delle  comunicazioni  nell'azione amministrativa 1.Le  pubbliche  amministrazioni  nell'organizzare autonomamente  la  propria  attività  utilizzano  le tecnologie  dell'informazione  e  della  comunicazione per  la  realizzazione  degli  obiettivi  di  efficienza, efficacia,  economicità,  imparzialità,  trasparenza, semplificazione e partecipazione.   Omissis Art. 15  ­ Digitalizzazione e riorganizzazione 1.  La  riorganizzazione  strutturale  e  gestionale  delle pubbliche  amministrazioni  volta  al  perseguimento degli  obiettivi  di  cui  all'articolo  12,  comma  1, avviene  anche  attraverso  il  migliore  e  più  esteso utilizzo  delle  tecnologie  dell'informazione  e  della comunicazione nell'ambito di una coordinata strategia che  garantisca  il  coerente  sviluppo  del  processo  di digitalizzazione.  2.  In  attuazione  del  comma  1,  le  pubbliche amministrazioni  provvedono  in  particolare  a razionalizzare  e  semplificare  i  procedimenti amministrativi,  le  attività  gestionali,  i  documenti,  la 

                                                 1 Testo successivamente aggiornato con le modifiche introdotte dal d.lgs. 4 aprile 2006, n. 159 – “Disposizioni integrative e correttive al decreto legislativo 7 marzo 2005, n. 82, recante codice dell’ amministrazione digitale”, pubblicato nel supplemento ordinario n. 105 alla Gazzetta Ufficiale del 29 aprile 2006, serie generale, n. 99. 

Area Studi legislativi 

Page 6: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Individuazione dei partner scientifici

• Contributi del Laboratorio di sperimentazione – In collaborazione con:

• Fondazione Ugo Bordoni• Univ. Tor Vergata: Laboratorio Art Research Group• Univ. Tor Vergata: Laboratorio Nestor• Univ. Glasgow (collab. indiretta)

– In raccordo con la dott.ssa Lupo per le collaborazioni in corso con il CNR

– In raccordo con il GdL classificazione dei documenti – CNR e Università della Calabria

Ufficio Gestione e condivisione della conoscenza 

Page 7: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Funzionalità di “NavigaNorme”

• Rilevanza calcolata in base a:– Grado di “somiglianza” statistica– Riferimenti espliciti tra norme (attivi e passivi)– Presenza di termini del dizionario “amministrativo”– Presenza di termini del dizionario “ICT”– ... estendibile

Comma X

Elenco di commi correlati a X ordinati per rilevanza

Page 8: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Prestazioni di “NavigaNorme”

Configurazione:Riferimenti Attivi:  +100Riferimenti Passivi:  +  50 

Numero commi recuperati: 800Numero commi rilevanti recuperati dal sistema: 450 (+ 11 commi)

% di commi rilevanti nei primi 5:  91% (+20%)% di commi rilevanti nei primi 10:  81% (+17%)% di commi rilevanti nei primi 20:  68% (+6%)% di commi rilevanti nei primi 40:  56% (+2%)

Il prototipo è stato reputato estremamente soddisfacente 

dagli esperti di dominio che lo hanno provato

Page 9: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

“NavigaNorme” oggi...  (1/2)

Page 10: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

“NavigaNorme” oggi... (2/2)

• Oltre al tool di annotazione semantica, sono in fase di studio tecniche per sfruttare al meglio:– La struttura XML dei testi normativi – Il feedback da parte dell'utente.

Page 11: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Le risorse per “NavigaNorme”

Risorse umane impiegate:• 1 risorsa interna e 1 collaboratore (part­time)• 1 dottoranda in Ingegneria informatica• 1 tesista di Informatica• 3 studenti di master (settore giuridico)• varie collaborazioni con gli esperti

Tempi di realizzazione: • circa 5 mesi solari (NavigaNorme + partecipazione 

TREC) 

Page 12: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Text REtrieval Conference (TREC)

• Workshop internazionale che ospita una competizione nella risoluzione di problemi complessi di IR

• Gruppi di partecipanti: tra 200 e 250.• Obiettivo principale: incoraggiare lo sviluppo della 

ricerca in questo settore – Collezioni di test realistiche– Procedure di valutazione uniformi e “oggettive”

Page 13: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

La Legal track

Page 14: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Partecipazione CNIPA a TREC'08

• Squadra italiana composta da:– CNIPA– Fondazione Ugo Bordoni– Università di Roma “Tor Vergata” ­ Laboratorio Nestor

• Risultati:– seconda posizione nella competizione “Legal Track”– verificata efficacia delle tecnologie usate per  

NavigaNorme– acquisite conoscenze utili alla realizzazione e valutazione 

di NavigaNorme– rafforzati rapporti di collaborazione e gettate le basi per 

nuove attività di ricerca e nuove collaborazioni.

Page 15: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Conclusioni

• Le esperienze di NavigaNorme e TREC testimoniano:– Potenzialità delle collaborazioni tra PA e S.P.R.– Efficacia degli approcci multidisciplinari:

• il confronto continuo e faticoso tra gli esperti delle diverse discipline (giuristi, informatici, avvocati)

– Capacità di valorizzare risorse esistenti:• archivi XML, glossari, ...

– Capacità, da parte della PA, di identificare problemi sfidanti presenti nella PA interessanti per il mondo della ricerca.

– Capacità, da parte del S.P.R., di proporre tematiche di ricerca di interesse per la PA.

Page 16: Applicazioni del TAL e dell'Information retrieval nel settore giuridico

Bibliografia

• M.Bianchi, M.Draoli, G.Gambosi, G.Stilo, A support system for the analysis and the management of complex ruling documents, in the Proceedings of the 2nd Workshop on Legal Informatics and Legal Information Technology, Poznan (Poland), 2009.

• M.Bianchi, M.Draoli, G.Gambosi, A.L.Petrucci, G.Stilo, ICT tools for the simplification of legislative frameworks, in the Proceedings of the 1st International Conference on eGovernment and eGovernance, Ankara (Turkey), 2009.

• G. Amati, M. Bianchi, A. Celi, M. Draoli, G. Gambosi, G. Stilo, CNIPA, FUB and University of Rome "Tor Vergata" at TREC 2008 Legal Track, in the Proceedings of the 17th  Text REtrieval Conference (TREC 2008), Gaithersburg (Mariland – USA), 2008