Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete...

25
Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names ) Progetto “Norme in rete” Corso di lezioni Camerino, 27-28 settembre 2004

Transcript of Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete...

Page 1: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

Identificazione dei documenti giuridici

tramite URNs (Uniform Resource Names)

Progetto “Norme in rete”Corso di lezioni

Camerino, 27-28 settembre 2004

Page 2: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 2

I riferimenti nei documenti giuridici

• Nei documenti giuridici, i riferimenti ad altri provvedimenti sono molto frequenti ed estremamente importanti

• La possibilità di consultare immediatamente il documento referenziato è spesso indispensabile per la piena comprensione del testo

• I link ipertestuali attualmente utilizzati nel Web soddisfano questa esigenza, ma:

- sono basati sulla locazione fisica della risorsa referenziata attraverso la URL (Uniform Resource Locator)

- presentano una serie di problematiche note

- nel diritto (come in ogni disciplina), i riferimenti usano un sistema basato sugli elementi significativi del documento referenziato

> non adatti ad ad un uso su larga scala nel diritto

Page 3: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 3

Problematiche legate alle URLLe applicazioni Internet individuano le risorse di rete attraverso la loro locazione, espressa in maniera uniforme tramite URL (Uniform Resource Locator), secondo vari schemi.

es. http://www.normeinrete.it/doc/NIR2000sito.doc mailto:[email protected]

Componenti: protocollo, macchina, directory, file, utente, ...

Per la creazione di un ipertesto globale sui documenti giuridici, l’utilizzo su vasta scala delle URL comporta:- difficoltà nel conoscere la locazione della risorsa referenziata- perdita di validità nel tempo delle locazioni utilizzate- impossibilità a referenziare risorse non disponibili in rete

> la rete dei collegamenti fra i documenti risulta quindi estremamente limitata rispetto alle potenzialità e sempre più inaffidabile nel tempo

Page 4: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 4

Uso dei nomi uniformi nel progetto NiR

nome uniforme

xspazio di tutti

i documenti giuridici

I nomi uniformi (URNs: Uniform Resource Names) sono identificativi univoci e persistenti di risorse:- indipendenti da: disponibilità, accesso e locazione fisica- concepiti dalla comunità Internet come classe di URI- standard descritto e citato in diversi RFC (2141: sintassi)

Le URNs sono state scelte nel progetto NiR- come identificativi univoci e persistenti dei documenti giuridici- come strumento per rappresentare le relazioni fra questi

> i riferimenti: sono persistenti e possono essere costruiti, anche automaticamente (in modo permanente o temporaneo), dagli estremi significativi del provvedimento citato

x x

xx

x

xx

o

x

x

Page 5: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 5

URN vs URL

caratteristiche URL URN

univocità risorsa di rete documento

base locazione di rete estremi significativi

persistenza no si

aggiornamento tutti i link solo risolutore

accesso risorsa diretto tramite risolutore

risorse di rete una una o più

costruzione non possibile regole del namespace

automatizzabilità non possibile dai riferimenti

browser vari schemi non riconosciuto

Page 6: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 6

Obiettivi in “Norme in Rete”

Utilizzare il nome uniforme come mezzo per:

1. il reperimento diretto di un documento in rete

2. la navigazione attraverso i collegamenti fra i documenti (rinvii)

urn(A)

nir

doc. A

doc. A

riferimentoa doc. B nir

doc. B

urn(B)

Page 7: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 7

Tappe per la definizione dello standard

1. Stesura del documento da parte del Gruppo di lavoro (mar. 2001)

2. Richiesta di commenti, entro 3 mesi, da parte di: - altri Gruppi di lavoro - istituzioni partecipanti al progetto NiR - altri soggetti interessati

3. Rilascio della versione finale 1.0 da parte del GdL (lug. 2001)

4. Approvazione dal Comitato tecnico istituzionale del progetto (lug. 2001)

5. Stesura della versione 1.1 (nov. 2001) http://www.normeinrete.it/risorse/urn.htm

6. Emanazione della circolare AIPA con la norma tecnica (nov. 2001)

Page 8: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 8

Requisiti del sistema (1)1. Uno schema di assegnazione dei nomi capace di rappresentare, all’interno di uno specifico spazio di nomi (nir):- qualsiasi provvedimento- emesso da qualsiasi autorità- in qualunque tempo (presente, passato e futuro)

Schema di base proposto:<autorità>:<provvedimento>:<estremi>:<annesso>?@<versione>?con le necessarie articolazioni interne:<autorità> ::= (<istituzione>;<organo>?;<funzione>?) | <carica><provvedimento> ::= <tipo>;<specificazione>?<estremi> ::= <data>;<numero><annesso> ::= <id-annesso>;<specificazione>?

es. stato:legge:1997-07-16;[email protected]+ministero.giustizia:decreto:1998-09-12;22regione.piemonte;consiglio:delibera:1999-12-14;58:allegato.acomune.firenze;sindaco:ordinanza:1995-03-07;nir-2

Page 9: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 9

Requisiti del sistema (2)

2. un meccanismo per la risoluzione da nome uniforme a locazione (URL) della risorsa in rete [centralizzato o distribuito (deleghe su domini)]

url-1(A)

risoluzione

doc. A (url-2)

urn(A)

sitourl-2(A)

url-n(A)

es.: stato:legge:1997-07-16;254 --> www.parlamento.it/leggi/97254l.htm --> www.giustizia.it/cassazione/leggi/l254_97.html

Page 10: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 10

Architettura del sistema di risoluzione

urn:nir:stato:legge:1999;5

stato

nir

leggeregione

d.l.

dns

serviziorisoluzione

url(servizio)?urn:nir:stato:legge:1999;5

risol. catalogourl-1(stato:legge:1999;5)url-2(stato:legge:1999;5)

sitotesto legge n. 5/1999

Page 11: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 11

Associazione dell’URN al documentoI documenti XML prodotti in futuro conterranno al loro interno:- il nome uniforme (una apposita meta-informazione)- i collegamenti ad altri documenti espressi attraverso i nomi uniformi relativi> aggiornamento automatico del catalogo

<?xml version="1.0"?><!DOCTYPE legge . . . ><legge><meta><urn>nome uniforme di A</urn>. . .</meta>. . .testo testo testo testo testo testo<link href=“urnB”>documento B</link>testo testo testo testo testo testo . . .

accesso al doc. A

doc. A

link al doc. B

Page 12: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 12

Soluzione nel transitorioCreazione di un “Catalogo delle norme”, un archivio contenente gli estremi significativi (autorità, tipo atto, titolo, data e numero, pubblicazione, ambito, materia, ecc.) dei provvedimenti:- pubblicati in G.U. dal 1948;- disponibili nei siti istituzionali;a cui sono stati aggiunti URN e URL (se esistente):- dalle regole di naming adottate dai siti (automaticamente); - dalla metainformazione nei documenti (automaticamente); - dalla redazione (manualmente).

<html><head>

<title>Legge n. 948 del 1971</title>

<META name=“nir.urn” content=“urn:nir:stato:legge:1971-11-17;948”>

. . . . . . </head>

<body>testo testo testo testo testo testo testo testo testo</body></html>

Page 13: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 13

Struttura del Catalogo delle norme

provvedimento - tipo atto - titolo - urn [urn:nir:stato:decreto.legislativo:1998-02-19;51] - etc.

alias*

versione+ - tipo - data - etc.

url* - http://www.parlamento.it/parlam/leggi/deleghe/98051dl.htm - http://www.giustizia.it/cassazione/leggi/l51_98.html - etc.

[ * ::= 0 o più volte; + ::= 1 o più volte]

Page 14: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 14

Regole base dello schemaa. caratteri- ammessi (minuscoli, cifre, “.”, ecc.)- riservati (“:”, “;”, “+”, “,”, “-”, “@”) - vietati (“/”, “%”, “#”, “?”)

b. conversione di caratteri - maiuscoli in minuscoli- segni diacritici in caratteri base (es. à -> a)- spazio in “.”- connettivi e punteggiatura eliminati (es. del)

c. sigle e abbreviazioni- non accettate: diciture estese (es. Min. -> ministero)

d. formati- date: aaaa-mm-gg (es. 2001-12-03)- numeri ordinali: convertiti in arabi (es. I°, primo -> 1)

Page 15: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 15

Regole base dello schema (2)

a. autorità

- autorità multipleministero.finanze+ministero.giustizia:decreto:1999-12-21;537

- struttura internaministero.finanze;dipartimento.entrate;dirigente:circolare:1995-05-01;cr21

- carica istituzionalepresidente.repubblica:decreto:2001-09-22;345

b. provvedimento

- non qualificatoministero.finanze:decreto:1999-12-29;233 - specificazioneregione.toscana:regolamento;contabilita:1999-01-15;2

- riferimenti duplici (alias)presidente.repubblica:decreto:1986-12-22;917stato:testo.unico;imposte.redditi:1986-12-22;917

Page 16: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 16

Regole base dello schema (3)

c. estremi

- date e/o numeri multiplicorte.cassazione:sentenza:1998-06-12;c-10-97,c-11-97

- non numeratiministero.affari.esteri:comunicato:1999-03-17;nir-1

d. annessi- se documento autonomostato:legge:1982-12-31;979:allegato.a;sostanze.nocive

e. versioni successive- data ultimo provvedimento modificativostato:regio.decreto:1941-01-30;12 stato:regio.decreto:1941-01-30;12@1998-02-19

Esempi: http://www.normeinrete.it/risorse/urn.htm

Page 17: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 17

Prototipi sviluppati

1. Software di risoluzione nome-locazione (Cineca)

- basato sul Catalogo delle norme- accesso tramite una maschera (form) Web- fornisce il testo o gli estremi significativi del provvedimento

Redazione NiR (http://norma.test.cineca.it/) -> Accesso al Laboratorio -> Nuova versione prototipo URN

2. Analizzatore (parser) dei riferimenti (Idg)

- riconosce al momento un dominio limitato (l. cost., l., d.l., d.lgs. e dpr)- riferimenti: immessi dall’utente, via copia/incolla dallo schermo, via URL del documento- costruisce il nome uniforme e richiama il processo di risoluzione

http://test.idg.fi.cnr.it/urn/urn.html

Page 18: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 18

Prototipo URN per il portale NiR

4. ipertesto con link via URN

1. copia

2. incolla

3. analizza

5. click su un link

Redazione.NiR -> prototipo URN

Page 19: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 19

Prototipo URN per il portale NiR (2)

risultati del processo di risoluzione

2 risorse trovate per la legge

click su un link

Page 20: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 20

Prototipo URN per il portale NiR (3)

testo di legge

Page 21: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 21

Prototipo URN per il portale NiR (4)

click solo sulle informazioni del catalogo

risultato del processo di risoluzione

nessuna risorsa Web trovata per la legge

Page 22: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 22

Prototipo URN per il portale NiR (5)

informazioni del catalogo

Page 23: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 23

Altre applicazioni delle URN

link predisposti

Page 24: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 24

Attività in corso

1. Ampliamento dello schema:

- rappresentazione dei comunicati (rettifiche, errata corrige, ecc.): nome uniforme legato al provvedimento di riferimentoes. rettifica alla legge n. 1 del 1 gennaio 2002, pubblicata il 3.1.2002: urn:nir:stato:legge:2002-01-01;1*rettifica;2002-01-03

2. Creazione del registro delle autorità:

- DB con esatta nomenclatura dell’autorità ad una certa data

> ausilio in fase di redazione dei riferimenti

> normalizzazione delle URN (imprecise o costruite automaticamente) prima della risoluzione

3. Servizio di parsing centralizzato:

- per trasformare un documento (testo, html, Xml) in ipertesto

Page 25: Identificazione dei documenti giuridici tramite URNs (Uniform Resource Names) Progetto Norme in rete Corso di lezioni Camerino, 27-28 settembre 2004.

URN Camerino, 27-28 settembre 2004 25

… (continua) …

Introduzione al linguaggio XML