Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere...

18
La ricerca dei documenti giuridici in Internet. Il progetto DIRITTO ITALIA # di Mario Ragona, Loriana Serrotti, Fiorenza Socci, PierLuigi Spinosa * Istituto per la Documentazione Giuridica del CNR [M.Ragona,L.Serrotti,F.Socci,P.Spinosa]@ittig.cnr.it Sommario: 1. Introduzione - 1.1. Dall’informazione centralizzata all’informazione diffusa - 1.2. Gli strumenti di ricerca in Internet - 1.3. L’informazione giuridica italiana in Rete - 2. La banca dati DIRITTO ITALIA - 2.1. Illustrazione dell’archivio - 2.2. La ricerca in banca dati - 3. Considerazioni e prospettive del progetto - 3.1. Analisi delle caratteristiche - 3.2. Prospettive del progetto - 3.3. Rapporti con altre metodologie - 3.4. Scenari futuri - 3.5. Conclusioni 1. Introduzione Da alcuni anni a questa parte assistiamo ad un fenomeno del quale non si è forse realizzato appieno la portata e talvolta non se ne è, per così dire, assecondato la filosofia che ne sta alla base; ci riferiamo alla diffusione dell’informazione attraverso le reti telematiche. Per meglio comprendere come l’informatica in genere, la telematica in particolare sia stata rilevante nel settore giuridico, fino ad operarne modificazioni, anche rilevanti, ci sembra utile qualche considerazione sulle problematiche del diritto. Nel loro ambito i giuristi, studiosi e operatori, hanno sempre messo in evidenza la necessità, principalmente nella sfera legislativa, di avere a disposizione un sistema che tendesse alla completezza e alla coerenza. In effetti il nostro sistema normativo, com’è tipico dei sistemi a civil law, soffre di un’iperproduzione di norme, per certi versi inquinante, e ha risentito - anche se la situazione è oggi migliorata - di una formulazione sovente non corretta delle norme stesse. L’iperproduzione ha evidenziato la difficoltà d’impostare una ricerca sistematica all’interno delle norme stesse, a tutto scapito di quella certezza del diritto, che è uno dei concetti irrinunciabili in una società civile. Ne è emersa sempre più fortemente un’esigenza di sistematizzazione che renda giustizia della sovrabbondanza, della lacunosità, qualche volta della contraddittorietà delle norme. La formulazione spesso farraginosa, appesantita dai rinvii, talvolta anche volutamente ambigua perché frutto di mediazioni e compromessi a livello politico, ha reso un altro pessimo servizio alla collettività. Se diamo un’occhiata panoramica allo sviluppo dell’informatica, per capirne i riflessi anche nel settore giuridico, possiamo fare alcune considerazioni. Le tappe fondamentali di tale sviluppo possono essere individuate in tre grossi filoni: le banche dati, le applicazioni dell’intelligenza artificiale, le reti telematiche. Nella prima fase si è rivelata di eccezionale importanza la possibilità di immagazzinare rilevanti quantità di dati in archivi elettronici, tale da consentire, con modalità sempre più sofisticate, il reperimento dell’informazione in tempi prima non immaginabili. Tale possibilità, oltre a rivelarsi di indiscussa utilità pratica, ha così rappresentato il passo propedeutico alla sistematizzazione del diritto, cioè alla sua raccolta ordinata. L’informatica giuridica documentaria si è così consolidata con ottimi frutti e la progettazione delle banche dati ha ormai raggiunto importanti risultati da diversi punti di vista: l’archiviazione, il reperimento e la facilità di consultazione che, grazie all’ausilio di interfacce amichevoli, consente all’utente, non necessariamente esperto in questo tipo di tecnologie, di accedere alle informazioni che lo interessano. Gli studi di IA hanno avuto un grande successo negli ultimi decenni e le relative applicazioni si sono rivelate di grande utilità in molte discipline (diagnostica, robotica, settore militare e così via); anche il diritto è stato oggetto di questi studi, sia dal punto di vista dei sistemi di supporto alla decisione giuridica (i c.d. sistemi esperti) sia da quello orientato all’analisi delle norme, nella prospettiva di rendere i sistemi normativi più coerenti e più chiari e di fornire un # Relazione presentata al Convegno IDG “Il diritto nella società dell’informazione” (Firenze, 2-5 dicembre 1998). * L’articolo è stato discusso e corretto da tutti gli autori. Il cap. 1 è stato redatto da F. Socci, il cap. 2 da M. Ragona e L. Serrotti e il cap. 3 da P. Spinosa. 1

Transcript of Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere...

Page 1: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

La ricerca dei documenti giuridici in Internet.Il progetto DIRITTO ITALIA #

di

Mario Ragona, Loriana Serrotti, Fiorenza Socci, PierLuigi Spinosa *

Istituto per la Documentazione Giuridica del CNR[M.Ragona,L.Serrotti,F.Socci,P.Spinosa]@ittig.cnr.it

Sommario: 1. Introduzione - 1.1. Dall’informazione centralizzata all’informazione diffusa - 1.2. Gli strumenti di ricerca in Internet - 1.3. L’informazione giuridica italiana in Rete - 2. La banca dati DIRITTO ITALIA - 2.1. Illustrazione dell’archivio - 2.2. La ricerca in banca dati - 3. Considerazioni e prospettive del progetto - 3.1. Analisi delle caratteristiche - 3.2. Prospettive del progetto - 3.3. Rapporti con altre metodologie - 3.4. Scenari futuri - 3.5. Conclusioni

1. Introduzione

Da alcuni anni a questa parte assistiamo ad un fenomeno del quale non si è forse realizzato appieno la portata e talvolta non se ne è, per così dire, assecondato la filosofia che ne sta alla base; ci riferiamo alla diffusione dell’informazione attraverso le reti telematiche.

Per meglio comprendere come l’informatica in genere, la telematica in particolare sia stata rilevante nel settore giuridico, fino ad operarne modificazioni, anche rilevanti, ci sembra utile qualche considerazione sulle problematiche del diritto.

Nel loro ambito i giuristi, studiosi e operatori, hanno sempre messo in evidenza la necessità, principalmente nella sfera legislativa, di avere a disposizione un sistema che tendesse alla completezza e alla coerenza. In effetti il nostro sistema normativo, com’è tipico dei sistemi a civil law, soffre di un’iperproduzione di norme, per certi versi inquinante, e ha risentito - anche se la situazione è oggi migliorata - di una formulazione sovente non corretta delle norme stesse. L’iperproduzione ha evidenziato la difficoltà d’impostare una ricerca sistematica all’interno delle norme stesse, a tutto scapito di quella certezza del diritto, che è uno dei concetti irrinunciabili in una società civile. Ne è emersa sempre più fortemente un’esigenza di sistematizzazione che renda giustizia della sovrabbondanza, della lacunosità, qualche volta della contraddittorietà delle norme. La formulazione spesso farraginosa, appesantita dai rinvii, talvolta anche volutamente ambigua perché frutto di mediazioni e compromessi a livello politico, ha reso un altro pessimo servizio alla collettività.

Se diamo un’occhiata panoramica allo sviluppo dell’informatica, per capirne i riflessi anche nel settore giuridico, possiamo fare alcune considerazioni.

Le tappe fondamentali di tale sviluppo possono essere individuate in tre grossi filoni: le banche dati, le applicazioni dell’intelligenza artificiale, le reti telematiche.

Nella prima fase si è rivelata di eccezionale importanza la possibilità di immagazzinare rilevanti quantità di dati in archivi elettronici, tale da consentire, con modalità sempre più sofisticate, il reperimento dell’informazione in tempi prima non immaginabili. Tale possibilità, oltre a rivelarsi di indiscussa utilità pratica, ha così rappresentato il passo propedeutico alla sistematizzazione del diritto, cioè alla sua raccolta ordinata. L’informatica giuridica documentaria si è così consolidata con ottimi frutti e la progettazione delle banche dati ha ormai raggiunto importanti risultati da diversi punti di vista: l’archiviazione, il reperimento e la facilità di consultazione che, grazie all’ausilio di interfacce amichevoli, consente all’utente, non necessariamente esperto in questo tipo di tecnologie, di accedere alle informazioni che lo interessano.

Gli studi di IA hanno avuto un grande successo negli ultimi decenni e le relative applicazioni si sono rivelate di grande utilità in molte discipline (diagnostica, robotica, settore militare e così via); anche il diritto è stato oggetto di questi studi, sia dal punto di vista dei sistemi di supporto alla decisione giuridica (i c.d. sistemi esperti) sia da quello orientato all’analisi delle norme, nella prospettiva di rendere i sistemi normativi più coerenti e più chiari e di fornire un

# Relazione presentata al Convegno IDG “Il diritto nella società dell’informazione” (Firenze, 2-5 dicembre 1998).* L’articolo è stato discusso e corretto da tutti gli autori. Il cap. 1 è stato redatto da F. Socci, il cap. 2 da M. Ragona e L. Serrotti e il cap. 3 da P. Spinosa.

1

Page 2: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

ulteriore contributo a quel processo di sistematizzazione a cui prima abbiamo accennato. Molte delle aspettative sono però andate deluse; numerosi sono stati i contributi teorici, anche perché il discorso spazia in altre discipline parallele, come quelle della filosofia, della logica e della scienza cognitiva, ma scarse le applicazioni concrete che in molti casi non sono andate al di là di modelli e proposte.

Arriviamo così alla terza tappa, le reti telematiche. La loro diffusione è legata fondamentalmente a due principali caratteristiche: 1) l’indipendenza dalle piattaforme hardware e software; 2) la globalizzazione dell’informazione e il facile accesso ad essa. Queste caratteristiche, che si fondano sostanzialmente su modalità interattive, rappresentano il vero momento innovativo di questi ultimi anni. La diffusione delle reti telematiche ha condotto all’affermazione di uno standard unificato di accesso all’informazione (Web) sul quale hanno confluito velocemente i sistemi preesistenti e i nuovi. Le conseguenze sono state il proliferare di nuovi soggetti distributori di dati informativi e l’esplosione quantitativa dei dati stessi.

È immediatamente intuitivo come un processo di questa portata abbia avuto le sue conseguenze anche nel settore giuridico con grandi vantaggi, ma anche con nuovi problemi da risolvere.

1.1. Dall’informazione centralizzata all’informazione diffusa

L’affermarsi e il diffondersi dell’utilizzo di reti telematiche, in particolare di Internet, porta un elemento nuovo e per certi versi rivoluzionario. L’accesso all’informazione avviene, in questa prospettiva reticolare, in modo diffuso; l’utente è per così dire immerso in una massa di dati ricca ma disordinata che spazia da un polo all’altro del globo terrestre. L’influenza di questo approccio produce i suoi effetti anche sul modo di ragionare e quindi di fare ricerche; prevale infatti un tipo di ragionamento associativo rispetto a quello deduttivo, al quale siamo culturalmente più abituati. La modalità ipertestuale, che sta alla base di Internet, è la manifestazione più evidente di questo processo mentale.

Alla visione di banche dati centralizzate, che pure hanno indiscussi vantaggi, si va affiancando la visione più ampia di una informazione distribuita, dislocata cioè in più punti della Rete.

I vantaggi e gli svantaggi delle due soluzioni sono in realtà per così dire speculari. Le principali caratteristiche degli archivi centralizzati sono rappresentate da informazioni strutturate, sistemi di reperimento omogenei e più sofisticati, registrazione uniforme dei dati.

Nel sistema ad informazione diffusa mancano gli elementi sopra descritti, e questo comporta sicuramente dei problemi da risolvere, ma sono presenti altri vantaggi quali, innanzi tutto, la ricchezza di informazione, l’ampiezza della diffusione, la responsabilità dei dati (l’informazione risiede dove nasce), la possibilità di aggiornamento tempestivo, l’agilità nella creazione degli archivi. In sintesi, gli aspetti positivi degli archivi centralizzati costituiscono gli aspetti problematici degli archivi diffusi e viceversa. Resta però il fatto che ormai la soluzione tradizionale (centralizzata) è per molti aspetti superata e di fatto impraticabile, se ragioniamo in termini di larga scala: è impensabile, ad esempio, che presso un sistema informativo si raccolga tutta la normativa italiana sia a carattere nazionale che a carattere locale (regionale, provinciale, comunale, ecc.), per l’impossibilità pratica (più che tecnica) di gestire una mole di dati di questa portata, mentre appare ragionevolmente realizzabile l’ipotesi che ogni realtà territoriale renda disponibile, senza eccessivo sforzo, la propria produzione normativa.

Ciò non ci esime dal constatare che l’informatica giuridica con le sue banche ordinate ha prodotto notevoli benefici mentre il regno di Internet si presenta come un mondo di anarchia, dove ciascuno mette in linea ogni tipo di materiale nelle forme più diverse: elenchi, banche dati, testo integrale, riferimenti. Il panorama si presenta così variegato da appesantire spesso le operazioni di reperimento.

Sembrerebbe quindi che l’utilizzo di reti telematiche segni un passo indietro, rispetto all’obbiettivo primario che nella parte introduttiva abbiamo messo in evidenza, ma se si entra in un nuovo tipo di filosofia e si realizzano quegli accorgimenti che superino i lati negativi appena considerati, i vantaggi che emergeranno saranno sicuramente di grande portata.

Innanzitutto è necessario avere a disposizione strumenti, come guide, motori di ricerca specifici, intelligent agent che consentano all’utente di orientarsi e ottenere delle informazioni pertinenti, ristabilendo un ordine fra il disordine. Ma strumenti come questi, per essere efficienti, hanno bisogno di esser coordinati fra tutti i produttori di informazione: l’elemento indispensabile che sta alla base di questa nuova filosofia è infatti proprio quello della cooperazione. E cooperazione non significa solo comunicarsi dati, ma significa, in prospettiva, concordare strategie, uniformare certi canoni di base (per esempio rendere omogenee le citazioni) in modo da evitare per quanto possibile la dispersività che può divenire fonte di disinformazione. Naturalmente già l’interscambio informativo, se attuato in modo puntuale e sistematico, rappresenta un importante passo avanti, ma é auspicabile prendere in considerazione, prima possibile, altre forme di collaborazione per ottenere risultati veramente efficaci.

1.2. Gli strumenti di ricerca in Internet

L’esigenza di disporre di strumenti di aiuto alla ricerca, almeno a livello generale, è stata avvertita fin dall’inizio, tant’è vero che esistono in Rete guide, intelligent agent e motori di ricerca.

2

Page 3: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

Le guide sono di tipo eterogeneo; nella maggior parte dei casi sono raccolte di link organizzati per materie o su singoli argomenti oppure elenchi di siti di un determinato tipo (per esempio, in ambito giuridico amministrativo gli indirizzi di tutti i ministeri o delle più importanti reti civiche), talvolta accompagnati da note di commento o illustrative.

Gli intelligent agent sono invece programmi che filtrano le informazioni in base ad un interesse particolare dell’utente, memorizzandone le scelte e costruendone la domanda. Sono oggi considerati il futuro della ricerca di informazioni su Internet e costituiscono quindi oggetto di studio da parte di molti produttori di software. Essi servono soprattutto ad economizzare il tempo del reperimento dell’informazione1.

I motori di ricerca sono praticamente dei grandi database, che si avvalgono di robot (o spider) la cui funzione è quella di scandagliare la Rete come vere e proprie talpe, e che, grazie all’indicizzazione di tutte le parole contenute nelle pagine individuate, consentono all’utente di ricercare per parole chiave, anche tramite l’utilizzo di moduli guida predisposti, e di selezionare le informazioni pertinenti2.

Ogni motore ha caratteristiche particolari che lo rendono differente dagli altri come la facilità d’uso, la tempestività di aggiornamento, la potenza elaborativa, il tipo di informazioni contenute, i livelli di pertinenza. Rappresentano ad oggi lo strumento più utile di reperimento di informazioni, soprattutto se l’utente, che in questo approccio svolge una funzione importante, imposta la ricerca in modo efficiente e corretto.

Nel settore giuridico l’esempio italiano3 che abbiamo attualmente è “Cicerone”, motore di ricerca che non agisce in modo autonomo (cioè su un proprio indice) ma su indici costruiti da altri motori4 e a questi indirizza la stringa di ricerca opportunamente adattata, raccogliendone poi i risultati; si comporta in altre parole come un intermediario tra gli utenti e i veri motori di ricerca. Inoltre limita la selezione solo sulla base dei riferimenti normativi e giurisprudenziali e non consente il reperimento con parole chiave liberamente scelte5.

Nella realtà italiana, mentre le guide si vanno diffondendo (non sempre con caratteristiche di completezza e sistematicità) anche in ambiti specialistici6, i motori di ricerca o restano interni al sito che li propone o sono del tutto generici, utili comunque ma non orientati a materie particolari; gli intelligent agent poi sono ancora in fase sperimentale.

1.3. L’informazione giuridica italiana in Rete

L’esplosione in Rete della massa di informazione ha l’effetto di indebolire l’efficacia di strumenti d’ordine generale e sorge quindi l’esigenza di disporre di meccanismi più sofisticati, soprattutto più specializzati, che consentano al navigante una ricerca più puntuale e un minor livello di rumore.

Per meglio comprendere come si presenta l’informazione giuridica italiana in Rete sarà utile dare uno sguardo al panorama attuale.

Possiamo osservare innanzitutto come i primi e i più attivi sono stati i soggetti privati e il settore Università/Ricerca, mentre le Istituzioni pubbliche sono arrivate con ritardo anche se, negli ultimi tempi, soprattutto nella Pubblica Amministrazione, vi sono stati sensibili miglioramenti sia quantitativi che qualitativi. Carente per ora la presenza della maggior parte degli organi giudiziari, come Tribunali, Preture e organi affini, che invece sarebbero di notevole importanza per i giuristi.

Bisogna considerare che la qualità dell’informazione, il suo livello di aggiornamento, la fonte dei dati che si mettono in linea sono elementi di grande rilevanza; l’informazione fornita spesso è molto ricca, ma anche molto frastagliata, non sempre sicuramente attendibile, qualche volta carente di aggiornamento; per questo è fondamentale che soprattutto le Istituzioni pubbliche, punto di riferimento più autorevole, siano presenti in Rete con tutte le informazioni e i dati necessari. Non dimentichiamo che il mondo dei giuristi è tradizionalmente conservatore e abbastanza impermeabile a tecnologie avanzate. E, se a ciò si aggiunge la diffidenza verso fonti di informazioni che non garantiscano precisione, affidabilità e completezza, potrebbe essere rallentato il diffondersi di strumenti, che

1 A titolo esemplificativo possiamo citare WBI (Webby) dell’IBM, che è dotato di varie funzioni: tiene traccia delle pagine visitate e aiuta a richiamarne il contenuto; prima del collegamento a una pagina avverte se questa non è disponibile o è lenta; apprende le preferenze dell’utente e le utilizza per aiutarlo nella navigazione; avverte dei cambiamenti nei contenuti delle pagine.2 Quelli appena descritti sono del tipo comunemente chiamato spider o crawler. Esistono poi quelli di tipo directory organizzati per tematiche o discipline (sport, religione, medicina, diritto, finanza ed economia, ecc.), all’interno delle quali appaiono gli indirizzi dei siti pertinenti. Ma, attualmente, va diffondendosi sempre più il tipo c.d. ibrido che somma le due caratteristiche (es. AltaVista, Excite, Yahoo).3 Negli Stati Uniti esistono da tempo motori di ricerca specializzati nel diritto come ad esempio LawCrawler (http://www.lawcrawler.com) e FindLaw (http://www.findlaw.com), ma la presenza di materiale italiano è scarsa e non facilmente reperibile.4 Sono motori di ordine generale e non specifici per il diritto, per cui il risultato della ricerca produce spesso una percentuale di rumore molto alta.5 Per esempio chi volesse ottenere da Cicerone il testo della cosiddetta “Legge Bassanini” e non ne conoscesse gli estremi, non sarebbe in grado di reperirla.6 Ormai quasi tutti i siti ne propongono una, più o meno articolata.

3

Page 4: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

rappresentano il futuro e che meritano sicuramente grande attenzione. È questa una circostanza che deve essere tenuta presente da tutti gli editori telematici che vogliono essere presenti in Rete.

Molti progressi si sono riscontrati a livello di amministrazioni locali: la maggior parte degli Enti (Comuni, Province, Regioni) mette in linea statuti, regolamenti, delibere e frequentemente le leggi nazionali più importanti; questi Enti spesso si organizzano in Reti Civiche ben strutturate che forniscono al cittadino una buona qualità di servizi documentari/informativi in genere, alcuni dei quali in modalità interattiva. I servizi interattivi rappresentano una delle più sostanziali novità della Rete perché consentono all’utente non solo di ricevere l’informazione ma anche di stabilire un dialogo7.

Come si può facilmente constatare, ci troviamo di fronte a una rivoluzione nei rapporti tra P.A. e cittadini8 che prefigura uno scenario completamente inedito, dove le nuove tecnologie giocano un ruolo fondamentale. Ciò appare con maggior evidenza nei rapporti tra privati dove ormai sono largamente diffusi servizi di tipo interattivo, tra i quali, a titolo esemplificativo, si può citare il grande fenomeno rappresentato dal commercio elettronico.

Per quanto riguarda invece la tipologia dei materiali consultabili, occorre rilevare che le fonti principali del diritto (leggi statali e sentenze delle supreme corti), pur essendo disponibili in sistemi informativi di riconosciuta affidabilità (come Cassazione e IPZS), sono in massima parte di accesso difficile ed oneroso. Pur sottolineando l’esistenza di lodevoli e recenti eccezioni9, si deve purtroppo constatare che importanti organismi pubblici attuano una politica di diffusione di queste risorse a costi elevati di consultazione e con pesanti modalità contrattuali10, ostacoli non di poco conto per un’effettiva fruizione da parte di un’utenza diffusa.

2. La banca dati DIRITTO ITALIA

Attualmente le strade percorribili per aiutare gli utenti nella navigazione in Rete sono sostanzialmente due: o una guida, il più possibile evoluta, che tenga conto della varietà sia del materiale che della tipologia dei produttori e che si ponga il compito di tentare una classificazione (per esempio una banca dati di riferimenti) oppure la realizzazione di un vero e proprio motore, che, partendo da questa, riesca anche ad entrare nel contenuto dei documenti per ottenere un livello informativo più preciso e, per quanto possibile, esaustivo.

L’Istituto per la Documentazione Giuridica ha affrontato questi problemi ed ha cercato di dare un primo contributo creando uno strumento idoneo a reperire più facilmente i materiali e le informazioni d’interesse giuridico e amministrativo presenti nei siti italiani.

2.1. Illustrazione dell’archivio

Lo strumento, al quale è stato dato il nome di DIRITTO ITALIA, consiste in una banca dati di riferimenti che contiene, oltre all’indirizzo della home page dei siti che contengono materiale giuridico11, anche i link specifici ai vari tipi di risorse giuridiche esistenti. L’archivio12, operativo dal mese di maggio del 199813, è organizzato in unità documentarie14

corrispondenti ai singoli tipi di materiali considerati: di conseguenza ciascun sito potrà comparire in più schede di rilevamento a seconda della ricchezza della documentazione posseduta. Ad esempio, se il sito della Camera dei Deputati contiene dati normativi e documentazione parlamentare, in banca dati si troveranno due schede relative a questo sito. La scheda raccoglie più tipologie di materiali soltanto nei casi in cui non è stato possibile individuare

7 Un esempio tipico di modalità interattiva, estendendo il discorso alle Università, ci viene da alcune facoltà (es. Facoltà di Giurisprudenza di Bologna e di Camerino): gli studenti hanno la possibilità di prenotare gli esami direttamente via Internet.8 Questa rivoluzione troverà un terreno particolarmente fertile in Italia, dove già con la legge n. 59 del 1997 si riconosce la validità legale del documento elettronico, trasmesso anche per via telematica. È quindi immaginabile quali prospettive offra un provvedimento di questo tipo anche se dovranno essere affrontati una numerosa serie di problemi giuridici, tecnici e organizzativi, come la firma digitale, la sicurezza nella trasmissione dei dati e così via.9 Ci riferiamo alla messa in linea, ad esempio, sul sito del Parlamento dei provvedimenti legislativi della XIII legislatura in maniera gratuita, o sul sito privato “Oli.Net” delle Gazzette Ufficiali (dal 1994) a costi fissi abbastanza contenuti.10 Ad esempio, i sistemi Italgiure e Guritel prevedono contratti di abbonamento annuale con pesanti adempimenti amministrativi ed elevate tariffe a consumo.11 Sono stati presi in considerazione anche i siti in cui il materiale giuridico costituisce solo una parte, anche minima, della documentazione complessiva distribuita. Ovviamente il materiale non giuridico non è stato segnalato.12 L’indirizzo in Rete è http://www.idg.fi.cnr.it/ita/informazione/dirittoitalia/dirittoitalia.htm13 In circa 5 mesi, DIRITTO ITALIA ha avuto oltre 12.000 contatti, passando dai quasi 1.000 accessi di maggio agli oltre 3.000 di settembre; già nei primi 20 giorni di ottobre ci sono stati 2.300 contatti. Si può quindi rilevare un trend in continua ascesa, che denota l’interesse verso questo tipo di strumenti di aiuto alla ricerca.14 All’ultimo aggiornamento del 19 ottobre 1998 risultano presenti in banca dati 779 schede.

4

Page 5: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

isolatamente un genere documentario.La scheda di rilevamento contiene una pluralità di informazioni che hanno l’obiettivo di orientare l’utente nel

reperimento dei dati di proprio interesse. La scheda è strutturata nei seguenti campi:

a) ProduttoreDenominazione del sito che distribuisce il materiale, con link alla relativa home page. S’intende per “produttore” l’editore telematico (ente, associazione, organo, società, privato cittadino) che distribuisce l’informazione anche se non l’ha effettivamente prodotta. Per esempio, sono denominati “produttore” sia il Parlamento, che emette e distribuisce la legislazione nazionale, sia la società Oli.Net, anch’esso distributore di legislazione nazionale, di cui non è, ovviamente, il produttore.

b) CategoriaIl produttore viene classificato secondo le categorie più sotto indicate. Per facilitare la consultazione, ad alcuni produttori sono state attribuite due categorie. Ad esempio l’Istituto Poligrafico e Zecca dello Stato è un Ente pubblico nazionale che svolge anche una notevole attività come editore, per cui appare sotto entrambe le categorie; l’Associazione Nazionale dei Comuni Italiani (ANCI) e l’Unione delle Province d’Italia (UPI) sono state classificate come “Ordini e Associazioni”, ma, tenuto conto delle informazioni che distribuiscono, appaiono anche nella categoria dei rispettivi Enti locali. Lo stesso criterio è stato adottato per le Unioncamere (“altri Enti territoriali e locali” e “Ordini e Associazioni”) e per tutti quei produttori che presentano o caratteristiche tali da poter appartenere a più categorie, oppure per meri fini documentari finalizzati ad una ricerca più completa di un argomento o di un settore: è il caso del sito Comuni d’Italia, produttore privato che fornisce prevalentemente materiale attinente ai comuni.Le categorie previste sono:- Parlamento:

Camera dei Deputati, Senato della Repubblica;- Governo e Ministeri:

Presidenza del Consiglio dei Ministri e tutti i Ministeri presenti in Rete;- altri Organi e Enti di rilevanza nazionale:

appartengono a questa categoria le Autorità indipendenti (Aipa, Agcm), Organi consultivi (Cnel), Enti di assistenza e previdenza (Inps, Inail) e tutti gli altri Organismi che operano a livello nazionale (Istituto Poligrafico e Zecca dello Stato, Corpo Forestale dello Stato, Arma dei Carabinieri, Istituto Superiore di Sanità);

- Regioni - Province - Comuni:oltre agli Enti suindicati le categorie contengono alcuni siti che distribuiscono prevalentemente materiale attinente agli enti locali (Ancitel, Upitel, Comuni d’Italia);

- Reti civiche:navigando in Internet si nota che l’espressione “rete civica” identifica indifferentemente le iniziative telematiche di comuni, province, regioni o altre aree geografiche. DIRITTO ITALIA invece, intende per “rete civica” un progetto autonomo a cui partecipano vari soggetti: quindi un sito è stato schedato sotto questa categoria soltanto nei casi in cui produca o distribuisca materiale giuridico diverso dai materiali prodotti dai singoli partecipanti, i quali appaiono non sotto “Reti civiche”, ma con una scheda indipendente intestata al proprio sito;

- altri Enti territoriali e locali:in questa categoria sono compresi non solo i tipici enti territoriali e locali (come ad esempio le Camere di Commercio, Guardie Ecologiche Volontarie), ma anche gli uffici periferici o decentrati di enti e organi nazionali quali Prefetture, Questure, Commissariati della Polizia di Stato, Vigili del Fuoco, Uffici Imposte;

- Organi e Uffici giudiziari:comprende tutti gli organi giudiziari di ogni ordine e grado (preture, tribunali, corti di appello, ecc.), nonché gli uffici della magistratura inquirente (procure) e il Consiglio Superiore della Magistratura;

- Ordini e Associazioni:sono così classificate le schede relative ai materiali prodotti da ordini professionali (avvocati, notai, dottori commercialisti, medici) e da Associazioni tra soggetti pubblici (Ancitel, Upitel, Unioncamere) e/o privati cittadini. La categoria comprende anche i sindacati, i partiti politici e tutte le altre forme di associazionismo in genere (volontariato, movimenti di opinione);

- Università e Ricerca:comprende i siti delle Facoltà giuridiche, delle Università e degli altri Istituti di istruzione superiore (Accademie, Scuole superiori), nonché quelli relativi agli Enti di ricerca pubblici e privati (Cnr, Enea, Ismea);

- Case editrici:raccoglie i siti degli editori italiani, pubblici e privati, che pubblicano volumi, periodici o editoria elettronica d’interesse giuridico (anche se le pubblicazioni in tema di diritto costituiscono solo una parte della produzione globale);

- Iniziative private:identificano le società, le ditte o le singole persone che producono materiale giuridico, ma che non rientrano nelle categorie precedenti. Valgono come esempio i siti di Zucchetti, Uckmar Tax Digest, Sting, Telelavoro;

5

Page 6: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

- Biblioteche giuridiche:questa categoria relativa alle biblioteche d’interesse giuridico non è ancora organizzata come banca dati, ma accede a un elenco già disponibile sul sito IDG15.

c) MaterialeContiene l’indicazione del tipo di materiale giuridico presente nel sito. È da tener presente che le tipologie individuate, e i provvedimenti classificati come tali, costituiscono una sorta di compromesso tra precisione scientifica e semplicità di utilizzo. Infatti, considerata la grande varietà dei provvedimenti normativi e la natura complessa o controversa di alcuni di essi (es. regolamenti) è stata adottata una soluzione che, pur presentando qualche inesattezza o “forzatura” dal punto di vista strettamente giuridico, appare la più semplice e intuitiva, in fase di consultazione, per la maggioranza degli utenti.La tipologia dei materiali utilizzata è la seguente:- normativa, a sua volta articolata in:

∙ internazionale (convenzioni, accordi, trattati);∙ comunitaria (trattati, decisioni, direttive, raccomandazioni, regolamenti, risoluzioni emesse

da organi comunitari);∙ straniera (provvedimenti emessi da Stati stranieri, anche se appartenenti alla UE);∙ nazionale (leggi costituzionali, leggi statali, decreti del Presidente della Repubblica,

decreti legge, decreti legislativi, decreti e ordinanze ministeriali o interministeriali, regolamenti emessi da Enti e Organi costituzionali o di rilevanza nazionale, contratti collettivi di lavoro);

∙ regionale (statuti, leggi, regolamenti, decreti e ordinanze delle regioni e delle province autonome);

∙ locale (statuti, regolamenti, ordinanze di enti locali e territoriali (es. Comune, Camera di commercio);

- giurisprudenza, suddivisa in:∙ italiana (provvedimenti emessi da organi e uffici giudiziari di ogni ordine e grado e da

altre Autorità (Autorità Garante della Concorrenza e del Mercato, Garante per la protezione dei dati personali) nello svolgimento dell’attività giurisdizionale);

∙ comunitaria (provvedimenti emessi dalla Corte di Giustizia della UE);∙ straniera (provvedimenti emessi dagli organi giudiziari di altri Stati);

- atti amministrativi, articolati in:∙ nazionali (provvedimenti emessi da enti e organi nazionali: circolari, deliberazioni,

determinazioni, istruzioni);∙ regionali (provvedimenti emessi da enti e organi regionali: delibere, determinazioni,

istruzioni);∙ locali (provvedimenti emessi da enti e organi territoriali o locali: delibere, determinazioni,

istruzioni);- atti parlamentari:

disegni e progetti di legge, atti di sindacato ispettivo e altri materiali che documentano l’attività del Parlamento nazionale e degli organi rappresentativi regionali, provinciali e locali (assemblee, consigli);

- atti comunitari:atti amministrativi e atti che documentano l’attività della UE: interrogazioni, proposte, pareri, relazioni, rapporti;

- dottrina e altre pubblicazioni:volumi e periodici pubblicati a stampa e on line. Sono compresi in questa tipologia oltre alla letteratura giuridica in senso stretto anche pubblicazioni a contenuto normativo o giurisprudenziale (repertori legislativi o di giurisprudenza, testi unici, codici). Questa soluzione, che privilegia il supporto rispetto al contenuto specifico, si è resa necessaria per classificare i cataloghi delle Case Editrici e delle biblioteche, i periodici e, in genere, tutte le pubblicazioni, singole o sotto forma di raccolta, per le quali non è stato possibile individuare, e quindi separare, il contenuto in base alle tipologie previste. Nelle pubblicazioni on line, invece, il cui testo integrale o indice, nella maggior parte dei casi, è consultabile, le tipologie sono state isolate e schedate separatamente;

- informazione e documentazione:identifica materiali eterogenei (documentazione, strumenti di navigazione, dibattiti on line) che non rientrano nelle categorie precedenti, ma che riteniamo di interesse per l’utente. A questa tipologia appartengono: comunicazioni, rapporti, relazioni, progetti, “libri bianchi”, letteratura grigia, istruzioni, disposizioni e modulistica on line a carattere burocratico-amministrativo prodotta prevalentemente da enti pubblici, Notiziari e Bollettini, Forum e news di interesse giuridico, motori di ricerca (giuridici), guide16, informazioni su editoria elettronica (cd-rom);

15 http://www.idg.fi.cnr.it/ita/informazione/biblioteche/bibliote.htm16 Per “guida” si intende un elenco di siti organizzato dal produttore per categoria (Comuni, Province, Enti pubblici, editori, biblioteche) o per argomento (Euro, privacy, famiglia, mass media)

6

Page 7: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

d) AmbitoContiene, in generale, la competenza territoriale dell’autorità emittente (o autrice) del materiale identificato, per facilitare la selezione geografica in fase di ricerca; i termini utilizzati sono: internazionale, estero, europeo, nazionale, oppure l’indicazione della regione o della provincia. Infatti, per evitare un’eccessiva dispersione, il livello di specificità geografica è limitato alla provincia anche nel caso di organi con competenze più ristrette (comuni, preture).Per i provvedimenti normativi, amministrativi e parlamentari l’ambito coincide con l’area geografica di produzione e di efficacia.Per quelli giurisprudenziali il campo riporta la giurisdizione di competenza dell’organo giudicante; per esempio, una scheda che documenta la presenza di sentenze del Tribunale di Catania riporta nel campo “ambito” il termine Catania, che corrisponde all’ambito geografico di produzione del provvedimento e non della sua efficacia, che, com’è noto, è nazionale: in tal modo però l’utente reperirà tutta la giurisprudenza emessa in questa provincia. Costituiscono un’eccezione a questo criterio le raccolte di giurisprudenza emesse da organi distribuiti su tutto il territorio nazionale (es. archivi Merito e Tar della Corte di Cassazione), nei quali l’ambito contiene l’indicazione “nazionale”.Infine, per i materiali del tipo “dottrina e altre pubblicazioni” e “informazione e documentazione”, visto che i criteri sopra esposti perderebbero di significato, è stato scelto di riferire l’ambito ai contenuti del materiale stesso. Ove questi non siano facilmente identificabili o appartengano a tutti gli ambiti, ovvero si tratti di motori di ricerca o guide, l’indicazione è stata omessa.

e) ContenutoDescrizione sintetica, con parole significative, del materiale con il link alla pagina specifica. Il link è unico alla home page del sito quando i materiali sono numerosi e non singolarmente identificabili.

f) Unità documentariaIndica il tipo di informazione contenuta nel materiale schedato. Può essere:- testo integrale;- scheda bibliografica: autore, titolo, riferimenti bibliografici;- abstract: scheda bibliografica corredata da riassunto (o sommario del contributo, recensione o presentazione del

volume o del periodico) e altre eventuali indicazioni (classificazione, soggetto, ecc.);- indice: indicazione dei contributi di un periodico o degli argomenti (o partizioni) di un volume;- massima: di un provvedimento giurisprudenziale;- riferimenti: estremi identificativi (data, numero, organo ed eventualmente titolo) di qualunque tipo di

provvedimento.

g) FormaL’indicazione è riferita alla modalità di consultazione dei materiali. Può essere:- banca dati: il materiale è organizzato secondo una tipica banca dati con un proprio sistema d’information retrieval

che permette all’utente di selezionare il materiale pertinente tramite una richiesta da lui stesso formulata;- elenco: quando i dati sono organizzati sotto forma di liste ordinate secondo vari criteri (cronologico, alfabetico,

sistematico, ecc.); il lettore deve, quindi, scorrere l’elenco per individuare il materiale di proprio interesse.

h) Motore di ricercaSegnala la presenza o meno di un motore di ricerca sui materiali: in corrispondenza di una banca dati l’indicazione è sempre affermativa. L’indicazione “si (sito)” sta a indicare che il materiale considerato non ha un proprio motore di ricerca a sé stante, ma può essere utilizzato quello più generale che opera sull’intero sito.

i) AccessoIndica la modalità, sotto il profilo economico, di accesso alla documentazione; può assumere quindi i valori: oneroso oppure gratuito. È segnalato il caso di un accesso gratuito che richieda comunque una registrazione: ad esempio il sito della Camera dei Deputati richiede in alcuni casi l’utilizzo di una password.

l) NoteContiene eventuale note integrative al contenuto. Ad esempio: necessità di registrazione gratuita per l’accesso al materiale.

m) RilevamentoData di redazione della scheda.

Siamo consapevoli che criteri stabiliti (scelta dei campi, assegnazione dei valori) mostrano qualche “forzatura”. Ma, considerata la grande varietà ed eterogeneità del materiale trattato (natura giuridica, tipologia, modalità di distribuzione e consultazione) è stato necessario raggiungere un compromesso in grado di conciliare l’esigenza di

7

Page 8: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

precisione scientifica con la facilità di consultazione e di utilizzo della banca dati da parte dell’utente.

2.2. La ricerca in banca dati

Per l’interrogazione di DIRITTO ITALIA sono state predisposte tre soluzioni, che permettono all’utente di “lanciare” una ricerca senza avere particolari conoscenze del linguaggio d’interrogazione:i. due gruppi di ricerche “preconfezionate” per categoria di produttori e per tipologia di materiale (v. Fig. 1);ii. una “ricerca diretta” che consente di utilizzare uno o più termini combinati tra loro con gli operatori disponibili,

che operano a livello dell’intera scheda (v. Fig. 1);iii. una “ricerca guidata” con un modulo d’interrogazione che si articola in campi a ricerca libera oppure a “tendina”

con i valori già esplicitati (v. Fig. 2).La “ricerca guidata”, a differenza di quella “diretta”, offre la possibilità di vincolare la presenza dei termini da

immettere ai campi in cui è articolata la scheda, e di combinarli tra loro tramite operatori logici.In particolare, i campi “Categoria”, “Materiale”, “Ambito” e “Accesso” contengono valori predefiniti che l’utente

può scegliere aprendo la relativa tendina (v. fig. 3), mentre i campi “Produttore”, “Contenuto” e “Intero Documento” possono essere riempiti liberamente con una o più parole chiave. All’occorrenza anche le etichette dei campi possono essere modificate, tramite menù a tendina.

In entrambe le modalità di ricerca è possibile: troncare col simbolo * un termine per effettuare una ricerca a livello di radice; utilizzare le parentesi per modificare l’ordine di esecuzione delle operazioni; combinare più termini con operatori logici o contestuali. Gli operatori ammessi, utilizzabili sia all’interno dello stesso campo che fra campi diversi, sono: and, or, not, adjacency o adj (per l’adiacenza di due termini), with (che opera a livello di frase); in mancanza di un operatore tra due termini, viene assunto implicitamente l’operatore and17.

17 DIRITTO ITALIA è implementata con il software Cds/Isis dell’Unesco e resa disponibile con un’interfaccia Web realizzata presso il Cnuce/Cnr di Pisa e modificata in parte dall’Idg. L’utente può anche utilizzare tutti i comandi e le funzioni del linguaggio d’interrogazione Isis, digitando le istruzioni o nella finestra d’immissione della “ricerca diretta” oppure in una di quelle della “ricerca guidata”.

8

Page 9: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

9

Page 10: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

Riportiamo un esempio di “Ricerca guidata” per reperire informazioni sulla disponibilità di normativa nazionale, a testo integrale, in tema di sanità e medicina. Si dovrà (v. Fig. 4):1) aprire la tendina relativa al campo “materiale” e selezionare il valore “normativa nazionale”;2) digitare in corrispondenza del campo “contenuto” l’espressione sanit* or medic*, che consente di

selezionare tutti i documenti contenenti le parole che iniziano con la stringa di caratteri indicati, qualunque sia la desinenza: sanità, sanitario, medicina, medico, medical, ecc.;

3) indicare nel campo “intero documento” i termini testo integrale (in assenza di un operatore viene assunto per default l’operatore and).

Il risultato della ricerca (v. Fig. 5) informa che i documenti selezionati sono in totale 4 (riga 1), a cui segue l’elenco dettagliato dei qualificatori principali (produttore, tipo materiale e contenuto) di ciascun oggetto, limitati su ciascuna riga a un numero prestabilito di caratteri.

L’utente può scegliere di visualizzare una qualunque delle schede elencate o tutte insieme cliccando sulla prima

10

Page 11: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

riga (v. Fig. 6).

Ministero della Sanità normativa nazionale;atti amministrativi nazionali

Normativa su: scheda di dimissione ospedaliera (SDO) e sistema delle remunerazioni delle prestazioni sanitarie (decreti e circolari)valutazione dei medicinali e farmacovigilanza (leggi, decreti, circolari, documentazione varia)profilassi di malattie infettive corredata di alcuni decreti ministeriali inerenti all'attività dell'Ufficio e del DipartimentoDecreto legislativo 24/2/97 n.46 (attuazione della direttiva CEE 93/42 concernente i dispositivi medici)

Categoria: Governo e Ministeri Accesso: gratuito

Ambito: nazionale Unità doc.: testo integrale

Forma: elenco Motore di ricerca: si (sito)Rilevamento: marzo 1998

ANAAO-ASSOMED - Associazione Medici Dirigenti

normativa nazionale Legislazione nazionale di interesse sanitario (1990-1998)

Categoria: Ordini e Associazioni Accesso: oneroso

Ambito: nazionale Unità doc.: testo integrale

Forma: elenco Motore di ricerca: no Rilevamento: 18 agosto 1998

Normazione Medico Sanitaria

atti comunitari;normativa nazionale

Le Direttive CEE nel settore sanitarioLegislazione italiana sui dispositivi medici Legislazione italiana sugli impianti di tecnologia sanitariaDecreto 16 maggio 1996 (attuazione della direttiva 90/385/CEE in materia di dispositivi medici)Norme tecniche sui dispositivi medici (ISO e UNI)

Categoria: Iniziative private Accesso: gratuito (con password)

Ambito: europeo; nazionale Unità doc.: testo integrale (Direttive CEE e Decreto16/5/96); breve descrizione sintetica

Forma: elenco Motore di ricerca: si (sito) Rilevamento: 2 settembre 1998

Cittadino lex atti amministrativi nazionali;atti parlamentari;normativa nazionale;giurisprudenza italiana

Norme, Circolari e Disegni di legge e Sentenze in tema di - Fisco- Sanità- Casa- Pensioni- Lavoro

11

Page 12: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

- Famiglia- Scuola- Giovani- Società- Stato

Categoria: Iniziative private Accesso: gratuito

Ambito: nazionale Unità doc.: testo integrale

Forma: elenco Motore di ricerca: no Note: pagina di servizio, curata dal quotidiano La Repubblica, che pubblica e spiega, con l'aiuto di esperti e in tempo reale, testi (leggi, sentenze, decreti, circolari) di interesse per la vita quotidiana del cittadino Rilevamento: 10 settembre 1998

Fig. 6: visualizzazione delle schede

3. Considerazioni e prospettive del progetto

3.1. Analisi delle caratteristiche

Come abbiamo potuto vedere dalla descrizione dettagliata delle caratteristiche di DIRITTO ITALIA, la soluzione adottata per la sua realizzazione è abbastanza tradizionale: la raccolta e organizzazione in una banca dati dei riferimenti ai materiali giuridici e amministrativi presenti in Rete.

Il prodotto si presenta infatti come una versione più flessibile e più dettagliata delle ormai numerose guide18 ai siti d’interesse giuridico in generale, o a specifiche tipologie di documenti giuridici e amministrativi, curate da istituzioni pubbliche o da iniziative private.

La flessibilità è dovuta essenzialmente all’archiviazione dei riferimenti in una banca dati e alla possibilità quindi per l’utente di selezionare, tramite chiavi di ricerca, l’elenco dei materiali d’interesse: in altre parole l’utente si costruisce di volta in volta, in base alle esigenze del momento, una sorta di guida ritagliata sui materiali di cui vuole prendere visione. Per ottenere questo sono disponibili diversi approcci (per tipo di materiale, per contenuto, per produttore, ecc.) che possono essere combinati in vario modo fra loro.

Questo risultato è in contrapposizione alle guide tradizionali ad elenco, dove esiste un unico criterio di ordinamento (generalmente per sito o per materiale) e che vanno quindi consultate sequenzialmente per trovare quanto cercato; il più delle volte vanno anche visitati i siti riportati prima di capire dove e quale materiale è effettivamente disponibile.

Il maggior grado di dettaglio di DIRITTO ITALIA è dovuto invece alla presenza sia di una descrizione sintetica per ciascun materiale scoperto (che consente spesso di decidere se visitare o no il sito) sia di un link diretto alle pagine relative. Chi abbia una anche minima esperienza di navigazione in Internet sa come non sia sempre facile scoprire dove si trovino all’interno di un sito i materiali cercati, nei casi in cui si disponga di una segnalazione non puntuale al riguardo.

La ricerca si basa sui descrittori, solo in parte tematici, dei materiali (es. normativa regionale, in tema di ambiente, testo integrale, accesso gratuito, ecc.) piuttosto che sui contenuti testuali degli stessi (es. le parole di un articolato sullo smaltimento dei rifiuti urbani); di conseguenza la risposta fornisce l’indicazione di dove poter reperire i documenti con quelle caratteristiche (es. in una particolare pagina o archivio del sito della regione Toscana), piuttosto che direttamente gli oggetti al cui interno sono presenti i termini indicati (es. testo del regolamento regionale).

Gli oggetti presenti nei siti in Rete non hanno, se non in piccolissima parte, una serie di attributi capaci di descrivere in maniera sintetica le loro proprietà, ed in particolare quelle giuridiche (es. autorità emittente, tipo di provvedimento, ambito territoriale, ecc.): una sorta di carta di riconoscimento che caratterizza la risorsa nell’insieme di quelle esistenti. Sebbene, come vedremo meglio più avanti, questa possibilità sia già attuabile tecnicamente nelle pagine Web, la sua adozione non è al momento né molto diffusa né molto utile.

Pertanto la determinazione delle caratteristiche dei materiali rilevanti ai nostri fini è stata ottenuta analizzando in concreto una grande quantità di siti19 e navigando al loro interno: solo in presenza di documenti d’interesse giuridico (si

18 Si veda ad esempio, fra quelle più complete, la guida “Il diritto in rete” di InterLex (http://www.interlex.com/siti.htm), la “Rubrichetta” della Scuola di Specializzazione in Diritto Civile dell’Università di Camerino (http://camcic.unicam.it/ssdici/agenda.html), la guida “La documentazione di fonte pubblica in rete” a cura dell’Associazione italiana biblioteche (http://www.aib.it/aib/commiss/pubuff/guida.htm).19 Punto di partenza per la scoperta di oggetti interessanti sono state le altre guide disponibili in Rete, mentre altri

12

Page 13: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

ricordi come questa sia una delle prerogative di DIRITTO ITALIA) è stata redatta la scheda relativa, attribuendo gli opportuni valori a tutti i campi informativi predisposti. Tale operazione si configura come una descrizione dell’oggetto effettuata a posteriori (cioè successivamente alla sua diffusione o messa in linea, piuttosto che nel momento della sua creazione) da personale appartenente ad un’organizzazione diversa dal produttore.

Il risultato è quindi una classificazione centralizzata dei materiali con un buon grado di precisione ed accuratezza, legato anche alla competenza dei documentalisti coinvolti, senza che sia richiesto al momento alcun intervento diretto dei produttori. Tale classificazione cerca quindi di rimediare alla scarsità di precisione documentaria, con cui generalmente sono pubblicati i materiali.

Da un lato questa operazione può sembrare la soluzione più semplice, in quanto non richiede alcun accordo fra gli editori telematici su come descrivere i documenti, né alcun impegno alla loro costante applicazione. Per contro appare subito chiaro che la pesantezza del lavoro, in termini di risorse umane concentrate sull’istituzione che cura la redazione delle schede dei riferimenti, non può essere sopportata per lungo tempo ed è alla lunga il punto debole del sistema.

È altresì chiaro che, una volta raggiunto l’obbiettivo primario di dimostrare possibilità e utilità di un simile prodotto, occorra subito pensare non solo a migliorare i risultati ottenibili, ma soprattutto a meccanismi più snelli per garantirne completezza e aggiornamento, pena la rapida perdita di affidabilità e quindi di reale valore pratico dell’iniziativa. Già nel piccolo intervallo di tempo trascorso durante la costruzione della banca dati DIRITTO ITALIA si è potuto verificare (anche se questo era in gran parte preventivato) la grande variabilità degli indirizzi dei siti, della loro organizzazione interna, della dislocazione e della quantità e tipologia degli oggetti in linea.

Esiste pertanto la concreta possibilità di un progressivo aumento di riferimenti non più validi (URL errate delle pagine), che potrebbero tuttavia essere scoperti, e quindi corretti, grazie ai programmi di verifica automatica ormai disponibili20. Ma esiste soprattutto il rischio di una crescita delle lacune, cioè di materiali pubblicati in Rete e non riportati nella banca dati: a questo riguardo si pensi soltanto alla velocità di produzione di atti normativi e amministrativi e al crescente aumento dei siti di organi dello Stato e di Enti pubblici.

3.2. Prospettive del progetto

Dall’analisi delle caratteristiche di DIRITTO ITALIA appena sopra esposte, le prospettive che si delineano per il progetto seguono due direttrici principali: il passaggio dalle semplici indicazioni sulla reperibilità alla selezione dei materiali sulla base del loro contenuto e l’aumento dell’affidabilità dei riferimenti segnalati.

Per quanto riguarda il primo obbiettivo, l’idea di fondo è quella di visitare automaticamente, per mezzo di un “robot di navigazione” (detto in gergo “ragno”), tutti i materiali referenziati dalla banca dati e costruire così l’indice centralizzato su cui far operare un motore di ricerca specifico per il diritto, utilizzando uno di questi programmi ormai ampiamente diffusi in Internet. Si sfrutterebbero cioè le schede redatte come guida all’indicizzazione: il “ragno” si limiterebbe a visitare le pagine, o gruppi di pagine, a partire da quelle segnalate all’interno di DIRITTO ITALIA.

Rispetto ai motori di ricerca di uso generale, che indicizzano invece i siti nella loro interezza, il risultato ottenuto avrebbe una precisione notevolmente superiore, in quanto basato sulle sole risorse d’interesse giuridico. Questo ridurrebbe drasticamente il rumore (documenti non pertinenti) abbinato alle risposte: si consideri a questo fine il rapporto fra i termini di uso comune e quelli strettamente specialistici presente anche nei testi giuridici.

Comunque anche questo obbiettivo non è di immediato raggiungimento: la memorizzazione di testi giuridici non segue regole uniformi. Se prendiamo ad esempio uno degli atti più frequentemente presente in Rete, lo statuto di un ente locale, si constata una grande varietà di modi di presentazione: testo completo in un’unica pagina Web, testo ripartito su più pagine in base alla suddivisione interna (in alcuni casi per titolo, in altri per capo), testo preceduto da una pagina di indice, testo coordinato con riferimenti alle versioni precedenti, ecc. Inoltre, per evitare noiosi appesantimenti alla consultazione, i riferimenti riportati in DIRITTO ITALIA sono a volte legati non ad un singolo oggetto, ma ad un loro insieme omogeneo (es. raccolta di normativa sulla autonomia degli enti locali, piuttosto che l’elenco delle singole norme): il link associato aggancia quindi una pagina indice piuttosto che le pagine dei singoli provvedimenti.

Pertanto volendo davvero limitare l’indicizzazione ai soli materiali d’interesse giuridico, il robot andrebbe opportunamente istruito con regole specifiche da seguire in ciascun caso o, cosa più snella, andrebbe fornito di una regola di comportamento di base (default) e delle sole varianti quando questa non è soddisfacente. Le regole da impartire sono ad esempio: seguire o no i link contenuti nella pagina, seguire i link purché il nuovo indirizzo sia più specifico di quello di partenza (solo approfondimenti nell’albero, non risalite) e così via. Anche questo lavoro, di una certa pesantezza se concentrato in un’unica istituzione, rischia di non essere poi aggiornato adeguatamente.

Inoltre, sfruttando proprio le categorie associate ai riferimenti registrati, sarebbe possibile, tramite opportune configurazioni o modifiche non eccessivamente complicate del ragno utilizzato, costruire indici separati per ciascun tipo di materiale. Cosa ancora migliore sarebbe invece la costruzione di un indice cumulativo, all’interno del quale però ciascun oggetto sia caratterizzato da una serie di qualificatori (tipo materiale, ambito, ecc.), che ne permettano la selezione nella fase di ricerca. L’utilizzo di un unico indice permette di adattare in maniera più flessibile il sistema alle

importanti aiuti sono venuti dai vari motori di ricerca nonché dai link presenti nei vari siti. 20 Diversi editori per pagine Web, come ad esempio HomeSite della Allaire Corp., prevedono questa funzione.

13

Page 14: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

richieste estemporanee, anche se in tal caso l’intervento di programmazione è più profondo: l’inserimento in fase di indicizzazione di informazioni aggiuntive (i descrittori sopra citati) alle parole presenti nella pagina e il loro riconoscimento nella fase di ricerca. Una buona base di partenza per l’innesto di dette modifiche sono i motori di ricerca capaci di gestire i tag META.

Appare quindi oltremodo chiaro che l’ottenimento di un alto grado di precisione nella costruzione dell’indice (sia esso unico o multiplo), e quindi nelle risposte restituite dal motore di ricerca, poggia su due punti cardine: la completezza e l’aggiornamento dei riferimenti nella banca dati di guida e l’accuratezza delle regole di scansione. Questi obbiettivi sono entrambi troppo onerosi per essere centralizzati su un’unica organizzazione e quindi l’unica alternativa percorribile appare quella del coinvolgimento diretto degli editori telematici: ancora una volta, quindi, il decentramento delle responsabilità e la cooperazione fra i soggetti presenti nella Rete sono alla base del successo di un’iniziativa, così come è già avvenuto per molti altri servizi o applicazioni (un esempio su tutti il DNS: domain name system).

In concreto tale cooperazione potrebbe attuarsi, almeno in una fase iniziale, sotto forma di alimentazione e aggiornamento di una banca dati centralizzata dove ciascun distributore di materiali d’interesse giuridico manterrebbe le schede che lo riguardano. In altre parole, ad ogni nuovo materiale pubblicato (o gruppi omogenei di questi) l’editore telematico dovrebbe inserire od aggiornare o semplicemente segnalare la scheda relativa. Suddividendo così il carico di lavoro totale fra una molteplicità di soggetti, l’impegno per ciascuno risulterebbe accettabile. Il movente per il produttore ad assumersi questo onere aggiuntivo potrebbe essere individuato, oltre che nei vantaggi per la collettività degli utenti, in una maggiore, integrata e più facile visibilità dei materiali diffusi dal proprio sito, cioè in una ricaduta diretta in termini di accessi al sito.

Una tappa intermedia verso questo traguardo potrebbe essere la ripartizione fra più soggetti, su base volontaristica, dell’aggiornamento della banca dati logicamente centralizzata. Il criterio più semplice di tale suddivisione potrebbe essere quello sulla base della categoria di produttore: ciascun soggetto che collabora all’iniziativa (es. istituzione scientifica o di ricerca) sarebbe quindi responsabile di un sottoinsieme dei dati raccolti. Una rete attiva di interscambio di informazioni sarebbe invece lo strumento per segnalare novità, errori e lacune.

L’IDG ha intenzione di lanciare quanto prima proposte in tal senso alla comunità degli editori telematici “giuridici” e ai curatori di guide del settore.

3.3. Rapporti con altre metodologie

Le prospettive di breve periodo appena indicate per DIRITTO ITALIA hanno il vantaggio di non coinvolgere la riedizione di quanto già pubblicato e si basano su un impegno di descrizione delle risorse di granularità media: è sufficiente infatti effettuare tale operazione per gruppi omogenei di materiali. Vediamo ora quali risvolti sul progetto si possano invece avere dall’adozione di metodologie emergenti che, a fronte di risultati più precisi e dettagliati, richiedono tuttavia un impegno di granularità fine, cioè sul singolo documento pubblicato in Rete.

Con l’aumento esponenziale della quantità di informazioni disponibili in Rete, il problema di migliorare rilevanza e pertinenza dei risultati delle ricerche è oggetto di studi e proposte da parte di diversi soggetti: comunità scientifica, produttori di software, gestori di servizi, ecc. In particolare le soluzioni più accreditate ruotano attorno alla possibilità di identificare le risorse sulla base delle loro proprietà piuttosto che del semplice contenuto testuale, e la metodologia suggerita si fonda in maggioranza sull’adozione dei metadata21. Questi “dati strutturati sui dati” sono un insieme di informazioni aggiuntive inserite all’interno del documento, o collegate comunque all’oggetto, che ne descrivono la natura: una sorta di pacchetto informativo che accompagna la risorsa e può essere utilizzato dalle applicazioni per diversi fini, primo fra tutti migliorare le capacità di reperimento e di selezione. Si ottiene così un documento arricchito da una serie di qualificatori che lo classificano sotto diversi aspetti.

I metadata sono espressi attraverso coppie di dati attributo-valore: il primo descrive la proprietà considerata (es. la lingua in cui è scritto) mentre il secondo ne specifica il valore nel caso in oggetto (es. italiano). L’insieme degli attributi utilizzabili definisce uno schema; diversi schemi sono pensabili per soddisfare le molteplici esigenze di differenti categorie di utilizzatori, i diversi scopi applicativi e la enorme varietà delle risorse esistenti: in ciascun schema22 viene quindi stabilito scopo, significato ed eventuale codifica di ogni attributo dell’insieme. La definizione di uno schema per una classe di oggetti e il riconoscimento della sua validità dagli operatori nel settore (produttori, utenti, servizi, ecc.) sono un importante stimolo a standardizzare la descrizione di risorse affini.

La tecnica più diffusa al momento prevede di inserire all’interno del documento, tramite l’apposito tag META23

21 Informazioni al riguardo possono essere reperite a http://www.w3.org/Metadata/22 Ad esempio la Dublin Core Initiative, che si pone l’obbiettivo di una descrizione delle risorse per facilitarne il loro reperimento in Rete, ha definito uno schema con 15 elementi in totale, di cui 7 per descrivere l’aspetto del contenuto (titolo, oggetto, descrizione sintetica, fonte, lingua, relazione con altre risorse, copertura spaziale o temporale), 4 la proprietà intellettuale (autore, editore, altri contributi minori, diritti d’autore) e 4 la pubblicazione in Rete (data, tipo di risorsa, formato dei dati, identificatore univoco). Informazioni più dettagliate possono essere reperite a http://purl.oclc.org/metadata/dublin_core/23 Alcuni editori di testi e programmi di ausilio alla redazione di pagine Web inseriscono in maniera automatica già ora

14

Page 15: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

previsto da linguaggio HTML, delle coppie attributo-valore secondo lo schema adottato, al quale è raccomandata una referenza esplicita per comunicare il quadro di riferimento entro cui si collocano i metadata presenti. Sono allo studio, e prossime alla definizione ufficiale, nuove tecniche più flessibili di associazione dei metadata: ad esempio la Resource Description Framework24 (RDF) sviluppata in seno al WWW Consortium25 (W3C) definisce un’infrastruttura di codifica, scambio e uso di tali informazioni, con la possibilità anche di importare in seno al documento proprietà da diversi schemi. Questa è una caratteristica importante: evita di definire schemi completi per ogni categoria di risorsa e finalità prefissate, e consente quindi, utilizzando le proprietà già esistenti, di aggiungere solo quelle necessarie all’insieme in oggetto.

L’utilizzo dei metadata presenti nei documenti avrebbe per il progetto DIRITTO ITALIA un impatto decisamente positivo, soprattutto per quanto riguarda sia l’aggiornamento della banca dati dei riferimenti che la creazione di un indice specifico sui materiali giuridici.

L’archivio logicamente centralizzato è a nostro avviso uno strumento da conservare ancora per un certo periodo: contiene infatti informazioni non ricavabili dai documenti pubblicati (es. materiali raccolti in banche dati) e può costituire un valido punto di partenza per ottimizzare le esplorazioni sui siti. Il suo aggiornamento potrebbe tuttavia essere quasi completamente automatizzato per la parte relativa alle pagine Web: un ragno opportunamente modificato potrebbe per prima cosa riconoscere i materiali d’interesse giuridico sulla base di uno specifico attributo presente nelle pagine (es. “diritto” nel campo “materia”), quindi estrarre dai metadata presenti26 i valori degli attributi definiti nella banca dati e infine costruire i dati di ingresso per l’aggiornamento dell’archivio.

Allo stesso tempo l’indicizzazione delle pagine visitate potrebbe essere arricchita da tutte le informazioni espresse nei metadata e il motore di ricerca effettuare quindi le selezioni in base non solo alle parole contenute nel testo (quello che avviene attualmente in molti motori di ricerca), ma anche ai qualificatori associati. Occorre perciò che i due differenti tipi di dati (il testo e i descrittori) siano non solo combinabili fra loro ma anche identificabili con i rispettivi qualificatori27.

Lo sfruttamento su vasta scala dei metadata per la costruzione di indici per motori di ricerca più intelligenti, comporta tuttavia un intervento da parte dell’editore telematico: l’attribuzione delle varie coppie attributi-valori a tutte le pagine pubblicate, o almeno a quelle d’interesse giuridico, prima della loro immissione in Rete. Come in altre soluzioni individuate, questo è un carico di lavoro aggiuntivo rispetto alla mera redazione del testo, carico distribuito su ciascun produttore al fine di migliorare la reperibilità globale del sistema diritto. Se tali dati riguardano soltanto aspetti puramente formali (es. titolo, data, numero, ecc.), possono essere immessi anche da personale non particolarmente specializzato; altrimenti potrebbe essere richiesto un intervento di più elevata professionalità, come ad esempio l’attribuzione di una classificazione per materia, la redazione di un abstract, ecc. Comunque non è ipotizzabile in tempi brevi un’ampia diffusione di questa metodologia documentaria.

A tale riguardo vanno però considerati con la massima attenzione i risultati ottenibili attraverso programmi che, analizzando il testo, effettuano una categorizzazione dello stesso in base a profili prestabiliti. Se, dalle opportune sperimentazioni da pianificare nel campo giuridico, detti programmi si dimostrassero all’altezza del compito per una adeguata percentuale di casi, potrebbero dare senza dubbio un valido aiuto alla risoluzione del problema. Al produttore verrebbe richiesto solo un’opera di validazione dei dati suggeriti o, al limite, addirittura nessun intervento preventivo sulle pagine pubblicate: la creazione dei metadata potrebbe essere un’operazione “virtuale” svolta dall’organizzazione che gestisce il motore di ricerca e quindi il processo di categorizzazione automatica. Forse rimarrebbe da risolvere comunque la discriminazione iniziale (materiale d’interesse giuridico o no) se si ritiene valido puntare ad un indice specifico sul diritto piuttosto che ad uno generale su tutto.

Inoltre un fattore determinante è l’uniformità dei metadata utilizzati, sia come insieme di attributi utilizzabili (i nomi) che come insieme di valori a questi assegnabili (i contenuti): in altre parole occorre un accordo fra tutti i

dei metadata, ma questi sono di scarso ausilio alla classificazione giuridica del documento; sono infatti del tipo: autore della pagina, data di creazione, denominazione del sito, parole chiavi generali sul campo di attività dell’ente.24 Per approfondimenti si veda http://www.w3.org/RDF/25 Il sito dell’organizzazione è http://www.w3.org/26 A titolo d’esempio un documento giuridico arricchito con i metadata potrebbe presentarsi a questo modo:<HTML><HEAD><TITLE>Ordinanza del Sindaco di Firenze n. 958/98></TITLE><METAname=”materia” content=”diritto” name=”materiale” content=”normativa locale”name=”autorità” content=”Sindaco” name=”provvedimento” content=”ordinanza”name=”luogo” content=”Firenze” name=”data” content=”11-02-1998”name=”numero” content=”958” name=”ambito” content=”Comune di Firenze”name=”oggetto” content=”limitazione alla circolazione veicolare del 12.2.1998 a seguito di livelli e di stati di attenzione e di allarme per gli inquinanti atmosferici”...altri metadata...></HEAD><BODY>...testo dell’ordinanza...</BODY></HTML>27 In sostanza c’è una differenza fondamentale fra, ad esempio, il termine “ordinanza” attribuito al descrittore “provvedimento” e lo stesso termine contenuto nel “testo”: in quest’ultimo caso potrebbe trattarsi di un qualsiasi riferimento presente in un documento di natura diversa (es. delibera, comunicato stampa, ecc.).

15

Page 16: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

produttori sullo schema da adottare. In particolare gli aspetti interessanti ai nostri fini sono essenzialmente quelli giuridici, quali ad esempio il tipo di provvedimento, l’autorità emittente, l’ambito territoriale, gli estremi significativi, ecc. Inoltre non è pensabile l’elaborazione di un unico schema per rappresentare adeguatamente tutti i materiali giuridici ma è bensì ipotizzabile la definizione di uno specifico almeno per ciascuna categoria delle fonti principali (normativa, prassi amministrativa, giurisprudenza e dottrina), vista la notevole differenza di informazioni fondamentali fra questi documenti. Si può anche pensare a più schemi in rapporto gerarchico fra loro dove ai livelli superiori sono indicate le proprietà comuni a tutti i livelli inferiori (classi e sottoclassi di oggetti).

Gli strumenti a disposizione per arrivare al riconoscimento di schemi di riferimento nel campo giuridico sono quelli ormai consolidati nella comunità di Rete: la circolazione di una proposta sulla quale ciascun soggetto possa pronunciarsi e, dopo confronti e perfezionamenti successivi, il rilascio delle specifiche ufficiali. In questo senso gli istituti di ricerca, fra cui l’IDG, potrebbero farsi carico di elaborare le prime bozze da sottoporre al giudizio della collettività, ma per assicurare il successo di tutta l’iniziativa, è auspicabile anche il coinvolgimento di qualche istituzione autorevole nel settore (es. Camera, Cassazione, AIPA, ecc.). La reale affermazione dello standard sarà poi determinato dall’adozione in concreto da parte dei principali o di un gran numero di produttori, che trascineranno poi gli altri a uniformarsi.

Sebbene le difficoltà organizzative appaiano maggiori rispetto a quelle che si presentano nella soluzione a più breve termine ipotizzata per DIRITTO ITALIA (questo ne spiega anche l’approccio pragmatico per ottenere risultati utili in breve tempo), a nostro avviso vale la pena impegnarsi concretamente su questo terreno. Fra l’altro la prospettiva di un largo impiego a tempi abbastanza vicini del nuovo standard emergente per le applicazioni Web, il XML (Extensible Markup Language28) dovrebbe facilitare la creazione o comunque l’utilizzo di metadata, grazie sia a strumenti più flessibili di gestione (RDF) che alla possibilità di associazioni fra un dato e l’elemento di struttura in cui è presente.

Ancora una volta la cooperazione fra i soggetti presenti sulla Rete è la chiave determinante del successo di un obbiettivo ambizioso quale quello di facilitare l’accesso ai materiali giuridici e di produrre risposte con alto grado di precisione ai bisogni documentari di una grande moltitudine di utenti, dal cittadino comune all’operatore specializzato. Nel caso in esame l’unione dei dati di contenuto (le parole del testo) con quelli di descrizione (tipo di atto, ambito, ecc.) sembra essere la soluzione che permette alle varie tipologie di utenti di trovare adeguata soddisfazione alle diverse esigenze.

3.4. Scenari futuri

La velocità di cambiamento presente nelle modalità di pubblicazione dei materiali in Internet è tale da sollevare addirittura l’interrogativo sulle prospettive di medio termine degli attuali motori di ricerca, che sono al momento la risposta tecnologicamente più avanzata al reperimento di documenti sulla base dei termini contenuti.

A questo proposito ci sembra di poter riportare una tendenza in atto: quella del progressivo passaggio dalla pubblicazione di pagine statiche a quella di pagine dinamiche, cioè non registrate stabilmente nel sito ma ottenute come risultato dell’esecuzione di un programma. In molti casi queste pagine sono composte con la risposta ad una ricerca (in gergo query) in una banca dati (es. dei procedimenti amministrativi dell’ente29). I parametri di composizione della ricerca sono ottenuti sulla base delle selezioni indicate nella pagina precedente (o gruppi di queste), sia sotto forma di informazioni immesse o comunque selezionate da tastiera (moduli guida di ricerca o form) che di stringhe di ricerca preconfezionate attivate con la scelta di un link. Tale tendenza ci sembra destinata ad essere sempre più utilizzata in particolare nei siti delle pubbliche Amministrazioni, che sono poi anche le maggiori produttrici di oggetti d’interesse giuridico. Questo per almeno due ordine di motivi.

Il primo è legato al numero e alle dimensioni dei materiali da trattare. La produzione di alcuni provvedimenti, come ad esempio gli atti amministrativi di un ente locale, può raggiungere tranquillamente le diverse migliaia in un anno: sarebbe oggettivamente impensabile di pubblicarli semplicemente attraverso un elenco che ne riporti estremi ed oggetto, anche se suddivisi in fasce temporali. La ricerca sequenziale risulterebbe troppo lunga e sarebbe impossibile qualunque forma di combinazione fra i dati. Inoltre alcuni provvedimenti, primi fra tutti quelli normativi, hanno dimensioni tali (es. diverse decine di articoli) che diventano realmente utilizzabili solo se adeguatamente suddivisi in unità documentarie più contenute (es. articoli); in questo caso l’archiviazione in banche dati piuttosto che in pagine Web consente di estrarre e visualizzare solo le parti interessanti dell’atto.

Il secondo motivo è legato invece all’organizzazione interna dell’Ente. Sempre più i materiali pubblicati tendono ad essere gli stessi che sono utilizzati nel normale lavoro d’ufficio, per ovvie ragioni di unicità della fonte e quindi di affidabilità delle informazioni diffuse. Pertanto diventa molto più economico estrarre le pagine da pubblicare direttamente dalla banca dati creata ad uso interno (magari attingendo per ragioni di sicurezza ad una copia allineata e limitandone la vista alle informazioni di pubblico dominio), piuttosto che registrarle stabilmente sul sito.

28 Si tratta di una versione semplificata dello Standard Generalized Markup Language (SGML) di cui conserva tutte le principali e più utilizzate funzionalità: in particolare la definizione della struttura interna del documento. Informazioni aggiuntive possono essere reperite a http://www.w3.org/XML/ oppure a http://www.xml.com/xml/pub29 Si veda ad esempio il Comune di Venezia http://www.comune.venezia.it/ammin/proc_amm/procedset.htm

16

Page 17: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

Di fronte a tale tendenza sembrano quindi entrare in crisi gli attuali motori di ricerca basati sulle pagine statiche: i ragni devono infatti nella maggioranza dei casi fermarsi alle soglie delle banche dati per diversi motivi come ad esempio l’impossibilità a simulare l’immissione di dati da tastiera o la temporaneità dell’indirizzo della pagina di risposta, che lo rende non utilizzabile per un suo recupero differito. Ciò si traduce in un graduale impoverimento dei materiali giuridici indicizzati dai motori di ricerca, che verrebbero a rappresentare quindi una porzione sempre minore e sempre meno rilevante di quelli ottenibili mediante un accesso diretto al sito.

Forse questo problema verrà risolto da una nuova generazione di motori, ma al momento occorre prendere in seria considerazione l’eventualità di passare dagli attuali indici centralizzati a meccanismi che coinvolgano direttamente i siti dove risiedono i materiali giuridici. La soluzione che in questo momento appare più facilmente percorribile sembra quella di demandare al singolo sito il compito di reperire al proprio interno, secondo l’organizzazione e le tecniche utilizzate per la messa in linea, i documenti che rispondono alle condizioni imposte nella richiesta.

A questo fine occorre stabilire non solo uno standard comune di rappresentazione dei materiali giuridici (un insieme minimo di attributi particolarmente significativi per ciascun tipo di materiale), ma anche una modalità uniforme di accesso ai dati, che andrà poi concretamente interfacciata con il reale sistema di gestione esistente in ciascun nodo. I metodi per realizzare concretamente tale uniformità sono essenzialmente due.

Il primo è quello di stabilire un linguaggio comune d’interrogazione che dovrebbe essere importato in ciascun sito, ovvero che ciascun sito penserà a tradurre negli opportuni comandi del proprio sistema di reperimento. Le esperienze di riferimento, anche se opportunamente reinterpretate, potrebbero essere quelle maturate intorno a progetti nati originariamente in ambito bibliotecario, quali quelli condotti dal Center for Network Information Discovery and Retrieval30 (CNIDR) e che utilizzano il protocollo standard z39.5031 di comunicazione, ricerca e reperimento in archivi distribuiti. Alcune loro caratteristiche peculiari sono particolarmente adatte ai nostri scopi: la capacità di indirizzare contemporaneamente una richiesta a più banche dati residenti su siti diversi, di utilizzare un linguaggio d’interrogazione unificato, di prevedere interfacce verso sistemi d’information retrieval diversi e di comporre il risultato finale sulla base delle risposte di ciascun archivio. In questa ipotesi a ciascun nodo sarebbe richiesta, per il proprio inserimento nel sistema globale, l’implementazione del programma d’interfaccia.

Il secondo approccio, con maggiori probabilità di successo, è invece quello di creare un agente centralizzato capace di tradurre la richiesta proveniente dall’utente nei diversi metodi di accesso e nei rispettivi linguaggi d’interrogazione presenti in ciascun sito, cioè in pratica nella modalità e nel formato dei parametri con cui va richiamato lo specifico programma di ricerca. Una richiesta così convertita dovrà infine essere smistata a tutti i siti interessati. In questa soluzione ciascun sito dovrà esportare i propri metodi di accesso in maniera che l’agente centralizzato sia in grado di effettuare la conversione: il sistema si configurerebbe in modo abbastanza analogo agli attuali meta-motori32 di ricerca, anche se numero e varietà dei metodi di accesso e dei linguaggi sarebbero in questo caso decisamente superiori. A ciascun nodo sarebbe quindi richiesta, per l’inserimento nel sistema globale, l’indicazione della modalità specifica (eventualmente una per tipo di materiale) di accesso ai documenti.

Un consistente aiuto in questa direzione potrà venire dalla prossima adozione del linguaggio di marcatura XML come standard per l’applicazione Web: la capacità infatti di questo linguaggio di descrivere la struttura di un documento e associarla a questo, farà assumere un ruolo centrale alla definizione di modelli di documenti (in gergo DTD: document type definition) di riferimento per ciascun tipo di materiale (sentenza, ordinanza, circolare, ecc.). Si può prevedere, o semplicemente auspicare, che questi vengano adottati da un numero sempre crescente di editori telematici e che siano di stimolo allo sviluppo di applicazioni più sofisticate: questo accade spesso quando emerge uno standard di rappresentazione dei dati che richiama investimenti più consistenti grazie all’allargamento dei possibili utilizzatori. Gli elementi in cui detta struttura si articola troveranno nella grande maggioranza dei casi un corrispettivo nei campi (o sottocampi) del database che li gestisce: anche questo riproduce infatti le unità informative e le relative relazioni. In altre parole è facilmente individuabile un stretta correlazione fra lo schema della banca dati e il modello del documento gestito ed è ipotizzabile la diffusione di sistemi di gestione di banche dati che trattino oggetti XML in maniera nativa. Pertanto non solo la traduzione nei singoli sistemi di accesso risulterà semplificata, ma anche le modalità di recupero fra pagine Web e banche dati interfacciate si andranno sempre maggiormente integrando, dal momento che entrambe si baseranno su strutture analoghe, se non addirittura identiche.

In entrambi i casi ipotizzati occorre tuttavia costruire un archivio centralizzato (da un punto di vista logico anche se costruito dalle informazioni esportate da ciascun sito ovvero replicato su più sedi) in cui venga riportata l’indicazione dei siti contenenti materiali giuridici e della tipologia relativa: questa appare la soluzione più idonea a garantire un accesso sufficientemente veloce e preciso. Si evita così di “sparare” la ricerca a tappeto su tutti i siti italiani e si indirizza la richiesta solo a quelli che contengono il tipo di materiale cercato. Al crescere delle dimensioni e delle

30 Si tratta di un’organizzazione, nata da un progetto finanziato dalla National Science Foundation (NSF), con la finalità di progettare e sviluppare sistemi informativi distribuiti, principalmente in campo tecnico e scientifico. Fra i vari strumenti realizzati si ricordano Isite e Isearch, rispettivamente un sistema informativo distribuito e un motore di ricerca testuale. Per maggiori dettagli si veda http://www.cnidr.org/31 Per maggiori informazioni http://ds.internic.net/z3950/z3950.html32 Una guida completa sui vari motori e metamotori di ricerca è reperibile a http://cuiwww.unige.ch/meta-index.html

17

Page 18: Mario Ragona-Loriana Serrotti-Fiorenza Socci-PierLuigi ... · forme di collaborazione per ottenere risultati veramente efficaci. 1.2. Gli strumenti di ricerca in Internet L’esigenza

movimentazioni di detto archivio si può anche pensare ad architetture più sofisticate (archivi distribuiti). Essendo comunque in gioco un numero consistente di siti da contattare, anche la velocità e affidabilità delle reti avranno un loro peso nella realizzazione pratica dell’applicazione. Comunque, ancora una volta, la cooperazione fra i soggetti presenti in Rete sembra essere un passaggio obbligato per l’ottenimento di più alti traguardi nei servizi.

3.5. Conclusioni

Il progetto DIRITTO ITALIA presenta a nostro avviso motivi di utilità diretta e indiretta. Il primo è legato essenzialmente al prodotto ottenuto: al di là delle tecniche utilizzate, dei limiti evidenziati e dei miglioramenti apportabili, il prodotto è un utile strumento per conoscere quali materiali giuridici siano oggi presenti sulla Rete e quali siano le loro caratteristiche. Forse è addirittura uno degli strumenti più completi, flessibili e dettagliati disponibili al momento, permette approcci differenziati secondo varie esigenze, consente il più delle volte di decidere se l’informazione segnalata è utile a risolvere le proprie necessità di documentazione e infine indirizza direttamente al materiale indicato facendo così abbreviare il tempo di navigazione all’interno del sito.

Il secondo motivo è invece di carattere tecnico-scientifico, legato all’approfondimento dei temi relativi alla costruzione di un sistema di accesso all’informazione giuridica su scala nazionale. La stessa implementazione di DIRITTO ITALIA ha indotto alcune riflessioni sulla possibile architettura futura, sulle caratteristiche da soddisfare, sull’organizzazione dei materiali e del lavoro, che possono essere messe a disposizione e confrontate con quanti altri si pongano lo stesso obbiettivo. Ha quindi probabilmente dato un altro piccolo contributo a chiarire non solo quali possano essere le prospettive di breve, medio e più lungo termine ma soprattutto le problematiche connesse a ciascuna ipotesi formulata ed in particolare ad un utilizzo su larga scala delle metodologie emergenti. L’auspicio è che il concorso di tante idee, esperienze e sforzi nel settore produca in tempi ragionevoli una soluzione largamente accettata e concretamente praticabile per raggiungere l’obbiettivo forse più sentito al momento, e cioè che la diffusione delle reti telematiche e la proliferazione dei materiali giuridici pubblicati nei vari siti si traducano realmente in opportunità di informazione più ricca, completa, integrata, veloce e quindi utile per una vasta gamma di categorie di utenti.

18