Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

28
1 Le peculiarità del linguaggio giuridico. Problemi e prospettive nel contesto multilingue europeo Maria-Teresa Sagri, Daniela Tiscornia Ittig-CNR, Istituto di Teoria e Tecniche per l'Informazione Giuridica del Consiglio Nazionale Delle Ricerche (Italia) * , {sagri|tiscornia}@ittig.cnr.it Citation: Sagri, Maria-Teresa e Daniela Tiscornia (2009), “Le peculiarità del linguaggio giuridico. Problemi e prospettive nel contesto multilingue europeo”, mediAzioni 7, http://mediazioni.sitlec.unibo.it, ISSN 1974-4382. Parole chiave: terminologia giuridica, multilinguismo, semantic web, ontologie per il diritto, accesso ai contenuti digitali. Riassunto: Il forte tecnicismo del linguaggio giuridico rappresenta da sempre un ostacolo alla comprensione ed alla conoscenza sostanziale dei contenuti normativi. Il diritto regola ogni manifestazione della vita sociale, perciò confluiscono nella terminologia giuridica termini creati dal legislatore, parole del linguaggio comune utilizzate in accezione tecnica, termini che appartengono alla realtà normata. In più, il diritto è fortemente dipendente sia dalla sua testualità che da una particolare contestualità, generata dal sistema giuridico entro cui ogni innovazione normativa va ad inserirsi: ne è prova la frequente sovrapposizione fra le metodologie della comparazione giuridica e la traduzione del diritto. Il presente contributo intende analizzare il fenomeno dalla prospettiva degli 'strumenti', più precisamente descrivendo come le tecniche dell'Information Technology affrontino il problema delle barriere linguistiche nella ricerca e nella comprensione dell'informazione giuridica on line. Si analizzeranno approcci teorici e metodologici sottostanti allo sviluppo di risorse lessicali e di architetture software, atte a consentire un accesso ai contenuti digitali indipendente dalla forma linguistica in cui sono espressi, affrontando i temi del multilinguismo, del tecnicismo e dell'eterogeneità delle fonti. Si illustreranno iniziative concrete, frutto di progetti di ricerca promossi dalla Commissione Europea, se ne descriveranno le caratteristiche, i risultati, i punti deboli e le lezioni imparate dalle esperienze applicative. * Maria-Teresa Sagri, ricercatrice presso Ittig è autrice degli paragrafi 1, 2, 3. Daniela Tiscornia, dirigente di ricerca presso Ittig, è autrice del paragrafo n. 4.

Transcript of Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

Page 1: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

1

Le peculiarità del linguaggio giuridico. Problemi e prospettive

nel contesto multilingue europeo

Maria-Teresa Sagri, Daniela Tiscornia

Ittig-CNR, Istituto di Teoria e Tecniche per l'Informazione Giuridica del Consiglio

Nazionale Delle Ricerche (Italia)∗, {sagri|tiscornia}@ittig.cnr.it

Citation: Sagri, Maria-Teresa e Daniela Tiscornia (2009), “Le peculiarità del linguaggio giuridico. Problemi e prospettive nel contesto multilingue europeo”, mediAzioni 7, http://mediazioni.sitlec.unibo.it, ISSN 1974-4382.

Parole chiave: terminologia giuridica, multilinguismo, semantic web, ontologie per il diritto, accesso ai

contenuti digitali.

Riassunto: Il forte tecnicismo del linguaggio giuridico rappresenta da sempre un ostacolo alla

comprensione ed alla conoscenza sostanziale dei contenuti normativi. Il diritto regola ogni manifestazione

della vita sociale, perciò confluiscono nella terminologia giuridica termini creati dal legislatore, parole del

linguaggio comune utilizzate in accezione tecnica, termini che appartengono alla realtà normata. In più, il

diritto è fortemente dipendente sia dalla sua testualità che da una particolare contestualità, generata dal

sistema giuridico entro cui ogni innovazione normativa va ad inserirsi: ne è prova la frequente

sovrapposizione fra le metodologie della comparazione giuridica e la traduzione del diritto. Il presente

contributo intende analizzare il fenomeno dalla prospettiva degli 'strumenti', più precisamente descrivendo

come le tecniche dell'Information Technology affrontino il problema delle barriere linguistiche nella ricerca

e nella comprensione dell'informazione giuridica on line. Si analizzeranno approcci teorici e metodologici

sottostanti allo sviluppo di risorse lessicali e di architetture software, atte a consentire un accesso ai

contenuti digitali indipendente dalla forma linguistica in cui sono espressi, affrontando i temi del

multilinguismo, del tecnicismo e dell'eterogeneità delle fonti. Si illustreranno iniziative concrete, frutto di

progetti di ricerca promossi dalla Commissione Europea, se ne descriveranno le caratteristiche, i risultati, i

punti deboli e le lezioni imparate dalle esperienze applicative.

∗ Maria-Teresa Sagri, ricercatrice presso Ittig è autrice degli paragrafi 1, 2, 3. Daniela Tiscornia, dirigente di ricerca presso Ittig, è autrice del paragrafo n. 4.

Page 2: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

2

Introduzione

L'ordinamento comunitario nasce come un sistema giuridico che riesce a

svilupparsi al di sopra delle singole sovranità nazionali. Tale processo risulta

piuttosto singolare, dato che la nuova organizzazione politica viene ad

affermarsi senza presentare quegli elementi costitutivi1 che la dottrina ritiene da

sempre necessari per il consolidamento e la legittimazione di un ordinamento

giuridico2. Ne consegue che, mancando un substrato storico di riferimento, il

nuovo assetto comunitario si presenta come una realtà multiculturale

caratterizzata da differenti lingue e sistemi giuridici nazionali (Pozzo e Jacometti

2006).

In particolare il crescente raffronto e confronto dei documenti in lingua diversa

ha indotto la ricerca ad affrontare le problematiche delle traduzioni multilingue e

concentrarsi sullo sviluppo di strumenti che possano ovviare al difficile

problema della comunicabilità dei dati e dei concetti giuridici. Ciò ha fatto

emergere l’importanza di assicurare un’efficiente comunicazione linguistica che,

superando le problematiche inerenti al “multilinguismo” degli Stati membri,

favorisca la necessaria osmosi tra i diversi contesti3.

Secondo le politiche comunitarie, infatti, il miglioramento del processo

informativo e conoscitivo può rappresentare una ottima manovra strategica per

risolvere il problema della legittimazione del nuovo ordinamento ed avvicinare i

contesti nazionali alla dimensione europea (Schioppa 2002: 6). Viene quindi

fortemente percepita l'esigenza di sviluppare un concetto di appartenenza

1 Sul punto Cuocolo (1999: 120) sottolinea come gli elementi costitutivi di un ordinamento Statale sono il popolo, territorio e potere sovrano. E' proprio quest'ultimo elemento che in dottrina solleva molte polemiche e discussioni. In effetti è dubbia la natura giuridica della sovranità dell'ordinamento europeo. Sull'argomento cfr. anche Bin e Petruzzella (2005).

2 Su questo aspetto un interessante contributo è dato dalle teorie di Cannanea (2003) dove si approfondiscono le tematiche del problema della legittimazione dell'ordinamento europeo.

3 Cfr. Schena e Snel Trampus (2002) e Ricoer (2000: 2).

Page 3: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

3

sociale e politica al nuovo sistema giuridico4. In particolare, attraverso

programmi istituzionali si incentiva la possibilità di acquisire le informazioni,

capirle, comunicarle e rielaborarle, al fine di incidere sulla sua stessa vita di

relazione comunitaria5. Solo una adeguata capacità di interazione dell'utente

con i nuovi organismi istituzionali sembra aprire la strada ad una maggiore

percezione dello status di cittadinanza europea e coadiuvare così il processo di

consolidamento politico (Azzena 2007: 1420).

Nel contesto giuridico questa problematica viene particolarmente ad acuirsi. Nel

mondo giuridico, contrariamente ad altri contesti tecnici, l'accesso

all'informazione non significa soltanto accrescere la capacità conoscitiva

dell'utente, ma anche soddisfare un più generale obbligo di informazione che

grava sulle istituzioni statali6. L'ordinamento, in quanto formale tutore della

legalità, deve inevitabilmente farsi garante della trasparenza ed accessibilità

delle informazioni giuridiche. Purtroppo però il problema dell'uso del linguaggio

per il recupero delle informazioni si complica non solo a causa del forte

tecnicismo che caratterizza il linguaggio legale ma anche a causa della

fisionomia multilingue acquisita negli ultimi anni dai sistemi giuridici (Sacco

2000: 125).

L'affermarsi dell’ordinamento comunitario ha, infatti, determinato la presenza di

alcune problematiche che scaturiscono dalle differenze e dalle distanze tra i

sistemi giuridici ed i moduli linguistici comunitari (Rossi 2007: 140).

4 L’Unione europea è fondata sul motto “unità nella diversità: diversità di culture, usi, costumi e credenze e di lingue – ovvero una realtà in cui ciascuna individualità nazionale viene salvaguardata e valorizzata in tutte le sue manifestazioni – è proprio questa diversità a fare dell’Unione europea [...] non un ‘melting pot’ in cui le differenze si fondono, bensì una casa comune in cui la diversità viene celebrata e le nostre numerose lingue materne rappresentano una fonte di ricchezza e fungono da ponte verso una solidarietà e una comprensione reciproca maggiori”. Cfr. Comunicazione della Commissione: Un nuovo quadro strategico per il multilinguismo, Bruxelles, 22.11.2005, COM (2005) 596, p. 2.

5 Per un approfondimento di questa tematica cfr. Migliazza (2002).

6 “Si pensi esemplarmente al settore della comunicazione e dell'informazione pubblica, grazie a cui l'amministrazione è chiamata sempre più ad operare [...] in una “forma” nuova, calcata sul modello interattivo reso possibile dalla digitalizzazione ed alle reti” (Costanzo 2006: 4).

Page 4: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

4

Non solo a livello europeo non si dispone di una comune terminologia giuridica,

ma nella fase di elaborazione normativa, si è imposta all'interno delle diverse

istituzioni comunitarie la prassi secondo la quale la bozza preliminare del

documento normativo viene realizzata utilizzando soltanto tre principali lingue di

lavoro (inglese, francese e solo in più limitati casi il tedesco); ne consegue che i

documenti non sono “pensati” multilingue fin dall'origine, e vengono tradotti

nelle diverse lingue ufficiali soltanto nella fase finale della redazione (Cosmai

2007: 122). Ciò determina la produzione di una regolamentazione che non tiene

conto delle profonde differenze esistenti tra i vari ordinamenti (Ajani e Ebers

2005).

Le stesse problematiche vengono ad acuirsi nel difficile rapporto tra la

legislazione comunitaria e quella dei singoli Stati. Gli atti comunitari vengono

difficilmente armonizzati nei contesti nazionali, sia perché la normativa richiede

l'inserimento di concetti giuridici che sono spesso sconosciuti agli assetti

nazionali, sia perché le difformità di recepimento da un ordinamento all'altro

tendono a inficiare l'uniformità giuridica dell'Unione (Ajani e Rossi 2006: 124).

1. Difficoltà di traduzione del linguaggio giuridico

Le problematiche poste dall'incidenza del diritto comunitario trovano uno stretto

collegamento con le tematiche legate alla traduzione giuridica e sono diventate

evidenti proprio quando i giuristi hanno cominciato a lavorare su progetti volti

all’uniformazione del diritto (Ioratti 2005: 1552).

I termini tecnici utilizzati in ciascun contesto non esplicitano soltanto i concetti

giuridici in esso operanti, ma rispecchiano anche le profonde differenze

esistenti tra i vari ordinamenti (Pozzo 2006: 6).

In diritto è infatti più opportuno parlare di versioni multilingue di un testo

legislativo piuttosto che di traduzioni, altrimenti si corre il rischio di perdere gran

parte del contenuto del documento, là dove una traduzione approssimativa può

far correre il rischio di appiattire i diversi contenuti dei testi. Si possono infatti

verificare delle situazioni in cui pur essendo possibile la traduzione letterale del

Page 5: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

5

termine, l’equivalente acquista in un diverso contesto linguistico un significato

completamente diverso7. In altri casi le difficoltà nascono dal dover confrontare

sistemi linguistici divergenti per struttura e matrice culturale8, dove anche gli

stessi domini giuridici sono caratterizzati da profonde divergenze di carattere

sostanziale9.

Ne consegue che nei linguaggi specialistici, come quello giuridico, per stabilire

una corrispondenza tra i termini di lingue diverse occorre individuare la

corrispondenza tra concetti o istituti giuridici, in quanto la diversità di struttura

dei diversi ordinamenti determina la difficile comparazione tra gli istituti presenti.

In questo senso alcune teorie terminologiche propongono, nel processo di

traduzione, di spostare l’attenzione dal termine, espressione linguistica usata in

un determinato contesto, per focalizzare lo studio sul senso contenuto, ovvero il

concetto espresso dal termine stesso10. Questa metodologia consente di

superare in parte le difformità della lingua per confrontare così i concetti

utilizzati in un determinato contesto comunicativo e verificare se l’istituto esista

7 Ad esempio il termine diritto civile in italiano, tradotto in inglese in civil law, viene a rappresentare un significato estremamente lontano a quello del contesto italiano.

8 La teoria della relatività linguistica sostiene che la struttura della lingua condiziona la struttura stessa del pensiero dei parlanti. Ne consegue come corollario che come le lingue sono diverse, anche i concetti sono diversi da cultura a cultura. Ad esempio la lingua francese è caratterizzata da un'abbondanza di parole polisemiche o la frequenza di certe figure retoriche ingannevoli che provano molte difficoltà ad essere raffrontati con termini e strutture della lingua inglese, che risulta invece molto più pragmatica e pratica. Ne consegue alcune difficoltà nel trovare i termini equivalenti. Come sottolinea Sacco “i concetti creati, elaborati, definiti dal legislatore o dal giurista di un certo sistema non corrispondono necessariamente ai concetti elaborati per un altro sistema, così è difficile trovare la parola francese che permetta di esprimere agent, estoppel, executor, ecc.“ (Sacco 2000: 126).

9 Un esempio è rappresentato dal termine negozio giuridico introdotto dalla dottrina tedesca che difficilmente trova un equivalente nella lingua francese o in quell’inglese; in effetti, è un concetto che può essere perfettamente spiegato sia dai giuristi francesi ed inglesi ma in nessuna delle due lingue è possibile tradurre l’espressione con un apposito termine, rappresentando così un limite alla comparazione e traduzioni di testi (Sacco 1995: 86).

10 Secondo Ricoer, il concetto è una unità di pensiero, il cui contenuto semantico può essere riformulato ricorrendo a una combinazione di altri concetti (Ricoer 2000).

Page 6: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

6

in un sistema giuridico, oppure se sia elaborato all’interno di un ordinamento

attraverso strutture giuridiche differenti. Più precisamente, la traduzione

giuridica mira a definire una nozione di equivalenza funzionale tra concetti

appartenenti ai diversi ordinamenti giuridici, vale a dire un’equivalenza basata

sul confronto tra due termini che, essendo descritti attraverso gli elementi

costitutivi, possono in qualche modo essere messi in relazione in virtù di uno o

più elementi comuni (De Groot 2000; Wroblewski 2000).

Secondo tale prospettiva, nel settore giuridico si sostiene che “la traduzione di

una parola in un’altra è possibile e legittima nella misura in cui le due parole

esprimono lo stesso concetto” (Sacco 1991: 24). La parola esprime la nozione,

ma diversamente da altri contesti tecnici, nel dominio giuridico certi concetti,

creati, elaborati e definiti dal legislatore o dal giurista di un certo sistema

giuridico, non necessariamente corrispondono a concetti elaborati per un

differente sistema (Sacco 2000: 126). Le lingue di differenti paesi esprimono

concetti che sovente non si equivalgono. La nozione giuridica, pur essendo

all’origine di un numero indefinito di realizzazioni che maturano nelle diverse

esperienze culturali e giuridiche, è incentrata su elementi considerati come

invariabili da un sistema giuridico all’altro. Ad esempio la nozione di contratto è

incentrata sull'accordo, la convenzione, il consenso, il patto, a prescindere dalla

sua realizzazione linguistica. Secondo alcuni linguisti (Vanderlinden 1995: 23),

dato che difficilmente una parola di una lingua corrisponde interamente ad

un'altra parola di un'altra, una metodologia utilizzabile nella traduzione è

rappresentata dal riuscire a decomporre le nozioni giuridiche, far figurare tra i

componenti tutti gli elementi che non corrispondono ad uno o l'altro dei termini

che si cerca di comparare, per poi individuare le caratteristiche comuni di

entrambi al fine di estrapolare il concetto generale.

Di fronte a tale metodo rimane da chiedersi se questa procedura rappresenti già

una forma di interpretazione piuttosto che una traduzione di un messaggio

verbale da un lingua all'altra (Zaccaria 2003 e 2006).

Page 7: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

7

2. L'informatica giuridica ed il trattamento dell’i nformazione multilingue

Come già sottolineato nel paragrafo introduttivo, la nascita dell’Unione Europea

ha reso indispensabile una più agile circolazione delle informazioni.

In questo senso lo strumento informatico si inserisce come mezzo ideale per

trasformare i contesti istituzionali in “società trasparenti” e permettere a

chiunque, attraverso uno strumento democratico e veloce, non solo di accedere

a tutte le informazioni disponibili, ma anche di superare l'oggettiva distanza

materiale dalla fonte informativa. L'accelerazione tecnologica rende disponibili

tecnologie di comunicazione ed informazione sempre più potenti, capaci di

trasformare profondamente le organizzazioni pubbliche e private.

Un utilizzo effettivo di tali risorse si lega però inscindibilmente con la concreta

capacità dell'apparato di fornire strumenti affinché il cittadino possa godere di

tali strumenti senza bisogno di intermediazioni.

Il Web è stato progettato come un grande spazio di informazioni, ma queste

ultime sono progettate per essere “mostrate” piuttosto che “comunicate”

(Calzolari e Lenci 2004: 57). Ne consegue che possono essere forniti grandi

quantitativi di dati che nel concreto sono difficilmente gestiti o utilizzati

dall'utente a causa della difficile interazione tra l'uomo e la macchina.

L'utente medio può relazionarsi con la risorsa informatica soltanto attraverso il

linguaggio naturale; ciò comporta il sorgere di alcune complicazioni originate

dalle incongruenze linguistiche che spesso esistono tra i dati archiviati ed il

linguaggio utilizzato per la ricerca.

Il problema di acquisire e gestire la conoscenza depositata nei documenti

testuali dipende dal suo essere codificata all'interno di una rete di strutture e

relazioni grammaticali e lessicali che costituiscono la natura stessa della

comunicazione linguistica. Nel linguaggio infatti, il lessico e le regole per la

combinazione delle parole in strutture sintatticamente complesse si fanno

veicoli degli aspetti multiformi e creativi dei contenuti semantici (Calzolari e

Lenci 2004: 57).

Page 8: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

8

La situazione si complica quando l'informazione ricercata è di tipo tecnico. I

domini specialistici utilizzano dei linguaggi tecnici che sono difficilmente

conosciuti da un utente non specialistico. Le caratteristiche dei linguaggi

settoriali sono principalmente due: in primo luogo la loro insostituibilità per lo

studio di una determinata disciplina e per l’esercizio di un’attività; in secondo

luogo la loro attitudine ad indicare l’appartenenza ad un gruppo di individui uniti

da legami di interessi e conoscenze più stretti di quelli che intercorrono

normalmente tra i membri di una comunità linguistica. Le informazioni sono

quindi prodotte con un linguaggio molto distante da quello utilizzato dall'uomo

della strada. Quest'ultimo molto spesso è incapace di recuperare e di

consultare tali informazioni, oppure pur riuscendo a rintracciarle, queste

risultano comunque incomprensibili.

3. Gli strumenti semantici nella ricerca di informa zione giuridica

Al fine di migliorare l’accesso all’informazione, la ricerca si è focalizzata sullo

sviluppo di strumenti che, superando i limiti di una ricerca di informazioni basata

sulla rappresentazione grafica di un termine, permettano di avvicinarsi al

contenuto e di conseguenza anche al contesto in cui un termine è utilizzato

(Roventini et al. 2003).

Gli sviluppi più recenti della linguistica computazionale e del Natural Language

Engineering hanno creato soluzioni tecnologiche dalle enormi potenzialità per

migliorare la ricerca e gestione intelligente dell’informazione contenuta nei

documenti testuali. All’interno di questi ambiti di ricerca si tenta di sviluppare

delle metodologie che attraverso il linguaggio macchina rendano possibile

veicolare i contenuti là dove il termine grafico di per sé non è sufficientemente

in grado di farlo11.

11 ”Parte della linguistica studia tutte le denominazioni adottate in una stessa lingua o dialetto,

per designare una medesima cosa o concetto. E’ lo studio delle parole raggruppandole per aree concettuali. Così, mentre la lessicografia ricorre alla descrizione del concetto (cioè dalla parola al concetto), la terminografia, invece, basandosi sul concetto così configurato nell’analisi

Page 9: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

9

Le nuove tecnologie della lingua, infatti, permettono ai sistemi informatici di

accedere al contenuto digitale attraverso il Trattamento Automatico della Lingua

(TAL) (Calzolari e Lenci 2004: 60). L’obiettivo dello sviluppo ed

implementazione delle risorse linguistiche diventa quello di arricchire i motori di

ricerca che operano su Internet con strumenti che consentano la ricerca

concettuale e l’accesso a dati eterogenei e multilingue, basandosi su un

modello standardizzato di descrizione del dominio giuridico; tra questi

analizzeremo le reti semantiche quali strumenti per costruire rappresentazioni

del contenuto dei documenti per potenziare l’estrazione di informazione

rilevante da testi (Information Extraction) e la ricerca di documenti redatti in

lingue diverse (Cross-lingual Information Retrieval).

3.1. Le reti semantiche

Le reti semantiche (c.d. lessici semantici) sono strumenti attraverso i quali il

significato dei termini è reso esplicito e comprensibile dai programmi informatici

(Miller 1995). L’utilizzo di tali strumenti è finalizzato ad arricchire i motori di

ricerca che operano su Internet con metodologie che consentano la ricerca

concettuale e l’accesso a dati eterogenei e multilingue, basandosi su un

modello standardizzato di descrizione del dominio giuridico. Queste risorse

sono delle reti di concetti definiti attraverso relazioni di significato che

permettono di descrivere le informazioni. Il concetto rappresentato in una parola

può essere identificato da termini diversi all’interno di uno stesso sistema

linguistico, ma spesso può essere effettivamente reso comprensibile e

raffigurato solo relazionandolo con altri ad esso connessi.

L’accesso multilingue all’informazione giuridica non può basarsi sul semplice

utilizzo della parola, intesa come segno grafico, ma deve diversamente

incentrarsi su una relazione tra concetti. Si cerca quindi di migliorare la capacità

lessicografica, giunge poi alla denominazione del concetto in un contesto di standardizzazione e normalizzazione della parola o concetto” (Tessuto 2006: 120).

Page 10: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

10

semantica degli strumenti disponibili attraverso delle risorse che possono

descriverne il contenuto (Tiscornia 2007: 146).

Attraverso tali risorse le unità lessicali costituite da tutti i termini che esprimono

lo stesso concetto, dette varianti, vengono legate da una relazione semantica

‘vicina’ alla sinonimia12 e descritti da una glossa che ne esplicita il senso13. Più

precisamente questi gruppi di termini sono insiemi di parole, basati

sull’equivalenza di significato, che rappresentano un concetto o l’istanza dello

stesso. Ad esempio: il termine del linguaggio comune casa può essere

rappresentato da una pluralità di termini quali abitazione, immobile che sono

principalmente appartenenti al linguaggio tecnico. Attraverso una rete

semantica il termine comune può quindi essere ricercato indifferentemente con

ognuna di queste varianti (Sagri 2007: 78).

In alcune tipologie di lessici14, l’entità atomica è denominata synset e

rappresenta l’insieme di sinonimi, abbreviazioni, sigle, varianti ortografiche e

desuete di uno stesso concetto (Fellbaum 1998).

12 Nell’ambito del linguaggio giuridico non sono previste relazioni di sinonimia vera e propria, poiché ogni termine tecnico è considerato portatore di un significato primario e non sostituibile; di fatto, però gli utenti, soprattutto quelli non prettamente specialistici, sostituiscono ai termini tecnici espressioni utilizzate dal linguaggio comune. Da qui nasce l’opportunità di creare una rete semantica capace di convogliare nello stesso significante le varie tipologie di sinonimi, anche se non secondo un'accezione prettamente tecnica.

13 Il formalismo delle reti semantiche prevede, in linea generale, di rappresentare gli oggetti dell'universo di riferimento attraverso dei grafi orientati in cui i nodi rappresentano i concetti e gli archi rappresentano relazioni tra i concetti.

14 Nel presente contributo sono presi in analisi i lessici della famiglia WordNet. WordNet (http://wordnet.princeton.edu/) e MultiWordNet (http://tcc.itc.it/projects/multiwordnet/multiwordnet.php) sono, infatti, delle reti semantiche disponibili gratuitamente su Internet che attraverso delle strutturazioni di relazioni semantiche permettono non solo di rappresentare concettualmente un dominio linguistico prescelto, ma attraverso le reti lessicali/semantiche sviluppate per le altre lingue europee dal progetto EuroWordNet (finanziato dalla Comunità Europea), permettono un collegamento simultaneo con gli equivalenti concettuali di altre realtà linguistiche. ItalWordNet (IWN) rappresenta la rete semantica sviluppata per l'italiano generico dall'Istituto di Linguistica Computazionale di Pisa del CNR all'interno del progetto IWN. Un approfondimento ed un’estensione sotto l’aspetto giuridico della risorsa IWN è il lessico JurWordNet (JWN), realizzato all’interno di un programma di

Page 11: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

11

Ogni synset può essere descritto rappresentando le sue relazioni con altri

concetti e viene poi strutturato e collegato con gli altri termini della

tassonomia15. Le relazioni utilizzate sono basate su relazioni di senso:

iper/iponimia, (corrispondente alla logica relazione di inclusione di una classe in

un’altra), meronimia (o relazione parte-tutto), antonimia (opposizione di

significato), causa (causalità fattiva e non fattiva), implicazione, ruolo, strumento

(tra un oggetto ed il materiale con cui è realizzato), appartenenza, derivazione,

ecc.16

Le differenze di senso (polisemie) sono poi distinte, numerate e definite

mediante relazioni tassonomiche ed associative.

Sono proprio queste diverse tipologie di relazioni che distaccandosi dal ricoprire

la mera funzione di vocabolario giuridico permettono la ricostruzione

concettuale del singolo termine. Non solo il termine viene catalogato secondo le

sue diverse accezioni, ma viene anche collegato tramite relazioni semantiche

ad altri termini che a loro volta ne spiegano e ne chiarificano il senso.

Attraverso tali risorse si passa quindi da quello che può essere rappresentato

come un semplice insieme di parole (processo, procedimento giuridico,

sentenza, tribunale, attore, convenuto ecc.) ad una struttura di parole

esemplificative di una area di conoscenza. Nella rete semantica il termine

procedimento giuridico non solo è considerato equivalente di processo

giuridico, al pari del termine processo, tipico del linguaggio usato dall’utente non

ricerca promosso dall’ITTIG (http://www.ittig.cnr.it/Ricerca/Unita.php?Id=11&T=4). La risorsa JurWordNet è stata quindi strutturata secondo gli stessi principi adottati per la risorsa generica: i nodi della rete sono i synsets (insieme di termini sinonimi organizzati secondo le relazioni previste dal modello generale) che rappresentano dei concetti basilari collegati nella rete da numerose relazioni di senso oltre che da relazioni tassonomiche (Sagri 2002; Sagri et al. 2004).

15 Il synset rappresenta all’interno del progetto l’unità di misura, l’insieme di sinonimi, abbreviazioni, sigle, varianti ortografiche e desuete. Ciascun termine appartenente allo stesso gruppo può essere indistintamente intercambiato all’interno di una stessa frase, senza cambiarne il senso.

16 Il progetto ItalWordNet prevede al suo interno ben 16 tipi diversi di relazioni. Per maggiori dettagli visita http://www.ilc.cnr.it/viewpage.php/sez=ricerca/id=834/vers=ita.

Page 12: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

12

specialistico, ma è anche collegato ad altri diversi concetti tramite delle relazioni

che ne descrivono il significato. Il termine procedimento giudiziario ha come

superiore gerarchico il più generale concetto di procedimento e come termini

più specifici processo penale e processo civile. Lo stesso termine è inoltre

collegato da una relazione di causa-effetto con il termine sentenza, e da una

relazione di ruolo con i soggetti coinvolti nel processo: il soggetto agente è

rappresentato dal termine giudice, mentre l’attore ed il convenuto sono

rappresentati come parti passive dello stesso fra loro collegate da una relazione

di “co-ruolo”.

L’uso di un lessico semantico permette all’utente di navigare agevolmente

all’interno delle liste dei descrittori (monotermini o pluritermini), nonché di

selezionare espressioni chiave di suo interesse ed eventualmente espanderle

automaticamente nella specifica sintassi utilizzata dal motore di ricerca,

sostituendo ad ogni lemma individuato la disgiunzione di tutti i descrittori

collegati da relazioni di sinonimia, iperonimia ed iponimia.

La stessa risorsa può al contempo essere utilizzata per distinguere i diversi

significati nei termini polisensi17. Per esempio il termine canone a livello

giuridico rappresenta il senso di “prestazione (in denaro o in natura) oggetto di

un rapporto obbligatorio di stampo contrattuale” e, al tempo stesso, il senso di

una norma giuridica dal carattere universale, caratteristico del diritto canonico.

Per mezzo dell’aggregazione di varianti (termini equivalenti) e della definizione

di relazioni semantiche tra synset, è possibile disambiguare i diversi significati

di un concetto e gestire così il problema della polisemia. Il termine canone

secondo il senso di prestazione sarà collegato con dei termini che ne

permettano la rappresentazione, come affitto, prestazione; mentre il termine

della diversa accezione sarà rappresentato da termini inerenti al diritto

canonico. I principali vantaggi delle reti semantiche risiedono nell’essere

relativamente facili da comprendere, efficienti da elaborare per i calcolatori e

sufficientemente potenti per rappresentare idee e concetti anche complessi.

17 Nel linguaggio tecnico tale operazione è definita “disambiguazione”.

Page 13: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

13

3.2. Le reti semantiche come supporto nella localizza zione multilingue

Le reti semantiche oltre che rappresentare un’interessante risorsa per alcune

problematiche legate al reperimento di un’informazione caratterizzata da un

forte tecnicismo18, possono essere utilizzate come utili supporti informatici nel

gestire, comparare, reperire dati multilingue. Dove l’informazione è

caratterizzata non soltanto dal divario linguistico ma anche da quello

concettuale19.

In particolare il progetto europeo Lois20 (Peters et al. 2006) può essere

rappresentativo dell'utilizzo di reti semantiche nell'accesso multilingue

all’informazione giuridica. Nell’ambito del programma E-content, il Progetto

Europeo Lois è stato finalizzato allo sviluppo di uno strumento d’accesso

all’informazione giuridica in sei lingue europee: tedesco, portoghese, ceco,

italiano, olandese, collegate tra loro attraverso l’inglese, per migliorare la

funzionalità nella ricerca di documenti e concetti giuridici multilingue.

18 In questo settore le maggiori difficoltà dell’utente medio sono rappresentate da fatto di non conosce il termine tecnico del concetto ricercato. Ad esempio, alle parole omicidio o uccisione della lingua comune si sostituiscono i sintagmi italiani omicidio preterintenzionale, omicidio premeditato, omicidio colposo. Alcuni esempi del contrasto tra lessico comune e lessico giuridico nella lingua italiana sono i verbi: contrastare qc. ‘contraddire’; ovviare qc. ‘rimediare a’; rispondere a ‘essere responsabile per’, oppure l’uso giuridico di verbi molto comuni, come ad esempio chiedere (o disporre, pronunciare, ecc.). Ci sono poi, a titolo di esempio, altri usi di parole della lingua comune che, in ambito giuridico, hanno subito una risemantizzazione: accendere (un debito, un’ipoteca), accordo, affidamento, arresto, attore. Quindi, si potrebbe forse parlare di una sorta di disturbi alla comunicazione, disturbi che tuttavia hanno ragione di sussistere in virtù della precisione di significato ricercata e come tale istituzionalizzata nella comunicazione specialistica (Tessuto 2006: 167).

19 In tal senso si prevedono almeno tre aspetti di possibile utilizzo dei lessici semantici. In primo luogo come fonte di metadati per il tagging semantico dei testi legislativi (adottabile anche in fase di drafting legislativo come arricchimento dell’editore specialistico in fase di sviluppo). Alle strutture testuali viene aggiunta l’informazione semantica utilizzando i concetti definiti nella rete, individuando le singole disposizioni come entità alternative (non sempre coincidenti) ai segmenti testuali. Ancora, come strumento di supporto a sistemi di information retrieval per facilitare l’accesso a dati eterogenei e multilingue; oppure come base di conoscenza concettuale utilizzabile per l’estrazione di informazioni, per il tagging semantico automatico, per la condivisione di conoscenza (knowledge sharing), per il confronto tra normative.

20 http://www.ittig.cnr.it/Ricerca/materiali/lois/GoalOfLOIS.htm

Page 14: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

14

Il lessico semantico di Lois è costituito, secondo la metodologia WordNet, da un

insieme di termini rappresentativi dei concetti basilari del dominio giuridico,

organizzati e collegati nella rete da numerose relazioni di senso e da relazioni

tassonomiche. I concetti sono strutturati utilizzando dei criteri a livello

linguistico, concettuale, ed ontologici, poiché la descrizione dei concetti

coinvolge spesso, nel mondo giuridico, il collegamento fra gli istituti e gli

ordinamenti giuridici. Questa metodologia di descrizione consente una più

agevole comparazione ed un collegamento tra i diversi domini giuridici.

La risorsa è composta da un database lessicale e da un database normativo. Il

primo è una banca dati contenente i principali concetti appartenenti alla dottrina

giuridica; il secondo è un database normativo composto da concetti definiti nelle

direttive comunitarie e nelle leggi di implementazione delle direttive. Per

quest'ultimo sono state previste due particolari relazioni: una relazione

implemented-as che lega i concetti presenti nelle direttive con i concetti definiti

nelle leggi di implementazione ed una relazione di equivalenza o quasi

equivalenza a seconda di una più forte o lieve equivalenza concettuale tra i

concetti implementati nella legislazione nazionale rispetto alle norme

comunitarie.

La struttura di Lois permette di utilizzare dei diversi criteri di collegamento tra

lessici a seconda di due diverse concezioni di equivalenza.

L’equivalenza di tipo semantico, secondo l’accezione di EuroWordNet21

(Roventini et al. 2003), come ad esempio eq-synonym, eq-near-synonym, eq-

hyperonym, è guidata dalla glossa dei concetti e collega i synset della parte

lessicale; la relazione di equivalenza normativa è stabilita sulla base di un

criterio di appartenenza alle stesse fonti normative e collega i concetti estratti

della parte legislativa. Si è inoltre prevista la definizione di criteri di interazione e

collegamento semantico delle due banche dati.

21 Per maggiori dettagli sul progetto EuroWordNet cfr. http://www.illc.uva.nl/EuroWordNet/.

Page 15: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

15

Lo sviluppo della risorsa linguistica ha previsto due fasi distinte: la prima volta

all'editing delle reti lessicali giuridiche corrispondenti a ciascuna lingua

coinvolta, la successiva di confronto e collegamento tra i diversi contesti

linguistici dei singoli membri del progetto.

Al fine di garantire una copertura lessicale simile per le diverse lingue del

progetto si è proceduto quindi alla codifica di dati a partire da un insieme di

lemmi considerati rappresentativi dei concetti essenziali del dominio giuridico

nei singoli ordinamenti.

Per quanto concerne la sezione italiana del progetto, una volta selezionato un

gruppo rappresentativo del dominio italiano, si è proceduto a strutturarlo

all’interno della rete semantica. Ciascun basic term, considerato come possibile

root di una sotto-gerarchia di termini, è stato prima definito e poi collegato ad

altri secondo le relazioni linguistiche previste, in particolare attraverso le

relazioni di sinonimia e quelle di iper/iponimia. A questa fase ha fatto seguito

una fase successiva che prevede il collegamento tra gli specifici database per

ciascuna lingua (Peters et al. 2007).

Queste prime operazioni hanno consentito di individuare una parte delle

corrette relazioni semantiche fra termini in due lingue diverse. Ad esempio è

stato possibile disambiguare le due diverse accezioni del lemma contratto,

senso n.1 documento e senso n.2 accordo di volontà. Infatti utilizzando

l’iperonimo documento, il senso n.1 di contratto è stato collegato a “instrument:

document that states some contractual relationship or grants some right”; il

senso n.2 a “contract: a binding agreement between two or more persons that is

enforceable by law”. Come ulteriore esempio, il lemma diritto in italiano ha due

accezioni, “facoltà derivante da norme o consuetudini”, oppure “complesso di

norme legislative o consuetudinarie che regolano i rapporti sociali”; in inglese la

prima corrisponde a right, la seconda a law. Successivamente attraverso il

confronto automatico fra italiano ed i termini stranieri è stato possibile collegare

le corrette traduzioni utilizzando le relazioni di iponimia: infatti, diritto pubblico

viene correttamente tradotto con public law, e da questo si crea il corretto

iperonimo law (Peters et al. 2007).

Page 16: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

16

3.3. Metodologie alternative per la descrizione dei contenuti giuridici

All'interno della linguistica computazionale si sono sviluppate anche altre

metodologie per la creazione di risorse semantiche. Di particolare interesse

risulta quelle sviluppata da Charles J. Fillmore, presso l'Università di Stanford,

basata su una grammatica dei casi, la c.s. semantica dei frame;

rappresentazioni del lessico organizzate sulla base di frame semantici, correlati

ad esempi di occorrenza testuale (Fillmore e Atkins 1992).

I frame sono strutture di dati che rappresentano o schematizzano situazioni

stereotipate che si configurano come una via di accesso lessicale alle situazioni

descritte.

La struttura usata in FrameNet si basa sulla teoria linguistica secondo la quale

ogni predicato ha una sua struttura argomentale, richiede un numero di

argomenti che indicano i partecipanti minimamente coinvolti nell'attività o nello

stato espressi dal verbo stesso. La relazione semantica tra il verbo ed i suoi

argomenti, o ruolo tematico, assegna un ruolo a ciascuno dei suoi argomenti.

L'informazione sulla relazione semantica tra il predicato ed i suoi argomenti è

registrata nel lessico e fornisce una griglia tematica in cui si ottiene la

rappresentazione del tipo di ruolo semantico espresso da un argomento. Ad

esempio il contratto di vendita, previsto dall' art. 1470 del c.c., può essere

rappresentato da una forma verbale rappresentativa dell'azione di contrarre,

dove i soggetti coinvolti, venditore e compratore, rispettivamente l'agente ed il

paziente dell'azione, sono coinvolti in un accordo, attraverso il quale incombe

l'obbligo di pagare un prezzo.

La struttura argomentale di un predicato, codificata nella griglia tematica,

stabilisce così quali siano i componenti minimi della frase.

Tale metodologia, diversamente da quelle utilizzate nelle risorse WN, sembra

permettere una rappresentazione più completa del contenuto, soprattutto là

dove viene utilizzata per definire una relazione di equivalenza funzionale.

Page 17: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

17

Nel contesto giuridico multilingue infatti, la coesistenza dei diversi istituti

giuridici, organi, istituzioni esistenti nei differenti ordinamenti, può implicare che

un particolare concetto giuridico non esista in tutti i contesti normativi. E' invece

probabile che i due differenti ordinamenti condividano le stesse azioni

giuridiche: ordinare, legiferare, sanzionare, eleggere. Ne consegue che la

rappresentazione schematica di tali azioni, secondo la struttura del frame,

permette di riconoscere immediatamente il tipo di azione senza dover

necessariamente riconoscere l'organo o l'istituto coinvolto.

4. Ontologie formali

Mentre i lessici intendono facilitare l'informazione, migliorando il reperimento dei

contenuti sul web, le ontologie formali nascono con l'obiettivo più ambizioso di

rafforzare il processo di apprendimento, la conoscenza (Visser e Bench Capon

1999). Lo scopo delle ontologie è di codificare in un linguaggio artificiale (la

logica formale) gli elementi di conoscenza necessari alla comprensione; questi

vengono utilizzati dai linguaggi del Semantic Web per aggregare alle

informazioni testuali disponibili su Internet la descrizione concettualizzata dei

contenuti (semantic tagging). In certi settori, ad esempio nel commercio

elettronico e nel trattamento dei diritti digitali, la conoscenza viene totalmente

trasferita nel modello ontologico; essa diventa in tal modo comprensibile anche

dai programmi che sono a loro volta in grado di generare, attraverso passaggi

inferenziali, nuova conoscenza (machine-understandable knowledge bases).

Esiste un’enorme letteratura in tema di ontologie formali: molte classificazioni

(ontologie fondazionali, core, di dominio), una notevole quantità di risorse

realizzate, molte varietà di metodologie e di strumenti per la costruzione di

ontologie.

In questa sede parliamo di ontologie esclusivamente in relazione al trattamento

del multilinguismo nel dominio giuridico ed in particolare per evidenziare le

differenze con le ontologie leggere già descritte e per valutare i vantaggi

metodologici che derivano dall'ancoraggio della semantica 'leggera' dei lessici

computazionali alla robusta struttura assiomatica delle ontologie.

Page 18: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

18

Rispetto alle reti terminologiche tradizionali i lessici computazionali presentano

elementi di maggiore flessibilità e ricchezza espressiva, ma mantengono una

forte dipendenza dai contesti linguistici. Le terminologie tradizionali rispondono

ad una esigenza di standardizzazione che richiede l'elezione di un termine al

rango di concetto univoco, mentre nei lessici computazionali non esiste una

corrispondenza uno a uno fra termini, ma affinità o sovrapposizioni semantiche

fra (insiemi di) termini (i synset). La polisemia viene mantenuta e esplicitata (un

termine può avere word sense appartenenti a synset diversi).

Inoltre, mentre nelle costruzione di risorse terminologiche multilingue il

collegamento cross-lingual fra i concetti è stabilito manualmente da esperti del

dominio, nei lessici semantici l'equivalenza semantica è di norma basata sulla

individuazione di un linguaggio pivot che funge da interlingua. In EuroWordNet

(e in Lois) l'indice interlingua, esemplificato nella Figura 1, collega termini

espressi nelle varie lingue attraverso le relazioni di equivalenza stabilite con il

concetto inglese, descritto da una glossa (un’espressione linguistica espressa

in inglese). Si tratta dunque di una comparazione di termini a livello concettuale

ma pur sempre dipendente da un sistema linguistico. Questo perché le relazioni

semantiche dei lessici (iponimia, meronimia, ruolo) non sono di per sé sufficienti

a cogliere le assunzioni di significato dei concetti in modo così profondo da

consentirne la comparazione.

Figura 1: Il collegamento interlingua nei lessici W ordNet

Page 19: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

19

La costruzione di risorse semantiche richiede un massiccio lavoro manuale e

comporta il rischio che si generino inconsistenze nella strutturazione semantica.

Per raggiungere un grado di concettualizzazione più accurato, occorre

introdurre delle strutture di conoscenza più astratte, condivise e indipendenti dai

sistemi linguistici, che consentano al tempo stesso di mantenere il collegamento

dei concetti ai contesti e di salvaguardare la molteplicità sincronica

(multilinguismo) e diacronica (evoluzione del significato).

Il ruolo delle ontologie formali è appunto quello di fornire i fondamenti cognitivi

(ed il vocabolario) per la concettualizzazione formale di un dominio. Le

categorie che popolano il modello ontologico classificano i concetti che

appartengono al lessico (Gangemi et al. 2003b). Questo è il ruolo degli

strumenti ontology-based nella gestione di dati multilingue (o eterogenei in

senso lato, ad esempio, dati multimediali).

People understand the world via cognitive frames […] or models […] in which prototype-structured units of understanding are related [...]. What is named by the same term in different texts can be shown to have different referents. More often than not a category cannot be clearly delineated. It is like a chunk of knowledge which has a core and a structure but which exists in a process of continuing reformulation and is therefore in constant transition. (Temmerman et al. 2006: 303)

Questo approccio, applicato con risultati positivi anche nel dominio giuridico

(oltre al già citato progetto Lois si vedano Syllabus (Lesmo et al. 2007) e Dalos

(Francesconi et al. 2007: 404)) ha per altro generato varie e molto dibattute

questioni metodologiche: si deve costruire una struttura ontologica formale

come un elemento 'terzo' di descrizione del dominio, autonomo rispetto ai

sistemi lessicali, o si deve introdurre la descrizione del dominio all'interno dei

lessici, arricchendo la struttura di relazioni semantiche con relazioni proprie del

dominio?

Nel primo caso, l'ontologia formale si pone ad un livello di astrazione maggiore

rispetto a quello lessicale, nel secondo è il lessico stesso ad essere trasformato

in una ontologia di dominio. Nel seguito vengono illustrati con esempi i diversi

ruoli svolti dalla componente ontologica. La Fig. 2 illustra con un esempio il

primo caso, cioè l'interconnessione fra distinti livelli ontologici e lessicali. I

Page 20: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

20

concetti che popolano il lessico costituiscono il livello di base: essi sono

'classificati' dalle categorie della Core Legal Ontology.

Figura 2: Interconnessione fra livelli ontologici e lessicali

Le ontologie core per il diritto intendono coprire quella parte della conoscenza

del mondo creata dalle norme, rielaborata dalla teoria giuridica e che può

essere considerata condivisa in una ampia comunità sociale (Gangemi et al.

2003a). Ad esempio, entità di conoscenza (unit of understanding) come reato,

diritto, sanzione, contratto, proprietà, testimonianza, giudice, norma ecc. sono

descritte nell'ontologia core per mezzo di proprietà/attributi: in termini formali da

insiemi di espressioni di logica del primordine. Tali descrizioni catturano gli

elementi cognitivi di senso comune sottostanti i processi di comunicazione e

possono perciò essere 'compresi' universalmente e collegati alle loro molteplici

realizzazioni linguistiche. Costituiscono al tempo stesso la struttura prototipica

di riferimento per la comparazione di concetti ed istituti nei diversi sistemi

normativi e per monitorare l'evoluzione di significato di nozioni giuridiche

attraverso l'elaborazione giurisprudenziale. Anche nel settore delle legal

ontologies esiste una ricca letteratura e varie proposte di ontologie core. In

questa sede facciamo in particolare riferimento alla Core Legal Ontology

costruita come estensione per il mondo del diritto dell'ontologia fondazionale

Dolce (Masolo et al. 2003). Dolce è un‘ontologia fondazionale, o di alto livello, in

quanto include nozioni di base ad un livello di alta astrazione e riccamente

Page 21: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

21

assiomatizzate. Per la descrizione delle ontologie formali rinviamo alla

vastissima letteratura disponibile.

Nell'esempio in Fig. 2 il concetto (synset) espresso dai termini legal evidence,

legal proof viene classificato dalle categorie ontologiche legal document e legal

description. La duplice appartenenza ontologica esprime due delle prospettive

con cui il concetto può essere inteso nel senso comune, sia come contenitore

fisico di informazioni, vale a dire un documento contenente la prova

testimoniale, o come contenuto informativo dotato di valore giuridico. Nulla

esclude che altre possibili 'viste' del medesimo concetto possano essere

rappresentate nell'ontologia, ad esempio il concetto di prova dal punto di vista

della medicina legale farà riferimento anche ad elementi del mondo fisico.

L'ontologia rimane dunque esterna al lessico come criterio ordinante in grado

di:

• rendere esplicite molteplici assunzioni di significato, non rilevate dalla

semantica lessicale, come nell'esempio sopra illustrato. Ciò consente

anche di guidare la corretta localizzazione linguistica dei concetti nella

costruzione di lessici multilingue, ad esempio nel caso in cui alla diversa

prospettiva ontologica, non evidenziata dalla glossa, corrisponda una

diversa lessicalizzazione.

• distinguere i sensi dei termini polisemici. Come è stato illustrato

nell'esempio di canone, i lessici computazionali consentono la

numerazione dei sensi (word sense) nei termini polisemici. Con la

classificazione ontologica, non è più necessaria la specificazione dei

significati contenuta nella glossa.

• arricchire le informazioni sugli elementi di conoscenza condivisi

(meaning agreement) che sottostanno ai processi cognitivi e

comunicativi di senso comune. Va notato che, a differenza dei lessici

computazionali, nelle ontologie la relazione di sussunzione fra classi e

sottoclassi (relazione ISA) è logicamente valida, perciò ogni elemento

eredita proprietà/attributi della classe superiore. Ogni classe si

differenzia dal suo genus per la presenza di ulteriori elementi di

specificità che nel linguaggio delle ontologie sono espressi come vincoli,

cioè restrizioni di significato (intenzionale) rispetto alla classe più ampia:

Page 22: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

22

ad esempio, municipality, in Fig. 2, appartiene alla classe delle legally

constructed institutions, sottoclasse delle entità sociali. Le proprietà

specifiche della classe legally constructed institution ereditate da

municipality sono: essere dipendente da norme giuridiche ed in

particolare essere costituita da norme costitutive, essere rappresentata

da un soggetto giuridico identificato da una persona fisica. Nella

ontologia Dolce, ad un livello ancora maggiore di astrattezza, i social

object sono entità che popolano la realtà sociale, che vengono percepite

e comprese dal senso comune sulla base di convenzioni sociali ed a cui

viene riconosciuta una esistenza concreta affine a quella degli oggetti

fisici (Gangemi et al. 2005).

Tutta questa conoscenza implicita, che può sembrare ridondante nello stabilire

equivalenze terminologiche, diventa però molto importante per consentire il ri-

uso, l'integrazione, l'aggiornamento della risorsa lessicale, oltre che a guidare la

costruzione di ontologie su domini giuridici ristretti (ad esempio, il diritto

d'autore, il diritto contrattuale, ecc.) o quando si voglia allineare il lessico con

l'ontologia.

Questa seconda ipotesi metodologica comporta l’interpretazione delle relazioni

lessicali in termini di relazioni logiche, in particolare la trasformazione delle

relazioni tassonomiche in relazioni classe-sottoclasse. Il passaggio richiede un

controllo manuale della consistenza, in quanto non sempre nelle tassonomie

lessicali viene rispettata la distinzione fra relazioni di sussunzione o di istanza in

senso proprio; ad es., l'Autorità per la Protezione dei dati che in un lessico può

essere considerato iponimo di Autorità, nell'ontologia è istanza di Organismo

pubblico. La Tabella 1 riporta la corrispondenza fra le relazioni WordNet e le

proprietà dell'ontologia. Per maggiori dettagli si veda il progetto OntoWordNet22,

volto ad allineare WordNet inglese all'ontologia Dolce.

22 http://www.w3.org/TR/wordnet-rdf/.

Page 23: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

23

Relazioni Wordnet Proprietà in Dolce+CLO

Hyponym/hyper/nym, instance_of, meronym

ISA (sub-class-of), instance_of, part-of, member_of, constituent-of

ogni word sense che compone il synset same_as

role, cause assiomi e proprietà del dominio

Tabella 1: La corrispondenza fra le relazioni WordN et e le proprietà dell'ontologia

Come esempio del risultato finale del processo, la Fig. 3 mostra la

rappresentazione ontologica del concetto proprietà: si noti come, a differenza

dei lessici, in cui ciascun sistema linguistico ha una struttura autonoma basata

su relazioni semantiche interlinguistiche, e collegata da relazioni

interlinguistiche di equivalenza alle altre, nell'ontologia il modello è unico e la

proprietà has-IT-name, has EN-name collega la concettualizzazione al

linguaggio.

Figura 3: La rappresentazione ontologica del concet to proprietà

Conclusioni

Il contributo intende fare il punto sulle metodologie fornite dall'Information

Technology nel trattamento del multilinguismo nei settori specialistici, in

particolare nel settore giuridico. Il tema del multilinguismo nel diritto è molto

Page 24: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

24

complesso e richiede una attenzione particolare agli aspetti culturali, storici,

sociali che sottostanno a tutti i fenomeni linguistici ed alla loro analisi. Non si

può parlare di traduzione del diritto, ed infatti non si è fatta menzione dei

progressi raggiunti dalle tecniche di traduzione automatica nel settore del

linguaggio comune e del parlato, ma di rapporti di equivalenza concettuale fra

concetti e nozioni giuridiche. L'utilizzo delle tecniche informatiche presuppone

perciò un processo di concettualizzazione manuale o semiautomatico, su cui i

modelli computazionali intervengono offrendo strutture, metodologie e linguaggi

a gradi progressivi di formalizzazione. Le scelte metodologiche dipendono dagli

obiettivi, dalla complessità del dominio, dai risultati pratici che si intendono

raggiungere.

Bibliografia

Ajani, G. e M. Ebers (a cura di) (2005) Uniform Terminology for European

Contract Law, Baden Baden: Nomos.

Ajani, G. e P. Rossi (2006) “Coerenza del diritto privato e multilinguismo”, in B.

Pozzo (a cura di) Le politiche linguistiche delle istituzioni comunitarie dopo

l'allargamento, Milano: Giuffré, 119-139.

Azzena, L. (2007) “La costruzione del principio di uguaglianza nell’ordinamento

comunitario”, Diritto pubblico comparato ed europeo 3: 1419-1440.

Bin, R. e G. Petruzzella (2005) Diritto pubblico, Torino: Giappichelli.

Calzolari, N. e A. Lenci (2004) “Linguistica Computazionale - strumenti e risorse

per il trattamento automatico della lingua”, Il mondo digitale 2: 56-64.

Cannanea, G. (2003) L'Unione europea: un ordinamento composito, Roma:

Laterza.

Cosmai, D. (2007) Tradurre per l'Unione Europea. Problematiche e strategie

operative, Milano: Hoepli.

Page 25: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

25

Costanzo, P. (2006) “Nuove tecnologie e “forma” dell’amministrazione”, in P.

Costanzo, G. De Minico e R. Zaccaria (a cura di) I tre codici della Società

dell'Informazione. Amministrazione digitale. Comunicazioni elettroniche.

Contenuti audiovisivi, Torino: Giappichelli, 4-20.

Cuocolo, F. (1999) Principi di diritto costituzionale, Milano: Giuffrè.

De Groot, G-R. (2000) “La traduzione di informazioni giuridiche”, Ars

Interpretandi 5: 133-154.

Fellbaum, C. (1998) WordNet: An electronic lexical database, Cambridge: The

MIT Press.

Fillmore, C.J. e B.T.S. Atkins (1992) “Towards a Frame-based organization of

the lexicon: the semantics of RISK and its neighbors”, in A. Lehrer e E.F. Kittay

(a cura di) Frames, Fields, and Contrasts: New Essays in Semantics and

Lexical Organization, Hillsdale: Lawrence Erlbaum, 75-102.

Francesconi, E., P. Spinosa e D. Tiscornia (2007) “A linguistic-ontological

support for multilingual legislative drafting: the DALOS Project”, in P.

Casanovas, M.A. Biasiotti, E. Francesconi e M.T. Sagri (a cura di) Proceedings

of LOAIT ’07, II Workshop on Legal Ontologies and Artificial Intelligence

Techniques, 103-112. Disponibile online: http://www.ittig.cnr.it/loait/loait07.html.

Gangemi, A., M.T. Sagri e D. Tiscornia (2003a) “Metadata for Content

Description in Legal Information”, in Proceedings of the ICAIL 2003 Workshop

on Legal Ontologies. Disponibile online: http://www.loa-cnr.it/Papers/ICAIL.pdf.

Gangemi, A., N. Guarino, C. Masolo e A. Oltramari (2003b) “Sweetening

WordNet with DOLCE”, AI Magazine 24(3): 13-24.

Gangemi, A., M.T. Sagri e D. Tiscornia (2005) “A Constructive Framework for

Legal Ontologies”, in V. Richard Benjamins, P. Casanovas, J. Breuker e A.

Gangemi (a cura di) Law and the Semantic Web, Berlin: Springer, 77-96.

Page 26: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

26

Ioratti Ferrari, E. (2005) “Lingua e diritto in Europa: multilinguismo, pluralismo

linguistico e terminologia giuridica uniforme nel diritto europeo dei contratti”,

Diritto pubblico Comparato ed europeo IV: 1549-1568.

Lesmo L., G. Boella, A. Mazzei e P. Rossi (2007) “Multilingual conceptual

dictionaries based on ontologies: analytical tools and case studies”, in G. Ajani,

G. Peruginelli, G. Sartor e D. Tiscornia (a cura di) The Multilanguage

Complexity of European Law: Methodologies in Comparison, Firenze: European

Press Academic Publishing, 179-194.

Masolo, A., S. Borgo, A. Gangemi, N. Guarino e A. Oltramari (2003)

WonderWeb Deliverable D18, Ontology Library. Disponibile online: www.loa-

cnr.it/Papers/D18.pdf.

Migliazza, M. (2002) Il diritto all'Informazione nell'Unione Europea, Milano:

Giuffrè.

Miller, G. (1995) “WordNet: A lexical database for English”, in Communications

of the ACM 38(11): 39-41.

Peters, W., M.T. Sagri, D. Tiscornia e S. Castagnoli (2006) “The LOIS Project”,

in Proceedings of the 5th International Conference on Language Resources and

Evaluation (LREC) (Genova, 23-27 maggio 2006), 1089-1094.

Peters, W., M.T. Sagri e D. Tiscornia (2007) “The Structuring of Legal

Knowledge in LOIS”, Journal of Artificial Intelligence and Law 15: 117-135.

Pozzo, B. (2006) “Multilinguismo, terminologie giuridiche e problemi di

armonizzazione del diritto privato europeo”, in B. Pozzo e V. Jacometti (a cura

di) Le politiche linguistiche delle istituzioni comunitarie dopo l'allargamento,

Milano: Giuffrè, 3-18.

----- e V. Jacometti (a cura di) (2006) Multilingualism and the Harmonisation of

European Law, The Netherlands: Kluwer Law International.

Ricoer, P. (2000) “Il paradigma della traduzione”, Ars Interpretandi 5: 1-17.

Page 27: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

27

Rossi, P. (2007) “Il diritto plurilingue europeo nella prospettiva del legislatore

comunitario e dell’interprete nazionale”, Politica del diritto 38(1): 139-147.

Roventini, A., A. Alonge, F. Bertagna, N. Calzolari, J. Cancila, C. Girardi, B.

Magnini, R. Marinelli, M. Speranza e A. Zampolli (2003) “ItalWordNet: Building a

Large Semantic Database for the Automatic Treatment of the Italian Language”,

in A. Zampolli, N. Calzolari e L. Cignoni (a cura di) Computational Linguistics in

Pisa, Special Issue of Linguistica Computazionale Vol. XVIII-XIX, Pisa-Roma:

Istituto Editoriale e Poligrafico Internazionale, 745-791.

Sacco, R. (1991) La comparaison juridique au service de la connaissance du

droit, Parigi: Economica.

----- (1995) “Negozio giuridico, circolazione del modello”, in Digesto delle

discipline privatistiche, sez. civile 12: 86-95.

----- (2000) “Lingua e diritto”, Ars Interpretandi 5: 117-134.

Sagri, M.T. (2002) “Strumenti semantici per l’accesso all’informazione giuridica:

JurWordNet”, Informatica e diritto 28(2): 185-210.

----- (2007) “Strategie per migliorare la rilevanza delle informazioni reperite.

Dalla descrizione semantica alla descrizione logica”, in G. Taddei Elmi (a cura

di) Corso di informatica giuridica, Napoli: Simone, 76-85.

-----, D. Tiscornia e F. Bertagna (2004) “Jur-WordNet“, in P. Sojka, K. Pala, P.

Smrz, C. Fellbaum e P. Vossen (a cura di) Proceedings of the Second

International WordNet Conference --- GWC 2004 (Brno, Czech Republic 20-23

gennaio 2004), 305-310.

Schena, L. e R.D. Snel Trampus (2002) (a cura di) Traduttori e giuristi a

confronto: interpretazione traducente e comparazione del discorso giuridico,

Bologna: CLUEB.

Schioppa, F. (2002) Rapporto sullo Stato dell’Unione Europea, Istituto di Studi

ed Analisi Economica, Bologna: Il Mulino.

Page 28: Le peculiarità del linguaggio giuridico. Problemi e prospettive nel ...

28

Temmerman, R., K. Kerremans e P. De Baer (2006) “Sociocognitive

terminology and Termontography”, in Proceedings of the Journées d'Etudes sur

le Traitement Automatique de la Langue Arabe (Rabat, Marocco, 5-7 giugno

2006), 290-313.

Tessuto, G. (2006) English for law. A focus on legal concepts and language,

Milano: Giappichelli.

Tiscornia, D. (2007) ”Structuring multilingual ontologies for law”, in G. Ajani, G.

Peruginelli, G. Sartor e D. Tiscornia (a cura di) The Multilanguage Complexity

of European Law: Methodologies in Comparison, Firenze: European Press

Academic Publishing, 145-162.

Vanderlinden, J. (1995) Comparer le droit, Diegem: Kluwer.

Visser, P.R.S e T. Bench Capon (1999) “Ontologies in the Design of Legal

Knowledge Systems, Towards a Library of Legal Domain Ontologies”, in

Proceedings of Jurix 99, Leuven, Belgique, 30-44.

Wroblewski, J. (2000) “Il problema della traduzione giuridica”, Ars intrepretandi

5: 155-164.

Zaccaria, G. (2003) “Testo, contesto e linguaggi settoriali nell’interpretazione

giuridica”, in A. Mariani Marini (a cura di) La lingua, la legge, la professione

forense, Giuffrè: Milano, 90-102.

----- (2006) “Tradurre e interpretare”, Ars intrepretandi 1: 197-206.