Marcello Frixione - Logica, Significato e Intelligenza Artificiale

185

description

Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Transcript of Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Page 1: Marcello Frixione - Logica, Significato e Intelligenza Artificiale
Page 2: Marcello Frixione - Logica, Significato e Intelligenza Artificiale
Page 3: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Prefazione

Questo lavoro si propone di contribuire a chiarire alcuni aspetti dei rapporti che sussistono fra le teoriefilosofiche del significato di impostazione logico-modellistica e l'intelligenza artificiale (IA) di orientamento logico. Inanni recenti alcuni filosofi del linguaggio hanno tentato di individuare una risposta a problemi difficilmente affrontabiliall'interno del paradigma logico modellistico facendo riferimento alle ricerche svolte nell'ambito della scienza cognitiva.In particolare, grande attenzione è stata dedicata ai formalismi e alle tecniche sviluppate in intelligenza artificiale.Contemporaneamente, tuttavia, l'IA, spinta dalla necessità di un maggiore rigore teorico e formale, ha adottato inmaniera sempre più massiccia strumenti di tipo logico, e della semantica model teoretica in particolare. Quindi, questidue settori di ricerca si sono sviluppati lungo linee in parte parallele, seguendo però direzioni opposte; questo hacomportato certamente una auspicabile sinergia fra i due settori, ma ha anche posto problemi che vale la pena mettere inluce: talvolta sembra che entrambe le discipline cerchino nel campo dell'altra una soluzione ai problemi che laaffliggono, dando origine in questo modo a una sorta di circolo vizioso. Lo scopo di questo lavoro consiste appuntonell'indagine e nel chiarimento di alcuni aspetti dei rapporti che sussistono fra questi due ambiti disciplinari. Taleobiettivo verrà affrontato analizzando i modelli sviluppati in IA in relazione a due settori critici per le teorie filosofichedel significato di impostazione logico-formale, vale a dire la rappresentazione del significato dei simboli primitivi extralogici (o, in altri termini, la rappresentazione del significato lessicale), e i contesti di atteggiamento proposizionale, inparticolare i contesti epistemici.

Il volume è organizzato come segue. La prima parte, articolata in tre capitoli, costituisce un inquadramentogenerale del problema. In essa vengono introdotti i concetti chiave della semantica modellistica (cap. 1), si espongono ledifficoltà del paradigma modellistico nei confronti di problemi quali la rappresentazione del significato lessicale e gliatteggiamenti proposizionali, e si esamina la recente tendenza in filosofia del linguaggio ad accostarsi all'area dellascienza cognitiva (cap. 2). Infine, viene dato un rapido inquadramento dell'IA, con particolare attenzione alla tendenzalogicista (cap. 3).

La seconda parte verte sul tema della rappresentazione del significato lessicale. Vengono analizzati i formalismiutilizzati in IA a questo scopo (in particolare frame e reti semantiche), e i loro rapporti con gli strumenti logici classici.Il cap. 4 costituisce una breve introduzione storica dei sistemi a rete semantica. Si descrive poi la possibilità diricondurre a formalismi logici opportuni i vari tipi di reti semantiche (capp. 5 e 6). Dal punto di vista dellarappresentazione lessicale, tali sistemi risultano quindi equivalenti a sistemi di postulati di significato (cap. 7). Ciòcomporta che, per un verso, il problema della rappresentazione del significato dei simboli primitivi extralogici rimangairrisolto. Per altri aspetti, questi sistemi di rappresentazione possono risultare più flessibili dei postulati di significatoclassici, ammettendo ad esempio la possibilità di rappresentare eccezioni nella caratterizzazione dei concetti lessicali(come nel caso delle logiche non monotòne).

La terza parte tratta il problema dell'onniscienza logica nelle logiche epistemiche. Dapprima vengono descritte lelogiche epistemiche tradizionali, con associata la semantica a mondi possibili classica (cap. 8). Nel seguito, vengonoanalizzate le varie soluzioni proposte per il problema dell'onniscienza logica nell'IA di impostazione logicista. Vengonopassati in rassegna i sistemi basati sull'introduzione di elementi sintattici nel modello (cap. 9), e i sistemi basati sull'usodi strutture semantiche non classiche (cap. 10). Il cap. 11 è dedicato al lavoro di Fagin e Halpern, che sintetizzano granparte delle ricerche svolte in precedenza. Essi individuano cause diverse per il problema dell'onniscienza logica; moltedelle logiche proposte non costituirebbero quindi soluzioni alternative, ma risposte ad aspetti differenti del problema.

Nella sezione finale (cap. 12) si traggono alcune conclusioni globali del lavoro svolto. Gli strumenti utilizzatinell'ambito della IA di impostazione logica sono omogenei, dal punto di vista formale, a quelli della semanticamodellistica di tipo logico (basti pensare, ad esempio, che la maggior parte delle proposte relative al problemadell'onniscienza logica sono state sviluppate estendendo la semantica kripkeana tradizionale). Esiste quindi unaprofonda continuità fra il programma modellistico in filosofia del linguaggio e l'IA logicista. Tuttavia, quest'ultima haprodotto risultati e sviluppato linee di ricerca che in molti casi risultano innovativi rispetto ai risultati dei filosofi dellinguaggio. In particolare, l'IA ha posto l'enfasi sulla necessità di modelli logici delle capacità inferenziali di soggettifiniti e limitati, sia dal punto di vista delle risorse computazionali che dell'informazione disponibile. Questo ha fatto sìche venissero sviluppati, all'interno di un quadro unitario di tipo logico, strumenti che sono rilevanti per aspetti diversidi una teoria del significato: non solo per una teoria del significato intesa in quanto specificazione delle relazioni astrattefra linguaggio e mondo, ma anche per una teoria della competenza semantica, e per una teoria della comprensione.

Dedico questo libro alla memoria di Eduardo R. Caianiello, che fu pioniere e maestro dello studiocomputazionale della mente, e il cui aiuto mi è stato prezioso nel completamento di questo lavoro. Ringrazio il prof.Evandro Agazzi che ha reso possibile la pubblicazione di questo volume, e il prof. Dario Palladino che ha seguito davicino il mio lavoro in tutte le sue fasi. Ringrazio inoltre Roberto Cordeschi, Vanni Criscuolo, Diego Marconi e CarloPenco per avermi aiutato con attente letture del manoscritto e con proficue discussioni.

Page 4: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

1. Lo sviluppo della semantica modellistica: da Frege a Montague1.1 L'eredità di Frege

La semantica modellistica, o semantica model teoretica, costituisce il paradigma dominante nello studio formaledel significato nell'ambito della filosofia del linguaggio di tradizione analitica. Essa si basa sull'impiego di strumenti ditipo logico matematico, sviluppati nel corso del nostro secolo da studiosi quali Alfred Tarski, Rudolph Carnap, SaulKripke e Richard Montague. Gli assunti di partenza su cui si fonda tale paradigma hanno origine in un certo numero ditesi dovute essenzialmente a Gottlob Frege. In questo paragrafo verranno esposte tali tesi (distinzione senso/riferimento,antipsicologismo, composizionalità del significato), esaminando come da esse abbia preso le mosse la tradizione logico-modellistica successiva. Lo scopo tuttavia non è quello di fornire una visione esaustiva del contributo di Frege allosviluppo della semantica formale. Non si renderà quindi giustizia alla profondità e alla complessità dei temi fregeani. Cilimiteremo piuttosto ad esporre per sommi capi gli elementi che utilizzeremo nel seguito di questo lavoro. Su temitalmente complessi e stratificati ogni esposizione sintetica rischia di risultare schematica e arbitraria. D'altra parte, qui ciinteressa non tanto ricostruire il pensiero fregeano o l'evoluzione della semantica formale a partire da esso, quantopiuttosto riassumere la versione canonica, accettata nella tradizione semantico formale, di certi concetti e di certistrumenti fondamentali. Per un'esposizione più dettagliata, si vedano ad esempio Casalegno (1992) o Penco (1993).

La teoria fregeana presuppone due livelli di entità semantiche: ad ogni espressione linguistica (nomi, predicati,enunciati, eccetera) sono associati un senso (Sinn) e un riferimento (Bedeutung)1 (Frege 1892). In generale, ilriferimento di un'espressione corrisponde all'entità extra linguistica cui l'espressione stessa si riferisce, a ciò che essadenota. Il senso di un'espressione è definito da Frege come il modo in cui il riferimento di tale espressione è dato;ovvero come la maniera in cui esso può essere pensato. In altri termini, i sensi per Frege sono entità concettuali checonnettono i vari costrutti linguistici al loro riferimento. Come ciò avvenga può essere chiarito esaminando come sonocaratterizzati senso e riferimento rispetto alle varie categorie di espressioni linguistiche.

Iniziamo con i termini singolari, ossia da quella classe di espressioni che comprende nomi propri, come "JamesJoyce", "Parigi" o "il Sole", e descrizioni definite, ossia descrizioni cui corrisponde al massimo un solo oggetto, come"l'attuale pontefice", o "la montagna più alta". Frege non distingue fra nomi propri in senso stretto e descrizioni definite,ma utilizza il termine "nomi propri" per indicare entrambi. Ciò che caratterizza i termini singolari è il fatto che il lororiferimento, ciò che essi denotano, è costituito da un oggetto individuale. Il riferimento di un nome proprio è costituitodall'oggetto di cui esso è il nome, e il riferimento di una descrizione definita è costituito dall'oggetto cui essa si applica.Per quanto concerne il senso di un termine singolare, esso può essere caratterizzato come un criterio che consenta diidentificare il riferimento del termine stesso. Ciò è molto plausibile nel caso delle descrizioni definite: una descrizionelinguistica come "la montagna più alta" fornisce un criterio per individuare l'oggetto cui essa si riferisce: essa denotaquell'oggetto che gode della proprietà di essere la montagna più alta. I nomi propri in senso stretto si comportanosecondo Frege come una sorta di descrizioni definite "nascoste". Il senso di un nome proprio in senso stretto come"James Joyce" potrebbe essere parafrasato da una descrizione del tipo "lo scrittore autore dell'Ulysses". Queste posizionisaranno in seguito oggetto di aspri dibattiti filosofici (si vedano più oltre i cenni alla teoria dei nomi propri comedesignatori rigidi); tuttavia noi non approfondiremo tali problemi in questa sede. Abbiamo detto che il senso diun'espressione linguistica può essere caratterizzato come il modo in cui ne viene dato il riferimento. Ne consegue chedue espressioni aventi lo stesso senso devono necessariamente avere lo stesso riferimento. Non vale tuttavia di norma ilcontrario: due espressioni possono avere lo stesso riferimento, senza che tuttavia il loro senso sia lo stesso. Questo valeper espressioni di ogni categoria linguistica. L'esempio più noto riportato da Frege riguarda tuttavia i termini singolari.Si considerino le due descrizioni definite "la stella del mattino" e "la stella della sera". Esse sono dotate chiaramente diun senso diverso: il senso di "la stella del mattino" potrebbe essere parafrasato come "l'ultimo astro che scompare dallavolta celeste dopo il sorgere del sole", mentre il senso di "la stella della sera" può essere parafrasato come "il primoastro che compare dopo il tramonto". Tuttavia esse hanno lo stesso riferimento: entrambe denotano il pianeta Venere.

Per quanto riguarda i predicati, il riferimento di un predicato secondo Frege è un concetto. Un concetto per Fregeè una funzione che assume come argomenti individui e restituisce come valori dei valori di verità (ossia, il vero o ilfalso). Si consideri ad esempio il predicato "cane". Il concetto che costituisce il riferimento di "cane" sarà una funzioneφcane ad un argomento, tale che, per ogni oggetto x, se x è un cane, allora φcane(x) avrà come valore il vero, altrimenti, sex non è un cane, avrà come valore il falso. E' evidente che, dato un generico predicato P ad un argomento, la funzioneφP costituisce quella che, nella terminologia attuale, si chiamerebbe la funzione caratteristica dell'insieme di oggetti chegodono della proprietà di essere un P. Il tutto può essere facilmente generalizzato a predicati a più di un argomento. Siconsideri ad esempio una relazione a due argomenti R. Il concetto corrispondente a R è la funzione φR a due argomenti,tale che, per ogni coppia (x,y), φR(x,y) è uguale al vero se e soltanto se x e y stanno nella relazione R, ed è uguale al falsoaltrimenti. Il senso di un predicato invece è il modo in cui viene pensato un concetto. Abbiamo visto che, per i predicati

1Abbiamo scelto di tradurre il termine Bedeutung con riferimento anziché, letteralmente, con significato, in quantoquesto è l'uso consolidatosi nella terminologia filosofica successiva; rispetto alla Bedeutung fregeana il terminesignificato ha mantenuto una connotazione più generale e meno tecnica.

Page 5: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

2

a un argomento, il concetto denotato è una funzione da individui a valori di verità. Il senso corrispondente si puòcaratterizzare come il modo per calcolare i valori di tale funzione, come una specie di regola che, per ogni argomento,consente di ottenere il valore corrispondente. Consideriamo ad esempio due predicati come "bipede implume" e"animale razionale". Essi denotano i due concetti φbipede implume_ e φanimale razionale_ che possiamo assumere sianoequivalenti: qualcosa è un bipede implume se e soltanto se è un animale razionale. Dunque, in quanto funzioni daindividui a valori di verità sono identici. "Animale razionale" e "bipede implume" hanno quindi lo stesso riferimento.Tuttavia, essi differiscono rispetto al senso. La regola che consente di calcolare i valori di φbipede implume_ è qualcosa deltipo "se l'argomento è un essere con due piedi, e non ha le piume, allora il valore è il vero, altrimenti è il falso", mentrela regola che consente di calcolare i valori di φanimale razionale_ è "se l'argomento è un essere animato dotato di ragioneallora il valore è il vero, altrimenti è il falso". Che questi sensi siano diversi è evidente se si considera che, in unasituazione diversa da quella del mondo reale, essi potrebbero dare luogo a concetti, ossia a denotazioni, diversi. Adesempio, nel paese degli Houyhnhnm (nei viaggi di Gulliver) l'insieme degli animali razionali comprenderebbe i cavalli,che, ovviamente, non sarebbero compresi nell'insieme dei bipedi implumi; nel cretaceo l'insieme dei bipedi implumicomprendeva il Tyrannosaurus rex, che in quanto a razionalità lasciava certamente a desiderare.

Consideriamo infine gli enunciati. La caratterizzazione fregeana del riferimento degli enunciati, sebbene possaapparire di primo acchito poco intuitiva, si è rivelata in seguito estremamente fertile in tutta la tradizione logico formale.Il riferimento di un enunciato è, per Frege, il suo valore di verità. Secondo Frege il vero e il falso sono oggetti di tipologico; tutti gli enunciati veri denotano il valore di verità vero, mentre tutti gli enunciati falsi denotano il valore di veritàfalso. Il motivo per cui i valori di verità vengono posti sul piano del riferimento, ossia, ad esempio, sullo stesso pianodell'oggetto denominato da un termine singolare, viene motivato da Frege in base alla considerazione chel'identificazione dell'oggetto denotato da un termine singolare e l'identificazione del valore di verità di un enunciato sicollocano allo stesso livello di analisi semantica: di norma si è interessati a ciò che un termine denota nella misura in cuisi vuole stabilire il valore di verità di un enunciato in cui esso compare, e la determinazione del valore di verità di unenunciato dipende dall'identificazione del riferimento delle espressioni che in esso compaiono. Il fatto che tutti glienunciati veri da un lato, e tutti gli enunciati falsi dall'altro, siano dotati dello stesso riferimento sembrerebbecomportare un totale appiattimento del contenuto informativo dei diversi enunciati. Tale contenuto informativo vienetuttavia recuperato a livello di senso. Si è già detto che espressioni con uguale riferimento possono avere senso diverso.Questo è quanto accade con due enunciati di diverso "contenuto", ma con lo stesso valore di verità: ad esempio dueenunciati come "2 +2 = 4" e "La capitale della Spagna è Madrid" hanno lo stesso riferimento (sono entrambi veri), masono dotati di senso diverso. Il senso di un enunciato viene detto da Frege il pensiero associato a quell'enunciato. Se, ingenerale, il senso di un'espressione viene definito come il modo in cui ne è dato il riferimento, allora il pensieroassociato a un enunciato è il modo in cui è dato il valore di verità di un enunciato. Ossia, dato un enunciato p, possiamoimmaginare il pensiero associato a p come qualcosa che ci dica come deve essere il mondo perché p sia vero. Ossia,utilizzando una terminologia posteriore all'opera di Frege, potremmo dire che il senso associato a un enunciato consistenelle sue condizioni di verità, ossia conoscere il senso di un enunciato vuole dire conoscere le condizioni che devonoessere soddisfatte perché l'enunciato sia vero.

Un ulteriore assunto della teoria semantica fregeana che ha fortemente influenzato tutta la tradizione filosoficasuccessiva è costituito dal suo antipsicologismo. I sensi non devono essere confusi con entità di tipo mentale2. Essi sonooggetti di natura logica e non psicologica. Il senso di un termine singolare o di un predicato non è l'immagine mentale, ola rappresentazione che il parlante associa al termine. Le rappresentazioni mentali infatti sono soggettive, dipendonodalla storia di ciascun individuo, dalle sue esperienze, dalle informazioni di cui dispone. Variano quindi da individuo aindividuo, e, in uno stesso individuo, sono diverse in momenti diversi e in fasi diverse della sua vita. Sono inoltreindissolubilmente legate ad elementi di ordine emotivo. Infine, sono entità di tipo eminentemente privato, accessibiliesclusivamente a chi ne è il portatore e non comunicabili intersoggettivamente. Viceversa i sensi devono essere garantidell'uso del linguaggio in quanto fenomeno intersogettivo. Devono essere quindi intersoggettivamente condivisibili. PerFrege, il fatto che due individui comprendano e usino lo stesso linguaggio può essere spiegato esclusivamentepostulando il fatto che entrambi riescano ad accedere a un patrimonio comune di sensi. Da ciò per Frege segue la naturaoggettiva del senso. "Il senso non costituisce invero [...] qualcosa di inscindibile dal singolo individuo, ma può formareil possesso comune di molti. Che sia così, ce lo prova l'esistenza di un patrimonio di pensieri comuni all'umanità,patrimonio di pensieri che si trasmette di generazione in generazione" (Frege 1892). O ancora: "con il termine 'pensiero'intendo non l'atto soggettivo del pensare, ma il suo contenuto oggettivo che può costituire il possesso comune di molti"(Frege 1892, p. 383 della trad. it. 1965). La conclusione è che i pensieri, i sensi, non sono né oggetti del mondo esterno,né rappresentazioni mentali, bensì sono entità che esistono in un "terzo regno" di natura platonica (Frege 1918). L'atto dipensare comporta operazioni mentali individuali, il cui fine è tuttavia quello di mettere in contatto la mente con i sensioggettivi del terzo regno.

2L'antipsicologismo di Frege rispetto alla semantica è strettamente collegato al suo rifiuto di una fondazionepsicologistica della matematica, e di una definizione in termini mentali degli enti matematici (Frege 1884).

Page 6: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

3

Infine, un ulteriore elemento centrale della semantica fregeana va identificato nell'assunzione dellacomposizionalità del significato, in base al quale il significato di ogni espressione sintatticamente complessa, sia alivello di senso che di riferimento, può essere ottenuto componendo i significati (sensi o riferimenti) delle espressioniche la costituiscono. O, in altri termini, il significato delle espressioni linguistiche complesse è funzione della lorostruttura sintattica e del significato dei componenti, sia a livello di senso, sia a livello di riferimento. Una formulazionepiù precisa del principio di composizionalità del significato è la seguente:

data un'espressione complessa e in cui compaia come componente un'espressione f, sostituendo a fun'espressione f' dotata dello stesso senso (riferimento) di f, si ottiene un'espressione e' il cui senso(riferimento) coincide con quello di e.

Un corollario del principio di composizionalità per i riferimenti è il principio di sostitutività degli identici salvaveritate, in base al quale sostituendo in un enunciato a una certa espressione un'altra espressione con uguale riferimento,il valore di verità dell'enunciato non cambia. Il principio di composizionalità del significato consente a Frege di rendereconto di quella che oggi chiameremmo "capacità generativa" delle lingue, cioè della capacità di esprimere un numeropotenzialmente infinito di contenuti a partire da un numero finito e limitato di espressioni base:

Le prestazioni della lingua sono veramente sorprendenti: esprimere un immenso numero di pensiericon poche sillabe - o addirittura trovare il modo di dare a un pensiero, che un terrestre ha or ora afferratoper la prima volta, una veste che permetta che un altro, cui esso è del tutto nuovo, lo riconosca. Ciò nonsarebbe possibile se non potessimo distinguere nel pensiero delle parti alle quali corrispondono partidell'enunciato, di modo che la costruzione dell'enunciato possa valere come immagine della costruzionedel pensiero. [...]

Se si considera quindi il pensiero come composto di parti semplici e se si fanno inoltrecorrispondere a esse certe parti semplici dell'enunciato, diviene comprensibile come si possa costruire unagrande molteplicità di enunciati cui corrisponda, di nuovo, una grande molteplicità di pensieri. (Frege1923 p. 99 della trad. it.)

Il principio di composizionalità, così come è stato formulato più sopra, fallisce nei cosiddetti contesti opachi, oindiretti. Esempi di contesti indiretti sono i contesti modali aletici (quelli generati da espressioni come "è necessario che..." o "è possibile che ..."), i contesti temporali (come "in passato era vero che ...." o "fra una settimana sarà vero che....") o i contesti di atteggiamento proposizionale, come ad esempio i contesti epistemici (quelli generati dai verbi"sapere" e "credere", come nelle espressioni "Tizio sa che ...." o "Sempronio crede che ...."). In questi contesti ilprincipio di sostitutività come è stato sopra formulato di norma non vale. Si consideri un enunciato modale vero come"Necessariamente, Werner Herzog è Werner Herzog". In esso, non è possibile sostituire salva veritate un'occorrenza di"Werner Herzog" con un altro termine singolare di uguale riferimento, come ad esempio "il regista di Aguirre, furore diDio". Infatti, l'enunciato che ne risulterebbe: "Necessariamente, Werner Herzog è il regista di Aguirre furore di Dio" èpresumibilmente falso. Analoghe considerazioni valgono per i contesti temporali: "Roma" e "la capitale d'Italia" sonotermini singolari con lo stesso riferimento. Tuttavia, sostituendoli nell'enunciato (vero) "Nel 1869 la capitale d'Italia eraFirenze" si otterrebbe "Nel 1869 Roma era Firenze". O ancora, per quanto riguarda i contesti epistemici, due enunciaticome "Giorgio crede che Roma sia la capitale d'Italia" e "Giorgio crede che Frege sia l'autore di Über Sinn undBedeutung" possono certamente avere riferimenti (vale a dire, valori di verità) diversi, sebbene il secondo sia statoottenuto dal primo mediante sostituzione di enunciati con lo stesso valore di verità.

L'intuizione fregeana fu che, nel determinare il riferimento di un'espressione nella quale figuri un contestoindiretto, entrassero in gioco i sensi delle espressioni che occorrono all'interno del contesto stesso. Più precisamente, peri contesti indiretti varrebbe un vincolo più forte al principio di sostitutibilità: data un'espressione e in cui compaia uncontesto indiretto, perché resti invariato il riferimento di e possono essere sostituite nell'ambito del contesto indirettoesclusivamente espressioni dotate dello stesso senso. Frege postulò che, nell'ambito dei contesti indiretti, le varieespressioni avessero come riferimento il loro senso, anziché il loro riferimento usuale. Questo gli consentì disalvaguardare il principio di composizionalità nella sua formulazione più generale.

1.2 La formalizzazione del concetto di riferimento: il contributo di Tarski

Una formalizzazione del concetto fregeano di riferimento rispetto ai linguaggi logici del primo ordine è statafornita dal logico polacco Alfred Tarski nel corso degli anni trenta3. L'interesse di Tarski era rivolto esclusivamente ailinguaggi formali. Tuttavia, le tecniche da lui elaborate sono state in seguito estese allo studio del linguaggio naturale. Ilavori di Tarski rappresentano l'atto di nascita della semantica di tipo logico-formale basata su strumenti e metodi diteoria degli insiemi, di quella cioè che in seguito verrà detta semantica modellistica (o semantica model-teoretica), in 3Gli scritti fondamentali di Tarski su questi argomenti sono compresi in (Tarski 1956).

Page 7: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

4

quanto fondata sulla nozione chiave di modello. Storicamente, il concetto di modello è successivo ai primi lavoritarskiani, nei quali esso può essere individuato solo in maniera implicita. Tuttavia, esso ha avuto un ruolo centrale intutti gli sviluppi successivi che trassero origine dall'opera di Tarski. Per questa ragione, qui esporremo brevemente irisultati di Tarski degli anni trenta utilizzando la terminologia modellistica contemporanea.

Introduciamo innanzi tutto un linguaggio del primo ordine L definito come segue.

L'alfabeto di L sia formato dai seguenti insiemi di simboli:

a) un insieme al più numerabile di costanti individuali a, b, c, c1 , c2 , ...;b) un insieme al più numerabile di costanti predicative a n argomenti P1

1, ..., Pn1, ..., Pi

1 , ..., Pmi , ... (dove Pj

m è laj-esima costante predicativa a m argomenti);c) un insieme numerabile di variabili individuali x, y, z, x1 , x2 , .....;d) i connettivi logici ∧ (congiunzione), ∨ (disgiunzione), → (implicazione materiale) e ¬ (negazione), ilquantificatore universale ∀, e il quantificatore esistenziale ∃;e) le parentesi tonde e la virgola come segni ausiliari.

Nel seguito, per comodità, utilizzeremo anche altre costanti individuali e predicative oltre a quelle sopra introdotte, incui la notazione suggerisca direttamente il significato intuitivo (ad es. Fido, Cesare, cane, padre_di, bipede, e così via)4.

Definiamo l'insieme dei termini come l'unione degli insiemi delle variabili e delle costanti individuali. Dato unpredicato Pi

n a n argomenti, e una n-pla (t1 , ..., tn ) di termini del linguaggio, Pin (t1 , ..., tn ) è una formula atomica di L.

Definiamo ora l'insieme delle formule di L come il più piccolo insieme per cui valgano le seguenti regole:

1) ogni formula atomica è una formula;2) se α eβ sono formule, allora (α ∧ β) è una formula;3) se α eβ sono formule, allora (α ∨ β) è una formula;4) se α e β sono formule, allora (α → β) è una formula;5) se α è una formula, allora (¬ α) è una formula;6) se α è una formula e x è una variabile, allora (∀x α) è una formula;7) se α è una formula e x è una variabile, allora (∃x α) è una formula.5

Prima di procedere, si noti che, in L, le costanti individuali equivalgono a quelli che nel paragrafo precedenteabbiamo chiamato termini singolari (più precisamente, esse corrispondono ai nomi propri in senso stretto - il linguaggioL non offre la possibilità di introdurre descrizioni definite). Per quanto riguarda gli enunciati, essi corrispondono in L aun sottoinsieme dell'insieme delle formule, vale a dire alle formule chiuse. Si dicono formule chiuse quelle in cui tutte levariabili compaiono nell'ambito di un quantificatore (fra le formule chiuse sono comprese quindi quelle in cui noncompare alcuna variabile). Sono formule chiuse, ad esempio, P3

1(a), ∀x( P21(x)), mentre non lo sono P5

1(y) e ∀x1( P3

2 ( x1 , x5)).A questo punto, vediamo come viene caratterizzato il riferimento delle varie espressioni di L in base a una

semantica di tipo tarskiano. Dobbiamo in primo luogo introdurre un dominio, ossia un universo del discorso su cui illinguaggio di L sia interpretato. In secondo luogo bisogna specificare in che modo le varie espressioni di L vadanointerpretate su tale dominio, quale debba essere cioè il loro riferimento. Il dominio consiste in un insieme non vuoto Ddi individui. Per specificare il riferimento delle espressioni di L viene introdotta una funzione interpretazione ϕ. Si trattadi una funzione ad un posto, che assume come argomenti espressioni di L, e associa loro un riferimento nel dominio D.In particolare, ϕ associa un riferimento alle costanti individuali e predicative del linguaggio L, consentendo di calcolareil riferimento delle formule chiuse. Chiameremo una interpretazione del linguaggio L una coppia ordinata I = (D, ϕ),dove D è un dominio e ϕ una funzione interpretazione.

Vediamo come si comporta nei diversi casi la funzione interpretazione. Per quanto riguarda le costantiindividuali, il riferimento che ϕ associa a ciascuna di esse è un elemento del dominio D. Ossia, per ogni costanteindividuale c di L, ϕ[c] ∈ D. Per quanto riguarda le lettere predicative, a ogni lettera predicativa a n argomenti, ϕassocia come riferimento un insieme di n-ple di elementi di D. Così, se Pi

1 è una lettera predicativa a un argomento, ilsuo riferimento sarà un sottoinsieme del dominio; cioè ϕ[ Pi

1] ⊆ D. Intuitivamente, ϕ[ Pi1] è l'insieme degli individui di

cui è vero Pi1. Ad esempio, dato un simbolo predicativo ad un argomento cane dall'ovvio significato intuitivo,

nell'interpretazione intesa ϕ[cane] dovrebbe essere l'insieme dei cani. In generale, ϕ[ Pin ] ⊆ Dn . ϕ[ Pi

n ] è l'insieme delle

4Per semplicità, abbiamo preferito non introdurre simboli di funzione nel linguaggio.5Alcune parentesi possono essere omesse adottando opportune convenzioni sull'ambito dei vari connettivi.

Page 8: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

5

n-ple tali che, per ciascuna n-pla, i suoi elementi stanno nella relazione rappresentata da Pin . Così, dato il simbolo

predicativo a due argomenti padre_di, ϕ[padre_di] sarà l'insieme di coppie (ordinate) di elementi di D tali che il primoelemento è padre del secondo. Nel caso di enunciati, ossia di formula chiuse, la funzione interpretazione assegna lorocome riferimento un valore di verità. Così, per ogni formula chiusa α di L, si ha che ϕ[α] ∈ {v, f}.

Per quanto riguarda termini singolari ed enunciati, la formalizzazione model teoretica coincide con la propostafregeana: i termini singolari denotano singoli individui del dominio, e gli enunciati denotano valori di verità.Leggermente diversa è la situazione per i predicati. Per Tarski, essi denotano insiemi di n-ple di oggetti del dominio,mentre abbiamo visto che, secondo Frege, essi si riferiscono a concetti, ossia a funzioni da n-ple di oggetti a valori diverità. Dal punto di vista tecnico dell'attuale teoria degli insiemi, tuttavia, tali soluzioni sono assolutamente equivalenti.Prendiamo ad esempio un simbolo predicativo ad un argomento come cane. Nella formulazione modellistica essodenota l'insieme dei cani del dominio, mentre, per Frege, esso denota la funzione φcane descritta nel paragrafoprecedente, che, abbiamo detto, costituisce la funzione caratteristica dell'insieme dei cani nel dominio. Ora, è noto chein teoria degli insiemi una formulazione in termini di insiemi è completamente equivalente a una formulazione in terminidi funzioni caratteristiche. In base alle posizioni di Frege i concetti di insieme e di funzione hanno statuti filosoficiprofondamente diversi (Frege 1891; si veda anche Casalegno 1992); tuttavia tale distinzione non ha avuto seguito neglisviluppi formali successivi, e possiamo quindi considerare la formalizzazione tarskiana come una ricostruzioneragionevolmente fedele delle posizioni fregeane.

Sin qui, abbiamo visto che tipo di riferimento viene associato dalla semantica tarskiana alle varie categorie diespressioni di L. Vediamo ora come viene determinato il riferimento effettivo delle varie espressioni. Ciò si ottienemediante una serie di regole che, assunto come noto il riferimento dei componenti, permettono di calcolare il riferimentodelle espressioni complesse costruite a partire da tali componenti. Esporremo qui le regole per l'interpretazione di unsottoinsieme di L. In particolare, per semplicità, non prenderemo in considerazione le regole che concernono le formulequantificate. In questo modo escludiamo dalla nostra trattazione il contributo tecnico più originale e rilevante dellateoria tarskiana, vale a dire la nozione di soddisfacimento di una formula rispetto a un'assegnazione di valori allevariabili. Gli altri aspetti della teoria si limitano a rendere esplicite idee già presenti in Frege, o nel Wittgenstein delTractatus. Tuttavia, il trattamento della quantificazione richiederebbe uno spazio maggiore a causa della necessità diintrodurre un bagaglio tecnico piuttosto sofisticato, e non risulta necessario per la nostra argomentazione. Ai nostri fini èsufficiente illustrare lo spirito generale dell'operazione tarskiana.

1) Data una formula atomica del tipo Pin (c1 , ..., cn ), dove c1 , ..., cn sono costanti individuali di L, Pi

n (c1 , ..., cn )

è vera se e soltanto se l'n-pla costituita dai riferimenti di c1 , ..., cn appartiene al riferimento di Pin ; in altri termini

si ha che:

ϕ[ Pin (c1 , ..., cn )] = v se (ϕ[c1 ], ..., ϕ[cn ]) ∈ ϕ[ Pi

n ]e

ϕ[ Pin (c1 , ..., cn )] = f se (ϕ[c1 ], ..., ϕ[cn ])∉ ϕ[ Pi

n ].

(Quindi, ad esempio, una formula del tipo cane(fido) è vera se e soltanto se ϕ[fido] ∈ ϕ[cane], se cioè ilriferimento di fido appartiene al riferimento di cane).

2) Date due formule chiuse α e β di L,

ϕ[α ∧ β] = v sse ϕ[α] = v e ϕ[β] = v.

3) Date due formule chiuse α e β di L,

ϕ[α ∨ β] = v sse ϕ[α] = v oppure ϕ[β] = v.

4) Date due formule chiuse α e β di L,

ϕ[α → β] = v sse ϕ[α] = f oppure ϕ[β] = v.

5) Date una formula chiusa α di L,

ϕ[¬ α] = v sse ϕ[α] = f.

Page 9: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

6

Data una formula chiusa α di L e una interpretazione I, si dice che I è un modello di α (in simboli, I α), se esoltanto se α risulta vera rispetto a I. Dato un insieme Γ di formule di L, si dice che una interpretazione I è un modellodi Γ se e soltanto se I è un modello di tutte le formule di Γ. Si dice che una formula α (un insieme di formule Γ) èsoddisfacibile se e soltanto se esiste almeno un modello di α (di Γ). Una formula α è valida se e soltanto se ogniinterpretazione è un modello di α. (In simboli, che α è valida si indica con α). Si dice che una formula β èconseguenza logica di una formula α (in simboli, α β) se e soltanto se ogni modello di α è a sua volta anche unmodello di β. Si può facilmente mostrare che β è conseguenza logica di α se e soltanto se α → β è una formula valida.Si dice che β è conseguenza logica di un insieme di formule Γ (in simboli, Γ β) se e soltanto se ogni modello di Γ èanche un modello di β.

A questo punto, possiamo anche introdurre sinteticamente i concetti di correttezza e di completezza per unsistema formale. Sia F un sistema formale definito a partire dal linguaggio L (aggiungendo a L un insieme di assiomi -eventualmente vuoto - e un insieme di regole di inferenza). Sia F la relazione di derivabilità in F6. Diremo che F ècorretto se e soltanto se ogni formula dimostrabile in F è valida (ossia se, per ogni formula α, se F α allora α).Diremo che F è completo se ogni formula valida è derivabile in F (ossia se, per ogni formula α, se α allora F α).

I putni 1)-5) della precedente definizione rispettano il requisito della composizionalità del significato: ogniclausola definisce il riferimento di un'espressione complessa esclusivamente come funzione del riferimento dei suoicomponenti. Vale quindi il criterio secondo cui, in un'espressione complessa, sostituendo a un componente un'altraespressione con lo stesso riferimento, il riferimento dell'espressione di partenza non cambia. Ad esempio, in unadisgiunzione del tipo α ∨ β, sostituendo a α una formula con lo stesso valore di verità, il valore di verità delladisgiunzione resta invariato. Allo stesso modo, in una formula atomica del tipo P1(ai ), sostituendo a P1 (oppure ad ai )una costante predicativa (o una costante individuale) dotata dello stesso riferimento, il valore di verità della formularimane lo stesso. La composizionalità del significato è collegata a una importante caratteristica della precedentedefinizione. Sia la definizione sintattica dell'insieme delle formula di L che le regole della definizione semantica hannouna struttura di tipo ricorsivo. In entrambi i casi la prima clausola costituisce la base della definizione, mentre leclausole seguenti costituiscono i vari casi del passo induttivo. Benché la nostra definizione semantica sia incompleta(manca sostanzialmente il caso delle formule quantificate e abbiamo ignorato, in generale, il problema della formule nonchiuse), si può notare una "somiglianza" fra le clausole che definiscono la sintassi e quelle relative alla semantica. Insostanza, le regole semantiche "lavorano in parallelo" a quelle sintattiche: il riferimento di un'espressione complessaviene costruito a partire dal riferimento dei suoi componenti atomici sulla base della struttura dell'espressione stessa. E'questo che garantisce che la composizionalità sia rispettata.

1.3 Intensioni e Mondi Possibili

La semantica di tipo tarskiano non riesce a rendere conto dei contesti indiretti, come ad esempio i contestigenerati da espressioni modali aletiche ("è possibile che ...", "è necessario che ...") o i contesti temporali. Come abbiamovisto, già Frege aveva messo in luce che, per fornire un trattamento semantico di contesti di questo genere, non erasufficiente prendere in considerazione il riferimento delle espressioni linguistiche. In particolare, in tali contesti fallisceil criterio di sostitutibilità degli identici salva veritate. Il riferimento di espressioni in cui compaiano contesti indirettinon dipende composizionalmente dal riferimento dei suoi componenti. Per studiare il riferimento di espressioni diquesto genere, una analisi semantica a livello esclusivamente denotazionale non è sufficiente. E' quindi ovvio che lasemantica tarskiana, in quanto formalizzazione del riferimento, non sia adeguata allo scopo. Intuitivamente,l'insufficienza della semantica tarskiana nel trattamento semantico dei contesti indiretti può essere ricondotta al fatto cheessa prende in considerazione come rilevante un solo stato di cose alla volta, interpreta cioè tutte le espressioni sullabase di un modello di un singolo stato del mondo. Un modello tarskiano è un modello del "mondo reale". Di normainvece i contesti indiretti fanno riferimento a stati di cose alternativi, o comunque differenti, dallo stato del mondo reale.Ciò è particolarmente evidente nel caso dei contesti temporali. Si consideri un enunciato come "La capitale d'Italia èRoma, e nel 1869 era Firenze". E' evidente che per rendere conto della verità di questo enunciato non è sufficienteprendere in considerazione un singolo stato del mondo, quello reale, ma si deve considerare anche la situazione cui fariferimento il contesto temporale, cioè lo stato del mondo come era nel 1869. Qualcosa di simile vale per i contestimodali. La verità di un enunciato come "sarebbe possibile che l'Italia fosse un regno" non dipende ovviamente soltantoda come vanno le cose oggi nel mondo, ma fa riferimento ad altri stati di cose diversi da quello reale. Così, perché sia 6Intuitivamente, si dice che una formula α è derivabile in F a partire da un insieme Γ di formule (in simboli, Γ F α) see soltanto se è possibile ottenere α applicando le regole di F a partire dagli assiomi di F e dalle formule in Γ. Unformula α si dice dimostrabile in F (in simboli, F α) se e soltanto se è possibile ottenerla applicando le regole di F apartire esclusivamente dagli assiomi di F. In un certo senso, la nozione di derivabilità è il corrispettivo sintattico dellanozione semantica di conseguenza logica, mentre la nozione di dimostrabilità è il corrispettivo sintattico della nozionesemantica di validità.

Page 10: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

7

vero "E' necessario che 2+2=4" non è sufficiente che "2+2=4" sia vero nel mondo reale. Bisogna che esso sia vero intutti quegli stati del mondo che, in qualche senso, vengono ritenuti possibili.

Una formalizzazione di questa idea intuitiva si è avuta con lo sviluppo della semantica dei mondi possibili. Sitratta di una generalizzazione della semantica tarskiana, in cui gli strumenti della teoria dei modelli vengono estesi altrattamento dei contesti indiretti. L'idea di mondo possibile, di origine leibniziana, è stata ripresa da Carnap, in Meaningand Necessity (Carnap 1947) per fornire un trattamento formale delle modalità aletiche ("è possibile ...", "è necessario.."). Lo sviluppo definitivo della semantica dei mondi possibili per la logica modale si è avuta nel corso degli annisessanta con i lavori di Kripke (1963). La semantica a mondi possibili è stata in seguito generalizzata ad altri tipi dicontesti indiretti, quali ad esempio i contesti temporali7. Il concetto formale di mondo possibile dovrebbe catturare l'ideaintuitiva di situazione controfattuale, ossia di situazione in cui le cose stanno diversamente da come stanno nel mondoreale (quindi stati del mondo passati o futuri, situazioni ipotetiche, e così via).

In questo paragrafo non daremo una esposizione formale dettagliata della semantica a mondi possibili, ma cilimiteremo a fornire quelle informazioni necessarie per proseguire nella nostra argomentazione. Un trattamento piùformale dei modelli di Kripke per la logica proposizionale verrà fornito nel par. 8.2, in relazione alla discussione sugliatteggiamenti proposizionali e sui contesti di credenza8.

Come la semantica di Tarski può essere considerata una formalizzazione del concetto fregeano di riferimento,così la semantica dei mondi possibili può essere considerata una ricostruzione formale degli aspetti semantici legati allanozione fregeana di senso. Anche in questo caso, e in grado forse maggiore che per la teoria di Tarski, la teoria deimondi possibili si discosta dalla formulazione fregeana rispetto ad alcuni punti centrali. Tuttavia, nella nostraprospettiva, i motivi di continuità sono certamente più rilevanti della differenze. In particolare, nella tradizionemodellistica, la distinzione fregeana senso/riferimento è stata sostituita dalla distinzione intensione/estensionenell'accezione in cui è stata introdotta nella terminologia filosofica da Carnap (1947). In questo senso, si parla di logicheintensionali per le logiche basate sulla semantica a mondi possibili, e di contesti intensionali per indicare quelli cheFrege chiamava contesti indiretti. Carnap propose i concetti di intensione e di estensione come un'esplicazione dellenozioni fregeane di senso e riferimento, anche se vi sono importanti differenze che metteremo in parte in luce nelseguito. Nella semantica a mondi possibili le estensioni sono trattate in accordo alla semantica tarskiana (per cui, adesempio, l'estensione di una costante individuale è un oggetto del dominio, l'estensione di un simbolo predicativo a nargomenti è un insieme di n-ple di oggetti del dominio e l'estensione di un enunciato è un valore di verità). Vedremo inseguito a cosa corrispondono le intensioni.

Abbiamo visto che, intuitivamente, un mondo possibile può essere pensato come una situazione controfattuale,ossia come una situazione che potrebbe esistere se le cose fossero andate diversamente da come sono andate nel mondoreale. Così, in qualche mondo possibile diverso da quello reale Milano potrebbe essere un porto, i gatti potrebberoessere verdi, e così via. Le verità necessarie sono quelle che sono vere non solo nel mondo reale, ma anche in tutti imondi possibili che si possano concepire. Nella semantica di Kripke il meccanismo dei mondi possibili è formalizzatomediante strumenti di tipo insiemistico. Ogni mondo possibile è un elemento wi di un insieme W di mondi. Ogni wi puòessere visto come una struttura insiemistica in un certo senso analoga a un modello di Tarski. Nei modelli kripkeani, lafunzione interpretazione associa ai vari simboli del linguaggio un'estensione rispetto ad ogni mondo possibile. Si trattacioè di una funzione ϕ a due argomenti, di cui il primo argomento deve essere un mondo possibile, e il secondoun'espressione del linguaggio. Così, data una costante individuale c e un mondo wi , ϕ[wi , c] è l'individuo del dominiodenotato da c nel mondo wi ; data una formula chiusa α e un mondo w j , ϕ[w j , α] è il valore di verità di α in w j , e cosìvia. I mondi in cui Milano è un porto sono quegli elementi di W rispetto ai quali l'oggetto denotato dalla costanteindividuale Milano è un elemento dell'insieme denotato dal simbolo predicativo porto. I mondi dove i gatti sono verdisono i mondi dove l'insieme che corrisponde al simbolo predicativo gatto è un sottoinsieme dell'insieme che corrispondeal simbolo predicativo verde.

Nella semantica di Kripke, perché una formula del tipo "è necessario che α" (in simboli: α) sia vera rispetto aun mondo w, α deve essere vera in w e in tutti i mondi che siano accessibili da w, cioè, intuitivamente, in tutti queimondi possibili che possono essere concepiti dagli "abitanti" del mondo w. Simmetricamente, una formula come "èpossibile che α" (in simboli ◊α) è vera in w se e soltanto se α è vera in w, o in almeno uno dei mondi concepibili in w.Sull'insieme W dei mondi è definita una relazione di accessibilità R, che stabilisce quali altri mondi siano accessibili,vale a dire, possano essere concepiti, a partire da ogni mondo possibile dato. Un particolare elemento G di Wrappresenta il mondo reale. Quindi, α è vera nel mondo reale se e soltanto se α è vera in G e in tutti i mondi possibiliw ∈ W tali che R(G,w). Nella semantica a mondi possibili, l'equivalente del concetto di interpretazione della semanticatarskiana è una struttura più complessa, una quadrupla I = (D, W,ϕ, R), dove D è il dominio di interpretazione, W èl'insieme dei mondi possibili, ϕ è la funzione interpretazione definita come abbiamo visto sopra, cioè come funzione da

7Si veda ad esempio (van Benthem 1983).8Per una esposizione più approfondita della semantica kripkeana rimandiamo ad esempio a (Hugues e Cresswell 1968);(Gabbay e Guenthner 1984); (Galvan 1985).

Page 11: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

8

mondi possibili ed espressioni del linguaggio a estensioni, e R è la relazione di accessibilità tra mondi possibili. Unainterpretazione di questo genere è detta anche una struttura di Kripke.

Dato un linguaggio per la logica modale (ad esempio il linguaggio L esteso con gli operatori modali di necessità e di possibilità ◊), il significato dei vari tipi di formule viene assegnato mediante regole ricorsive analoghe a quelle

della semantica estensionale di Tarski. Se una formula α è vera rispetto all'interpretazione I nel mondo w, si scrive I,wα. Le nozioni di modello, di validità, di soddisfacibilità e di conseguenza logica sono definite generalizzando quelledella semantica tarskiana. Ad esempio, una formula α è valida se e soltanto se per ogni interpretazione I e per ciascunmondo w in W si ha che I,w α.

Vediamo ora come risultano definite le intensioni nella semantica a mondi possibili. Partiamo da un esempio ditipo modale. Si consideri l'enunciato "i bipedi implumi sono implumi", in simboli:

(1) ∀x (bipede_implume(x) → implume(x)).

(Assumiamo che i vari predicati utilizzati qui e nel seguito abbiano l'interpretazione suggerita intuitivamente dal nome).Nei termini della semantica modellistica tarskiana, perché (1) sia vera, l'estensione di bipede_implume deve essere unsottoinsieme dell'estensione di implume. Si consideri ora l'enunciato modale "è necessario che i bipedi implumi sianoimplumi", in simboli:

(2) ∀x (bipede_implume(x) → implume(x)).

Data l'interpretazione intuitiva dei simboli che vi compaiono, (2) è un enunciato vero. Tuttavia, come abbiamo visto, lasemantica tarskiana non è in grado di rendere conto del valore di verità di enunciati di questo tipo, poiché per rendereconto del valore di verità di (2), non è sufficiente prendere in considerazione le estensioni dei simboli nella formula.Infatti, il predicato umano ha la stessa estensione di bipede_implume, e può quindi essere sostituito a bipede_implumesalva veritate in (1). Ma se applichiamo tale sostituzione in (2), si ottiene l'enunciato:

(3) ∀x (umano(x) → implume(x)),.

che, presumibilmente, è falso: è certamente lecito immaginare che gli uomini possano avere le piume in qualche mondopossibile diverso dal nostro (mentre è certamente contraddittorio immaginare che un bipede implume le abbia). Larelazione di inclusione fra le estensioni non è sufficiente perché (3) sia vera. In base alla teoria kripkeana, (3) sarebbevera se l'insieme degli umani fosse un sottoinsieme dell'insieme dei bipedi implumi in ogni mondo possibile accessibiledal mondo reale, e non soltanto nel mondo reale. Abbiamo visto che, secondo Frege, nei contesti indiretti sono i sensi adavere il ruolo di solito giuocato dai riferimenti, nel senso che la composizionalità vale per i sensi anziché per iriferimenti usuali. Se vogliamo che le intensioni siano in questo senso analoghe ai sensi fregeani, allora termini con lastessa intensione devono essere sostituibili salva veritate nei contesti indiretti come appunto quelli modali. In base alladefinizione della verità per le formule modali, è evidente che due predicati P e Q sono sostituibili salva veritate in ognicontesto modale se, per ogni mondo possibile w, l'estensione di P in w è uguale all'estensione di Q in w. In tal caso, sipuò quindi assumere che P e Q abbiano la stessa intensione. Perciò, in semantica modellistica l'intensione di unpredicato (ad un posto) P è definita come una funzione Ψ P da mondi possibili a sottoinsiemi del dominio D9. Per ognimondo possibile preso come argomento, tale funzione restituisce come valore l'estensione di P in quel mondo. Peresempio, l'intensione di umano è la funzione Ψumano che, per ogni mondo wn in W, associa a wn l'insieme ψumano (wn )degli esseri umani in wn .

In generale, l'intensione di un'espressione e sarà una funzione Ψ e da mondi possibili a estensioni: per ognimondo w, Ψ e (w) è l'estensione di e in w. Così, l'intensione di un predicato a n argomenti è una funzione da mondipossibili a insiemi di n-ple di oggetti di D, l'intensione di un termine individuale è una funzione da mondi possibili aelementi di D, e l'intensione di un enunciato è una funzione da mondi possibili a valori di verità. Le intensioni intesecome funzioni da mondi possibili a estensioni possono essere considerate come una formalizzazione dell'idea fregeanadi senso inteso come modo in cui è dato il riferimento. Se un senso è un modo per cui, date certe circostanze, è possibileindividuare un certo oggetto (individuo o concetto o valore di verità), un'intensione modellistica è proprio una funzioneche, dato un certo stato di cose (un mondo possibile), individua l'estensione corrispondente. Ad esempio, l'intensione diun enunciato come funzione da mondi possibili a valori di verità formalizza in maniera efficace l'idea formulata daWittgenstein nel Tractatus in base a cui il significato di un enunciato sono le sue condizioni di verità. L'intensione ψα diuna formula α specifica a quali condizioni, ossia in quali mondi possibili, la formula chiusa α ha come valore di verità ilvero.

9In questa sede assumiamo che D sia l'unione dei domini dei mondi di W. Di fatto, sono possibili diverse alternative. Adesempio, che tutti i mondi abbiamo lo stesso dominio, oppure che ciascun mondo abbia un dominio distinto.

Page 12: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 1

9

L'identificazione delle intensioni con funzioni da mondi possibili a estensioni, benché già implicita nei lavori diCarnap e di Kripke, è stata formulata esplicitamente nell'opera di Richard Montague. Il lavoro di Montague sullasemantica intensionale (Montague 1974) rappresenta il massimo punto di sviluppo della semantica a mondi possibili edell'approccio model teoretico al significato del linguaggio naturale10. Montague costruisce una logica intensionale incui il meccanismo dei mondi possibili viene generalizzato lungo linee diverse. Ad esempio, i mondi possibili vengonoutilizzati per rendere conto delle modalità, del tempo, degli indicali, e così via. Complessivamente, la semantica modelteoretica viene resa estremamente flessibile, in maniera da consentire una maggiore aderenza alla struttura grammaticaledelle lingue naturali. L'aspetto più appariscente della teoria di Montague consiste probabilmente nel fatto di associare imetodi semantici della teoria dei modelli di derivazione logica con i risultati delle teorie sintattiche di ambitolinguistico, in particolare con la sintassi di tipo generativo di origine chomskiana. Prima di Montague, i tentativi dianalisi logica di enunciati delle lingue naturali erano limitati ad esempi estremamente semplici, e presupponevanosempre una parafrasi degli enunciati di partenza in un linguaggio logico effettuata "a mano" da chi conduceva l'analisi.Viceversa, la teoria di Montague consente di prendere in considerazione in maniera sistematica sottoinsiemi abbastanzacomplessi del linguaggio naturale, in modo che la teoria sia in grado di rendere conto del passaggio dalla formagrammaticale degli enunciati alla loro rappresentazione semantica. Ad ogni oggetto sintattico di un certo tipo vieneassociato un oggetto semantico di un tipo corrispondente, e si riesce a costruire composizionalmente, mediante regolericorsive, una rappresentazione del significato di espressioni linguistiche complesse a partire dal significato dei lorocomponenti.

Un efficace esempio della duttilità delle intensioni nella semantica di Montague è costituito dai connettivigeneralizzati. Si consideri un connettivo come la congiunzione. In logica, normalmente, la congiunzione può connetterefra loro soltanto formule. Dal punto di vista sintattico cioè la congiunzione può essere vista come un operatore a dueposti, che assume come argomenti due formule e produce una formula come risultato. Nel linguaggio naturale tuttavia lacongiunzione ha un comportamento più vasto e complesso. Si possono congiungere, oltre che enunciati, anche nomi,verbi, aggettivi, avverbi, e così via. Ad esempio, i seguenti sono tutti enunciati grammaticalmente corretti dell'italiano:

"Il sentiero è lungo e stretto""Ugo salta e scodinzola""Ugo e Pluto scodinzolano".

Un enunciato come "Fido salta e scodinzola" tradizionalmente poteva essere analizzato in logica soltantotrasformandolo in una congiunzione di enunciati, e rappresentato come salta(Fido) ∧ scodinzola(Fido). La teoria diMontague permette di definire una congiunzione generalizzata, che consente di ottenere espressioni sintatticamentecomplesse congiungendo tra loro oggetti sintattici di diverse categorie, in maniera da poter associare loro direttamenteuna semantica. Così si può ottenere il predicato complesso ad un posto lungo e stretto congiungendo fra loro il predicatolungo e il predicato stretto. Intuitivamente, in generale, l'intensione della congiunzione generalizzata è una funzione adue posti, che, se assume come argomenti le intensioni di due predicati a un posto, produce come valore l'intensione diun predicato a un posto, se assume come argomenti le intensioni di due enunciati, produce come valore l'intensione di unenunciato, e così via.

La semantica di Montague costituisce, come si è detto, il punto di massimo sviluppo dell'approccio modelteoretico allo studio del significato del linguaggio naturale, e quindi, in un certo senso, il punto di massimo sviluppo delprogramma fregeano in semantica. Il lavoro di Montague realizza i vari desiderata fregeani: la distinzionesenso/riferimento nella forma della distinzione intensione/estensione, la composizionalità del significato,l'antipsicologismo (Montague riteneva che la semantica fosse una parte della matematica e non della psicologia - cfr.Thomason 1974). I suoi successi hanno fatto che sì che, per un certo periodo, si sia potuto ritenere che la semantica deimondi possibili fosse in grado di offrire un quadro generale in cui affrontare i problemi della teoria del significato. Essaè così diventata il paradigma dominante nell'ambito delle teorie logico-filosofiche del significato. Gli assunti centrali ditale paradigma erano che il significato di un enunciato coincidesse con le sue condizioni di verità, e che compitoprincipale della semantica fosse di individuare tali condizioni e di indagare le relazioni di conseguenza logica fraenunciati. Tuttavia, nonostante l'indubbia eleganza della teoria, i successi ottenuti e il grado di generalità dimostratonell'affrontare numerosi problemi semantici, vi sono alcuni problemi cruciali che non è stato possibile affrontareall'interno di questo paradigma. Da tali problemi prenderemo le mosse nel prossimo capitolo per proseguire la nostratrattazione.

10Per una esposizione introduttiva del lavoro di Montague si vedano ad esempio, a diversi gradi di approfondimento e dicompletezza, (Dowty et al. 1981); (Thomason 1974); (Chierchia 1992).

Page 13: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

2. Dalla Semantica Modellistica alla Semantica Cognitiva2.1 I Limiti del Paradigma Model Teoretico

Esamineremo in questo paragrafo alcune delle difficoltà e dei limiti della semantica di tipo modellistico. Da unlato, esistono infatti problemi semantici rilevanti che sono al di fuori degli scopi della semantica dei mondi possibili (o,più in generale, della semantica modellistica). Essi cadono al di fuori dell'ambito dei fenomeni che il paradigma puòspiegare, e la semantica modellistica non può, neppure in linea di principio, fornire una soluzione. Vi sono poi altriproblemi che, in linea di principio, rientrerebbero nell'ambito dei fenomeni che la teoria dei modelli dovrebbe spiegare,ma che risultano tuttavia estremamente difficili da affrontare con gli strumenti della teoria dei mondi possibili. Unesempio del primo tipo è costituito dal problema della semantica lessicale, ossia il problema di rappresentare ilsignificato dei simboli primitivi extra-logici di un linguaggio. L'esempio più rilevante del secondo tipo è costituito dalben noto problema degli atteggiamenti proposizionali: si consideri, ad esempio, il problema di un trattamento logicoadeguato dei contesti epistemici (credere e sapere).

Prendiamo in considerazione per primo il problema del significato lessicale. Per semplicità, partiamo dagliaspetti estensionali del significato. Abbiamo visto che la teoria di Tarski consente di calcolare il valore della funzioneinterpretazione (ossia il riferimento) di espressioni complesse a partire dal riferimento dei simboli primitivi extra-logici.Ad esempio, una volta che la funzione interpretazione ϕ associa come riferimento alla costante individuale Fido unelemento del dominio, e una volta che la funzione interpretazione associa come riferimento al predicato cane unsottoinsieme del dominio, allora la semantica tarskiana ci consente di stabilire il riferimento di una formula comecane(Fido). In particolare, si avrà che: ϕ[cane(Fido)]= v sse ϕ[Fido]∈ϕ[cane]. La teoria provvede poi regole perstabilire il riferimento di formule complesse a partire dal riferimento delle formule costituenti. Così, una formula deltipo α ∧ β è vera in una interpretazione (ϕ, D) se e solo se α e β sono entrambe vere in (ϕ, D). Ne risulta ad esempio che(cane(Pluto) ∧ nero (Pluto)) è vera se e solo se ϕ[Pluto] ∈ ϕ[cane] ∩ ϕ[nero]. Le regole che concernono le formulequantificate sono più complesse, e le abbiamo omesse per semplicità. Intuitivamente, tuttavia, una formula come ∀x(cane(x) → nero(x)) ("tutti i cani sono neri") è vera in (ϕ, D) se e solo se ϕ[cane] ⊆ ϕ[nero].

Si noti che una regola semantica come quella per la congiunzione stabilisce quale sia il significato del simbolo "∧". Quindi, le regole della teoria semantica definiscono il significato dei simboli primitivi di tipo logico, come ad esempioi connettivi. Tuttavia, per i simboli primitivi extra logici la funzione interpretazione è assunta come data, e , in ognicaso, caratterizzabile solo in maniera puramente "estensionale", come una tabella che, ad esempio, associ unsottoinsieme del dominio a ogni simbolo predicativo a un argomento. Gli strumenti della semantica modellistica nondicono nulla, ad esempio, su quale sottoinsieme di D ϕ dovrebbe associare a cane, né su quale sia la differenza fra canee un altro predicato a un posto come, ad esempio, gatto o aeroplano. Tutto quello che si può fare è assegnareesplicitamente a ϕ i valori per i simboli primitivi extra logici. Se Fido e Marco sono costanti individuali del linguaggioL, e cane, umano e maschio sono simboli predicati di L a un argomento, possiamo stabilire ad esempio:

ϕ[Fido] = Fidoϕ[Marco] = Marcoϕ[cane] = {Fido, Pluto, Ugo}ϕ[umano] = {Marco, Gianni, Maria}ϕ[maschio] = {Fido, Pluto, Marco, Gianni, Ugo}

dove "Ugo", "Pluto", "Marco", eccetera (in tondo) non sono simboli del linguaggio L, ma sono simboli che usiamo nellametateoria semantica per indicare oggetti del dominio D. Così, la teoria dei modelli stabilisce il concetto di verità "datoun modello", ma non dice nulla su quali modelli bisogna scegliere per interpretare i simboli primitivi del linguaggio,ossia, quale interpretazione deve essere associata alle costanti predicative e individuali.

Questo tipo di limite della teoria tarskiana è stato messo chiaramente in luce da Field (1972). Field sottolineacome la teoria di Tarski non fornisce una riduzione dei concetti semantici (come quello di verità) ad altri concetti di tiponon semantico. Tarski di fatto riduce la nozione semantica di verità ad altre nozioni semantiche, quali ad esempio quelladi denotazione di un termine singolare o di un predicato. La semantica tarskiana spiega le proprietà semantiche diespressioni complesse nei termini delle proprietà semantiche dei loro componenti primitivi. Ma su queste ultime non hanulla da dire1. Partee (1979a) distingue fra semantica lessicale e semantica strutturale. Quest'ultima assolve appunto ilcompito di ricondurre il significato di espressioni complesse a partire dal significato dei loro componenti primitivi. Lateoria tarskiana, e, in generale, vedremo, la semantica modellistica, affrontano il problema della semantica strutturale manon di quella lessicale.

Da questo punto di vista infatti, la semantica modellistica intensionale (ossia la teoria dei mondi possibili) nonoffre assolutamente nulla di più rispetto alla semantica modellistica estensionale di Tarski. Infatti la semantica dei mondipossibili non dice alcunché circa l'intensione dei simboli primitivi extra logici. Nel caso di un simbolo primitivo s, la

1Su questi problemi si veda anche (Bonomi 1983).

Page 14: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

2

funzione Ψ S che ne costituisce l'intensione è semplicemente assunta come data. Di solito si assume che sia dataestensionalmente, in forma di tabella. Cioè, se P è una lettera predicativa a un argomento, allora l'intensione di P èqualcosa del genere:

Ψ P ≡ w1 → {a, b, c, ....}w2 → {b, c, d, ....}w3 → {a, c, d, ....}...

dove "a", "b", "c", "d", .... sono elementi del dominio D. Si tratta, in un certo senso, di un trattamento "estensionale"delle intensioni: nulla è detto su come l'estensione di un simbolo primitivo in un dato mondo possibile possa esserecalcolata. Quindi, nonostante la semantica modellistica sia incentrata sulla nozione di significato di enunciato comecondizioni di verità, tuttavia essa non è in grado di fornire le condizioni di verità di un enunciato che in maniera"ipotetica": vengono date le condizioni di verità di un enunciato a patto che si assumano come note le intensioni deisimboli primitivi extra logici che vi compaiono.

L'impossibilità di rappresentare il significato dei simboli primitivi extra logici è dovuta dunque a un limiteinerente all'approccio modellistico in quanto tale. Di conseguenza, molti ricercatori che si collocano all'interno delparadigma modellistico hanno considerato il problema del significato lessicale come estraneo ai compiti della semanticaformale. Thomason (1974) ad esempio, a proposito della teoria di Montague, ha affermato:

i problemi della teoria semantica dovrebbero essere distinti da quelli della lessicografia. E' compitodella semantica rendere conto dei significati. Uno scopo centrale di questo resoconto è spiegare come tipidiversi di significati si colleghino a differenti categorie sintattiche [..] Ma non dobbiamo aspettarci cheuna teoria semantica renda conto di come due espressioni che appartengono alla stessa categoriasintattica differiscano in significato. "Camminare" e "correre", ad esempio, e "unicorno" e "zebra"certamente hanno un significato diverso, e ci serve un dizionario per sapere quale. Ma costruire undizionario richiede una conoscenza considerevole del mondo. [...] Forse anche i quadri di un museo diesemplari rappresentativi dovrebbero essere considerati come "terminologia" [...] In ogni caso, lalessicografia deve prendere in prestito concetti da tutte le aree del sapere e della pratica: astronomia,giurisprudenza, cucina, automobilismo, allevamento dei piccioni, e così via. [...] Queste sono faccende diapplicazioni, non di teoria. (pp. 48-49)

Nell'ambito dell'approccio modellistico alla semantica del linguaggio naturale questo tipo di problemi è statoparzialmente affrontato mediante l'introduzione di postulati di significato. Questa ad esempio è anche la soluzioneadottata nella semantica di Montague (si veda ad esempio Montague 1973). I postulati di significato (Carnap 1952) sonoformule che si assume valgano in tutte le interpretazioni di una teoria e in tutti i mondi possibili2, con la conseguenza dilimitare il numero delle interpretazioni ammissibili dei simboli primitivi extra-logici di un linguaggio. Semplici esempidi formule che possono essere utilizzate come postulati di significato in una teoria estensionale sono le seguenti:

(1) ∀x (leone(x) → mammifero(x))(2) ∀x (mammifero(x) → ¬ uccello(x)).

In entrambi i casi, assumendo che queste formule valgano in tutti i modelli viene ristretto il numero di interpretazioniche possono essere modelli di una teoria. Ad esempio (1) impone che l'interpretazione di leone sia un sottoinsiemedell'interpretazione di mammifero; (2) impone che l'interpretazione di mammifero sia disgiunta dall'interpretazione diuccello. Tuttavia questo non è sufficiente per fissare l'interpretazione dei simboli: nessun insieme di postulati disignificato può garantire che l'interpretazione dei simboli primitivi sia quella intesa. Una volta imposti i vincoli espressida (1) e (2), nulla dice che l'interpretazione di leone sia l'insieme dei leoni e che l'interpretazione di mammifero sial'insieme dei mammiferi. Ad esempio, (1) e (2) sono pienamente compatibili con un'interpretazione in cui mammifero èinterpretato sull'insieme dei treni, leone sull'insieme degli elettrotreni e uccello sull'insieme delle querce. In generale,dato qualsiasi insieme di postulati di significato ricco a piacere, esiste sempre un numero infinito di interpretazioni "nonintese" che lo soddisfa. Il metodo dei postulati di significato può essere esteso facilmente alle logiche di tipointensionale (in questo caso i postulati di significato devono essere imposti come necessariamente validi, devono cioèvincolare le interpretazioni dei simboli in tutti i mondi possibili). Tuttavia i problemi restano immutati.

A questo proposito, Thomason afferma ancora:

2 Carnap non faceva riferimento alla nozione di mondo possibile nella accezione tecnica modellistica attuale (che è piùrecente), ma al concetto, in senso lato analogo, di descrizione di stato (cfr. Carnap 1947).

Page 15: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

3

La teoria potrebbe quindi evolvere verso la concretezza aggiungendo postulati di significato o altriespedienti che consentano di distinguere il trattamento semantico di espressioni che appartengono allastessa categoria sintattica. Ma una tale evoluzione dovrebbe senza dubbio fermarsi assai prima di ottenerequalcosa che assomigli a un dizionario [...] La teoria semantica non si impegna su quali insiemi di entità[...] siano quelle "corrette", o quelle "intese", per l'interpretazione di un dato linguaggio. (p. 50).

Un ulteriore problema posto dalla rappresentazione del lessico mediante postulati di significato consiste nel fattoche i postulati di significato possono esprimere esclusivamente condizioni necessarie e/o sufficienti per l'applicazione diun concetto. Il punto è che per i concetti che corrispondono a parole del linguaggio naturale è estremamente difficileindividuare insiemi di condizioni necessarie e di condizioni sufficienti adeguate allo scopo. Di solito, quello che èpossibile fare è individuare insiemi di tratti che caratterizzano un concetto nei casi "tipici", e che tuttavia ammettononumerose eccezioni. In filosofia del linguaggio, l'uso di caratteristiche tipiche nella caratterizzazione di termini dellessico del linguaggio naturale è stato posto in evidenza soprattutto con lo sviluppo della teoria del riferimento diretto, onuova teoria del riferimento (Kripke 1972; Putnam 1975). Non è questa la sede per addentrarci in questo argomento3; cilimitiamo a ricordare che, in base a questa teoria, alcuni termini del linguaggio naturale si comporterebbero comedesignatori rigidi, sarebbero cioè collegati al loro riferimento in maniera diretta, senza la mediazione di un senso.Esempi di designatori rigidi sarebbero i nomi propri in senso stretto e i termini per tipi (o generi) naturali, ossia perclassi di oggetti dati in natura, come ad esempio le specie biologiche, le sostanze chimiche, e così via. Nel caso deitermini per tipi naturali, afferma ad esempio Putnam, il nome sarebbe stato collegato originariamente al suo riferimentoattraverso un "battesimo iniziale" e poi tramandato di generazione in generazione senza che necessariamente i parlantine conoscessero il "vero significato". Consideriamo ad esempio il termine "tigre", e supponiamo che il tipo naturaletigre sia caratterizzato da alcune proprietà della struttura genetica. Ora, è evidente che la stragrande maggioranza deiparlanti non conosce tale struttura genetica, e quindi, in questo senso, non conosce il significato di tigre (anzi, per moltisecoli, nessuno conosceva il significato di tigre, e potrebbe anche daresi il caso che neppure oggi nessuno lo conosca, sead esempio le nostre teorie biologiche risultassero sbagliate). In origine, il termine "tigre" è stato "agganciato" al suoriferimento battezzando con questo nome alcuni esemplari appartenenti a quella specie. Lo stesso vale per un terminecome "acqua". Supponendo vere le teorie chimiche attuali, "acqua" denota la sostanza chimica la cui formula è H O2 ,ma per secoli nessun parlante era al corrente di ciò. In questo senso Putnam afferma che i significati dei termini per tipinaturali non si possono collocare "nella testa" dei parlanti. Nel caso di parole come "tigre" e "acqua", prosegue Putnam,i parlanti normalmente identificano il riferimento utilizzando non il vero significato, ma uno stereotipo, ossia unacaratterizzazione in termini di un insieme di proprietà tipiche che tuttavia non sono né proprietà necessarie, nésufficienti per caratterizzare il concetto. Ad esempio, la tigre stereotipica ha la forma di un grosso gatto, ha le strisce,vive nella giungla, e così via. Tuttavia, possono esistere esseri che hanno queste proprietà ma non sono tigri, così comedelle tigri atipiche potrebbero non godere di queste proprietà. Analogamente, lo stereotipo di acqua comprendeproprietà come essere un liquido potabile, incolore ed insapore, ma tali proprietà non si applicano sempre e soltantoall'acqua (ad esempio, il vapore è certamente una forma non stereotipica di acqua, ed infatti per molto tempo non è statoriconosciuto come tale).

E' evidente che la teoria del riferimento diretto per i tipi naturali comporta forti assunzioni filosofiche di tiporealistico. Per chi condivida tali assunzioni, e sia inoltre convinto della necessità di caratterizzare la semantica in termininon soggettivi, ciò che è rilevante ai fini semantici è il riferimento reale dei termini per tipo naturale, e non il prototipoche gli è associato dai parlanti. Per un non realista, tuttavia, potrebbe risultare del tutto chimerico parlare di riferimentoreale, e potrebbe essere ovvio considerare lo stereotipo come il significato di un termine per tipo naturale. A questopunto, i postulati di significato del tipo tradizionalmente utilizzato nella semantica modellistica risulterebbero del tuttoinadeguati a catturare la caratterizzazione di un concetto in termini stereotipici. Vi sono poi alcune considerazioni inbase alle quali, anche accettando una posizione realista per i tipi naturali, può risultare rilevante la rappresentazione distereotipi per una teoria semantica. La prima di tali considerazioni ha a che fare con il problema degli atteggiamentiproposizionali, e la prenderemo in considerazione nel seguito. La seconda considerazione riguarda il fatto che glistereotipi sono cruciali anche per quanto concerne termini che non denotano tipi naturali. Ad esempio, si considerinoespressioni lessicali che denotano classi di manufatti, come ad esempio "sedia", o termini che denotano pratiche socialied attività, come, riprendendo un esempio di Wittgenstein, la parola "gioco"4. Nessuno si sognerebbe di affermare che sitratta designatori rigidi, che si riferiscono in maniera diretta a una estensione data in natura indipendentemente dallenostre pratiche sociali e dalle nostre attività cognitive. Tuttavia, una loro caratterizzazione in termini di condizioninecessarie e sufficienti è estremamente problematica, mentre risulta molto più naturale (ed è forse l'unica soluzionepossibile) associare loro un insieme di proprietà stereotipiche. Questo non è tuttavia possibile mediante i postulati disignificato tradizionali. Inoltre tutto questo mette in crisi la possibilità di una distinzione netta fra informazioni di tipo

3Una importante raccolta di saggi concernenti il dibattito filosofico su questi temi è (Schwartz 1977), per unaintroduzione si veda (Napoli 1992).4Si veda (Wittgenstein 1956), § 66.

Page 16: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

4

puramente semantico, che riguardano esclusivamente il significato dei termini, e informazioni di tipo fattuale5. Anchel'invarianza dei significati da parlante a parlante verrebbe meno: gli stereotipi e i criteri per fissare il riferimento sonodiversi da persona a persona, sulla base della cultura e delle informazioni disponibili ai singoli parlanti (Putnam a questoproposito parla di divisione del lavoro linguistico).

Veniamo ora al secondo problema della semantica modellistica che prenderemo in considerazione. La difficoltà"interna" più importante per la semantica dei mondi possibili concerne gli atteggiamenti proposizionali. A partire daRussell (1921; 1940), l'espressione atteggiamenti proposizionali (propositional attitudes) viene usata nella filosofiacontemporanea per indicare quegli atteggiamenti di tipo mentale che riguardano una proposizione, o che comunquehanno un contenuto che può essere descritto mediante un enunciato linguistico. Sono esempi di atteggiamentiproposizionali credere, pensare, temere, sperare, e così via. In tutti questi casi si crede (o si pensa, si teme, si spera) che α, dove α è un certo enunciato. I contesti linguistici generati da espressioni per atteggiamenti proposizionali sonocontesti indiretti, in cui non vale il principio di sostitutibilità salva veritate: dato un enunciato come "Marco spera che α" non è detto che sostituendo ad α un altro enunciato β con lo stesso valore di verità, il valore di verità dell'enunciato dipartenza non cambi. Tuttavia, per i contesti di atteggiamento proposizionale sorgono ulteriori problemi, in quanto in essineppure espressioni di eguale intensione risultano di norma sostituibili salva veritate6. Consideriamo ad esempio icontesti legati alla credenza o alla conoscenza (detti anche contesti epistemici). E' plausibile assumere che gli enunciatidell'aritmetica siano veri in tutti mondi possibili. Quindi, due enunciati aritmetici veri hanno la stessa intensione(intensione che in questo caso è la funzione costante che ad ogni mondo possibile associa il valore di verità vero).

Quindi, ad esempio, "2+2=4" e " 3259 162

2 3527

3⋅ è pari" avranno la stessa intensione. Tuttavia, sembra implausibile che

dalla verità di "Marco sa che 2+2=4" segua la verità di "Marco sa che 3259 162

2 3527

3⋅ è pari".

Questo fa sì che per i contesti epistemici, e, in generale, per i contesti di atteggiamento proposizionale, i risultatiottenuti con la semantica dei mondi possibili risultino estremamente problematici e poco soddisfacenti. Affronteremonei dettagli questo tema nel cap. 8. Qui ci limitiamo ad anticipare qualche considerazione generale. Una semantica deimondi possibili per la logica epistemica e per i contesti di credenza è stata proposta da Jakko Hintikka (1969). L'ideaintuitiva alla base della semantica di Hintikka è che ad ogni soggetto di credenza B sia associato un insieme di mondipossibili. Ogni membro di questo insieme rappresenta uno stato di cose compatibile con ciò che è creduto da B. Così, Bcrede un enunciato α se e soltanto se α è vero in tutti i mondi che egli considera possibili (quindi, nella semantica deimondi possibili il credere si comporta in maniera analoga alla necessità nelle logiche modali). Questo approcciocomporta tuttavia il ben noto problema dell'onniscienza logica. Date due formule α e β, supponiamo che α → β sia unaformula valida, ossia che β sia conseguenza logica di α. Ciò vuole dire che ogni interpretazione che rende vera α rendevera a sua volta anche β. Quindi, in ogni mondo possibile in cui sia vera α, anche β è vera (infatti i mondi possibili sonocorretti e completi, assegnano cioè uno ed un solo valore di verità ad ogni formula chiusa). Quindi, secondo la semanticadei mondi possibili per la logica epistemica, se qualcuno, diciamo Marco, crede che α, allora α deve essere vera in tutti imondi possibili compatibili con le sue credenze. Ma, se β è una conseguenza logica di α, allora anche β deve esserevera in tutti i mondi possibili compatibili con ciò che crede Marco. Così, se Marco crede che α, allora deve credereanche che β. In altre parole, ogni soggetto epistemico deve credere tutte le conseguenze logiche delle sue credenze.Questa assunzione è certamente troppo forte per essere accettabile: implica, ad esempio, che se qualcuno conosce gliassiomi di Peano, allora debba conoscere tutti i teoremi dell'aritmetica. Strettamente legato a questo è il problema che,se è creduta una verità necessaria, allora devono essere credute tutte le verità necessarie: infatti, tutte le verità necessariecondividono la stessa intensione, e sono quindi sostituibili salva veritate in tutti i contesti di credenza. Analogamente,due termini con la stessa intensione risultano sostituibili salva veritate in ogni contesto di credenza. Questo è ad esempioil caso dei nomi propri se si accetta la teoria del riferimento diretto. In base a tale teoria, i nomi propri sono designatoririgidi, e denotano quindi lo stesso individuo in tutti i mondi possibili. Dati due nomi propri con la stessa estensione, neconsegue che essi devono avere anche uguale intensione, e risultano quindi sostituibili salva veritate in tutti i contesti diatteggiamento proposizionale. "Espero" e "Fosforo" sono nomi propri con la stessa estensione (denotano entrambi ilpianeta Venere). Se si assume che siano designatori rigidi, allora essi avranno anche la stessa intensione. Quindi, nellasemantica dei mondi possibili, per ogni soggetto di credenza B, da "B crede che Espero = Espero", segue che "B credeche Espero = Fosforo", che è certamente poco plausibile. A prescindere dal fatto che i nomi propri siano o menodesignatori rigidi, un problema analogo si pone per quei termini che hanno lo stesso significato "per definizione" o persemplice convenzione linguistica, come ad esempio i predicati "greco" ed "elleno". Essi evidentemente hanno la stessaintensione, in quanto denotano lo stesso insieme di oggetti in tutti i mondi possibili. Tuttavia, ad esempio, qualcuno puòcredere che Pericle era greco senza credere che Pericle fosse elleno, semplicemente perché sa cosa significa "greco", ma

5Si veda ad esempio (Marconi 1989).6 Per questa ragione Cresswell (1975) ha introdotto l'espressione contesti iperintensionali (hyperintensional contexts)per indicare i contesti di atteggiamento proposizionale.

Page 17: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

5

non sa che cosa significa "elleno". Le intensioni forniscono quindi un livello di analisi insufficiente per un trattamentodei contesti di atteggiamento proposizionale.

Più sopra si è accennato al fatto che, anche dal punto di vista di un realista che accetti la teoria del riferimentodiretto per i termini che denotano tipi naturali, i contesti di tipo epistemico, e, più in generale, di atteggiamentoproposizionale, forniscono buoni argomenti affinché anche gli stereotipi vengano presi in considerazione all'internodella teoria semantica. Si tratta di un problema per molti versi simile a quello posto dai nomi propri. La tesi che i terminiper tipi naturali siano designatori rigidi comporta ad esempio che, se la vera essenza dell'acqua è di essere la sostanzachimica la cui formula è H O2 , l'intensione di "acqua" e l'intensione di "la sostanza chimica la cui formula è H O2 "coincidano (in ogni mondo possibile, queste due espressioni devono avere la stessa estensione). Nella semantica deimondi possibili questo comporta che ad esempio l'enunciato "Dante sapeva che l'acqua è potabile" implichi l'enunciato"Dante sapeva che la sostanza chimica la cui formula è H O2 è potabile". E' evidente che tale implicazione èdifficilmente accettabile (almeno rispetto alla lettura più intuitiva del secondo enunciato). Ed è altrettanto evidente chenessuno, per quanto convinto della validità della teoria realista del riferimento diretto, sarebbe disposto a considerarlavalida. Il punto è che, anche se si accettano le posizioni realiste della teoria del riferimento diretto rispetto ai termini pertipi naturali, nell'ambito dei contesti epistemici, o, in generale, nei contesti di atteggiamento proposizionale, ciò che èrilevante per l'analisi semantica non è tanto il significato di un termine di tipo naturale, quanto piuttosto lo stereotipo adesso associato, cioè i criteri, incompleti ed eventualmente anche in parte scorretti, utilizzati dai parlanti per fissarne ilriferimento.

Si noti che le conseguenze della semantica a mondi possibili per gli atteggiamenti proposizionali sonoindesiderabili anche qualora si assuma che la semantica sia la teoria delle relazioni astratte che intercorrono fra illinguaggio e il mondo, e non una spiegazione della competenza semantica dei parlanti7. Infatti, accettare le fortiidealizzazioni imposte dalla semantica dei mondi possibili per gli atteggiamenti proposizionali implica non solo che sistia descrivendo una competenza semantica "idealizzata" (cioè, che la semantica sia la teoria del significato dellinguaggio come se fosse "parlato da Dio"), ma anche che tutti i soggetti di credenza siano dei "soggetti di credenzaidealizzati" (Partee 1982).

In generale, sembra che questi problemi traggano origine dal fatto che la semantica dei mondi possibili forniscauna caratterizzazione del significato di grana troppo "grossolana" per riuscire a rendere conto dei contesti diatteggiamento proposizionale. Sembrerebbe necessario un livello di analisi semantica più fine, in base al quale, adesempio, due enunciati diversi ma logicamente equivalenti possano risultare distinguibili a livello semantico (mentre,come abbiamo visto, nella semantica a mondi possibili ad essi viene associata la stessa intensione).

E' interessante a questo proposito (anche nell'ottica di comprendere in che misura le intensioni della semanticamodellistica forniscano una formalizzazione adeguata del concetto di senso fregeano) cercare di comprendere a chelivello di analisi Frege collocasse il concetto di senso, e quanto, in base alla concezione originale fregeana, i sensifossero adatti a fornire una risposta a questo tipo di problemi. Tuttavia, l'analisi delle opere di Frege rivela a questoproposito una certa ambiguità (cfr. ad esempio Casalegno 1992). Per un verso Frege sembra concepire i sensi comeentità più articolate rispetto alle intensioni della semantica modellistica. Ad esempio egli afferma che:

7La nozione di competenza trae origine dalla teoria linguistica chomskiana, ed è stata elaborata da Chomsky inriferimento a problemi di carattere sintattico piuttosto che di carattere semantico. Secondo Chomsky la competenzalinguistica consiste in ciò che un parlante conosce della propria lingua. Si tratta tuttavia di un parlante idealizzato, e, inquesto senso, la nozione di competenza viene contrapposta alla nozione di esecuzione, che concerne invece la praticalinguista effettiva dei parlanti reali. A differenza della competenza, l'esecuzione è sottoposta a vincoli di natura extra-linguistica. "La teoria linguistica si occupa principalmente di un parlante-ascoltatore ideale, in una comunità linguisticacompletamente omogenea, il quale conosce perfettamente la sua lingua e non è influenzato da condizionigrammaticalmente irrilevanti quali le limitazioni di memoria, le distrazioni, i cambiamenti di attenzione e di interesse, egli errori (casuali o caratteristici) nell'applicazione della propria conoscenza della lingua nel corso dell'esecuzioneeffettiva [...]. Per considerare l'esecuzione linguistica effettiva, dobbiamo considerare l'interazione di vari fattori, e lacompetenza sottostante del parlante-ascoltatore non è che uno di essi." (Chomsky 1965, pp. 44-45 della trad. it., corsivinostri). Per quanto idealizzata, tuttavia, la competenza è sempre competenza di un parlante. Nel testo quindicontrapponiamo la nozione di "competenza semantica" non a una nozione di esecuzione, ma alla nozione di significatomodel teoretica classica, caratterizzata esclusivamente nei termini delle relazioni fra espressioni linguistiche e lorosignificati, prescindendo completamente dal ruolo dei parlanti. Vi è tuttavia chi è propenso a considerare la semanticamodellistica come una teoria della competenza semantica (Cresswell 1978; si veda anche Chierchia 1992). Cresswellidentifica nella semantica modellistica un possibile candidato per una teoria della competenza semantica in quantoritiene che concetti come quello di verità e di riferimento siano irrinunciabili per caratterizzare il concetto stesso dicompetenza semantica. Pur concordando su questo punto, sosterremo una posizione in base alla quale una teoria dellacompetenza impone vincoli più restrittivi rispetto alla concezione model teoretica di significato (cap. 12).

Page 18: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

6

L'enunciato può essere concepito come una rappresentazione del pensiero, nel senso che alrapporto fra parti e tutto che sussiste fra il pensiero e le sue parti corrisponde, nel complesso, il rapportoche intercorre fra l'enunciato e le sue parti. (Frege 1969, p. 400 della trad. it.).

Sembra quindi che i pensieri (cioè i sensi degli enunciati) abbiano per Frege una struttura che sia in qualche modoisomorfa alla struttura sintattica dell'enunciato, il che non accade appunto per le intensioni model teoretiche, in cuienunciati di forma sintattica totalmente diversa possono avere la stessa intensione. Altrove tuttavia Frege sembraconcepire i pensieri in maniera del tutto analoga alle intensioni della semantica dei mondi possibili. Casalegno (1992)cita ad esempio il seguente passo di una lettera di Frege a Husserl del 1906:

In logica bisogna risolversi a considerare enunciati equivalenti come diversi solo nella forma.Enunciati equivalenti hanno [...] qualcosa di comune nel contenuto: chiamo questo qualcosa il pensiero daessi espresso. (Frege 1976, p. 82 della trad. it., corsivo nostro).

La semantica intensionale ha sviluppato quindi soprattutto questa seconda accezione del concetto fregeano di senso.Una prima proposta nella direzione di individuare distinzioni di significato più sottili di quelle a livello

intensionale, e che sembra porsi direttamente sulla linea della prima delle due citazioni fregeane sopra riportate, è statafornita da Carnap (1947) con il concetto di isomorfismo intensionale. In breve, perché due espressioni complesse di uncerto linguaggio siano intensionalmente isomorfe non è sufficiente che abbiano la stessa intensione, ma devono esserecostruite nello stesso modo a partire da elementi primitivi equiintensionali. Ad esempio, due formule α e α ∧ (β ∨ ¬ β)hanno la stessa intensione (sono infatti logicamente equivalenti), ma non sono intensionalmente isomorfe, in quantohanno una struttura diversa (ad esempio nella seconda appare la formula β che non appare nella prima). Di fatto, lateoria dell'isomorfismo intensionale è un modo per inserire degli elementi sintattici nella semantica di un linguaggio.Uno dei problemi di questa strategia consiste tuttavia nel fatto che non funziona quando due enunciati differisconoesclusivamente per l'uso di simboli primitivi diversi, ma con la stessa intensione. Ad esempio se "greco" ed "elleno"sono sinonimi e quindi dotati della stessa intensione, allora "Pericle è greco" e "Pericle è elleno" sono intensionalmenteisomorfi, ma qualcuno potrebbe benissimo credere il primo senza credere allo stesso tempo il secondo (se, come si è giàdetto, sapesse cosa significa "greco" ma non sapesse cosa significa "elleno").

Dopo Carnap, e in parte a partire dalla sua proposta dell'isomorfismo intensionale, sono stati sviluppati diversitentativi di risolvere il problema degli atteggiamenti proposizionali in ambito in senso lato model teoretico8. Su alcunedi queste proposte torneremo nella terza parte. In ogni caso, nessuna soluzione globale soddisfacente è stata ancoraindividuata.

2.2 Verso la Semantica Cognitiva

Le difficoltà e i limiti della semantica modellistica, primi fra tutti quelli relativi agli atteggiamenti proposizionali,hanno fatto sì che, a partire grosso modo dalla metà degli anni settanta, alcuni filosofi del linguaggio ritenessero troppovincolanti e riduttive le assunzioni fortemente antipsicologistiche proprie della tradizione fregeana e model teoretica, esi avvicinassero ad altre concezioni della semantica, di ispirazione, in senso lato, psicologica. Nel caso degliatteggiamenti proposizionali, la motivazione di questo spostamento di interessi è in un certo senso evidente. Già a livellodi senso comune, non sembra plausibile che si possa rendere conto del significato di espressioni come "Tizio crede che..." o "Caio sa che ..." senza tenere conto in qualche modo di che cosa succede "nella testa" di Tizio e di Caio. Per poterinferire "Carlo crede che α" da "Carlo crede che β" sembra plausibile che si debba fare riferimento a un modello diqualche tipo delle capacità inferenziali di Carlo. I problemi incontrati dalla semantica modellistica in questo settoresembrano confermare questa prospettiva. Per quanto riguarda la rappresentazione del significato lessicale, la sostanzialepovertà ed inadeguatezza degli strumenti offerti dalla semantica modellistica ha fatto sì che si guardasse con interesse allavoro svolto in psicologia cognitiva nell'ambito della rappresentazione concettuale9. Il problema della rappresentazionedi concetti mediante tratti tipici anziché mediante condizioni necessarie e/o sufficienti, rispetto al quale i tradizionalipostulati di significato sono totalmente insufficienti, era stato affrontato da psicologi come Eleanor Rosch (si veda adesempio Rosch 1975). In base alle teorie della Rosch, il significato associato a livello cognitivo a un grande numero diparole può essere ricondotto a un prototipo, ossia alla rappresentazione di un esemplare tipico, di una sorta di"campione" della classe di oggetti denotata. Ad esempio, il prototipo associato alla parola "uccello" potrebbe essere unesemplare di passero, ma non un pinguino o uno struzzo, il prototipo associato alla parola "albero" potrebbe essere unaquercia, ma non un abete o una palma (anche se, evidentemente, le cose andrebbero diversamente per un lappone o perun nativo di un'isola dei Caraibi). Sono evidenti le analogie fra il prototipo e il concetto di stereotipo in Putnam. Inoltre,la constatazione della sostanziale impossibilità di una distinzione netta fra significato linguistico e conoscenza fattuale

8Per una rassegna di queste varie proposte si veda ad esempio (Bäuerle e Cresswell 1988).9Si vedano ad esempio (Medin e Smith 1984); (Tabossi 1985).

Page 19: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

7

nella semantica lessicale (e la stessa dipendenza dei giudizi di tipicità dal bagaglio cognitivo individuale) ha fatto sì chemolti ritenessero impossibile una rappresentazione del significato lessicale che prescindesse da tale bagaglio cognitivo eda una rappresentazione della competenza semantica globale dei singoli parlanti.

L'interesse dei filosofi del linguaggio per le teorie semantiche di indirizzo psicologico si è orientato versoquell'ambito di studi che prende il nome di semantica cognitiva10. La semantica cognitiva non si configura come unateoria o come un progetto di ricerca unitario, quanto piuttosto come una serie di ricerche, di proposte e di modelli checondividono un certo numero di assunzioni comuni. Una prima maniera di individuare la semantica cognitiva consistenell'identificarla con quella parte della scienza cognitiva che concerne la semantica delle lingue naturali. La scienzacognitiva, a sua volta, è un ambito interdisciplinare che non si identifica con una teoria unitaria e consolidata, ma siconfigura piuttosto come un crocevia di ricerche e di interessi che condividono l'assunto della rilevanza degli strumenti edei modelli computazionali per la comprensione della mente e del pensiero. Emersa nel corso degli anni settanta, viconfluirono ricerche svolte, oltre che in intelligenza artificiale, in discipline quali la psicologia cognitiva, la linguistica,la filosofia del linguaggio e della mente, le neuroscienze, la sociologia, l'antropologia e la biologia11. Nell'introduzione aun volume che raccoglie i saggi presentati a un convegno che per molti versi sancì l'affermarsi della scienza cognitiva,Donald Norman (1981) afferma che l'obiettivo della scienza cognitiva è di comprendere la mente in astratto e nei suoiaspetti generali, sia essa naturale o artificiale, umana o non umana, reale o ipotetica. Caratterizzare in maniera piùprecisa la scienza cognitiva risulta problematico, proprio per l'estrema varietà dei contributi disciplinari che viconfluiscono. In generale, si può dire che la scienza cognitiva, nella sua forma più "tradizionale", assume che le attivitàcognitive possano essere ridotte, spiegate o simulate nei termini di computazioni effettuate su rappresentazioni di tiposimbolico. Ad esempio, Norman (1981) afferma che "il tema centrale del libro è il ruolo della computazione e dellamanipolazione simbolica nella cognizione" (ibid., p.3). Approfondiremo nel prossimo capitolo cosa si debba intenderein questo contesto per rappresentazione e computazione di tipo simbolico. La centralità delle rappresentazionisimboliche per una teoria della mente non è accettata in maniera universale da tutti gli scienziati cognitivi. Soprattutto inanni recenti, molti hanno messo in discussione la natura simbolica e, più in generale, rappresentazionale della mente edei processi cognitivi12. Tuttavia, si può affermare che la dottrina simbolico-rappresentazionale costituisce la forma"classica" della scienza cognitiva. Tornando alla semantica cognitiva, in essa i significati vengono ricondotti appunto arappresentazioni di questo genere: il significato di un'espressione linguistica è spiegato nei termini dellerappresentazioni che i parlanti costruiscono ed elaborano nel corso del processo di comprensione. Possiamo introdurre aquesto punto una caratterizzazione più precisa del settore della semantica cognitiva, riportando le seguenti tesiindividuate da Diego Marconi (1992a) come caratteristiche del paradigma cognitivo in semantica:

1. la semantica dev'essere una teoria della comprensione, e la comprensione è un'attività mentale;

2. la semantica modellistica, quali che ne siano i meriti, non è una teoria della comprensione;

3. una teoria semantica adeguata deve rispondere alla domanda: che cosa viene costruito quando una fraseviene compresa?

4. la comunicazione è resa possibile dalla somiglianza o convergenza delle costruzioni mentali, nondall'esistenza di entità astratte, oggettive e pubblicamente accessibili (sensi, intensioni, ecc.);

5. le costruzioni mentali non hanno bisogno a loro volta di interpretazione (in senso modellistico), perchésono interpretazioni (Marconi 1992a, pp. 431-432).

Va precisato che tali tesi forniscono non tanto un insieme di condizioni necessarie e sufficienti che caratterizzano ilconcetto "semantica cognitiva", quanto piuttosto una serie di "tratti stereotipici", che possono ammettere diverseeccezioni rispetto alle posizioni dei vari ricercatori che operano nel settore. In particolare, il punto 5. non è accettatouniversalmente. Fra coloro che lo condividono, la posizione più estrema è probabilmente quella del solipsismometodologico sostenuto da Jerry Fodor in (Fodor 1980a), il quale nega ogni rilevanza dei concetti semantici (siaintensionali che estensionali) per la caratterizzazione delle rappresentazioni mentali. Per una posizione di tipo diverso siveda però, ad esempio, (Harman 1987). O anche Woods (1980), che, parlando di "un linguaggio interno, che precede sialogicamente che cronologicamente lo sviluppo del linguaggio esterno, e nei cui termini i significati delle espressioni dellinguaggio esterno sono definite" afferma: "questo stesso linguaggio interno richiede una semantica, e sosterrò che senza 10 Sul rapporto fra semantica modellistica e semantica cognitiva, l'introduzione a (Peters e Saarinen 1982),(Santambrogio e Violi 1986) e (Marconi 1992a) costituiscono utili saggi introduttivi; (Peters e Saarinen 1982) e (Eco etal. 1986) sono importanti raccolte di saggi sull'argomento.11 Sulla scienza cognitiva si vedano (Bara 1990); (Collins e Smith 1988); (Gardner 1985); (Johnson-Laird 1988);(Tabossi 1988).12Per una panoramica del recente dibattito su questi temi nel settore dell'IA si veda ad esempio (Kirsh 1991).

Page 20: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

8

una qualche comprensione della sua semantica, non si può avere una spiegazione semantica completa del linguaggioesterno" (p. 304-5). Nel seguito prenderemo in esame la linea "logicista" in IA, che risulta certamente rilevante per ilproblema della semantica delle lingue naturali nel filone, in senso lato, cognitivo. Come vedremo, i logicisti in IAnegano esplicitamente il punto 513.

In generale, è pur vero tuttavia che, nelle teorie semantiche di tipo cognitivo, l'enfasi viene posta più sullacomprensione degli enunciati, intesa come costruzione di rappresentazioni interne, che non, ad esempio, sulle lorocondizioni di verità. Analogamente, le relazioni inferenziali fra enunciati non vengono di norma ricondotte a nessi diconseguenza logica, ma a elaborazioni computazionali effettuate sulle rappresentazioni. Tali elaborazioni vengonoeffettuate da procedure computazionali, da cui il termine semantica procedurale, che caratterizza molti degli approccialla semantica cognitiva, sviluppati sia in ambito di IA che in ambito più propriamente psicologico. Il termine semanticaprocedurale viene impiegato con significati diversi. Sulle diverse accezioni di procedura e di semantica procedurale siveda ancora (Marconi 1992a). Qui ci limitiamo a ricordare, per il momento, che, in IA, il termine semantica proceduraleè stato diffuso da Winograd (1973), e poi ripreso ed approfondito, ad esempio, da Woods (1980). In ambito psicologico,il modello procedurale più noto e autorevole è probabilmente la teoria dei modelli mentali di Philip Johnson-Laird(Johnson-Laird 1982 e 1983; Johnson-Laird et al. 1984). Secondo Johnson-Laird esistono due livelli di rappresentazionesemantica. Il primo livello consiste in ciò che lui chiama una rappresentazione "intensionale", cioè una rappresentazionesimbolica del tipo, ad esempio, che si può ottenere mediante una rete semantica (cfr. infra, capp. 4-7; si noti che questouso del termine "intensionale" non ha nulla a che fare con le intensioni della tradizione modellistico formale: qui si ha ache fare con un piano puramente sintattico di rappresentazione). Il secondo livello consiste di una rappresentazione"estensionale" che può essere generata ed aggiornata ricorsivamente a partire dalla rappresentazione simbolica"intensionale". Tale rappresentazione estensionale è un modello mentale del mondo, costruito sulla base della memoria,della percezione e dell'immaginazione. Un modello mentale è una rappresentazione analogica, con una struttura che inqualche modo "corrisponde" al mondo reale rappresentato. Così, la rappresentazione mentale di un concetto consiste inparte delle procedure che rendono possibile costruire ed elaborare un modello mentale: "per esempio, la semanticadell'espressione 'a destra di' specifica la direzione da seguire per formare un modello mentale di un'asserzione come 'A èalla destra di B'. Il sistema interpretativo colloca un'entità in un vettore spaziale, e quindi lo percorre nella direzioneappropriata rispetto al punto di vista dell'osservatore in maniera da localizzare la seconda entità" (Johnson-Laird et al.1984, pp. 311-312).

La semantica cognitiva è stata concepita da alcuni suoi sostenitori in contrapposizione esplicita, e con intentidichiaratamente polemici, rispetto alla semantica modellistica di tipo filosofico. Ad esempio Johnson-Laird (1982)sottolinea i seguenti punti di disaccordo fra semantica modellistica e semantica di tipo psicologico/cognitivo. Innanzitutto il problema del lessico. Abbiamo visto che per la tradizione modellistica il problema del lessico è al di fuori degliscopi della semantica, mentre per la semantica cognitiva essa è parte integrante di una teoria del significato. Inoltre, leposizioni di Putnam sui designatori rigidi postulano che il significato di certe classi di termini del linguaggio non siano"nella testa" dei parlanti - siano quindi, in un certo senso, inconoscibili. Per Johnson-Laird invece il significato di tutti itermini lessicali, compresi quelli per tipi naturali, vanno identificati con entità di tipo mentale. In secondo luogoJohnson-Laird contrappone il concetto di modello mentale al concetto di mondo possibile. In semantica modellistica ilsignificato delle varie classi di espressioni dipende da ciò che è vero in un insieme di norma infinito di mondi possibili.Tuttavia gli esperimenti degli psicologi hanno mostrato che gli esseri umani hanno grandi difficoltà a prendere inconsiderazione anche un piccolo numero di alternative contemporaneamente. Quindi Johnson-Laird ipotizza che gliesseri umani costruiscano un solo modello mentale alla volta, rivedendolo e modificandolo quando si rivelasseinadeguato. D'altro canto i mondi possibili e i modelli della semantica formale sono strutture complete, nel senso cheassegnano un riferimento ad ogni espressione linguistica. Viceversa, i modelli mentali sono modelli parziali, cheassegnano un valore di verità soltanto ad alcuni degli enunciati del linguaggio. Infine, Johnson-Laird sottolinea ilproblema degli atteggiamenti proposizionali, che, afferma, non può essere affrontato senza tenere conto delle limitazionipsicologiche dei singoli agenti.

Alcune delle obiezioni mosse dagli scienziati cognitivi alla semantica modellistica sono chiaramente inconsistentie basate su fraintendimenti. Barbara Partee (1979b) esamina ad esempio l'obiezione di parte cognitivista in base allaquale le intensioni (intese come funzioni da mondi possibili ad estensioni) non sarebbero plausibili da un punto di vistapsicologico in quanto oggetti infiniti di tipo insiemistico, e quindi non elaborabili da soggetti finiti. Tuttavia questaobiezione si basa sulla confusione fra il fatto di conoscere una funzione, nel senso di conoscere un metodo percalcolarne i valori, e conoscere l'intero decorso dei valori della funzione stessa (che appunto, può essere un oggettoinsiemistico infinito). In base a questa obiezione non sarebbe ad esempio possibile conoscere le operazioni aritmetiche,come la somma, perché anch'esse hanno un decorso di valori infinito. Sembra che l'obiezione di Johnson-Laird

13 Nel par. 3.2 vedremo che i logicisti richiedono esplicitamente che, affinché le rappresentazioni interne di un sistemacomputazionale possano essere considerate effettivamente delle rappresentazioni, deve essere associata loro unasemantica modellistica (McDermott 1978). A ciò si può obiettare che questo non costituisce ancora una condizionesufficiente, in quanto la semantica modellistica, come abbiamo visto, non rende conto del significato delle costantiprimitive non logiche.

Page 21: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

9

sull'implausibilità cognitiva dei mondi possibili si fondi anch'essa su di un fraintendimento di questo genere. In realtàmodelli mentali e modelli della semantica model teoretica si collocano su piani totalmente diversi. Ad esempio, èpossibile costruire un dimostratore automatico di teoremi per una logica modale, ed implementarlo su un calcolatore;dopo di che, si può assegnare una semantica dei mondi possibili al linguaggio utilizzato in maniera da rendere contodelle prestazioni del dimostratore stesso (provando, poniamo, che il dimostratore è corretto rispetto a quella semantica).In questo modo, la semantica dei mondi possibili può fornire un resoconto adeguato del comportamento deldimostratore di teoremi. Ciò però non implica certamente che i mondi possibili, o qualche versione finita di essi, stiano"nella memoria" del calcolatore. In altri termini, quand'anche la semantica modellistica fosse pensabile come un modellopsicologicamente adeguato delle prestazioni linguistiche umane, questo non comporterebbe che le intensioni, o imodelli, o i mondi possibili sono qualcosa che sta nella mente dei parlanti. Questi fraintendimenti poggianoprobabilmente su accezioni diverse del termine "semantica", accezioni che Woods ad esempio esamina in (Woods 1975e 1980), e che prenderemo in considerazione nel seguito (par. 4.4). Tutto ciò non toglie ovviamente che il concetto dimodello mentale sia interessantissimo dal punto di vista psicologico o per una teoria del significato. Esso si colloca peròa livello di formalismo di rappresentazione, a livello sintattico quindi, cui, eventualmente, se lo si ritenesse utile perragioni di ordine metateorico o di ordine filosofico o di altro genere, si potrebbe forse assegnare una semantica, di tipomodellistico o di qualche altro tipo.

Per quanto riguarda il problema dei rapporti fra semantica modellistica e semantica cognitiva, Partee (1982) haindividuato due possibili atteggiamenti, che ha chiamato rispettivamente posizione degli obiettivi comuni (common goalposition) e posizione separatista (separatist position). In base alla prima, semantica modellistica e semantica cognitivapossono essere considerate parti di un unica impresa di ricerca, che può condividere obiettivi e strumenti. BarbaraPartee stessa condivide una prospettiva di questo genere. Una posizione degli obiettivi comuni in IA è quella di Woods(1980), che, parlando di semantica procedurale, afferma ad esempio:

Io vedo l'approccio procedurale al problema della semantica non come un'alternativa alla piùtradizionale spiegazione model teoretica tarskiana, ma piuttosto come un mezzo per completare talespiegazione con quello che nella terminologia informatica si chiamerebbe un'estensione "compatibileverso l'alto". Cioè, io vedo la spiegazione tarskiana come un caso particolare di spiegazione procedurale -nella quale le procedure coinvolte sono le definizioni dei quantificatori e dei connettivi logici in quantoprocedure per assegnare valori di verità a proposizioni complesse come funzione dei valori di verità deiloro costituenti. (Woods 1980, p. 317)

In base alla posizione separatista invece semantica modellistica e semantica cognitiva assumono punti di vistacompletamente distinti sul linguaggio, e non esiste quindi una reale possibilità di interazione fra i due progetti. Unaposizione di questo genere è ad esempio quella di Cresswell14 che, da un lato, considera irrinunciabile per la semanticafilosofica il riferimento a concetti come quelli di verità e di denotazione, e dall'altro rifiuta alle rappresentazioni mentaliqualsiasi ruolo in una teoria filosofica del significato. Una posizione simile è quella di Putnam (1978), che afferma: "lateoria della comprensione del linguaggio e la teoria del riferimento e della verità hanno molto meno a che fare l'una conl'altra di quanto molti filosofi hanno assunto". Una terza posizione, chiamata abbandonismo viene identificata da MarcoSantambrogio e Patrizia Violi (1986). Mentre sia i separatisti che i teorici degli obiettivi comuni concedono una pienalegittimità teorica e scientifica ad entrambe le imprese, della semantica modellistica e di quella cognitiva, gliabbandonisti sostengono che l'intero progetto della semantica modellistica poggia su basi errate e inconsistenti. Unaposizione di questo genere è sostenuta da alcuni scienziati cognitivi, come ad esempio Ray Jackendoff (1986).

In ogni caso, la difficoltà di articolare in maniera precisa i rapporti fra semantica modellistica e semanticacognitiva deriva in gran parte dalla natura stessa della seconda (e della scienza cognitiva più in generale), che sipresentano come un fenomeno estremamente variegato, sia per gli strumenti utilizzati, sia per la diversa formazione deiricercatori, sia per gli obiettivi che vengono perseguiti. L'interesse per gli aspetti psicologici, ad esempio, è un fattoreestremamente variabile. L'enfasi sull'adeguatezza empirica dal punto di vista psicologico dei modelli proposti è unfattore che varia molto di caso in caso, e talvolta non viene affatto presa in considerazione. La stessa cosa vale per gliaspetti computazionali: sebbene la concezione computazionale della mente sia un'idea guida di tutta la ricerca in scienzacognitiva, non ogni teoria produce modelli formulati in termini algoritmici, oppure implementati (o implementabili) sucalcolatore. Il grado di formalizzazione e i tipi di strumenti formali impiegati sono estremamente diversi. Di questocomplesso panorama, nel seguito prenderemo in considerazione l'IA di tipo simbolico, e in particolare quella linea diricerca dell'IA simbolica che va usualmente sotto il nome di linea "logicista", che propugna la centralità degli strumentilogico formali nell'IA. Chiariremo meglio nel prossimo capitolo queste posizioni, limitandoci qui a motivare brevementequesta scelta. Dal nostro punto di vista, il filone logicista in IA è particolarmente interessante per diverse ragioni.Innanzi tutto, si è dimostrato essere uno dei filoni più fecondi della ricerca nelle scienze cognitive, ed anche quello incui pare emergere qualcosa che più assomiglia ad un paradigma unitario, ad un progetto globale, con una linea disviluppo progressiva e "cumulativa", e non una serie di modelli, di singoli esempi isolati. Questo ha fatto sì che alla

14 Si veda ad esempio (Cresswell 1982).

Page 22: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 2

10

lunga si imponesse come il paradigma dominante nella ricerca della cosiddetta IA simbolica (almeno del punto di vistadella sociologia della ricerca). Ciò è indubbiamente legato al fatto di proporre una metodologia generale di ricerca, oalmeno di evidenziare l'esigenza di individuarne una. Inoltre, il fatto che la metodologia utilizzata si rifaccia aglistrumenti della logica formale può fare sperare in una maggiore continuità con il lavoro svolto nell'ambito dellasemantica formale di tipo filosofico. D'altro canto, proprio il fatto di fare riferimento agli stessi strumenti formali puòfare sorgere il dubbio che ci si trovi di fronte a una sorta di "circolo vizioso": i filosofi, per affrontare i problemi insolutiposti dalla semantica formale di tipo logico, si rivolgono verso i modelli computazionali dell'IA, e contemporaneamentel'IA, per fare fronte alle proprie esigenze di rigore metodologico, utilizza i metodi della logica. Il nostro scopo saràappunto quello di spezzare almeno in parte tale circolo, ponendo in evidenza i possibili contributi dell'IA logicista allateoria logica del significato, e i rapporti che intercorrono fra le due discipline. Prima di proseguire, è tuttavia necessariofare un passo indietro, ed esaminare più a fondo gli assunti generali dell'IA di tipo simbolico, quelli dell'IA del filone"logicista" in particolare, il dibattito fra sostenitori della logica e suoi oppositori, e, in generale, il posto in cui si collocal'approccio logico nell'ambito dell'IA. Questo sarà il tema del capitolo seguente.

Page 23: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

3. Logica e Intelligenza Artificiale3.1 I modelli computazionali simbolici della mente dalle macchine di Turing all'intelligenza

artificiale

Per tracciare una storia dello studio della mente nei termini di computazione simbolica, è opportuno partire dalconcetto di Macchina di Turing (d'ora in poi MT). Storicamente infatti, le MT hanno fornito sia un modello astratto dimacchina calcolatrice da cui hanno preso le mosse lo sviluppo dell'informatica teorica e la tecnologia dei calcolatoridigitali, sia il modello di mente cui si sono ispirati i filosofi funzionalisti della mente1. Quando lo sviluppodell'informatica ha consentito di tentare una verifica su modelli computazionali reali dell'ipotesi della mente comesistema computazionale, queste due tradizioni sono confluite nell'intelligenza artificiale "classica" di tipo simbolico.

Le MT sono state definite dal logico inglese Alan Turing durante gli anni trenta (Turing 1936-37), quando icalcolatori e l'informatica non esistevano ancora. Lo scopo originario di Turing si collocava nell'ambito delle ricerchelogiche sui fondamenti della matematica, e consisteva nell'individuare un equivalente formale del concetto intuitivo dialgoritmo, cioè di procedura che consenta di risolvere un problema applicando un numero finito di volte in mododeterministico un insieme (finito) di istruzioni. Si trattava di una questione studiata, da differenti punti di vista, da moltilogici in quel periodo (oltre Turing, anche Church, Gödel, Kleene, ed altri), e che ha dato origine a quel ramo dellalogica matematica detto teoria della computabilità o della calcolabilità effettiva, o anche teoria della ricorsività2.Turing propose di risolverlo definendo un modello formale del comportamento di un essere umano che esegue uncalcolo di tipo algoritmico3. Tale modello è dato sotto forma di una classe di dispositivi computazionali, di macchinecalcolatrici astratte, che in seguito furono dette appunto macchine di Turing. Le MT sono macchine astratte nel sensoche non vengono presi in considerazione quei vincoli che sono fondamentali se si intende progettare una macchinacalcolatrice reale (ad esempio le dimensioni della memoria, il tempo di calcolo, e così via), e soprattutto nel senso cheesse sono definite a prescindere dalla loro realizzazione fisica (ad esempio, dal tipo di hardware utilizzato). Vale a dire,cosa sia una MT dipende esclusivamente dalle relazioni funzionali che esistono fra le sue parti, e non dal fatto di poteressere costruita con particolari dispositivi materiali.

Non è questa la sede per una trattazione dettagliata delle MT4. Ci limitiamo a ricordare che le MT operano sudati che consistono di sequenze finite di simboli appartenenti a un determinato alfabeto (che, per ogni MT, deve essereanch'esso finito). I simboli che una macchina elabora sono scritti su di un dispositivo di memoria, il nastro dellamacchina, di capacità potenzialmente illimitata, ma di cui, in ogni fase del calcolo, può essere utilizzata solo unaporzione finita.

Ogni MT è "attrezzata" per eseguire un tipo di calcolo specifico. Dispone cioè di una serie di istruzioni tali che,applicate a partire da una certa situazione iniziale, in cui i dati del calcolo (l'input) sono scritti sul nastro mediante unacodifica opportuna, esse consentano di raggiungere una situazione finale in cui la macchina si ferma con i risultati(l'output) scritti sul nastro. Lo scopo delle istruzioni è di modificare i simboli scritti sul nastro, in modo da ottenerel'output voluto a partire dai simboli in input. Tali istruzioni, ovviamente, devono essere tali da poter essere applicate inmodo deterministico. Una volta fissato l'alfabeto, ogni MT è caratterizzata dall'insieme delle istruzioni, che è chiamatotavola di quella macchina.

Le MT possono calcolare un grande numero di funzioni. In particolare, una volta fissato un modo per codificare inumeri naturali mediante i simboli di un alfabeto finito, è possibile definire MT che calcolano le usuali funzioniaritmetiche: addizione, sottrazione, moltiplicazione, elevamento a potenza, e così via. Secondo Turing, le funzioni chepossono essere calcolate da una MT sono tutte e sole le funzioni calcolabili per mezzo di un algoritmo. Questaidentificazione fra funzioni calcolabili per mezzo di una MT e funzioni algoritmiche va usualmente sotto il nome di Tesidi Church-Turing, o Tesi di Church (Church 1936) (il logico americano Alonzo Church giunse infatticontemporaneamente alle stesse conclusioni di Turing in modo indipendente, utilizzando un formalismo, il λ-calcolo,equivalente alle MT), e costituisce uno degli enunciati fondamentali della teoria logica della computabilità.

L'interesse verso le MT nell'ambito della teoria delle macchine calcolatrici e in informatica risiede innanzi tuttonel fatto che le MT sono un modello del calcolo algoritmico, quindi di un tipo di calcolo che è, in linea di principio,automatizzabile, eseguibile da un dispositivo meccanico. Ogni MT è quindi il modello astratto di un calcolatore -astratto in quanto prescinde da alcuni vincoli di finitezza cui i calcolatori reali devono sottostare; ad esempio, lamemoria di una MT (vale a dire il suo nastro) è potenzialmente estendibile all'infinito (anche se, in ogni fase del calcolo,una MT può sempre utilizzarne solo una porzione finita), mentre un calcolatore reale ha sempre precisi limiti dimemoria. 1 Si veda oltre, in questo stesso paragrafo.2Si vedano ad esempio (Kleene 1952); (Hermes 1961); (Minsky 1967); (Davis 1958); (Rogers 1967).3Questo non significa che Turing intendesse proporre una descrizione del processo psicologico del calcolare. Il suoscopo era piuttosto quello di estrarre quelle caratteristiche del comportamento necessarie per giungere a unacaratterizzazione generale ed astratta del concetto di calcolo.4Per una tale trattazione rimandiamo ai testi citati nella nota precedente.

Page 24: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

2

Vi sono altre ragioni che giustificano l'analogia fra MT e moderni calcolatori digitali. Sino ad ora abbiamoconsiderato MT che sono in grado di effettuare un solo tipo di calcolo, sono cioè dotate di un insieme di istruzioni checonsente loro di calcolare una singola funzione (ad esempio l'addizione, o la moltiplicazione). Esiste tuttavia lapossibilità di definire una MT, detta Macchina di Turing Universale (d'ora in poi MTU), che è in grado di simulare ilcomportamento di ogni altra MT. Ciò è reso possibile dal fatto che le istruzioni di ogni MT possono essererappresentate in maniera tale da poter essere scritte sul nastro di una MT. In questo modo, esse possono essere prese ininput dalla MTU, la quale, a sua volta, le esegue.

Poiché la MTU è in grado di simulare il comportamento di qualsiasi macchina di Turing, allora essa, in virtùdella Tesi di Church, è in grado di calcolare qualsiasi funzione che sia calcolabile mediante un algoritmo. Ciò checaratterizza la MTU rispetto alle macchine di Turing usuali è costituito dal fatto di essere una macchina calcolatriceprogrammabile. Mentre infatti le normali macchine di Turing eseguono un solo programma, che è "incorporato" nellatavola delle loro istruzioni, la MTU assume in input, oltre ai dati veri e propri, anche il programma che deve eseguire(cioè, la codifica delle istruzioni della MT che deve simulare). Le istruzioni che compongono la tavola della MTUhanno esclusivamente la funzione di consentirle di interpretare e di eseguire il programma ricevuto in input. Un'altracaratteristica fondamentale della MTU è dato dal tipo di trattamento riservato ai programmi. La MTU tratta i programmi(cioè la codifica delle istruzioni della MT da simulare) e i dati (l'input della MT da simulare) in maniera sostanzialmenteomogenea: essi vengono memorizzati sullo stesso supporto (il nastro), rappresentati utilizzando lo stesso alfabeto disimboli ed elaborati in modo simile. Queste caratteristiche sono condivise dagli attuali calcolatori, i quali presentano lastruttura che va sotto il nome di architettura di von Neumann.

Storicamente, il primo calcolatore con architettura di von Neumann è stato l'EDVAC (acronimo di ElectronicDiscrete Variable Automatic Computer), progettato e realizzato dallo stesso von Neumann presso l'università diPrinceton fra il 1945 e il 1952. La struttura di un calcolatore di von Neumann è, molto schematicamente, la seguente. Undispositivo di input e un dispositivo di output permettono di accedere dall'esterno alla memoria del calcolatore,consentendo, rispettivamente, di inserirvi e di estrarne dei dati. Le informazioni contenute in memoria vengonoelaborate da una singola unità di calcolo (detta CPU - Central Process Unit), che opera sequenzialmente su di essi. Lacaratteristica più importante della macchina di von Neumann è costituita dal fatto che sia dati che programmi vengonotrattati in modo sostanzialmente omogeneo, ed immagazzinati nella stessa unità di memoria. Così, quando unprogramma deve essere eseguito, l'unità di calcolo lo reperisce in memoria, e lo applica quindi ai dati, anch'essiconservati in memoria. Questo consente una grande flessibilità al sistema. Ad esempio, poiché dati e programmi sonooggetti di natura omogenea, è possibile costruire programmi che prendano in input altri programmi e li elaborino, e cheproducano programmi in output. Queste possibilità sono ampiamente sfruttate negli attuali calcolatori digitali, e da essederiva gran parte della loro potenza e della loro facilità d'uso (ad esempio, un compilatore o un sistema operativo sonoessenzialmente programmi che operano su altri programmi). In questo senso, un calcolatore di von Neumann è analogoalla MTU. Anche la potenza computazionale è la stessa, nel senso che, se lo si suppone dotato di una memoriavirtualmente infinita, un calcolatore di von Neumann è in grado di calcolare tutte le funzioni computabili secondo laTesi di Church (per questo si dice che una macchina di von Neumann è un calcolatore universale). Per queste ragioni, laMTU costituisce un modello astratto degli attuali calcolatori digitali (elaborato prima della loro realizzazione fisica), ela teoria delle MT e della ricorsività costituisce, per così dire, la dottrina dei fondamenti dell'informatica teorica.

Per altre vie, la teoria delle MT ha avuto influenze rilevanti sulle riflessioni filosofiche sulla natura della mente.La Tesi di Church gode di uno statuto particolare nell'ambito degli enunciati matematici. "Algoritmo" e "funzionecomputabile in modo algoritmico" sono concetti intuitivi, non specificati in modo formale, per cui una dimostrazionerigorosa di equivalenza con il concetto di funzione calcolabile da una MT non è possibile. La Tesi di Church quindi nonè un teorema, e neppure una congettura che potrebbe un giorno, in linea di principio, diventarlo. Si tratta di un enunciatoche si fonda su un ampio spettro di evidenza matematica di tipo euristico5. Ai nostri fini, è interessante notare che gliapprocci al problema della computabilità basati sull'elaborazione di macchine astratte, come appunto le MT, hannocondotto alcuni studiosi a considerare la Tesi di Church come una sorta di "legge empirica" piuttosto che come unenunciato a carattere logico-formale. Il logico Emil Post, il quale propose un concetto di macchina calcolatrice in parteanalogo a quello sviluppato da Turing (Post 1936), sottolineava il suo disaccordo con chi tendeva ad identificare la Tesidi Church con un assioma o una mera definizione. Essa dovrebbe piuttosto essere considerata, afferma Post, una "ipotesidi lavoro", che, se opportunamente "corroborata", dovrebbe assumere il ruolo di una "legge naturale", una"fondamentale scoperta circa le limitazioni del potere matematizzante dell'Homo sapiens".

Su questa linea procedono alcuni sviluppi successivi del pensiero dello stesso Turing. Nel saggio "Macchinecalcolatrici ed intelligenza" (Turing 1950) assistiamo ad una sorta di radicalizzazione del modo di intendere la Tesi diChurch. Turing si dichiara fiducioso che un calcolatore universale possa giungere a simulare, nel volgere di pochidecenni, non soltanto il comportamento computazionale ed algoritmico di un essere umano, ma anche qualsiasi altraattività umana di tipo linguistico. Turing propone di riformulare la domanda "possono pensare le macchine?" nei terminidel cosiddetto gioco dell'imitazione. Il gioco viene giocato da tre "attori": a) un essere umano, b) una macchinacalcolatrice e c) un altro essere umano, l'interrogante. L'interrogante non può vedere a) e b), non sa chi dei due sia

5Che non è possibile analizzare in questa sede; si veda però (Kleene 1952).

Page 25: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

3

l'uomo, e può comunicare con loro solo in maniera indiretta (ad esempio, supponendo di disporre della tecnologiaattuale, attraverso un terminale video e una tastiera). L'interrogante deve sottoporre ad a) e a b) delle domande, inmaniera tale da scoprire, nel più breve tempo possibile, quale dei due sia l'uomo e quale la macchina. a) si comporterà inmodo da agevolare c), mentre b) dovrà rispondere in maniera tale da ingannare c) il più a lungo possibile. Invece dichiedersi se le macchine possono pensare, dice Turing, è più corretto chiedersi se una macchina possa ingannare unuomo nel gioco dell'imitazione, o, comunque, quanto a lungo possa resistergli. Questo "esperimento mentale" viene oggiabitualmente indicato col nome di Test di Turing.

Turing era eccessivamente ottimista circa le possibili prestazioni delle macchine calcolatrici: "credo che entrocirca 50 anni sarà possibile programmare calcolatori [...] per far giocare loro il gioco dell'imitazione così bene che unesaminatore medio non avrà più del 70 per cento di probabilità di compiere l'identificazione esatta dopo cinque minutidi interrogazione. Credo che la domanda iniziale, 'possono pensare le macchine?', sia troppo priva di senso per meritareuna discussione. Ciò nonostante credo che alla fine del secolo l'uso delle parole e l'opinione corrente saranno talmentemutate che chiunque potrà parlare di macchine pensanti senza aspettarsi di essere contraddetto" (in Somenzi e Cordeschi1986, p. 166). Ci troviamo di fronte ad una sorta di versione "estremista", o "radicale", della Tesi di Church, che, grossomodo, potrebbe essere formulata come segue: ogni attività linguistico-cognitiva è calcolabile da una macchina diTuring (il che non vuol dire, ovviamente, che la nostra mente funziona come una macchina di Turing, ma che ogniattività mentale è simulabile da un dispositivo che abbia la stessa potenza computazionale di una macchina di Turing).

Questo testo viene spesso considerato uno degli atti di nascita dell'intelligenza artificiale. Lo stesso test di Turingè stato a lungo considerato come il criterio più adeguato per stabilire la validità empirica dei modelli computazionalidella mente. In realtà è ancora preistoria, ancora pesantemente condizionata da assunzioni di tipo comportamentista. Daqui parte tuttavia una delle tradizioni dello studio computazionale della mente. La versione "estremista" della Tesi diChurch è di fatto condivisa, in qualche forma, dalla maggior parte dei seguaci dell'approccio computazionale classicoall'intelligenza artificiale e alla scienza cognitiva, seppure fondata su basi teoriche più articolate.

Sul versante filosofico, tali basi sono state fornite dalla filosofia funzionalista della mente. Negli anni successivialla seconda guerra mondiale, le due tendenze allo studio filosofico della mente più diffuse nel mondo anglosassoneerano il comportamentismo e il riduzionismo di tipo materialista (nella forma della teoria dell'identità degli stati mentalicon stati del sistema nervoso centrale). Il funzionalismo nasce come reazione a entrambe queste posizioni. Prendiamocome punto di partenza il problema di stabilire che cosa significa dire che due soggetti si trovano nello stesso statomentale, oppure che di essi è vero un certo predicato psicologico, come ad esempio soffrire o credere che p (dove p è uncerto enunciato). Il comportamentismo (o behaviorismo) è una teoria filosofica della mente legata alle posizioni delneopositivismo logico. La risposta dei comportamentisti al problema degli stati mentali deriva direttamente dalla teorianeopositivista della conoscenza e del significato: poiché le uniche espressioni linguistiche dotate di senso sono quelleriducibili a resoconti dell'esperienza empirica, il discorso psicologico non può fare riferimento a entità mentali interneinaccessibili dal punto di vista osservativo (stati mentali, rappresentazioni mentali, pensieri, e così via). Quindi, l'unicomodo per conferire un senso a un linguaggio psicologico consiste nel fondarlo sui comportamenti esibiti in modomanifesto. Il comportamentismo presenta due varianti principali, il comportamentismo logico, sviluppato in ambitofilosofico, e il comportamentismo metodologico, nato nell'ambito della ricerca psicologica empirica. Lo scopo deicomportamentisti logici (Ryle 1949; Hempel 1980) era quello di fornire dei criteri di significato accettabili dal punto divista neoempirista per quelle espressioni del linguaggio ordinario che concernono fenomeni mentali: si trattava diindividuare insiemi di condizioni necessarie e sufficienti affinché le espressioni linguistiche riferite a stati mentalipotessero essere ridotte ad espressioni concernenti il comportamento. I comportamentisti metodologici (Skinner 1953) siproponevano invece di fornire una metodologia della psicologia in quanto scienza: il loro scopo era di fondare unapsicologia scientifica in accordo con i dettami del neoempirismo, a prescindere dal fatto che ciò comportasse o meno unrecupero e una giustificazione del linguaggio psicologico ordinario e del senso comune.

La teoria dell'identità degli stati mentali con stati del sistema nervoso centrale (ad es. Smart 1959; Armstrong1981) è un tipo di riduzionismo materialista che storicamente si è contrapposto alle varie forme di comportamentismo. Iseguaci della teoria dell'identità sostengono che è legittimo postulare l'esistenza di stati mentali e di oggetti mentaliinterni, e propongono di identificarli con stati cerebrali descrivibili a livello neurofisiologico. Ad ogni stato psicologico(ad esempio credere che p) dovrebbe corrispondere un predicato (diciamo Cp ) definibile nel linguaggio dellaneurofisiologia. Dire che qualcuno, in un certo istante, crede p dovrebbe essere equivalente a dire che, in quell'istante,Cp è vero del suo cervello.

Sia comportamentismo che teoria materialista dell'identità presentano numerose difficoltà dal punto di vistafilosofico. Un problema che i comportamentisti logici dovettero porsi da subito concerne il fatto che il comportamentotipico corrispondente ai vari termini psicologici emerge solo a determinate condizioni: ad esempio, qualcuno puòprovare dolore, o avere fame, e non potere, o non volere, esibire il comportamento corrispondente. D'altro canto, uncomportamento può essere esibito fingendo. La soluzione proposta fu quella di ammettere la possibilità che le traduzionidal linguaggio mentale al linguaggio comportamentale comprendessero dei condizionali con antecedenti di tipocontrofattuale. Ad esempio, provare dolore significa che, se si verificano certe condizioni opportune (mancanza divincoli e impedimenti di altro tipo, eccetera), allora viene esibito un certo comportamento. Ciò comporta tuttaviaulteriori problemi. In filosofia della scienza le proprietà che ammettono traduzioni di questo tipo vengono dette

Page 26: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

4

proprietà disposizionali. A prescindere dalla difficoltà di individuare condizioni controfattuali opportune per ladefinizione comportamentista dei termini mentali, è noto che le definizioni di questo tipo non consentono una pienaeliminabilità del definiendum (Hempel 1952, par. 6). Quindi, esse non consentono una riduzione completa del discorsomentale nei termini di quello comportamentale, come era nel progetto originario del comportamentismo logico.

Per quanto concerne la teoria materialista dell'identità, essa comporta ad esempio un forte "sciovinismo"antropocentrico: per avere stati mentali bisogna avere un sistema nervoso come quello dell'uomo. Esseri diversi(animali, macchine, angeli, extraterrestri) non potrebbero avere stati mentali, o comunque non potrebbero avere gli stessistati mentali di un essere umano6.

I filosofi funzionalisti proposero di superare queste difficoltà ipotizzando che i criteri per l'identificazione deglistati mentali vadano individuati in base alle relazioni funzionali fra gli stati mentali stessi. Il funzionalismo riconosce lalegittimità di postulare l'esistenza di stati mentali interni; tuttavia tali stati interni non vengono identificati con statidescrivibili a livello neurofisiologico, ma vengono definiti esclusivamente dal punto di vista funzionale, sulla base cioèdelle loro relazioni reciproche e delle loro relazioni con gli input sensoriali e gli output comportamentali: due stati sonoidentici se sono identiche le loro relazioni funzionali con gli altri stati e con gli input e gli output del sistema, aprescindere da come essi sono realizzati fisicamente. Questo è esattamente il modo in cui sono definiti gli stati interni diuna macchina calcolatrice astratta, ad esempio di una MT. Le macchine calcolatrici astratte, le MT in particolare,diventano quindi il modello secondo il quale viene pensata la mente da parte di alcuni filosofi funzionalisti. Rispetto allateoria materialista dell'identità, il funzionalismo presenta il vantaggio che uno stesso stato mentale può essere"istanziato" da supporti fisici completamente diversi purché idonei a realizzare le relazioni funzionali rilevanti: in lineadi principio una mente potrebbe essere fatta di formaggio svizzero, dice ad esempio Putnam. Facendo riferimento allaterminologia informatica, la definizione funzionalista degli stati mentali porta all'identificazione mente/software esistema nervoso/hardware: come le proprietà formali che definiscono un programma prescindono dalle caratteristichefisiche dei calcolatori che lo eseguono, così le proprietà degli stati mentali prescindono dalle caratteristiche fisiche edanatomiche del sistema nervoso. La mente può essere vista come una macchina virtuale astratta implementatasull'hardware neuronale. Nasce quindi la metafora della mente come programma, o come insieme di programmi, che"girano" sul cervello.

Fra la fine degli anni cinquanta e gli anni sessanta (e soprattutto a partire dalla fine degli anni sessanta) glisviluppi tecnologici dell'informatica fornirono gli strumenti perché le tesi del funzionalismo potessero trasformarsi, dapura speculazione filosofica, ad una ipotesi che guidasse la realizzazione effettiva di programmi per calcolatore chesimulassero attività di tipo mentale, dando origine alla disciplina che va sotto il nome di intelligenza artificiale7. Iltermine "intelligenza artificiale" si può far risalire all'estate del 1956, quando, al Darthmouth College di Hanover, nelNew Hampshire, si tenne un congresso dal titolo The Darthmouth Summer Research Project on Artificial Intelligence, icui organizzatori principali furono John McCarthy e Marvin Minsky8.

La nascita dell'IA comportò una "riunificazione" delle due tradizioni che si erano sviluppate a partire dalle MT,vale a dire quella di ambito informatico e quella relativa alla filosofia della mente. Oltre a queste, erano presenti anchealtre componenti culturali. Importanti contributi furono forniti, ad esempio, dalla psicologia cognitivista, dallalinguistica chomskiana, dalla logica matematica.

Ci fu da sempre una certa ambiguità di intenti circa lo statuto e i fini della ricerca in IA, dovuta in parte proprioalla natura eterogenea delle discipline che vi sono confluite. Da un lato la ricerca in IA si è configurata come uno studiodi tipo empirico sulle attività cognitive umane, quindi campo di ricerca di psicologi interessati alla elaborazione dimodelli computazionali (per questa prospettiva si veda ad esempio Greco 1988). Per altri versi è stata posta l'enfasisull'indagine di strumenti di rappresentazione, linguaggi e tecniche computazionali, che hanno portato ad identificarecerte parti dell'IA con un ramo dell'informatica teorica. Vi è sempre stata infine una forte componente di tipoapplicativo, che avvicinava l'IA a una disciplina di tipo ingegneristico.

In ogni caso, l'assunto universalmente condiviso da chi opera nell'ambito dell'IA classica è che un trattamentoadeguato del comportamento intelligente presuppone la facoltà di manipolare rappresentazioni simboliche secondoregole di elaborazione di tipo formale. L'IA presuppone infatti una teoria rappresentazionale della mente secondo cui lamente costruisce rappresentazioni del mondo esterno, che svolgono un ruolo fondamentale nel pensiero e neldeterminare il comportamento9. Questo è l'assunto fondamentale di quella che viene usualmente detta psicologia del

6 Per maggiori dettagli sulle critiche filosofiche al comportamentismo e alla teoria dell'identità rimandiamo a (Fodor1980b) e ai saggi in (Putnam 1975).7Sui concetti e sui fondamenti teorici dell'intelligenza artificiale si veda ad esempio (Haugeland 1985). Una raccolta dicontributi classici del settore è (Webber e Nilsson 1981).8Per questi avvenimenti e, in generale, per la storia delle origini dell'IA si può consultare (McCorduck 1979).9Alle teorie rappresentazionali della mente si contrappongono le teorie di tipo eliminativista, in base alle quali i concettidella psicologia di senso comune, primo fra tutti il concetto di rappresentazione mentale, sono concetti ingenui,prescientifici, che non corrispondono ad alcuna realtà di fatto, e che devono quindi essere eliminati da ogni discorsorigoroso, a carattere scientifico o filosofico, sulla mente. Una posizione filosofica di tipo eliminativista è ad esempio

Page 27: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

5

senso comune (folk psychology). Secondo la psicologia del senso comune gli esseri intelligenti esibiscono certicomportamenti perché hanno determinati desideri e determinate credenze: un politico conduce la propria campagnaelettorale in un certo modo perché desidera essere eletto, e perché sa, o crede, che l'elettorato è particolarmente sensibilea certi problemi; una tigre si apposta vicino ad una sorgente perché desidera catturare una preda, e perché sa, o crede,che la preda verrà ad abbeverarsi. In questa prospettiva, gli stati mentali sono essenzialmente entità di tiporappresentazionale: gli oggetti della credenza e del desiderio (come essere eletto, o che la preda venga ad abbeverarsi)sono rappresentazioni mentali di stati possibili o reali del mondo esterno. Pensare equivale ad elaborare talirappresentazioni. L'IA, così come la scienza cognitiva e la maggior parte delle filosofie funzionaliste della mente,condivide questi assunti con la psicologia di senso comune.

Inoltre, in IA gli stati mentali vengono identificati con rappresentazioni di tipo simbolico. Uno dei "manifestiteorici" di questa maniera di concepire la mente e il pensiero è costituito dalla cosiddetta ipotesi del sistema simbolicofisico di Newell e Simon (1976). Un sistema simbolico fisico viene definito da Newell e Simon come un insieme dientità, i simboli appunto, che possono essere combinate in strutture simboliche complesse. Inoltre, il sistema dispone diprocessi che consentono di generare, trasformare o distruggere tali strutture. I simboli possono essere in una relazione didesignazione con altri simboli, con processi computazionali o con oggetti esterni al sistema. L'aggettivo fisico, infine,significa che un sistema del genere deve obbedire alle leggi della fisica, e quindi deve essere realizzabile per mezzo diun dispositivo meccanico (anche se resta valida l'assunzione funzionalista per cui non importa quale specificodispositivo fisico realizzi un dato sistema). Quindi "un sistema simbolico fisico è una macchina che produce nel tempoun insieme di strutture simboliche in evoluzione, e un tale sistema esiste in un mondo di oggetti che è più ampio di taliespressioni simboliche" (Newell e Simon 1976, p. 48 della trad. it.). L'ipotesi del sistema simbolico fisico vieneformulata come un'ipotesi empirica sulla natura dell'intelligenza, la quale afferma che "un sistema simbolico fisico è inpossesso degli strumenti necessari e sufficienti per l'azione intelligente generale" (ibid., p. 49), dove "con 'necessario'intendiamo affermare che ogni sistema che esibisce intelligenza generale mostrerà ad una successiva analisi di essereanche un sistema simbolico fisico. Per 'sufficiente' si intende che ogni sistema simbolico fisico di dimensioni sufficientipuò essere ulteriormente organizzato per esibire intelligenza generale" (ibid.).

In generale, dunque, si può assumere che, in un sistema di simboli come viene concepito in questo ambito, siapossibile distinguere fra un insieme di simboli primitivi, o atomici, e un insieme di simboli complessi, ottenuti a partireda quelli atomici mediante opportune regole di composizione sintattica. Vi sono poi procedure e regole, che consentonodi manipolare i simboli in modo da trarre le conseguenze volute. Inoltre, i simboli sono dotati di significato, in modotale che il significato dei simboli complessi dipenda dal significato dei loro componenti10. Le procedure e le regoledevono elaborare i simboli in accordo con tale attribuzione di significato. Il fatto di disporre di regole di questo tipo èciò che rende il sistema automatizzabile: esso può essere elaborato in maniera formale da un dispositivo meccanico chesegue le regole sintattiche, senza prendere in considerazione il significato dei simboli. L'analogia fra le strutture mentalicosì intese e strutture di tipo linguistico è evidente: in IA, come nelle discipline della mente ad essa collegate (filosofiafunzionalista della mente, psicologia cognitiva, etc.) il linguaggio ha sempre avuto un ruolo privilegiato, sia comeoggetto di studio, sia come metafora per la comprensione dei fenomeni mentali; si consideri ad esempio l'ipotesi di unfunzionalista come Fodor, per cui i costrutti mentali sarebbero espressioni di un linguaggio del pensiero (Fodor 1975).

Dato l'assunto della natura rappresentazionale e simbolica della mente, è ovvio che il problema di comedovessero essere rappresentate le informazioni in un sistema intelligente assumesse un ruolo assolutamente centralenella ricerca in IA. Il settore di indagine che va sotto il nome di rappresentazione della conoscenza ha come scopol'individuazione e lo studio di linguaggi formali adatti a questo fine11.

Gli obiettivi della rappresentazione della conoscenza possono essere espressi in maniera più precisa facendoriferimento alla cosiddetta knowledge representation hypothesis formulata dallo studioso di IA Brian Smith (Smith1982). Secondo Smith, ogni "sistema intelligente" deve incorporare un insieme di strutture di tipo, in senso lato,linguistico, tali che: quella di Churchland (1986). Anche nell'ambito delle scienze cognitive e dell'IA in senso lato sono state sviluppateposizioni eliminativiste. L'esempio più noto è costituito probabilmente dalle teorie del planning reattivo e della nuovarobotica. Secondo Rodney Brooks, il più noto rappresentante di questa tendenza, l'essenza dell'intelligenza non risiedetanto nella capacità di disporre e di elaborare rappresentazioni mentali complesse, quanto piuttosto nella capacità diinteragire in modo appropriato con la complessità del mondo esterno (si veda ad es. Brooks 1991). Si noti infine che unateoria rappresentazionale della mente non si accompagna necessariamente all'ipotesi simbolica sulla natura dellerappresentazioni mentali. Il connessionismo costituisce l'esempio più noto di un paradigma rappresentazionale ma nonsimbolico in scienza cognitiva (si veda Smolensky 1988).10Assumendo che i simboli siano dotati di significato adottiamo qui quella che nel par. 12.1 chiameremo accezionesemantica di "simbolo". In quel paragrafo vedremo come il termine "simbolo" venga talvolta utilizzato in un'accezionepiù debole, di tipo esclusivamente sintattico.11(Ringland e Duce 1988) è un'introduzione alla rappresentazione della conoscenza; (Brachman e Levesque 1985) è unaantologia di articoli di rappresentazione della conoscenza non molto recenti ma in molti casi ormai classici ostoricamente importanti; un'altra raccolta di saggi che può risultare utile è (Cercone e McCalla 1987).

Page 28: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

6

1. queste strutture, viste da un osservatore esterno al sistema, possono essere interpretate come la rappresentazionedella conoscenza di cui il sistema dispone;

2. indipendentemente da tale "attribuzione semantica" data dall'esterno, tali strutture devono essere manipolabiliformalmente, in modo da poter giocare un ruolo causale nel determinare il comportamento del sistema.

H. Levesque e R. Brachman (1985), altri due studiosi del settore, commentano l'ipotesi di Smith come segue:

[...] ci sono due proprietà principali che devono essere soddisfatte dalle strutture di un sistemabasato sulla conoscenza.

Innanzi tutto, deve essere possibile interpretarle come proposizioni che rappresentano laconoscenza globale del sistema. Altrimenti, potrebbe trattarsi di una rappresentazione non di conoscenza,ma di qualcosa di molto diverso, come numeri o circuiti. E' implicito in questo vincolo che tali strutturedebbano essere rappresentazioni in un linguaggio che abbia una teoria della verità. Per ognuna di esse,dovremmo essere in grado di dire come deve essere il mondo perché essa sia vera. Tali strutture nondevono assomigliare a frasi (non c'è nessun vincolo sintattico su di esse, a parte forse la finitezza); tuttaviadobbiamo essere in grado di comprenderle come se lo fossero.

Un secondo requisito dell'ipotesi è forse più ovvio. Le strutture simboliche in una certa base diconoscenza devono giocare un ruolo causale nel comportamento del sistema, in contrapposizione, adesempio, ai commenti in un linguaggio di programmazione. Inoltre, l'influenza che hanno sulcomportamento del sistema deve concordare con la nostra comprensione di esse in quanto proposizioniche rappresentano conoscenza. Questo non vuol dire che il sistema debba essere cosciente in qualchemodo misterioso dell'interpretazione delle sue strutture e della loro connessione con il mondo. Ma perchéabbia senso considerarlo "basato sulla conoscenza" dobbiamo essere in grado di interpretare il suocomportamento come se comprendesse quelle proposizioni, allo stesso modo in cui interpretiamo ilcomportamento di un programma di tipo numerico come se esso fosse in grado di comprendere larelazione fra strutture di bit e quantità numeriche astratte. [...] In altre parole, il fine di un sistema dirappresentazione della conoscenza è di individuare strutture simboliche e meccanismi di inferenzaappropriati sia per rispondere a domande che per acquisire nuove informazioni, in accordo con la teoriadella verità del linguaggio di rappresentazione sottostante. (pp. 44-47)

Resta da stabilire in che modo tali strutture di rappresentazione debbano essere caratterizzate in maniera piùprecisa. I sistemi formali elaborati dai logici godono esattamente di tali caratteristiche. E' quindi naturale che si siapensato di utilizzarli a questo scopo. Tuttavia, tale proposta ha incontrato un consenso tutt'altro che unanime: ilproblema dell'impiego della logica in IA ha scatenato un lunga serie di dispute a carattere teorico e fondazionale.

3.2 Logicisti e Anti-logici

Quando si introducono tematiche di carattere logico nell'ambito dell'IA si entra in un terreno minato; in passato ilruolo degli strumenti logici è stato oggetto di innumerevoli discussioni, e ancora oggi si possono registrare opinioni nonconvergenti per quanto riguarda l'opportunità del loro impiego. In anni più recenti i termini della discussione si sonofatti più distesi e pacati. Tuttavia il problema del rapporto fra logica e rappresentazione della conoscenza resta uno deiproblemi centrali dell'IA12.

Già fin dagli anni cinquanta, John McCarthy, uno dei più autorevoli sostenitori dell'approccio logico all'IA, avevaprofetizzato che la logica avrebbe dovuto svolgere nei confronti della computer science, e, in particolare, dell'IA, lafunzione che l'analisi infinitesimale ha svolto (e svolge tuttora) nei confronti della fisica. Queste posizioni nonsuscitarono tuttavia il consenso dell'intera comunità dei ricercatori. Si formarono due differenti punti di vista, e laricerca si sviluppò lungo linee divergenti. McCarthy e Marvin Minsky possono essere considerati rispettivamente isostenitori più rappresentativi delle due opposte tendenze. McCarthy ritiene che lo scopo dell'IA sia progettareprogrammi per calcolatore che funzionino in accordo coi dettami della logica matematica, a prescindere dal fatto chequesto sia o meno il modo in cui ragionano gli esseri umani. Minsky pensa che l'approccio migliore sia fare sì che i

12Recentemente, un numero monografico della rivista Sistemi Intelligenti (1991) è stato dedicato al problema del ruolodella logica in IA, e può costituire un utile punto di riferimento. Si veda in particolare (Lolli 1991). Un manuale di IAche segue l'impostazione logica è Genesereth e Nilsson (1987). I vari manuali elaborati da Nils Nilsson nel corso deglianni sono in un certo senso sintomatici dell'evoluzione dell'IA simbolica nella direzione logicista. Nilsson (1971)poneva l'enfasi sui metodi di ricerca nello spazio degli stati, riservando una trattazione relativamente esigua alla logica.In (Nilsson 1980) le proporzioni sono invertite, e viene dato ampio spazio ad aspetti computazionali del calcolo deipredicati, come ad esempio le diverse strategie di risoluzione. Genesereth e Nilsson (1986) infine estendono latrattazione della logica introducendo numerose tematiche di rappresentazione della conoscenza e di ragionamento delsenso comune, quali il ragionamento non monotòno, l'induzione, il ragionamento incerto, le credenze, e così via.

Page 29: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

7

calcolatori imitino il modo in cui funziona la mente umana, che, ritiene Minsky, è certamente diverso dal modo in cuifunziona la logica matematica (si veda Kolata 1982).

Questa contrapposizione ha avuto luogo in praticamente tutti i settori di ricerca dell'IA. Il settore delladimostrazione automatica di teoremi è uno dei più "antichi" dell'IA e quello in cui gli informatici si sono trovati adoperare in un terreno già ampiamente esplorato dai logici: l'elaborazione di calcoli corretti e completi in cui le formulelogicamente valide sono derivabili con procedimenti meccanici aveva mostrato come un'attività di tipo algoritmicopoteva surrogare il pensiero umano. Tuttavia, i limiti posti dai teoremi di indecidibilità di Turing-Church e dai problemicomputazionali connessi con la lunghezza delle dimostrazioni e con l'esplosione combinatoria hanno lanciato una nuovasfida ai ricercatori. Anche qui, per risolvere tali problemi, si è manifestata un'opposizione tra due diverse tendenze: laprima si è rivolta al perfezionamento dei calcoli logici esistenti, l'altra, pur volendo impiegare il calcolatore per simularel'attività dimostrativa, si oppone ai calcoli logici già precedentemente elaborati per fini diversi da quelli implementativi,rivolgendosi alla ricerca di strategie maggiormente human oriented, ispirate da considerazioni di ordine psicologico(Lolli 1988). Per esempio, la Geometry Proving Machine di Gelerneter e Gilmore (Gelerneter 1963; Gilmore 1970) èbasata sull'idea di Minsky di utilizzare la costruzione geometrica di figure come guida euristica nella dimostrazione diteoremi geometrici. Al di sotto di questa opposizione si ripropone la distinzione di fondo delle due diverse ottiche,quella della performance mode, orientata più verso i risultati che ai metodi impiegati, e quella della simulation mode,che pone al centro dei suoi interessi la simulazione dei processi mentali dell'uomo.

Nell'ambito specifico della rappresentazione della conoscenza i "logicisti" proponevano di utilizzare gli strumentidella logica matematicaper studiare e sviluppare i linguaggi di rappresentazione della conoscenza, mentre il versante"anti-logico" può essere identificato, in senso lato, con i sostenitori di sistemi di rappresentazione alternativi quali iframe e le reti semantiche. Il punto di partenza principale degli "anti-logici" è consistito nel mettere in evidenza ledifferenze fra logica matematica e ragionamento di senso comune: la logica è stata sviluppata per fare ciò che il sensocomune non è in grado di fare in quanto vago e contraddittorio, ma se vogliamo che un calcolatore "pensi" come unessere umano, dobbiamo rivolgerci a quelle caratteristiche tipiche del ragionamento di senso comune che non sono stateprese in considerazione, o che sono state deliberatamente rifiutate, dalla logica matematica13.

Oltre alle due posizioni estreme, ne esistono altre intermedie e più sfumate. Ad esempio, nel settore dellarappresentazione della conoscenza, secondo Israel e Brachman (1981) può essere individuato il seguente spettro dipossibili posizioni riguardo al problema dell'uso delle reti semantiche rispetto alla logica:

1. logicians: i logici "puri", che caldeggiano l'uso dei calcoli logici tradizionali direttamente comelinguaggi di rappresentazione della conoscenza;

2. net-logicians: considerano le reti semantiche come semplici varianti notazionali della logica del primoordine, in grado di offrire alcuni vantaggi dal punto di vista implementativo;

3. extended-net-logicians: considerano le reti semantiche come una variante notazionale dei calcoli logici,con tuttavia qualche vantaggio dal punto di vista espressivo;

4. net-workers: sostengono che le reti semantiche non sono riconducibili alla logica. Possono essereulteriormente suddivisi in due gruppi:

• psycho-net-workers: sostengono che le reti semantiche devono essere empiricamente adeguate da unpunto di vista psicologico, o semplicemente influenzate da considerazioni di carattere psicologico.

• not-psycho-net-workers: sostengono che le reti semantiche sono formalismi universali dirappresentazione, che non devono essere soggetti a vincoli di carattere psicologico.

Ciascuna di queste posizioni è stata sostenuta e discussa nella letteratura. Tuttavia, nel resto di questo capitolo,prenderemo in considerazione come paradigmatiche solo le due posizioni più radicali. Nel seguito si esporranno leprincipali obiezioni all'uso della logica in IA, e quindi alcune delle risposte dei logicisti a tali obiezioni.

Veniamo dunque agli argomenti che motivano le posizioni degli "anti-logici". I teorici della IA hanno iniziatonegli anni sessanta a porsi il problema di progettare sistemi simbolici mediante i quali affrontare il problema delragionamento di senso comune, andando alla ricerca di a) un linguaggio formalizzato con il quale rappresentare la

13 Nelle righe precedenti il termine logicisti è stato messo fra virgolette per sottolineare il fatto che qui non vieneutilizzato con il significato che ha usualmente in filosofia della matematica, dove indica la corrente che ha cercato didare un fondamento alla matematica riducendola alla logica. Si noti tuttavia che Thomason (1991) ravvisa dellesomiglianze fra il programma logicista in IA ed altre forme di logicismo - non soltanto il logicismo in filosofia dellamatematica, ma anche quello che Thomason chiama "logicismo linguistico", ossia appunto il paradigma model teoreticoin filosofia del linguaggio.

Page 30: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

8

conoscenza del soggetto da modellare, b) una rappresentazione dettagliata della conoscenza di base di un tale soggetto,e c) un meccanismo mediante il quale si possano inferire in modo automatico le conoscenze implicite nella conoscenzadi base. Le obiezioni all'uso della logica in questa impresa possono essere molteplici. Il problema è che, storicamente, lefinalità con cui sono stati sviluppati i calcoli logici sono radicalmente diverse. Innanzi tutto, come abbiamo visto, lalogica moderna, da Frege in poi, è sempre stata guidata da un forte assunto anti-psicologista. Lo scopo del logico non èquello di modellare il modo in cui un essere umano pensa, ma è quello di costruire un modello astratto e formale deiprocedimenti inferenziali. La logica non dice come viene effettuato un ragionamento, ma come un'inferenza già data puòessere giustificata come valida. La logica si è posta quindi, in origine, un intento di tipo normativo: l'elaborazione di unlinguaggio perfetto ideale che non soffrisse di tutte le lacune e le ambiguità delle lingue naturali, e di regole di inferenzadefinite su tale linguaggio. Inoltre il punto di riferimento che era stato assunto per la realizzazione di questo programmaera il tipo di ragionamento in uso nelle scienze matematiche: la logica, almeno inizialmente, è nata come laformalizzazione del ragionamento matematico. L'interesse verso questo ordine di problemi è una delle ragioni che hannoindotto molti teorici dell'IA a sottolineare la differenza di obiettivi tra le ricerche svolte in logica matematica e quellesvolte nel settore della rappresentazione della conoscenza, essendo queste ultime orientate a elaborare formalismi cheintendono riprodurre il funzionamento della mente umana. Dice Minsky (1982): "Molti ricercatori dell'IA hannocontinuato a perseguire l'uso della logica per la risoluzione di problemi. Ritengo che questo non abbia dato buoni frutti.Il ragionamento logico è più adeguato per spiegare o confermare il risultato del pensiero. Io credo che noi usiamo lalogica, piuttosto che per risolvere problemi, per spiegarne le soluzioni ad altre persone e - più ancora - a noi stessi".

Ragionamento e dimostrazione sono due concetti ben distinti. Nei confronti dei sistemi inferenziali da loroelaborati, i logici sono interessati soprattutto a proprietà metateoriche come la completezza e la correttezza. SecondoMinsky l'applicazione di regole di inferenza corrette e complete non è di importanza fondamentale nel commonsensereasoning. Il ragionamento di senso comune può condurci da premesse vere a conclusioni false, oppure consentirciinferenze corrette utilizzando regole tutt'altro che valide.

Una delle esposizione più articolate delle "debolezze" insite nell'impiego dei formalismi logici risale al 1975, edè l'appendice all'articolo di Minsky "A framework for representing knowledge". Le conclusioni sono le seguenti:

1. Il ragionamento "logico" non è abbastanza flessibile da servire come base per il pensiero: iopreferisco considerarlo come un gruppo di metodi euristici, che diventano efficaci solo quandovengono applicati a piani schematici rigidamente semplificati. Altrimenti, la coerenza che la logicarichiede non è di solito disponibile - e probabilmente neppure desiderabile - perché i sistemi coerentiprobabilmente sono troppo deboli.

2. Io dubito della possibilità di rappresentare effettivamente la conoscenza ordinaria nella forma di moltebrevi proposizioni, vere indipendentemente l'una dall'altra.

3. La strategia di separare completamente la conoscenza specifica dalle regole generali di inferenza ètroppo radicale. Abbiamo bisogno di una maniera più diretta per collegare frammenti di conoscenzaalle intuizioni su come usarla.

4. E' stato creduto a lungo che fosse essenziale rendere tutta la conoscenza accessibile alla deduzione nellaforma di asserzioni dichiarative, ma questo sarebbe molto meno urgente nella misura in cuiimparassimo a manipolare descrizioni strutturali e procedurali. (Minsky 1975, p. 262 di Brachman eLevesque 1985)

Analoghe critiche all'approccio logico sono mosse da Schank e Rieger (1974), che pongono l'accento sulladifferenza fra il concetto di inferenza intesa come processo psicologico, e il concetto logico-formale di deduzione. Adesempio, le inferenze spesso non sono deduzioni valide dal punto di vista logico. Un frammento di informazioneottenuto mediante inferenza non è mai da intendersi come vero in modo certo, ma solo plausibile ad un certo grado, esempre in linea di principio rivedibile. Inoltre, l'inferenza è sempre guidata dai legami associativi fra i concetti presentinella memoria.

E' fuori di dubbio che queste osservazioni sono pertinenti e centrate, e che i problemi sollevati riguardano,almeno in parte, anche gli approcci, come quello di McCarthy, in cui non si ritiene rilevante l'adeguatezza psicologicadei modelli elaborati. Esaminiamo quindi più in dettaglio alcuni punti specifici.

• Prototipi contro concetti definiti

Si tratta del corrispettivo, in rappresentazione della conoscenza, del problema posto in filosofia del linguaggiodai postulati di significato tradizionali. In logica i concetti devono essere definiti in maniera netta, in termini dicondizioni necessarie e/o sufficienti, mentre il ragionamento di senso comune adopera concetti vaghi, spessocaratterizzati mediante prototipi: prendendo in considerazione un concetto (o un insieme) noi spesso non diamodefinizioni esatte o complete delle proprietà degli individui che cadono sotto quel concetto (o dei membri dell'insieme),ma concentriamo la nostra attenzione su di un membro tipico, rappresentativo dell'insieme (un prototipo, appunto). Gliinsiemi basati su esempi sembrano essere una caratteristica tipica del pensiero umano, anche dal punto di vista

Page 31: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

9

psicologico. Questo è connesso con il problema dei default value, valori che vengono attribuiti alle istanze di unconcetto in assenza di altre informazioni esplicite. Essi rappresentano le proprietà del prototipo e delle istanze tipiche diun concetto; è tuttavia possibile accettare istanze del concetto che hanno proprietà differenti. Ad esempio, gli elefantitipici sono grigi ed hanno quattro zampe: queste sono proprietà del prototipo di elefante, assunte come vere per defaultper tutti gli elefanti "normali". Vi possono essere tuttavia istanze del concetto "elefante" che violano tali attributi (ad es.elefanti rosa o elefanti con tre zampe). Questo aspetto rimanda al problema del trattamento delle eccezioni e alla non-monotonicità del commonsense reasoning. Dice Minsky:

Si consideri un fatto come "gli uccelli possono volare". Se pensate che il commonsense reasoningsia simile al ragionamento logico, allora dovete credere che vi siano principi generali che affermano "seJoe è un uccello e gli uccelli possono volare, allora Joe può volare". Ma supponete che Joe sia uno struzzoo un pinguino. Bene, possiamo assiomatizzare ciò e dire che se Joe è un uccello, e Joe non è uno struzzo oun pinguino, allora Joe può volare. Ma se Joe è morto? O se ha i piedi nel calcestruzzo? Il problema conla logica e che una volta che voi avete dedotto qualcosa, non potete più sbarazzarvene. Dove voglioarrivare è che c'è un problema con le eccezioni.

Tradizionalmente in logica vale la proprietà di monotonicità: se una proposizione è conseguenza logica di un insieme dialtre, è ancora, a maggior ragione, conseguenza logica di un soprainsieme di esse (cfr. cap. 6). All'opposto, ilcommonsense reasoning è tipicamente non monotòno. Noi dobbiamo continuamente trarre conclusioni sulla base diconoscenza incompleta, ed essere disposti a ritrarre tali conclusioni se esse non sono più in accordo con le nuoveconoscenze disponibili. Impariamo dal mondo, e dobbiamo rivedere assunzioni e credenze in precedenza accettate.

• Inferenze "giuste" contro inferenze "sbagliate"

Si deve considerare il fatto che gli esseri umani eseguono inferenze che sono spesso sistematicamente "sbagliate"dal punto di vista logico14. Si ricordino a questo proposito le osservazioni di Schank riportate più sopra. Inoltre, spessoaccade che le credenze di un individuo siano contraddittorie, senza che questo abbia gli effetti disastrosi che unacontraddizione comporta in logica (in un sistema logico classico in cui sia presente una contraddizione è deducibilequalsiasi formula). In molti casi tali "errori" possono non costituire un limite per un soggetto razionale finito. Per unsoggetto limitato (sia dal punto di vista della conoscenza disponibile che delle capacità inferenziali) trarre certeinferenze in modo logicamente "corretto" potrebbe essere impossibile o troppo dispendioso in termini di tempo e dirisorse computazionali. Ai fini di un comportamento globale efficiente ed adeguato, può quindi essere più vantaggioso epiù "razionale" saltare alle conclusioni anche se in modo azzardato. Anche il problema del ragionamento non monotònonasce, in un certo senso, da questo ordine di problemi.

• Struttura della memoria

Non è plausibile che le informazioni nella memoria umana siano rappresentate in forma analoga ad una serie diassiomi logici. I dati disponibili fanno supporre che esse siano strutturate in maniera più complessa, organizzate in baseal loro contenuto, in modo da renderne più agevole l'accesso per lo svolgimento dei vari compiti cognitivi (come ilragionamento, la comprensione del linguaggio, la percezione). Secondo Minsky, le informazioni nella nostra memoriasono rappresentate sotto forma di blocchi più estesi e più organizzati di singole formule isolate. Un formalismo adeguatodi rappresentazione della conoscenza dovrebbe consentire di definire strutture analoghe. Inoltre per Minsky si dovrebbesuperare una distinzione troppo netta fra conoscenza espressa in forma dichiarativa e procedure di inferenza valide ingenerale: ad ogni blocco di informazioni dovrebbero essere associati procedimenti inferenziali specifici.

Nel modellare numerose attività cognitive sono rilevanti i legami associativi di "vicinanza semantica" fra iconcetti presenti nella memoria, legami che non sono riconducibili a nessi di tipo puramente logico. Ad esempio, ilconcetto cometa è più "vicino" al concetto Natale di quanto non lo sia il concetto forchetta, anche se questo nonrispecchia nessuna relazione logica specifica. I costrutti in una base di conoscenza dovrebbero rispecchiare anche questastruttura associativa. In una base di conoscenza tutte le informazioni connesse ad una certa entità concettualedovrebbero essere accessibili da un luogo unico. Strutture di rappresentazione come i frame e le reti semanticheavrebbero dovuto fornire una risposta a questo genere di problemi.

I "logicisti" non misconoscevano la rilevanza dei problemi posti dai loro avversari. Lo testimonia l'enfasi che essihanno posto da sempre sul ragionamento non monotòno. Ad esempio, in ambito logicista è stato individuato uno deiproblemi tipici posti dalla non monotonicità del ragionamento di senso comune, il cosiddetto frame problem (McCarthy

14In questo settore molte ricerche sono state condotte dagli psicologi; si vedano ad esempio i lavori di Wason e diJohnson-Laird (Wason e Johnson-Laird 1972; Johnson-Laird 1983).

Page 32: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

10

e Hayes 1969), sul quale torneremo in seguito15. I logicisti si limitavano a negare l'adeguatezza delle soluzioni propostedai loro avversari, ritenendo troppo frettolosa da parte loro la liquidazione degli strumenti della logica. I problemi postidagli oppositori della logica erano reali. Tuttavia i loro argomenti, almeno nei termini in cui erano stati originariamenteformulati, non offrivano alcuna alternativa rigorosa possibile, se non in maniera informale ed alquanto schematica. Quidi seguito esporremo alcune delle obiezioni dei logicisti a Minsky e agli anti-logici. In primo luogo, sebbenel'introduzione dei sistemi logico-formali e dello studio delle loro proprietà metateoriche abbia avuto storicamenteorigine nell'ambito delle indagini sui fondamenti della matematica, abbiamo visto che la formalizzazione logico-matematica è stata progressivamente estesa a comprendere modalità, eventi, azioni, contesti spazio-temporali, ecc.,rivelando una notevole flessibilità nel rendere esplicita la forma logica di classi sempre più ampie di enunciati dellinguaggio comune. Storicamente, la logica matematica è stata sviluppata con lo scopo di determinare un linguaggioartificiale senza la vaghezza e le ambiguità del linguaggio naturale al fine di perseguire il massimo rigore dimostrativo.Tuttavia, in tempi più recenti, soprattutto nell'ambito delle logiche filosofiche e della filosofia del linguaggio ditradizione analitica, molti sforzi sono stati indirizzati verso la formalizzazione dello stesso linguaggio naturale e verso lostudio della sua semantica. Si è così aperta la possibilità di concepire i linguaggi formali non in opposizione ai linguagginaturali, ma piuttosto come dinamiche approssimazioni alla ricchezza espressiva dei secondi e, in quanto tali, suscettibilidi articolazioni e adattamenti in funzione delle più diverse situazioni che si presentano in ragionamenti condotti nellinguaggio naturale. Vediamo allora alcuni degli argomenti che gli studiosi di impostazione logica hanno opposto allecritiche degli "anti-logici".

• Necessità di una semantica

Uno degli argomenti centrali dei sostenitori della logica è incentrato sulla necessità di un'adeguata semantica peri formalismi di rappresentazione della conoscenza. P. Hayes (1974) mise in luce il fatto che molti nuovi formalismierano stati sviluppati senza una semantica, eliminando in questo modo ogni possibilità di seri confronti. Questo punto èstato ribadito da D. McDermott (1978), che ha sottolineato come, senza la possibilità di assicurare la correttezza deicostrutti utilizzati per mezzo di un'adeguata semantica, programmi lunghi e complessi rischiano di diventare una massainestricabile di segni senza significato. McDermott fa l'esempio del sistema AMORD (deKleer et al. 1977).Generalmente, il sistema utilizza una versione della regola di risoluzione, che è ben studiata e ben compresa dal punto divista logico. Tuttavia, ci sono casi nei quali le primitive del sistema non hanno una precisa interpretazione logica: in talicasi, la sola garanzia che il sistema sia usato correttamente sono l'intuizione e il buon senso dell'utente. Il fatto che unsistema di rappresentazione sia implementato da un programma scritto in un linguaggio come il LISP non garantiscenulla sul suo significato e sulla sua correttezza. A proposito del sistema di rappresentazione a frame KRL di Bobrow eWinograd (1977); McDermott (1978) afferma: "Un sistema come KRL, che consiste di uno splendido edificio dinotazione senza denotazione, è un castello in aria". Ad esempio non è possibile stabilire quando in una base diconoscenza KRL c'è una contraddizione. Lo stesso vale per la maggior parte dei sistemi a rete semantica. Disporre diuna semantica, dice McDermott, è cruciale anche per il problema dell'accrescimento di un sistema. Innanzi tutto si devepoter stabilire che cosa è esattamente in grado di fare il sistema esistente, e in che cosa esso è incompleto. Inoltre, sideve poter stabilire che l'aggiunta dei nuovi elementi non distrugga la correttezza di quello che già esiste.

Anche Moore (1982) ribadisce l'importanza di un'adeguata semantica: "Qualunque cosa un formalismo possaessere, almeno una parte delle sue espressioni deve avere una semantica referenziale, se il formalismo deve costituire larappresentazione di qualche conoscenza. Cioè, deve esserci qualche tipo di corrispondenza fra un'espressione e ilmondo, tale che abbia senso chiedersi se il mondo è realmente come quell'espressione lo descrive"(p. 428). SecondoMoore la logica matematica è la disciplina che si occupa esattamente delle relazioni fra espressioni simboliche e mondo.Nel momento in cui ci si pone il problema dell'analisi della semantica referenziale di un sistema di rappresentazione, sista facendo logica: gli unici strumenti disponibili per questo tipo di analisi semantica sono quelli elaborati in logicaformale.

• Livello dell'espressione e livello dell'implementazione

Nel passo seguente di William Woods viene posta una distinzione che, sotto varie forme e denominazioni, hasvolto un ruolo fondamentale nelle risposte di parte logica agli anti logici:

Due aspetti del problema della rappresentazione della conoscenza devono essere considerati. Ilprimo, che io chiamo adeguatezza espressiva, ha a che fare con il potere espressivo della rappresentazione- cioè con quello che può essere detto. [...] Il secondo aspetto, che io chiamo efficacia notazionale,riguarda la forma effettiva e le strutture della rappresentazione, e l'impatto di queste strutture sulle

15In breve, il frame problem ha a che fare con il ragionamento su tempo, azioni ed eventi. Quando si cerca di inferire leconseguenze di una data azione, si assume implicitamente che valgano certe condizioni "tipiche". Tuttavia, talicondizioni possono risultare false, per cui le conclusioni raggiunte devono essere ritirate.

Page 33: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

11

operazioni del sistema. L'efficacia notazionale, a sua volta, si distingue in componenti quali l'efficienzacomputazionale rispetto a diversi tipi di inferenza, la sinteticità della rappresentazione, e la facilità dimodificazione. E' importante distinguere adeguatezza espressiva da efficacia notazionale, poiché il fatto dinon chiarire quale dei due problemi fosse affrontato ha esacerbato numerose dispute in questo campo(Woods 1983).

Alcuni autori hanno insistito sulla differenza fra livello dell'espressione (che concerne la progettazione di un linguaggioformale per esprimere conoscenze) e il livello dell'implementazione (che ha a che fare con i dispositivi computazionaliche realizzano su un calcolatore tale linguaggio di rappresentazione). Il ruolo della logica si colloca al livello espressivo,e non a quello implementativo. Hayes (1977) sostiene che la logica non è uno stile di programmazione, e non comportaalcuna scelta a livello degli algoritmi implementativi:

La logica è una collezione di idee su come esprimere certi tipi di conoscenza a proposito di certesituazioni del mondo. La metateoria della logica è una collezione di strumenti matematici per analizzarequesta classe di linguaggi di rappresentazione. Quello che questi strumenti analizzano non è ilcomportamento di un interprete, o la struttura di un processo in qualche sistema implementato, quantopiuttosto il significato estensionale delle espressioni di un linguaggio, qualora si assuma che esse faccianoriferimento ad una realtà esterna. Questi due temi distinti - il significato di un linguaggio e ilcomportamento di un suo interprete - sono correlati in vari modi. Essi vengono in contatto soprattutto conla nozione di inferenza. Il significato logico giustifica certe inferenze. Un sistema implementato eseguedelle inferenze: qualcuno dei suoi processi consiste nel fare delle inferenze. Ma sulla stessa nozione diinferenza e sullo stesso linguaggio di rappresentazione possono essere basati due sistemi diversi. Lastruttura inferenziale del linguaggio usato dal sistema non dipende dalla struttura di elaborazione. Inparticolare, un sistema può avere una struttura inferenziale di tipo logico - può effettuare inferenzededuttivamente valide - senza essere un classico dimostratore di teoremi che "macina assieme" liste diclausole (p. 559).

Analoga è la distinzione di McCarthy (McCarthy 1977; McCarthy e Hayes 1969) fra i problemi di tipoepistemologico e i problemi di tipo euristico dell'IA. I problemi epistemologici riguardano il tipo di conoscenza darappresentare, la semantica e il potere espressivo dei linguaggi di rappresentazione, la correttezza delle regole diinferenza adottate. I problemi euristici riguardano invece la scelta delle strutture dati che implementano il linguaggio dirappresentazione, degli algoritmi che implementano le regole di inferenza, le strategie per esplorare gli spazi di ricerca,e così via. Secondo i sostenitori dell'approccio logico, molte delle obiezioni poste dai detrattori della logica non sonorilevanti a livello epistemologico, poiché riguardano esclusivamente gli aspetti euristici. Ad esempio, il fatto diraggruppare la conoscenza in unità complesse e strutturate come i frame, i vantaggi che offrono frame e reti semantichenella consultazione di una base di conoscenza, o il problema di rappresentare la vicinanza semantica fra concetti sonoriconducibili al problema euristico di come rendere facilmente accessibile la conoscenza rappresentata agli algoritmi cheeseguono le inferenze, e non sono incompatibili con l'impiego della logica al livello epistemologico.

• Logiche per il senso comune

I logici concordano che il ragionamento umano è diverso dalla deduzione logica. Ad esempio, essi sonoconsapevoli che la storia della logica è dominata dalla ricerca di tipi di inferenza che preservino la verità, mentre spessoil ragionamento di senso comune non rispetta questo vincolo. Tuttavia si possono usare gli strumenti della logica percostruire modelli, più o meno astratti, del ragionamento di senso comune. Molti teorici dell'IA pensano che non ci sianulla da opporre all'uso di linguaggi logici standard per affrontare questi problemi. E' anche possibile suggerire l'uso disistemi non standard, come, ad esempio, le logiche paraconsistenti e le logiche condizionali. Moore (1982) sottolineacome il calcolo dei predicati sia molto flessibile, e ponga pochissime pregiudiziali "ontologiche" sulla struttura dellarealtà da rappresentare. Questo lo rende utilizzabile per formalizzare numerosi aspetti del ragionamento di sensocomune:

Forse la caratteristica principale delle logiche del primo ordine è quella di descrivere il mondo intermini di oggetti e delle loro proprietà e relazioni. Io dubito che chiunque in IA possa trovare da ridire suciò, poiché virtualmente tutti i formalismi di rappresentazione dell'IA fanno uso di questi concetti. Sipotrebbe argomentare che, come nozioni primitive, serva qualcosa di più dei soli oggetti, proprietà erelazioni. Ma bisogna tenere presente che la logica del primo ordine non pone alcun limite su cosa debbaessere considerato come oggetto. Non solo oggetti fisici, ma anche tempo, eventi, tipi, organizzazioni,mondi ed enunciati possono essere trattati come individui dal punto di vista logico. Inoltre, anche sedecidiamo che ci servono caratteristiche "non-standard", quali ad esempio operatori intensionali o diordine superiore, possiamo ancora incorporarli in un inquadramento logico. [...] La ragione principale per

Page 34: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

12

cui considero le caratteristiche della logica del primo ordine come essenziali per ogni formalismouniversale di rappresentazione è che esse si possono applicare alla conoscenza di qualunque dominio (p.430).

Abbiamo già visto come, soprattutto in ambito filosofico, siano stati elaborati calcoli logici che modellano tipi diinferenza più vicini al senso comune che non al ragionamento matematico (è il caso delle logiche modali aletiche, e diquelle deontiche, temporali, etc.). Vi sono poi tipi di problemi che non erano mai stati affrontati dai logici, ma che nonescludono a priori un trattamento di tipo logico. Un esempio è costituito dal ragionamento non monotòno. Tutte lelogiche "tradizionali" sono monotòne, sia la logica classica che le logiche non classiche (come, ad esempio, quellaintuizionista). Tuttavia, in ambito IA, oggi sono in corso molte ricerche per sviluppare logiche non monotòne (si vedaoltre, il capitolo 6). In generale, la maggior parte della ricerca logica in IA è incentrata sul problema di elaboraremodelli formali delle attività inferenziali di soggetti razionali finiti, non idealizzati, e limitati da diversi punti di vista(conoscenza, tempo e risorse di calcolo disponibili, etc.), problema di cui il ragionamento non monotòno è solo un casoparticolare. Ad esempio viene studiata la possibilità di individuare sistemi logici "deboli" adeguati a modellare leprestazioni di soggetti con capacità computazionali limitate (cfr. Levesque 1988). Su questi punti torneremo comunquein seguito.

Se si richiama la knowledge representation hypothesis di Brian Smith si ravvisano molte analogie fra la ricerca inrappresentazione della conoscenza e il lavoro dei logici. Si riveda ad esempio il passo di Levesque e Brachman sopracitato. Un sistema logico-formale è caratterizzato da un linguaggio, da un insieme di assiomi e da un insieme di regoledi inferenza. Il linguaggio corrisponde alle strutture del sistema di rappresentazione della conoscenza. Perché si tratti diun sistema logico, alle espressioni che appartengono al linguaggio deve essere possibile associare una semantica di tipoformale. Le regole di inferenza sono l'analogo dei meccanismi di inferenza del sistema di rappresentazione dellaconoscenza: esse devono consentire di elaborare le formule del sistema formale esclusivamente sulla base alle lorocaratteristiche sintattiche, ignorandone cioè il significato. Tuttavia le trasformazioni ottenute devono essere in accordocon la semantica, con la teoria della verità, del sistema formale.

Senza dubbio, perché ciò abbia senso, bisogna adottare un concetto esteso di logica, non limitato ai sistemi logicie alla notazione tradizionale. Moore (1982) prende questa direzione. Egli analizza alcuni aspetti della logica deipredicati, come ad esempio il fatto di rappresentare il mondo nei termini di individui, proprietà e relazioni, e lapossibilità di rappresentare conoscenza incompleta per mezzo di disgiunzione, negazione e quantificazione esistenziale.Egli quindi afferma: "Mi sembra che, nella misura in cui qualunque formalismo di rappresentazione ha le caratteristichelogiche discusse sopra, esso è una logica, e che, nella misura in cui una procedura di ragionamento prende inconsiderazione tali caratteristiche, essa ragiona deduttivamente. E' concepibile che possa esistere un modo di trattarequesti aspetti che sia radicalmente differente dalle logiche correnti, ma esse sarebbero ancora qualche tipo di logica"(pp. 430-31).

Dopo i violenti dibattiti degli anni '70, a partire dalla prima metà degli anni '80 la linea logicista è quella che haraccolto i maggiori consensi fra i ricercatori di IA simbolica16. Questo non implica né che si sia raggiunto un totaleconsenso sulla possibilità di ridurre tutta l'IA di tipo simbolico al paradigma logicista, né che in questo ambito possanotrovare una soluzione tutti i problemi posti dall'IA17. Tuttavia, il filone logicista è stato innegabilmente il più sistematicoed il più ricco di risultati.

Tornando al tema della semantica cognitiva e della rappresentazione del significato, gli assunti della linealogicista in IA comportano che le rappresentazioni costruite nel corso della comprensione di enunciati linguisticivengano identificate con espressioni di un linguaggio logico (nel senso lato visto prima), o almeno possano esserestudiate con gli strumenti della logica matematica - il che significa soprattutto che deve essere possibile associare lorouna semantica di tipo modellistico. Quindi, come avevamo anticipato, questo settore della scienza cognitiva negaesplicitamente il punto 5. della definizione di Marconi sopra riportata. Il logicismo in AI sembra dunque volereconciliare in qualche modo l'idea di significato come costruzione "mentale" e la tesi del significato definito nei terminidi condizioni di verità (in questo caso, ciò che diventa rilevante sono le condizioni di verità delle costruzioni mentali).Bisognerebbe ovviamente precisare cosa si debba intendere per "costruzione mentale" in questo contesto. E' infattievidente per l'IA di impostazione logica non è rilevante l'adeguatezza psicologica in senso empirico delle strutture dirappresentazione ipotizzate. Non si può quindi parlare di rappresentazioni mentali nel senso che interesserebbe unopsicologo (non si tratta in senso stretto di una semantica psicologica). Tuttavia si ha a che fare comunque concostruzioni elaborate da soggetti razionali (eventualmente artificiali), o da modelli di soggetti razionali, comunqueindividuali e finiti. Si tratta delle rappresentazioni (o di modelli delle rappresentazioni) che stanno "dentro la testa" (o"dentro la memoria") di un singolo agente - e quindi comunque non conciliabili con le assunzioni antipsicologistiche di

16 Per convincersene, basta sfogliare gli atti dei più importanti convegni internazionali.17Si veda ad esempio (McDermott 1987) per una critica al logicismo non sospettabile di faziosità, in quanto dovuta aduno dei maggiori rappresentanti di questa stessa linea.

Page 35: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 3

13

Frege e della tradizione model teoretica classica in filosofia del linguaggio. Torneremo su questi problemi nelleconclusioni.

Per il momento, si tratta innanzi tutto di capire quale contributo l'IA logicista possa fornire alla soluzione deiproblemi posti dalla semantica modellistica. Nelle due prossime sezioni esamineremo quindi rispettivamente iformalismi e i metodi proposti per la rappresentazione del significato lessicale, e le conseguenze per il problema di unarappresentazione del significato dei simboli primitivi extra logici (capp. 4-7), e le soluzioni proposte al problema degliatteggiamenti proposizionali, in particolare dell'onniscienza logica (capp. 8-11). Prima di procedere, sono doverose dueprecisazioni. La prima concerne il fatto che qui ci occuperemo principalmente di rappresentazione del significato, e nondella generazione di tale rappresentazione a partire dagli input in linguaggio naturale. Quindi, la nostra trattazione avrà ache fare con aspetti che riguardano il settore della rappresentazione della conoscenza piuttosto che il settoredell'elaborazione del linguaggio naturale. Questo non esclude ovviamente che esista un grande numero di temi dielaborazione del linguaggio naturale che risulterebbero estremamente rilevanti per il tema qui trattato. Tuttavia, nonpotendo ovviamente esaurire l'intero settore, riteniamo che i problemi che ci interessano emergano in maniera piùesplicita ed evidente in rappresentazione della conoscenza18.

La seconda precisazione concerne il fatto che le due sezioni sulla rappresentazione del significato lessicale e sulproblema dell'onniscienza logica sono per molti versi asimmetriche. Tale asimmetria deriva dal fatto che il primoproblema non è tematizzato in maniera specifica nella IA logicista (anche perché, come abbiamo visto, gli strumentilogici e model teoretici in quanto tali non consentono neppure in linea di principio una soluzione definitiva al problemadella rappresentazione del significato dei simboli primitivi extra logici di un linguaggio). In questa sezione quindi si ètentato di caratterizzare l'evoluzione dalle proposte di parte anti logica per il problema della rappresentazioneconcettuale e lessicale (soprattutto reti semantiche e frame) fino all'egemonia del logicismo. Viceversa, il ragionamentosul credere è un settore ben delimitato della IA di impostazione logica. Nella seconda parte si è cercato quindi di fornireun quadro delle ricerche che concernono il problema dell'onniscienza logica in ambito logicista, tralasciando i lavorisullo stesso argomento esterni a questa tradizione19. Di conseguenza, la sezione sull'onniscienza logica risulta molto piùomogenea di quella sulla rappresentazione lessicale, che spazia fra aree di ricerca molto diversificate. Questo ha fatto sìche nella sezione sull'onniscienza logica si sia potuto aspirare, se non a una completa esaustività, almeno a un resocontoabbastanza dettagliato delle varie proposte; viceversa, nella prima sezione è stato possibile fornire soltanto unapanoramica di ampio respiro, effettuando alcune scelte motivate in parte da decisioni personali, ma comunque tali damettere in luce le questioni di fondo del problema.

18Un altro tema che non affronteremo in questo lavoro, anche se presenterebbe motivi di interesse per l'indagine deirapporti fra IA logicista e teorie del significato, è costituito dai lavori concernenti la formalizzazione di aspettipragmatici del linguaggio, come ad esempio i vari tentativi di formalizzare gli atti linguistici o il dialogo. Inoltre,sempre per ragioni di spazio, non prenderemo in considerazione quelle teorie "eterodosse" del significato nate dal filonedella semantica modellistica, come ad esempio la situation semantics di Barwise e Perry (1983) o la teoria di Kamp (sulproblema degli atteggiamenti proposizionali nella teoria di Kamp si veda Castelnovo 1986), che pure si sono spessosviluppate secondo una prospettiva di tipo computazionale.19Come ad esempio i lavori di Maida e Shapiro (Maida e Shapiro 1982; Maida 1985).

Page 36: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

4. L'evoluzione delle reti semantiche

Nel capitolo precedente abbiamo visto come la ricerca sui formalismi di rappresentazione della conoscenzasvolga un ruolo centrale in IA. Le reti semantiche costituiscono una classe di sistemi di rappresentazione tipici dell'IA,basati sull'idea generale di utilizzare come strumento di rappresentazione un grafo, in cui ad ogni nodo è associataun'entità concettuale di qualche tipo (ad esempio un concetto, il significato di un enunciato, o il significato di unelemento lessicale). Le relazioni, di tipo logico o associativo, fra entità concettuali diverse sono rappresentate mediantegli archi che connettono i nodi. Al di là di questa caratterizzazione generale, i vari tipi di rete semantica sono moltodiversi fra loro. I tipi di nodi e di archi che è possibile utilizzare, la loro interpretazione, le regole sintattiche checonsentono di comporli in una rete, ed i meccanismi di inferenza che sono definiti sulle reti variano notevolmente neimolteplici sistemi di rappresentazione che sono stati via via elaborati.

Le reti semantiche furono sviluppate originariamente in base a motivazioni di carattere psicologico, e spesso,soprattutto nel corso degli anni settanta, utilizzate dagli oppositori della logica in contrapposizione ai classici formalismilogico matematici. Rispetto a tali formalismi, le reti semantiche infatti avrebbero dovuto consentire di costruire basi diconoscenza con una struttura associativa più simile a quella ipotizzabile per la memoria umana (ad esempio, utilizzandogli archi della rete per rappresentare non soltanto relazioni di tipo puramente logico, ma anche la "distanza concettuale"fra due rappresentazioni). Inoltre, la maggior parte dei sistemi a rete semantica (e più ancora i sistemi a frame, che dellereti semantiche sono parenti prossimi) prevedevano la possibilità di rappresentare concetti per mezzo di tratti prototipicianziché esclusivamente mediante condizioni necessarie e/o sufficienti. Questi fattori, e inoltre il fatto che in origine lereti semantiche venissero utilizzate soprattutto come formalismi per la rappresentazione del significato in programmi perla comprensione del linguaggio naturale e come modelli psicologici per la rappresentazione di concetti lessicali1 hannofatto sì che frame e reti semantiche fossero visti come la proposta sviluppata in IA per rispondere al problema dellarappresentazione del significato lessicale. Nei prossimi capitoli vedremo se le reti semantiche possano essereeffettivamente considerate un'alternativa rispetto ai classici strumenti della logica, e se esse possano superare in qualchemisura i limiti della semantica modellistica nella rappresentazione del lessico.

In questo capitolo passeremo brevemente in rassegna la storia di questi sistemi di rappresentazione, allo scopo difornire un panorama più vasto in cui inserire le analisi che condurremo nei capitoli successivi. La grande eterogeneitàdei sistemi a rete semantica proposti in letteratura fa sì che non sia possibile una trattazione sistematica dell'argomento.Già prima dell'avvento dei calcolatori, in ambito psicologico furono proposti modelli in cui si ipotizzava una struttura arete della memoria umana, come ad esempio in Selz (1913, 1922). I primi tentativi di utilizzare dei grafi per larappresentazione di conoscenza in un calcolatore sono precedenti allo sviluppo dell'IA in senso stretto, e risalgono allericerche sulla traduzione automatica del linguaggio naturale degli anni cinquanta e dei primi anni sessanta. Il sistemaNude (Richens 1956) prevedeva una rete semantica come interlingua per la traduzione automatica, ossia comelinguaggio intermedio da utilizzare nella traduzione di un testo da una lingua naturale ad un'altra. Margaret Masterman(1962) utilizzò una rete semantica per rappresentare su calcolatore le definizioni di un dizionario. Simili tecniche furonoadottate anche da altri ricercatori, ad esempio da Silvio Ceccato (1961). Nell'ambito specifico dell'IA, gli approcci alproblema della rappresentazione della conoscenza basati su reti semantiche sono stati sviluppati a partire dal modellocomputazionale di Quillian sulla struttura della memoria e sulla rappresentazione della conoscenza lessicale, che risalealla seconda metà degli anni sessanta (Quillian 1967, 1968, 1969). Dopo Quillian, gli ultimi venticinque anni hannovisto proliferare centinaia di ricerche incentrate sull'elaborazione e sull'impiego di sistemi a rete semantica nei varisettori dell'intelligenza artificiale, e, in generale, delle scienze cognitive. Un capitolo storico sulle reti semantiche chepretenda di essere esaustivo non è dunque possibile, a meno di non ridurlo ad un inutile elenco di nomi e di riferimentibibliografici. Abbiamo quindi scelto di mettere particolarmente in luce gli aspetti che più ci saranno utili nel corso dellavoro, senza tuttavia tralasciare i sistemi e le impostazioni più generalmente noti e diffusi2.

Il resto del capitolo è organizzato come segue. Il prossimo paragrafo è dedicato ai lavori di Quillian. Il secondo èdedicato ad alcuni degli sviluppi successivi, fra cui la teoria della dipendenza concettuale di Roger Schank e dei suoicollaboratori. Nel terzo si tratta del concetto di frame (i frame, benché talvolta vengano considerati distinti dalle retisemantiche vere e proprie, gli sono tuttavia strettamente collegati) e, in generale, della rappresentazione di informazioniprototipiche nei sistemi a rete e del problema dell'ereditarietà con eccezioni. Gli ultimi due paragrafi, infine, vertonorispettivamente sulle riflessioni "fondazionali" sul concetto di rete semantica che, a partire dal lavoro di Woods (1975),hanno condotto ad una maggiore chiarezza concettuale nell'elaborazione e nell'uso di questi strumenti dirappresentazione, e sulla proposta di Pat Hayes di ridurre alla logica frame e reti semantiche.

1Si veda ad esempio il modello di Quillian esposto più oltre.2Rassegne storiche più approfondite si possono trovare in (Brachman 1979), (Johnson-Laird et al. 1984), (Mac Randall1988), (Lehmann 1992). (Sowa 1991) e (Lehmann 1993) offrono trattazioni generali dei sistemi a rete semantica. Infine,nella antologia di Brachman e Levesque (1985) è riportata la maggior parte degli articoli storici "classici"sull'argomento.

Page 37: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

2

4.1 Il modello di Quillian

I lavori di Quillian sulla memoria associativa (Quillian 1967, 1968) costituiscono il punto di partenzauniversalmente riconosciuto delle ricerche sulla rappresentazione della conoscenza mediante reti semantiche in IA. Gliinteressi di Quillian erano di tipo eminentemente psicologico. Il suo scopo era di fornire un modello dell'organizzazionedella memoria semantica di un essere umano, in modo da rappresentare il significato lessicale di termini del linguaggionaturale, e di eseguire vari tipi di inferenza a partire da tali rappresentazioni. Ciò avrebbe dovuto consentire lasimulazione di alcune capacità linguistiche umane, quali il confronto del significato di due parole, o la "comprensione"di un testo in linguaggio naturale (dove per comprensione si intende la costruzione automatica di una rappresentazionedel significato a partire dal testo assunto in input). L'intento era di rappresentare esclusivamente la componente"oggettiva", non emotiva o puramente soggettiva, del significato. I dati di partenza per la costruzione della base diconoscenza erano forniti dalle definizioni di un dizionario. Nonostante i suoi interessi specificamente rivolti allinguaggio naturale, Quillian ipotizzava che il tipo di rappresentazione da lui proposto avesse una validità che andasseoltre l'ambito linguistico, e assumeva che la struttura della memoria semantica fosse la stessa della memoria generale.

Nel modello di Quillian esistono due generi principali di nodi: nodi tipo (type node) e nodi esemplare (tokennode, o, semplicemente, token). Il significato lessicale di ogni voce è rappresentato mediante un type node. Ad ogni typenode corrisponde nella rete un piano (plane), vale a dire una struttura che rappresenta la descrizione del significatocorrispondente. Graficamente, i type node sono raffigurati mediante ellissi. Ad esempio, nella fig. 4.1 (da Quillian 1967)FOOD è un type node, nella fig. 4.2 (da Quillian 1967) sono type node PLANT, PLANT2 e PLANT33. Poiché ad ognivoce lessicale possono corrispondere più significati distinti, a ciascuna voce può corrispondere più di un type node. Adesempio, nella fig. 4.2 il significato della parola "plant" è rappresentato mediante i tre type node PLANT, PLANT2 ePLANT3 che corrispondono a tre significati distinti (i quali coincidono rispettivamente con i significati delle paroleitaliane "pianta", "impianto" e al verbo "piantare"). Il piano corrispondente ad un type node è indicato da un rettangoloche circoscrive la porzione di rete che rappresenta la definizione corrispondente. Come in un dizionario ogni voce èdefinita utilizzando altre voci definite altrove nel dizionario stesso, così, per definire una voce lessicale in un piano, si fariferimento alla rappresentazione di altre voci definite nella rete. Ciò avviene mediante nodi token, i quali consentono difar riferimento dall'interno di un piano ad altre definizioni presenti nella rete. Nella fig. 4.1, MEAL, THING, KEEP,INTO sono esempi di token. Ogni token è collegato da un arco di tipo opportuno (raffigurato con una frecciatratteggiata) al type node che ne esprime la definizione. Quindi, mentre ad ogni significato di una voce lessicalecorrisponde nella rete al più un solo type node, non esiste un limite al numero di token di una voce presenti nel modello:essi sono tanti quante le volte che la voce viene utilizzata in altre definizioni.

Le relazioni fra i vari nodi token che concorrono a una definizione all'interno di un piano sono espresse mediantearchi che appartengono ad un insieme predefinito di tipi:

1. archi che rappresentano una relazione di sottoclasse; come ad esempio nella figura 4.1 l'arco fra il nodoFOOD e il nodo THING (che esprime il fatto che il cibo è un tipo particolare di cosa);

2. modification pointer: sono archi che consentono di utilizzare un token per modificare avverbialmente ocome aggettivo un secondo token; nella figura, è un modification pointer l'arco fra i token THING e HAS-

3Nel resto del capitolo e nei capitoli seguenti si è scelto di mantenere in inglese gli esempi tratti dalla letteratura, mentre,per gli esempi da noi formulati, è stato utilizzato l'italiano.

Page 38: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

3

TO; esso esprime il fatto che FOOD è una THING che ha la proprietà rappresentata dalla parte di rete cuipunta il modification pointer;

3. archi che esprimono relazioni di disgiunzione fra nodi; essi possono essere utilizzati per rappresentare imolteplici significati di una parola oppure per rappresentare espressioni che denotano un insieme ottenutoper disgiunzione (un esempio è l'arco etichettato OR nella figura, che connette il token HAS-TO, FORM eOTHER-THAN);

4. archi che esprimono relazioni di congiunzione, di cui un esempio è l'arco etichettato AND che connetteKEEP e GROW nella figura;

5. archi che consentono di rappresentare relazioni arbitrarie fra due token utilizzando un terzo token peresprimere il tipo di relazione che tra essi sussiste; essi vengono raffigurati con frecce doppie; ad esempio,nella figura, il token FORM è utilizzato come una relazione, il cui oggetto è il nodo MEAL e il cuisoggetto è indicato dal puntatore =A.

Nodi come =A e =B sono puntatori che vengono utilizzati per fare riferimento a nodi più "in alto" nella rete, inmodo da rappresentare pronomi, o, in generale, espressioni linguistiche che si riferiscono a termini citatiprecedentemente nella definizione che si intende rappresentare. Nella rappresentazione grafica di una rete, il nodoindicato da un puntatore viene identificato premettendo al nodo stesso il simbolo del puntatore. Ad esempio, nella fig.4.1, il simbolo =A fa riferimento al token THING che si trova immediatamente sotto il nodo FOOD.

La definizione di food della fig. 4.1 può quindi essere parafrasata come segue: un FOOD è una THING A taleche un BEING 2 B (il token BEING 2 fa riferimento al secondo significato della parola being rappresentata nel modello- così come TAKE 11 fa riferimento all'undicesimo significato della parola take) la ingerisce al fine di mantenersi in vitae di crescere, oppure tale che A forma un MEAL, oppure tale che è OTHER THEN un DRINK.

Il formalismo di Quillian presenta altre caratteristiche, alcune delle quali verranno largamente riprese esviluppate nelle reti semantiche successive. E' possibile associare ai nodi token vari tipi di specification tag, vale a direvalori numerici che servono ad indicare, ad esempio, il numero di istanze che deve avere un token, o la sua rilevanzanella definizione di un concetto. Secondo Quillian, espressioni come a, six, much, very, probably, not, perhapsdovrebbero essere rappresentate non come nodi distinti, ma come specification tag associate ai token di un piano.

Alla definizione di una parola possono essere associate clue word, che indicano con quali altri concetti unconcetto deve essere messo in relazione nei casi tipici. Ad esempio, la definizione del verbo to comb ha come oggetto laclue word hair, per indicare che di solito l'oggetto di to comb è hair. Le clue word sono quindi le antesignane dei defaultvalue dei sistemi di rappresentazione successivi, e in particolare dei frame (si veda oltre il par. 4.3); sono cioè valoritipici che si assumono come veri in mancanza di informazioni contrarie più specifiche.

Abbiamo visto che ogni piano contiene la definizione di un concetto lessicale. Tale definizione non è tuttaviacompleta, in quanto i vari token che vi compaiono rimandano a loro volta ad altri piani, cioè ad altre definizionirappresentate nel modello. La parte della definizione compresa in un singolo piano viene detta da Quillian la definizioneimmediata di una parola. Alla definizione immediata si contrappone il concetto completo di una parola (full wordconcept), che comprende tutti i nodi type e token che contribuiscono, in maniera diretta o indiretta, alla definizione. Ilfull word concept di una parola si ottiene partendo dal nodo type della parola stessa (detto nodo "patriarca"), sipercorrono quindi tutti gli archi del piano che le corrisponde e, per ogni token raggiunto, si visitano tutti i piani deirelativi nodi type, ripetendo ricorsivamente l'operazione e visitando, ogni volta che si incontra un token, il piano del typecorrispondente. Un insieme non strutturato di nodi type e token non costituisce un'adeguata rappresentazione di un fullconcept, poiché mancano completamente le informazioni sulle relazioni fra i nodi. E' quindi necessario, man mano chela ricerca procede, mantenere traccia anche dei vari archi che sono stati percorsi. Così, "nel modello della memoria ilconcetto completo di una parola è definito come l'insieme di tutti i nodi che possono essere raggiunti tramite un processoesaustivo di percorrimento avente origine nel corrispondente type node patriarca, assieme alla somma totale dellerelazioni fra questi nodi specificate da archi fra token e token di uno stesso piano" (Quillian 1968, p. 238).

Si noti che questo processo di ricerca può partire da qualsiasi nodo type della rete, poiché a ogni nodo type sonoassociati dei token che rimandano a loro volta ad altri type. Non ci sono infatti nodi primitivi nelle reti di Quillian, edogni voce è definita sempre nei termini di altre definizioni nella rete (così come in un dizionario ogni voce richiamasempre qualche altra voce).

Lo scopo dichiarato del modello di Quillian era quello di simulare la comprensione di enunciati espressi inlinguaggio naturale. Fornendogli in input un enunciato sconosciuto, il sistema avrebbe dovuto essere in grado di ricavareuna rappresentazione del suo significato sulla base delle definizioni presenti nella rete semantica. Le prestazioni effettivedel modello sono tuttavia molto più limitate: di fatto, esso è in grado soltanto di confrontare il significato di due vocilessicali. Sottoponendogli due parole la cui definizione è rappresentata nella rete, il programma individua le piùimportanti somiglianze e differenze fra i loro significati. Dopo di che, una seconda componente del programma generaun enunciato, scritto in un sottoinsieme semplificato dell'inglese, che esprime tali somiglianze e differenze.

Il meccanismo inferenziale utilizzato per confrontare due parole si basa su una forma di attivazione diffusa(spread activation) dei nodi della rete. Il confronto avviene individuando i punti in cui i full concept delle due parole siintersecano. Partendo dai nodi patriarca delle due definizioni da confrontare, il programma procede visitando man mano

Page 39: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

4

i nodi vicini (siano essi type o token) ai quali può accedere percorrendo i vari tipi di archi associativi. I nodi via viavisitati vengono "attivati", etichettandoli per mezzo di una activation tag. In questo modo, attorno a ciascun patriarca sicrea una zona di nodi attivati che si espande lentamente in tutte le direzioni. Si noti infatti che il processo di attivazioneprocede alternativamente su ciascuno dei due concetti da confrontare, in modo da simulare un'elaborazione eseguitaparallelo. Ogni activation tag comprende il nome del nodo patriarca da cui è partito il processo di attivazione. Questoconsente di evitare circoli viziosi e di identificare le intersezioni. Ogni volta che un nodo viene raggiunto da un processodi attivazione, il programma controlla se quel nodo era già stato attivato a partire dallo stesso patriarca. In tal caso quelpercorso viene abbandonato, in quanto già visitato precedentemente. Se invece quel nodo presenta la activation tag colnome di un altro patriarca, allora è stato identificato un punto in cui i due full concept si intersecano. Infine, se il nodonon presenta alcuna activation tag, allora il nodo viene etichettato, e il processo di attivazione continua. Ogni activationtag comprende anche il nome del nodo visitato immediatamente prima durante il processo di attivazione. Questoconsente, una volta individuata un'intersezione fra le sfere di attivazione di due concetti, di ricostruire i percorsi (path)che dai patriarchi conducono al nodo d'intersezione. Tali percorsi sono necessari al sistema per generare le proprierisposte. I path che conducono dai nodi patriarca al nodo intersezione vengono utilizzati per generare le risposte delsistema. Ogni risposta viene costruita sulla base dei nodi del percorso e dei tipi di archi che li collegano (utilizzandotalvolta anche le informazioni contenute nelle immediate vicinanze dei nodi percorsi).

4.2 Dopo Quillian

Nel modello di memoria associativa di Quillian erano presenti in nuce molte delle caratteristiche chediventeranno tipiche dei sistemi a rete semantica successivi. Ad esempio, gli archi che rappresentano relazioni disottoclasse fra concetti diventeranno un costrutto fondamentale di pressoché tutte le reti semantiche. Essi sono gliantesignani di quelli che in seguito verranno chiamati di volta in volta archi isa (dove isa sta per "is a", vale a dire "èun"), archi ako ("a kind of", cioè: "un tipo di"), o archi superc, ossia archi di superconcetto. Nel modello di Quillian è inun certo senso già implicito il principio in base a cui, mediante tali archi, si possa descrivere un concetto facendoriferimento a concetti di portata più generale. Ad esempio, nella rete di fig. 4.2, il concetto PLANT 2 viene introdottocome sottoclasse di APPARATUS, alla cui definizione si fa implicitamente riferimento senza tuttavia riprodurlaesplicitamente nella definizione di PLANT 2. Tale meccanismo evolverà in seguito nel principio dell'ereditarietà fraconcetti, in base al quale i concetti più specifici ereditano le caratteristiche dei loro superconcetti più generali. Tutto ciòtuttavia non è ancora presente, se non in maniera estremamente rudimentale, nel modello di Quillian che abbiamodescritto. In generale, il limite principale di tale modello consiste nel fatto che i meccanismi inferenziali definiti su diesso trattano i vari archi in maniera del tutto uniforme, e non esistono regole di inferenze specifiche relative ad archi didiverso tipo. Ad esempio, non viene introdotta alcuna regola che, dal fatto che un nodo A è sottoclasse di B e dal fattoche B è sottoclasse di C, consenta di dedurre che A è a sua volta sottoclasse di C. Di conseguenza, le informazioni chesono rappresentate nella rete utilizzando archi di diverso tipo non possono essere utilizzate per ottenere inferenze dalsistema. Il comportamento inferenziale del modello di Quillian, basato sul meccanismo della spread activation, utilizzala rete ignorando completamente il significato specifico dei vari archi. Il tipo degli archi viene utilizzato dal sistemasoltanto per generare risposte in linguaggio "quasi" naturale, una volta che il meccanismo della spread activation abbiaottenuto un risultato. Le reti di Quillian con i vari tipi di archi non costituiscono quindi un vero e proprio linguaggioformale di rappresentazione, ma soltanto una sorta di notazione sintetica in cui esprimere enunciati del linguaggionaturale.

Page 40: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

5

In vari lavori successivi Quillian ha ulteriormente perfezionato il modello che abbiamo presentato. Ad esempio,in Quillian (1969) scompaiono dalle reti i nodi token e, nella definizione dei concetti, vengono utilizzati direttamentepuntatori al nodo tipo corrispondente. In Collins e Quillian (1970) viene presentato un tipo di rete che può essereconsiderato un antesignano diretto di gran parte dei sistemi successivi. In quel lavoro emerge chiaramente il ruoloprivilegiato degli archi di tipo superset. Essi strutturano la rete come una gerarchia di concetti. Ad ogni nodo è associatoun insieme di proprietà che caratterizzano il concetto corrispondente (si veda fig. 4.3 - da Collins e Quillian 1970). Adesempio, Bird è descritto come sottoclasse di Animal, e gli sono attribuite le proprietà Has Wings, Can Fly e HasFeathers. Le proprietà più generali sono introdotte ai livelli più alti della tassonomia, e diventa esplicito il meccanismodell'ereditarietà, in base al quale, di norma, un concetto eredita le proprietà associate ai suoi superconcetti (ad esempio,Bird, in quanto sottoconcetto di Animal, eredita Has Skin, e così via). Viene inoltre introdotto esplicitamente ilmeccanismo per cui proprietà definite a livelli più specifici possono "cancellare" proprietà incompatibili che dovrebberoessere ereditate dai livelli superiori. Ad esempio, il concetto Bird ha associata la proprietà Fly, mentre per Ostrich, che èsottoclasse di Bird, vale invece la proprietà Can't Fly. Carbonell (1970) utilizza una rappresentazione a reti semantichesimile a quella di Quillian per la base di conoscenza di SCHOLAR, un programma per la didattica assistita dalcalcolatore. Le reti utilizzate da Carbonell presentano alcune importanti innovazioni; ad esempio, compare la distinzionefra concept units e example units, cioè fra nodi che rappresentano concetti generali e nodi che rappresentano istanzespecifiche, ossia singoli individui.

fig. 4.3

Un altro dei primi sistemi a rete semantica è legato alle ricerche di Winston (1970, 1975) sull'apprendimentoautomatico. Lo scopo di Winston era sviluppare programmi in grado di apprendere in base ad esempi semplicigeneralizzazioni in un mondo di blocchi. Come strumento di rappresentazione della conoscenza, veniva utilizzato unsistema di rappresentazione a rete che presenta caratteristiche comuni a molti sistemi successivi. Un esempio è in fig. 4.4(da Winston 1975). Nelle reti di Winston, alcuni nodi rappresentano oggetti, o classi di oggetti (come il nodo brick dellafigura), mentre altri nodi rappresentano relazioni (ad esempio il nodo left of). Di conseguenza, anche gli archi hannofunzioni diverse: alcuni rappresentano relazioni fra oggetti (ad esempio, l'arco one part is), altri servono semplicementea collegare nodi che rappresentano oggetti o classi a nodi che rappresentano relazioni. Non sempre la notazione diWinston è del tutto coerente, e può accadere che la stessa relazione compaia talvolta rappresentata come arco, talvoltacome nodo. Inoltre, la notazione non distingue tra relazioni di portata logica generale, quale quella di superconcetto, erelazioni specifiche dipendenti dal dominio, rendendo in questo modo impossibile, ad esempio, un trattamentosoddisfacente del meccanismo di ereditarietà. In questo, anche il lavoro di Winston è sintomatico dei limiti dei primisistemi a rete semantica, limiti che verranno in seguito messi in luce da W. Woods (si veda il par. 4.4).

Page 41: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

6

fig. 4.4

Un ulteriore linea di sviluppo nella storia delle reti semantiche prende l'avvio dal lavoro di Filmore (1968) sullestrutture a casi in linguistica. In questo tipo di sistemi le reti semantiche vengono usate principalmente per rappresentareil significato di verbi e di enunciati linguistici. Al verbo principale di un enunciato viene fatto corrispondere un nodonella rete, per il quale sono definiti archi che corrispondono ai diversi casi linguistici. Tali archi terminano in nodi cherappresentano i relativi riempitori. Così, ad esempio, dato un nodo che rappresenta una certa azione, per esso sonodefiniti archi che corrispondono al tipo di azione, al soggetto, all'oggetto, al tempo dell'azione, al suo effetto, e così via.Fra le reti semantiche ispirate a questo principio ricordiamo ad esempio i sistemi di Simmons e dei suoi collaboratori(Simmons et al. 1968; Simmons e Bruce 1971; Simmons e Slocum 1972), i sistemi HAM (Anderson e Bower 1973) eACT (Anderson 1976). Un ulteriore esempio di questo tipo di modelli è fornito dal lavoro del gruppo di ricerca LNR,composto da Linsday, Norman e Rumelhart (Rumelhart et al. 1972). In fig. 4.5 è riportato un esempio di rete del sistemaLNR, che rappresenta il significato dell'enunciato "In a park a hippie touched a debutante". In LNR sono previsti duetipi di nodi, nodi che rappresentano concetti (ad esempio HIPPIE e PARK nella figura) e nodi che rappresentano eventi(come TOUCH). I nodi che rappresentano concetti sono definiti sulla base di archi come ISA o HAS (utilizzato perattribuire sottoparti). I nodi che rappresentano eventi sono definiti per mezzo di archi che corrispondono ai vari casilinguistici (ad es. ACTOR, OBJECT, TIME, e così via). L'arco ACT è l'analogo di ISA per gli eventi. I nodi in LNR sidistinguono inoltre in nodi primari e nodi secondari. I nodi primari corrispondono ai vari elementi del lessico, epossono avere associata una definizione nella rete. I nodi secondari corrispondono a usi specifici di nodi primari, comenella rappresentazione del significato di un singolo enunciato. Ad esempio, nella figura, *TOUCH è un nodo secondariodi tipo evento che rimanda, attraverso un arco ACT, al corrispondente nodo primario TOUCH. *TOUCH è collegatomediante un arco ACTOR ad un nodo secondario di tipo concetto, che rimanda, attraverso un arco ISA, alcorrispondente nodo primario HIPPIE. Nella definizione dei nodi primari le proprietà di portata più generale di un nodovengono ereditate dai nodi più specifici. Come nelle reti di Collins e Quillian, sono ammesse eccezioni al meccanismodell'ereditarietà.

fig. 4.5

Page 42: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

7

Probabilmente il formalismo a rete semantica più noto fra quelli, in senso lato, ispirati alle strutture a casi è lateoria della dipendenza concettuale di Roger Schank4. Essa merita qualche cenno, oltre che per la notorietà di cui gode,anche perché si tratta di un esempio di sistema in cui in cui viene individuato un insieme finito di "primitive semantiche"che dovrebbero essere sufficienti per la rappresentazione di significati di tipo arbitrario. Un altro esempio di sistema arete basato su primitive semantiche è la teoria della Preference semantics di Wilks (si veda Wilks e Fass 1992). Schankidentifica un insieme di azioni primitive, circa dodici, che, opportunamente combinate, dovrebbero consentire dicostruire la rappresentazione del significato di qualsiasi verbo. Alcuni esempi delle primitive semantiche di Schanksono: ATRANS (che corrisponde al trasferimento di possesso di un oggetto), PTRANS (il trasferimento dellacollocazione fisica di un oggetto), MTRANS (il trasferimento di informazione mentale fra agenti), MBUILD (lacostruzione di un pensiero o di nuova informazione da parte di un agente), PROPEL (l'applicazione di una forza fisica aun oggetto), MOVE (il movimento di una parte del corpo di un agente), INGEST (l'ingerire un oggetto da parte di unessere animato). Inoltre il formalismo prevede un insieme di relazioni di dipendenza concettuale, ossia relazioniconcettuali che possono sussistere fra azioni primitive e oggetti o situazioni del mondo. Tali relazioni sono in parteanaloghe ai casi dei formalismi visti sopra. Fra tali "casi concettuali" si trovano ad esempio la relazione fra l'attore, ossiail soggetto di un'azione, e l'azione da lui compiuta, la relazione fra un'azione e il suo oggetto, e così via. Nelle retisemantiche basate sulla teoria delle dipendenza concettuale, i nodi sono costituiti da istanze di azioni primitive, oppurerappresentano oggetti o situazioni. Gli archi rappresentano relazioni di dipendenza concettuale fra i nodi.

Ad ogni azione primitiva è associato un certo numero di campi (slot), ossia di relazioni di dipendenzaconcettuale, con l'indicazione delle restrizioni che devono essere soddisfatte dagli oggetti che entrano in tale relazione.Ad esempio, l'azione primitiva PTRANS ha i seguenti slot: ACTOR, che corrisponde al soggetto dell'azione, che puòavere come argomento un essere umano, o comunque un oggetto animato; OBJECT, che corrisponde all'oggetto cheviene spostato, che deve essere un oggetto fisico; FROM e TO, che devono avere come argomento una locazionespaziale ciascuno, e che indicano rispettivamente il punto di partenza e il punto di arrivo dell'azione di spostamento.

Graficamente, un'azione viene rappresentata da una rete come quella in fig. 4.6. Questa rete rappresentaun'azione eseguita da Mario, che consiste nello spostare una certa sedia (la sedia SEDIA1) dal punto P1 al punto P2. Lefrecce rappresentano le varie relazioni di dipendenza concettuale. Ad esempio, la freccia bidirezionale a doppio trattorappresenta la relazione fra attore e azione, mentre la freccia a tratto semplice etichettata con O rappresenta la relazionefra l'azione e il suo oggetto.

fig. 4.6

Ciascuna azione primitiva può essere specificata in più modi diversi, in maniera da rappresentare il significato didiversi verbi di una lingua. Ad esempio, guidare, volare, camminare, cadere sono tutti esempi di PTRANS. Significatidiversi possono essere espressi mediante restrizioni di valore sugli slot; inoltre, nella rappresentazione del significato diun verbo, diverse azioni primitive possono essere coinvolte, connesse fra loro mediante opportune relazioni didipendenza concettuale.

Il sistema prevede inoltre un insieme di regole di inferenza. Tali regole possono essere classificate in categoriediverse, come ad esempio regole che stabiliscono come devono essere riempiti gli slot di un'azione primitiva inmancanza di informazioni specifiche, regole che inferiscono le possibili cause o precondizioni di un'azione, regole cheinferiscono le possibili conseguenze di un'azione, e così via. I vari tipi di azione primitiva sono connessi fra loro inmaniera da consentire varie inferenze. Ad esempio, un'azione di tipo PROPEL implica tipicamente un'azione di tipoPTRANS: se si spinge qualcosa, di solito avviene uno spostamento di un oggetto fisico. Tuttavia, Schank e i suoicollaboratori5 sottolineano la differenza fra regole di inferenza di questo genere e regole di deduzione logica nel sensoclassico: inferenze di questo genere non conducono necessariamente da premesse vere a conseguenze vere. Bisogna

4 Si veda (Schank 1972, 1975). Per una rassegna recente sulla dipendenza concettuale e sui sistemi che ne sono derivatisi veda (Lytinen 1992).5Si veda ad esempio (Schank e Rieger 1974).

Page 43: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

8

sempre essere disposti a rivedere le conseguenze che sono state tratte. Ad esempio, può accadere di spingere qualcosasenza che esso si muova6.

4.3 Prototipi ed eccezioni

In questo paragrafo prenderemo in considerazione formalismi la cui caratteristica principale è costituita dal fattodi rappresentare concetti sulla base di proprietà e di attributi prototipici - attributi cioè che valgono per istanze tipiche diun concetto, ma che possono essere violate da esemplari "anomali". Si tratta di un problema onnipresente nellarappresentazione della conoscenza di senso comune. Ad esempio, fra gli attributi tipici degli uccelli vi è la capacità divolare (o, in altri termini, il prototipo di uccello ha la proprietà di poter volare). Tuttavia esistono molti uccelli che nonsono in grado di farlo. I cani hanno quattro zampe, ma un cane che abbia perso una zampa è pur sempre un cane.Oppure, i tavoli tipici hanno quattro gambe, ma vi sono tavoli con un numero di gambe diverso, e così via. Nel capitoloprecedente abbiamo visto che l'esigenza di rappresentare proprietà prototipiche è stato uno degli argomenti utilizzatidagli oppositori dell'uso della logica in IA. D'altra parte, nel cap. 2 si è visto che dal punto di vista che qui ci interessa,ossia per la rappresentazione del significato lessicale, il problema è certamente centrale, in quanto la maggior parte deiconcetti associati ad elementi del lessico del linguaggio naturale è caratterizzabile esclusivamente in termini prototipici.Basti considerare gli ovvi esempi sopra riportati. Intuitivamente, è difficile negare che la proprietà di volare abbia a chefare a qualche titolo con il significato della parola "uccello", anche se non rientra fra le condizione necessarie nésufficienti della sua definizione. In generale, per molti termini del linguaggio naturale, così come per molti concetti delsenso comune, è estremamente difficile individuare condizioni necessarie o sufficienti, e ci si basa piuttosto su insiemidi caratteristiche tipiche.

Già nei sistemi a rete semantica citati nei paragrafi precedenti ci si poneva il problema di descrivere concetti sullabase di proprietà tipiche. Ne sono un esempio le clue word di Quillian o le eccezioni all'ereditarietà nelle reti di Collinse Quillian (1970). Anche le inferenze previste dalla teoria della dipendenza concettuale di Schank valgono generalmenteper "casi tipici", e devono essere considerate rivedibili. Prenderemo ora in considerazione due classi di formalismi in cuiil problema è stato posto in maniera più diretta e sostanziale. Si tratta dei sistemi a frame e delle reti tassonomiche coneccezioni, in particolare il sistema NETL di Fahlman.

I frame sono un tipo di rappresentazione della conoscenza proposto da Minsky (1975) in aperta polemica con lerappresentazioni basate sulla logica matematica. Secondo Minsky, molte teorie proposte sia in psicologia, sia in IA (efra esse, appunto, la logica) prevedono rappresentazioni di tipo troppo locale e poco strutturato per risultare adeguatecome rappresentazioni della conoscenza di senso comune e per servire da base alla simulazione di comportamentiintelligenti. Per spiegare le capacità di ragionamento e la velocità di accesso alle informazioni memorizzate propriedegli esseri umani (e quindi per poterle simulare mediante programmi) è necessario ipotizzare tipi di rappresentazionepiù strutturati e complessi. I frame dovrebbero servire appunto a questo scopo. L'idea intuitiva è che la memoria umanasia strutturata in un insieme di schemi, di rappresentazioni stereotipiche di oggetti e di situazioni. Posti di fronte asituazioni nuove, gli esseri umani identificano lo schema che meglio si applica ai dati disponibili, e agiscono sulla basedelle informazioni che tale schema mette a disposizione o delle aspettative che esso comporta. I frame dovrebberocorrispondere appunto a schemi di questo genere: dovrebbero essere strutture per la rappresentazione di situazioniprototipiche come, secondo gli esempi dello stesso Minsky, essere in un soggiorno di un certo tipo o andare a una festadi compleanno di bambini. A un frame sono associati diversi tipi di informazioni, relative anche a come adoperare ilframe stesso, a cosa aspettarsi, a cosa fare se tali aspettative si rivelassero errate.

Va precisato che, nell'articolo di Minsky, il concetto di frame viene presentato in maniera intuitiva e del tuttoinformale, senza che venga definito un formalismo di rappresentazione vero e proprio. Al di là dei concetti principali,che corrispondono grosso modo a quanto esporremo qui di seguito, molte parti risultano poco chiare e di difficilecomprensione. Le idee di Minsky, tuttavia, hanno avuto una grande influenza sulla ricerca successiva inrappresentazione della conoscenza, e molti sono i sistemi di rappresentazione che vi si sono ispirati7.

I frame sono organizzati in basi di conoscenza complesse dette sistemi di frame (frame system). Ciascun frame èuna struttura di dati costituita da diversi campi (slot), ciascuno dei quali rappresenta una delle caratteristiche o delleproprietà del prototipo rappresentato, e le sue possibili relazioni con altre entità. Ad ogni slot sono associati dati oinformazioni specifiche relative al prototipo. Ad esempio, il seguente potrebbe essere un frammento del frame cherappresenta il prototipo di mammifero:

nome del frame: mammiferoè un: vertebrato

...tipo riproduzione: viviparo

6Questi problemi possono essere ricondotti al frame problem e alla non monotonicità del ragionamento di senso comunesulle azioni - si veda il capitolo 6.7 Fra essi, ricordiamo ad esempio il sistema KRL di Bobrow e Winograd (1977).

Page 44: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

9

protezione del corpo: pellicciaarto: zampa (card.:4)

...

Il primo campo indica il nome del frame; gli altri campi indicano i vari attributi di mammifero: un mammifero è unvertebrato, in quanto a tipo di riproduzione è viviparo, ha il corpo protetto da una pelliccia, come arti ha delle zampe, ecosì via. Per ciascuno slot, oltre a essere specificato il tipo di riempitori che quello slot ammette, possono essere indicatealtre informazioni, come la cardinalità, ossia il numero di riempitori che lo slot può avere. Ad esempio, per il prototipodi mammifero i riempitori dello slot arto sono oggetti di tipo zampa e sono in numero di quattro. Lo slot è un di unframe fa riferimento a uno o più altri frame di cui esso è un caso particolare. In questo modo, i frame di una base diconoscenza sono organizzati in una tassonomia. Ad esempio, il frame mammifero è un caso particolare del framevertebrato. A loro volta, i frame seguenti sono casi particolari di mammifero:

nome del frame: tigre nome del frame: caneè un: mammifero è un: mammifero

... ...si nutre di: carne padrone: personahabitat: giungla ...

...

Ciascuno di essi eredita gli attributi di mammifero. Tali attributi possono essere ulteriormente specificati, o ne possonoessere aggiunti altri sotto forma di nuovi slot (nel nostro esempio, lo slot padrone potrebbe ad esempio essere definitolocalmente per il frame cane). I valori dei vari slot (come ad esempio pelliccia, zampa, giungla, persona, e così via)fanno riferimento, di norma, ad altri frame del frame system. Ad esempio, giungla potrebbe corrispondere ad un framedel genere:

nome del frame: giunglaè un: ambiente naturale

...collocazione geografica: regione tropicaleclima: caldo umido

...

In questo modo i frame di un frame system sono organizzati in base a una serie di complesse relazioni reciprocheanaloghe a quella fra i concetti di una rete semantica. Ai livelli più bassi della tassonomia possono esservi frame chedescrivono individui specifici. Ad esempio, il seguente frame descrive una istanza del frame cane:

nome del frame: Plutoè un: cane

...padrone: Topolino

...

Una caratteristica fondamentale del meccanismo di ereditarietà nei frame è costituito dai valori di default. Poiché iframe vanno intesi come rappresentazioni di prototipi, le informazioni associate agli slot in ciascun frame possonorisultare false in alcune situazioni specifiche. Ad esempio, i cetacei sono mammiferi, ma non hanno pelliccia e hannocome arti delle pinne; un mammifero può avere meno di quattro zampe; l'ornitorinco è un mammifero oviparo; una tigrepuò non vivere nella giungla, e così via. In generale, alcuni slot hanno come riempitori informazioni necessariamentevere per ciascuna istanza del frame (ad esempio, tutti i mammiferi sono necessariamente dei vertebrati). Taliinformazioni vengono ereditate da tutti i frame più specifici. Ad altri slot sono associate invece informazioni chevalgono esclusivamente per le istanze "tipiche" del frame. Tali informazioni vengono dette appunto valori attribuiti perdefault. Ad esempio, pelliccia è un valore di default dello slot protezione del corpo per il frame mammifero, così come èun valore di default la cardinalità 4 associata allo slot arto. Si assume che i valori di default valgano ogni qual volta nonsiano disponibili esplicitamente informazioni incompatibili con essi. Ad esempio, in base al frame sopra riportato, se sisa che un animale è un mammifero e non si dispone di nessuna informazione circa i suoi arti, si assume che abbiaquattro zampe. I default di un frame vengono quindi ereditati da tutti i frame più specifici, a meno che in essi non siarappresentata esplicitamente qualche informazione incompatibile con ciò che dovrebbe essere ereditato. Così, il frameseguente:

nome del frame: tigre da circo

Page 45: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

10

è un: tigre...

habitat: circo...

non eredita dal frame tigre il valore di default giungla dello slot habitat.I frame presentano inoltre altre caratteristiche, come ad esempio il collegamento procedurale (procedural

attachment). Ad ogni frame possono essere associate procedure specifiche di vario tipo che operano sulla base diconoscenza: regole di inferenza specializzate, procedure per individuare i riempitori di uno slot, procedure di ricercadefinite sul frame system, e così via. Tali procedure possono essere ereditate dai frame più specifici in base a unmeccanismo simile a quello dei valori di default8.

Un esempio di collegamento procedurale è fornito dalle procedure di tipo if needed. Tali procedure vengonoutilizzate qualora le informazioni circa i riempitori di uno slot in un frame non vengano immagazzinate esplicitamente,ma siano presenti in modo implicito nella base di conoscenza. Le procedure if needed hanno la funzione di calcolare iriempitori di uno slot nel momento in cui tale informazione venga richiesta. Si supponga ad esempio di avere un framepersona definito nel modo seguente.

nome del frame: persona...

genitore: persona (card.:2)antenato: persona

...

Non è necessario che le informazioni circa i riempitori dello slot antenato siano rappresentate esplicitamente perciascuna istanza del frame. Per individuare gli antenati di una persona è infatti sufficiente individuarne i genitori deigenitori, e quindi, ricorsivamente, gli antenati dei genitori. Una procedura di tipo if needed che svolga tale ricerca puòquindi essere associata allo slot antenato di persona. In parte analoghe alle procedure if needed sono le procedure ditipo if added, le quali provvedono invece a dedurre e ad aggiungere ulteriori informazioni alla base di conoscenzaqualora nuove informazioni di un determinato tipo (ad esempio riempitori di un certo slot) vengano inserite.

Un'altra classe di sistemi di rappresentazione della conoscenza in cui è centrale il problema delle eccezioni alsistema dell'ereditarietà è costituito dalle reti semantiche basate su di un meccanismo di elaborazione di tipo parallelo. Sitratta nella sostanza di un ulteriore sviluppo del concetto di attivazione diffusa in parallelo che abbiamo già incontratonel sistema di Quillian. Il capostipite di questo tipo di reti semantiche è il sistema NETL di Scott Fahlman (1979). Sitratta di un formalismo a rete semantica destinato ad essere implementato su opportune macchine ad hardwareconcorrente. In esso, le inferenze avvengono propagando in parallelo lungo gli archi della rete opportuni marcatori didiverso tipo. Il linguaggio di NETL prevede diversi tipi di costrutti. Vi sono nodi per rappresentare individui e nodi perrappresentare concetti generali. Fra i diversi tipi di archi, un ruolo centrale è svolto dall'analogo degli archi di tipo isa(che raffigureremo con delle frecce a tratto continuo), in base ai quali è organizzato il sistema dell'ereditarietà. Sonoprevisti inoltre archi di tipo is not, che raffiguriamo per mezzo di frecce tratteggiate9. Sia gli archi isa che gli archi is notammettono possibili eccezioni. Ad esempio, nella fig. 4.7, l'arco isa fra uccello e volatile sta a indicare che gli uccellitipici sono volatili, ma sono ammesse possibili eccezioni (ad esempio i pinguini). Allo stesso modo, i mammiferitipicamente non sono volatili (ma i pipistrelli sono mammiferi e volano). NETL prevede numerosi altri tipi di costruttioltre agli archi isa e is not (ad esempio archi per esprimere relazioni qualunque tra due concetti), e il trattamento delleeccezioni nell'ereditarietà costituisce soltanto una delle sue caratteristiche. Tuttavia, la linea di ricerca sviluppatasi apartire dal lavoro di Fahlman ha posto l'enfasi essenzialmente su questo tipo di problemi. Ciò è dovuto al fatto che ilmeccanismo inferenziale basato sulla propagazione in parallelo di marcatori sembrava offrire soluzioni plausibili adalcuni problemi connessi all'ereditarietà con eccezioni, e in particolare al problema dell'ereditarietà multipla. Tutti gliesempi di tassonomie di concetti con eccezioni che abbiamo visto nei paragrafi precedenti hanno la struttura di unalbero: ogni concetto sta nella relazione isa con al più un altro concetto della rete. E' di questo tipo la rete di Collins eQuillian della fig. 4.3, ed ha questa struttura anche la tassonomia di frame dell'esempio sopra riportato. In reti di questogenere il trattamento delle eccezioni è poco problematico. Ogni concetto eredita direttamente al più da un altro concetto.Quindi, per ogni concetto valgono, oltre alle caratteristiche definite localmente, tutte le caratteristiche che valgono per ilsuo superconcetto immediato e che non sono in conflitto con le prime. Questo criterio può essere applicatoricorsivamente fino alla radice della tassonomia.

8 Sul tema del collegamento procedurale si veda anche (Winograd 1975).9Fahlman non usa questa terminologia, tuttavia questo è l'uso invalso nella letteratura successiva, e noi adotteremo talidenominazioni per uniformità con l'uso generale.

Page 46: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

11

fig. 4.7

La situazione è più complessa se in una rete semantica che prevede eccezioni si ammette l'eredità multipla, secioè si ammette che ciascun concetto possa avere più di un superconcetto. In tal caso un concetto può ereditare da partidiverse caratteristiche fra loro in conflitto. Si considerino ad esempio i concetti pipistrello e pinguino nella rete di fig.4.7. pipistrello è collegato da un arco isa sia a volatile che a mammifero. I pipistrelli, in quanto mammiferi, dovrebberoereditare la caratteristica di non essere volatili; tuttavia nella rete si afferma esplicitamente che essi, tipicamente, sonovolatili. Intuitivamente, l'idea è che, in casi di questo tipo, le informazioni più specifiche dovrebbero avere la meglio suquelle più generiche. Così, da una rete del genere si vorrebbe poter inferire che tipicamente i pipistrelli volano, inquanto esiste una legame diretto di tipo isa fra pipistrello e volatile, mentre per dedurre che i pipistrelli non volano sidovrebbe passare attraverso il concetto mammifero. Il meccanismo inferenziale basato sulla propagazione in parallelo dimarcatori sembra mettere a disposizione una soluzione estremamente "naturale" a questo tipo di problemi. Si considerila rete di fig. 4.8. Essa presenta problemi di eredità multipla molto simili al caso appena esaminato relativo alpipistrello: i molluschi tipici sono animali con una conchiglia, tuttavia i cefalopodi sono molluschi, ma, tipicamente,sono privi di conchiglia. I Nautilus, infine, sono cefalopodi che sono dotati di conchiglia. Vediamo, a grandi linee, comesi comporterebbe NETL in un caso del genere. Nel meccanismo di attivazione parallela, i legami isa propaganomarcatori "positivi", mentre i legami di tipo is not propagano marcatori "inibitori". Tali marcatori vengono propagati inparallelo, un passo alla volta. Data la rete della figura, se si chiede a NETL se un cefalopode è un animale con laconchiglia, inizia un processo di attivazione in parallelo a partire dal nodo cefalopode. In questo caso, il marcatore chearriva per primo al nodo animale con conchiglia è un marcatore di tipo inibitore, e il sistema fornisce quindi unarisposta negativa. Qualora invece si chiedesse se un Nautilus ha la conchiglia, arriverebbe per primo un marcatore ditipo positivo (che raggiunge il nodo animale con conchiglia in un solo passo, attraverso l'arco isa che connettedirettamente i due concetti), e il sistema fornirebbe una risposta positiva. In NETL quindi gli eventuali conflittinell'ereditarietà vengono risolti in base a un'euristica che privilegia il percorso più breve che connette due concetti nellarete (questa forma di ragionamento prende usualmente il nome di path based reasoning).

Page 47: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

12

fig. 4.8

4.4 What is in a link

Un articolo di William Woods dal titolo "What's in a link: foundations for semantic networks" pubblicato nel1975 (Woods 1975) ha costituito, per molti versi, un punto di svolta nella storia di questo tipo di sistemi dirappresentazione della conoscenza. Quando uscì l'articolo di Woods le reti semantiche erano un tipo di rappresentazionemolto diffuso in IA, e molti erano i sistemi già proposti ed utilizzati. Woods partiva dalla constatazione che tuttavia"non esiste attualmente alcuna 'teoria' delle reti semantiche" (p. 36). D'altronde, già i pochi esempi brevemente descrittinei paragrafi precedenti possono rendere un'idea di quale fosse lo stato dell'arte. Al di là dell'idea generale di utilizzareuna struttura a grafo per la rappresentare la conoscenza in un programma, i vari sistemi a rete semantica erano quanto dipiù eterogeneo si possa immaginare. Anche nell'ambito di un singolo formalismo era tutt'altro che impossibile trovareusi incompatibili delle stesse strutture di rappresentazione. I nodi delle reti venivano utilizzati per rappresentare di voltain volta fatti, predicati, classi, eventi, proposizioni, relazioni, singoli individui, senza che per lo più queste differenzed'uso si rispecchiassero in corrispondenti distinzioni sintattiche nel formalismo. Lo stesso valeva per gli archi checonnettono i nodi. Molto spesso i diversi costrutti di una rete venivano trattati, a livello computazionale, in modo deltutto uniforme, senza che fossero state elaborate regole di inferenza formali che riflettessero il significato intuitivoattribuito ai diversi costrutti. Il comportamento inferenziale dei vari sistemi poteva essere ricavato esclusivamente inbase al comportamento computazionale dei programmi che li implementavano. E il significato da attribuire ai varicostrutti del formalismo si fondava di fatto solo sulle intuizioni di chi utilizzava il sistema di rappresentazione. Insostanza, mancava una semantica dei sistemi a rete semantica, in base alla quale si potessero giustificare in manieraprecisa le proprietà inferenziali dei sistemi stessi. Il compito che si proponeva Woods era appunto quello di analizzare lasemantica delle reti semantiche stesse:

Quando creo un nodo in una rete o quando istituisco un arco di qualche tipo fra due nodi, iocostruisco una rappresentazione di qualche cosa in una notazione. La domanda che mi porrò [...] è checosa io intenda con una tale rappresentazione. Ad esempio, se creo un nodo, e istituisco due archi a partireda esso, uno etichettato SUPERC che termina nel "concetto" telefono, e un altro etichettato MOD chetermina nel "concetto" NERO, cosa intendo rappresentare con tale nodo? Intendo che esso stia per il"concetto" telefono nero, o forse intendo asserire una relazione fra i concetti di telefono e di essere nero -cioè che i telefoni sono neri (tutti i telefoni, qualche telefono?). Quando si inventa una notazione a retesemantica, è necessario specificare non solo i tipi di nodi e di archi che possono essere usati, con le regoleper la loro possibile combinazione (la sintassi della notazione a rete), ma si deve specificare anche ilsignificato dei vari tipi di archi e di strutture - quello che si intende significare con essi (la semantica dellanotazione a rete). (Woods 1975, p. 47).

Woods parte con un'analisi del concetto stesso di semantica, individuando diverse accezioni in cui il termine èstato adoperato da filosofi, linguisti e studiosi di linguaggi di programmazione. Secondo lo schema proposto da Woods,i linguisti quando si occupano di semantica sono generalmente interessati a individuare un linguaggio "interno" dirappresentazione mediante il quale sia possibile rappresentare il significato di enunciati del linguaggio naturale. Loscopo di tale rappresentazione è, ad esempio, quello di risolvere le ambiguità della lingua naturale: ad enunciati

Page 48: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

13

linguistici sintatticamente uguali, ma con significato diverso, devono corrispondere rappresentazioni del significatodiverse. Secondo questa accezione, il processo di "interpretazione semantica" corrisponde alla traduzione da unlinguaggio (il linguaggio naturale) ad un altro linguaggio, di tipo formale (il linguaggio "interno" di rappresentazione), ilquale a sua volta resta non interpretato. Per i filosofi, d'altro canto, scopo della semantica è quello di mettere inrelazione le strutture di un linguaggio con oggetti di tipo extra linguistico, in maniera, ad esempio, da specificare lecondizioni di verità di un enunciato. Di norma, i filosofi si sono occupati di attribuire una semantica a linguaggi giàformalizzati, anziché direttamente al linguaggio naturale. Quindi il compito della semantica filosofica può essere vistocome complementare rispetto a quello della semantica linguistica.

L'uso del termine "semantica" nell'espressione "reti semantiche" va inteso secondo l'accezione dei linguistipiuttosto che secondo quella dei filosofi. Le reti semantiche, dice Woods, possono essere considerate, e sono stateconsiderate di fatto, dei candidati a fornire quel linguaggio interno di rappresentazione mediante cui rendere esplicito ilsignificato degli enunciati della lingua naturale. Tuttavia, resta ancora aperto il problema di specificare la semanticadelle reti semantiche stesse, e questa volta in un senso più simile a quello adottato dai filosofi, vale a dire specificandonele regole di corrispondenza con entità di natura extra linguistica.

Oltre all'uso filosofico e a quello linguistico del termine "semantica", Woods individua una terza accezione,collegata alla ricerca svolta in teoria dei linguaggi di programmazione e in IA. Il limite della semantica filosofica è,come abbiamo visto, quello di fermarsi al significato dei simboli primitivi, il quale viene assunto come dato, e diassumere come oggetto di studio principalmente il modo in cui viene specificato il significato di espressioni complesse apartire dal significato dei loro componenti. Diversi per Woods sono gli obiettivi dell'intelligenza artificiale. "Le ricerchein intelligenza artificiale - dice Woods - affrontano la necessità di specificare la semantica delle proposizioni elementaricosì come di quelle complesse [...] Così i ricercatori in intelligenza artificiale devono assumere una visione più globaledella semantica del linguaggio di quella che il linguista o il filosofo hanno assunto nel passato" (Woods 1975, p. 41). Lostudio delle condizioni di verità degli enunciati elementari può essere effettuato mediante procedure o funzioni cheassegnino loro un determinato valore di verità in una data situazione. Si tratterebbe quindi di una semantica di tipoprocedurale. Gli strumenti per sviluppare una tale semantica dovrebbero provenire dalla teoria dei linguaggi diprogrammazione:

i teorici dei linguaggi di programmazione hanno un vantaggio rispetto ai filosofi e ai linguisti, inquanto le loro specificazioni semantiche poggiano su un terreno più saldo, poiché sono definite in terminidi procedure che la macchina deve eseguire. E' lo stesso vantaggio che la nozione di semanticaprocedurale e intelligenza artificiale porta alla specificazione della semantica del linguaggio naturale.Benché nel linguaggio naturale ordinario non ogni enunciato abbia a che fare in modo evidente conl'esecuzione di procedure, è possibile tuttavia usare la nozione di procedura come strumento perspecificare sia le condizioni di verità di enunciati dichiarativi, sia il significato inteso di domande e dicomandi. In questo modo si raccoglie dai filosofi la catena semantica al livello delle condizioni di verità ela si completa al livello della specifica formale di procedure. Queste possono a loro volta esserecaratterizzate dal loro funzionamento su macchine reali, ed essere in questo modo ancorate alla fisica(Woods 1975. p. 43).

La semantica delle rappresentazioni utilizzate in IA dovrebbe quindi, in qualche modo, essere "completata" da unacomponente procedurale che garantisca una attribuzione di significato ai simboli primitivi. Torneremo su questo punto,che Woods affronta anche in (Woods 1980), nelle conclusioni di questa sezione e nel capitolo finale.

Il seguito dell'articolo di Woods procede, più che nei termini di una proposta organica e unitaria, sviluppandoalcuni suggerimenti generali e discutendo alcuni aspetti specifici. Viene perorata la necessità di una interpretazioneintensionale dei costrutti delle reti semantiche. Vengono discusse alcune limitazioni nel potere espressivo dei formalismia rete correnti, ad esempio rispetto alla quantificazione o alla rappresentazione di proposizioni relative. Vengono anchediscussi problemi più specifici. Ad esempio, il fatto che nelle reti spesso i nodi vengano utilizzati in maniera del tuttouniforme ed indifferenziata per rappresentare concetti generali (o classi) oppure singole istanze. Dato un nodo cherappresenta un singolo individuo (poniamo John), taluni archi definiti per esso rappresentano attributi dell'individuorappresentato (altezza, colore dei capelli, e così via). I nodi in cui terminano tali archi di norma corrispondonorispettivamente ai valori degli attributi relativi a John (ad esempio, l'arco colore dei capelli può terminare nel nodocastano, l'arco altezza nel nodo 1.75 m, eccetera). Vi sono però anche casi in cui, ad esempio, l'arco altezza termina inun nodo del tipo di maggiore di 1.60 m, il quale non denota il valore dell'attributo altezza, bensì una proprietà che talevalore deve soddisfare. Di norma, la notazione dei formalismi a rete semantica maschera completamente questo tipo didifferenze.

L'articolo di Woods sollevava una serie di problemi piuttosto che offrire vere e proprie soluzioni. Esso diedetuttavia inizio ad una sorta di "movimento del rigore" nelle reti semantiche. Su questa linea, ad esempio, RonaldBrachman si è interrogato sui vari significati che gli archi di tipo tassonomico (quelli che di volta in volta sono statichiamati archi isa, archi ako o archi superc) hanno assunto via via nei diversi sistemi a rete semantica (Brachman 1983).Vi è ad esempio un'ambiguità, analoga a quella riscontrata da Woods per le coppie attributo/valore, direttamente

Page 49: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

14

ereditata dall'ambiguità di espressioni come "... è un ...." del linguaggio naturale, che mettono in relazione talvolta duetermini generali, talvolta un termine individuale a un termine generale. Così in una rete semantica si può trovare lostesso tipo di arco isa che connette talvolta due concetti come città e capitale, oppure che connette il nodo Genova alnodo città. Un discendente diretto delle riflessioni di Woods sono, nella seconda metà degli anni settanta, le retisemantiche ad ereditarietà strutturata (anch'esse dovute a Brachman) e, in seguito, il sistema KL-ONE, di cui cioccuperemo in dettaglio nel prossimo capitolo.

Oltre che per il significato dei vari costrutti, anche per quanto riguarda i meccanismi di inferenza, come adesempio l'ereditarietà, i primi sistemi a rete semantica non erano esenti da problemi. Il trattamento dell'ereditarietà nellereti semantiche con eccezioni mancava in origine di un trattamento formale rigoroso, e il comportamento inferenziale disistemi come NETL si fondava di fatto sulle prestazioni dei programmi che implementavano il formalismo, i quali, aloro volta, erano stati scritti basandosi esclusivamente su euristiche di tipo intuitivo. Vi sono situazioni in cui questo tipodi trattamento è insufficiente, e pone problemi affrontabili solo su basi formali più rigorose. Questi temi sono statiindagati ad esempio da David Touretzky (1986). Un caso ben noto in letteratura, in cui il semplice meccanismo diattivazione in parallelo di NETL fallisce è il cosiddetto rombo di Nixon (the Nixon's diamond). Si consideri una retecome quella della fig. 4.9. Essa esprime l'informazione secondo cui i quaccheri, tipicamente, sono dei pacifisti, mentre irepubblicani (cioè i membri del Partito Repubblicano negli Stati Uniti) di solito non lo sono. Poi si asserisce che Nixonè sia un quacchero sia un repubblicano. Cosa è lecito dedurre circa il fatto che Nixon sia un pacifista o meno?Evidentemente, in mancanza di altre informazioni, le conoscenze rappresentate nella rete non consentono di trarrealcuna conclusione, o, in altri termini, entrambe le conclusioni sono ugualmente giustificate. Tuttavia, nel caso di unmeccanismo come quello previsto da NETL, non è assolutamente possibile prevedere che tipo di risposta fornirà ilsistema. A seconda di come è implementato l'algoritmo di attivazione in parallelo, il programma potrebbe risponderepositivamente, o negativamente, a entrambe le domande. O, peggio ancora, data una certa implementazione delprogramma, potrebbe rispondere positivamente in un caso e negativamente nell'altro in maniera arbitraria. Il punto è chemanca una specificazione formale rigorosa che consenta di stabilire che tipo di risposta si vuole ottenere, in base allaquale costruire l'implementazione del sistema inferenziale.

fig. 4.9

Problemi analoghi possono sorgere anche in situazioni di altro tipo. Si supponga di estendere la rete di fig. 4.8come in fig. 4.10. Rispetto a fig. 4.8, è stata aggiunta un istanza al concetto Nautilus: Nemo è un particolare esemplaredi Nautilus. Fino a qui, tutto funzionerebbe regolarmente come nell'esempio del paragrafo precedente. Nella nuova rete,però, è presente anche un arco isa "ridondante" che collega direttamente il nodo Nemo con il concetto cefalopode. Sinoti che, da un punto di vista intuitivo, la presenza di tale arco è del tutto legittima: anche se l'informazione che essoesprime è già presente nella rete, è certamente vero che Nemo, in quanto Nautilus, è a sua volta un cefalopode. Inoltrecasi di questo genere sono certamente frequenti nelle basi di conoscenza reali. Tuttavia, in questa rete, il meccanismo diattivazione in parallelo descritto nel paragrafo precedente non fornisce più i risultati voluti. Infatti ora esistono duepercorsi "minimi" di uguale lunghezza che connettono il nodo Nemo al nodo animale con conchiglia, uno dei qualitermina con un arco di tipo isa e l'altro con un arco di tipo is not. Anche qui dunque non si è in grado di prevedere se ilsistema fornirebbe una risposta positiva o negativa alla domanda se Nemo è o meno un animale con conchiglia. Inquesto caso inoltre si vorrebbe che Nemo continuasse a essere un animale con conchiglia, in quanto l'idea intuitiva è chele informazioni relative a concetti più specifici (in questo caso Nautilus) siano le più rilevanti per l'ereditarietà. Tuttaviaquesta inferenza non può essere giustificata sulla base dell'euristica del percorso più breve.

Page 50: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

15

fig. 4.10

4.5 La logica dei frame

Una risposta ai problemi di rigore formale posti dai formalismi a frame e a rete semantica venne proposta, daparte logicista, da Pat Hayes con un articolo del 1979 (Hayes 1979). Tale articolo è intitolato "The logic of frames" e inesso si affronta il problema dei linguaggi a frame piuttosto che delle reti semantiche. Tuttavia, le conclusioni chevengono tratte possono essere applicate senza sostanziali modifiche anche ai sistemi di rappresentazione a rete (di cui,come abbiamo visto, i frame sono parenti molto stretti). La tesi di fondo è che i frame, seppure inizialmente proposti inalternativa ai calcoli logici, come particolarmente adeguati a caratterizzare alcune caratteristiche tipiche del pensieroumano e del ragionamento di senso comune, non sono sostanzialmente dissimili dai linguaggi formali classici dellalogica per quanto riguarda la adeguatezza espressiva - essenzialmente perché fanno riferimento alla stessacategorizzazione del reale - diversificandosi da questi ultimi esclusivamente sul terreno della efficacia notazionale -ossia dal punto di vista euristico e della trattabilità computazionale. Citando le parole dello stesso Hayes, "i frame sonosemplicemente una sintassi alternativa per esprimere relazioni fra individui, cioè per la logica dei predicati" (Hayes1979, p. 48). O ancora, a proposito delle reti semantiche, in un lavoro precedente: "Se qualcuno sostiene la superioritàdelle reti semantiche rispetto alla logica, deve far riferimento a qualche loro proprietà diversa dal loro significato"(Hayes 1977, p. 561).

Secondo Hayes nell'articolo di Minsky (Minsky 1975) e, in generale, nella letteratura successiva, i framevengono motivati sulla base di argomenti che si collocano a livelli differenti. Al livello metafisico, i frame possonoessere considerati un'ipotesi sul tipo di entità esistenti nel dominio, o sul tipo di conoscenza che deve essererappresentata in un sistema intelligente. Al livello euristico, o dell'implementazione, essi costituiscono un modo perimmagazzinare in maniera adeguata delle rappresentazioni nella memoria di un calcolatore e per implementareprocedure e di inferenza e di reperimento dell'informazione. In "The logic of frames" i frame sono analizzati al livellodella rappresentazione, ossia in quanto linguaggio per la rappresentazione della conoscenza. Ciò che fa sì che unlinguaggio formale possa essere considerato un linguaggio di rappresentazione è il fatto che le sue espressioni sianodotate di un significato, vale a dire, che al linguaggio sia associata una teoria semantica, una spiegazione di come taliespressioni stiano in relazioni con entità del mondo. E' a questo livello che ha senso ricondurre i frame alla logica deipredicati.

Come si è visto, un frame è una struttura dati che intende rappresentare una "situazione stereotipica" o un"prototipo". Ad esempio, possiamo immaginare un frame che rappresenti una abitazione tipica. Un frame comprende

Page 51: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

16

degli slot che possono essere riempiti a loro volta con altri frame o con valori specifici. Il frame che rappresenta unaabitazione tipica potrà avere slot del tipo cucina, bagno, proprietario, indirizzo, e così via. In tal modo, dice Hayes, iframe possono essere visti essenzialmente come "fasci di proprietà" (bundles of properties), e ciò giustifica il fatto dipensarli nei termini di logica dei predicati.

Più precisamente, dato un frame che rappresenta un certo concetto C, possiamo considerare C come un predicatoad un argomento C(x) (nel caso del frame per il concetto abitazione avremo il predicato abitazione(x)). I vari slot R1 ...Rn possono essere visti come relazioni a due argomenti R1(x,y) ... Rn (x,y), in cui il secondo argomento di ciascunpredicato indica il riempitore dei vari slot. Ad esempio, nel caso di abitazione, avremmo cucina(x,y), bagno(x,y),proprietario(x,y), e così via. Un frame equivale allora a una formula del tipo:

∀x(C(x) → ∃ y1 R1(x, y1) ∧ ... ∧ ∃ yn Rn (x, yn )).

Tale formula esprime una serie di condizioni necessarie per "essere un C": se qualcosa è un C, allora è nella relazioneR1 con qualche y1, nella relazione R2 con qualche y2 , e così via.

"Per riuscire a comprendere meglio cosa si suppone che i frame significhino - prosegue Hayes - dobbiamoesaminare i modi in cui si suggerisce che essi vengano usati" (Hayes 1979, p.289). In altri termini, restano da prenderein considerazione le regole di inferenza definite sui frame, in maniera da capire se e come tali regole siano riconducibilia inferenze logiche.

Tra le regole di inferenza che Hayes esamina vi è la cosiddetta regola di criteriality, in base alla quale se sitrovano riempitori per tutti gli slot di un frame, allora si può inferire che esiste un'istanza appropriata del concettorappresentato. Tale regola era stata suggerita da Minsky, ed è in genere utilizzata nelle applicazioni concrete. Adesempio, se una certa entità ha una cucina, un bagno, un proprietario, un indirizzo, eccetera, allora si può inferire cheessa sia un'abitazione. La criteriality corrisponde di fatto ad assumere che i vari slot di un frame, oltre ad esprimerecondizioni necessarie, esprimano anche, complessivamente, una condizione sufficiente per l'applicazione del concettorappresentato, e che quindi consentano di riconoscere un dato individuo come istanza del frame. La criteriality èriducibile all'implicazione inversa della precedente:

∀x( ∃ y1 R1(x, y1) ∧ ... ∧ ∃ yn Rn (x, yn )→ C(x)).

Si tratta in effetti di una proprietà molto forte, e non è sempre chiaro nei sistemi a frame in quali casi si assume che essavalga. Anzi, in generale la confusione fra condizioni necessarie e condizioni sufficienti è una delle ambiguità più diffusenei primi sistemi a frame e a rete semantica. Rispetto a questo tipo di problemi mettono in guardia anche Israel eBrachman:

Se (si sa che) Clyde è un cammello, allora egli ha tutte le proprietà tipiche del cammello; non ilcontrario (ossia, il connettivo nella riformulazione logica precedente è il condizionale, non ilbicondizionale [corsivo nostro]). Sembra che questo sia corretto, perché ci sono proprietà non definitorieper il fatto di essere un cammello - cammello è un 'tipo naturale'. E, si potrebbe aggiungere, sono tali lamaggior parte, se non tutti, i concetti con cui deve avere a che fare un sistema di IA; lasciamo i concettidefiniti e astratti come ROMBO ai matematici, e lasciamo discutere ai filosofi se "scapolo" possa esseredefinito. (Israel e Brachman 1981, p.457).

Questo è certamente un punto cruciale in rappresentazione della conoscenza. Tuttavia ciò che qui conta è che ilprincipio di criterialità può facilmente essere espresso in logica, indipendentemente dal fatto che esso venga assunto omeno.

Un'altra forma di ragionamento sui frame che Hayes prende in considerazione, e che in parte è legata allacriteriality, è il principio spesso chiamato matching, utilizzato, ad esempio, in KRL (Bobrow e Winograd 1977). Ilmatching consente di stabilire se un'istanza di un concetto può risultare istanza di un altro concetto mettendo inrelazione i riempitori degli slot di due frame. L'esempio di Hayes è il seguente. Supponiamo che J.S. sia un'istanza delframe uomo (che ha uno slot nome riempito in maniera tale che, ad esempio, nome(J.S., "John Smith")), e supponiamodi chiederci se J.S. sia istanza del frame padrone_di_cane, cioè se possiamo trovare un'istanza del framepadrone_di_cane che corrisponda a (matches) J.S.. Se uomo ha uno slot chiamato possiede_animale potremmo dire cheuna condizione sufficiente affinché J.S. sia anche un padrone di cane è che tale slot sia riempito da un'istanza del framecane. Supponiamo inoltre che il frame padrone_di_cane abbia due soli slot: nome e cane_di. Dal frame uomo siottengono per istanziazione:

nome(J.S., "John Smith")possiede_animale(J.S., Fido) (1)

Page 52: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 4

17

e supponiamo che Fido sia proprio un'istanza del frame cane, per cui vale:

cane(Fido) (2).

Per dedurre padrone_di_cane(J.S.) si può ricorrere alla criteriality del frame padrone_di_cane ricavando, oltre anome(J.S., "John Smith") anche, cane_di(J.S., Fido). Quest'ultima formula è ottenibile da uno schema del tipo:

∀ x,y (possiede_animale(x,y) ∧ cane(y) → cane_di(x,y)) (3)

mediante (1) e (2). La (3) in sostanza esprime il trasferimento di riempitori da slot a slot che consente il matching fra idue frame.

Questi esempi mostrano come molte delle proprietà deduttive dei frame siano riconducibili a usuali inferenzelogiche. Tale traduzione logica presenta il vantaggio di ricondurre i sistemi di rappresentazione a frame ad unformalismo ben studiato e con una chiara semantica estensionale, che consente di stabilire cosa significano questestrutture.

Hayes prosegue indicando aspetti dei frame che creano alcune difficoltà se si vuole esprimerne il comportamentodeduttivo in termini logici. Secondo Minsky diversi frame avrebbero dovuto poter rappresentare lo stesso oggetto dadiversi punti di vista, per cui possono essergli attribuite proprietà apparentemente contraddittorie. La stessa persona, adesempio, può essere gentile sul posto di lavoro e irascibile quando guida l'automobile. Si può risolvere il problemaconsiderando diverse le relazioni che figurano in frame distinti; ad esempio gentile_sul_lavoro e gentile_alla_guidapossono essere predicati distinti. Oppure si può introdurre qualche ulteriore parametro come ad esempio il tempo o illuogo, in modo che un persona risulti al contempo, ad esempio, irascibile alla guida e gentile al lavoro. Questocomporta ovviamente che venga elaborata una teoria logica adeguata di tempo, spazio, eccetera. Successivamentevengono abbozzati i problemi del ragionamento per analogia e il concetto di valore di default. Quest'ultimo concetto, inparticolare, risulta trattato in maniera poco approfondita da Hayes. Su esso torneremo tuttavia nel cap. 6, per vederecome anche i default e le eccezioni possano rientrare nella proposta di Hayes di riduzione di frame e reti semantiche allalogica se si utilizza una logica non monotòna.

In conclusione, nella prospettiva di Hayes, i frame hanno avuto il pregio di porre l'enfasi su alcuni aspettiinteressanti del ragionamento di senso comune non ancora affrontati dai logici (ad esempio i default). Tuttavia, "eccettoquesto, non c'è nulla di nuovo da capire qui: né nuovi processi di ragionamento, né progressi nel potere espressivo. [...]un suggerimento più serio è che la forza reale dell'idea di frame non sia al livello rappresentazionale, ma piuttosto allivello dell'implementazione: un suggerimento su come organizzare grandi memorie" (Hayes 1979, p.294).

Come si è visto, in Hayes gli aspetti tecnici della della riduzione dei frame alla logica dei predicati sono appenaabbozzati e alcuni dei problemi, seppure individuati, sono impostati solo nelle loro linee essenziali. Ad esempio, lacomplessità del problema dei default e delle inferenze non monotòne sembra decisamente sottovalutata da Hayes.Tuttavia l'influenza esercitata da "The logic of frames" è stata notevole: molte ricerche sulla rappresentazione dellaconoscenza si sono ispirate alle indicazioni in esso contenute.

Negli anni successivi sono stati sviluppati formalismi dotati di una sintassi simile alle reti semantiche, ma chepresentavano le caratteristiche di una vera e propria logica (ad esempio, una semantica modellistica ben definita).Attardi, Simi e i loro collaboratori (Attardi e Simi 1981, Attardi et al. 1987) hanno proposto il sistema dirappresentazione OMEGA. Si tratta di un formalismo logico che riprende alcuni dei concetti chiave delle retisemantiche, come ad esempio il fatto di essere "centrato ad oggetti", l'organizzazione tassonomica della conoscenza el'ereditarietà. La componente fondamentale di OMEGA sono le descrizioni, assimilabili ai concetti di una rete. John, (aMan), (a Man (with friend (a Dog))) sono esempi di descrizioni. l'operatore a sta ad indicare che una descrizione non èuna descrizione individuale, ma che corrisponde a un termine generale o al nome di una classe. L'operatore with serveper specificare gli attributi di una descrizione, l'analogo degli slot di un frame o dei ruoli di KL-ONE (vedi oltre, nelprossimo capitolo). Le descrizioni sono organizzate tassonomicamente per mezzo della relazione di predicazione is. Leproprietà di is e degli attributi sono definite da opportuni assiomi. Ad esempio, il seguente è un esempio dell'assioma diomissione, che stabilisce che, omettendo una descrizione, si ottiene una descrizione più generale:

(a Cat (with name Jerry) is (a Cat)).

OMEGA ha una semantica formale rigorosa, e per esso sono stati dimostrati teoremi di correttezza e di completezza.Questo tipo di formalismi raggiunge il massimo sviluppo con le logiche terminologiche, che descriveremo nel prossimocapitolo.

Page 53: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

5. La dinastia di KL-ONE: reti semantiche per la conoscenza terminologica

In questo capitolo prenderemo in considerazione il sistema KL-ONE, in quanto esempio di sistema dirappresentazione della conoscenza a reti semantiche. Lo scopo è quello di esaminare in dettaglio l'apporto di questo tipodi formalismi rispetto al problema che stiamo indagando. KL-ONE è stato sviluppato verso la fine degli anni settanta apartire dalle ricerche di Ronald Brachman sulle reti semantiche (Brachman 1977, 1979). Brachman aveva proposto unaclasse di formalismi detti reti semantiche ad ereditarietà strutturata (SI-Nets: Structured Inheritance Nets) comerisposta alla richiesta di rigore formulata da Woods. Il sistema KL-ONE costituisce una realizzazione dei principi delleSI-Net. KL-ONE è stato inoltre il capostipite di una lunga dinastia di sistemi di rappresentazione, ed è all'origine di unalinea di ricerca che è tuttora attiva1.

La scelta di utilizzare KL-ONE come case study in questo capitolo è stata dettata da diverse considerazioni. Inprimo luogo, come abbiamo detto, KL-ONE costituisce una delle risposte più adeguate alla richiesta di rigore e dichiarezza di Woods, e in questo senso rappresenta uno dei risultati più avanzati nell'evoluzione dei sistemi a retesemantica. KL-ONE presenta alcuni aspetti metodologici di notevole interesse. Innanzi tutto, il fatto di basarsi su unpiccolo insieme di primitive (ossia di tipi di nodi e di archi) predefinite. Tali primitive si collocano al livello cheBrachman (1979) chiama epistemologico. Vale a dire, esse non dipendono ad esempio dalla natura del dominiorappresentato (come le primitive utilizzate nella teoria della dipendenza concettuale di Schank), né corrispondono astrutture di tipo implementativo (come locazioni di memoria o puntatori). Inoltre, in KL-ONE e nei suoi discendenti, si èsempre evidenziata la necessità di una semantica esplicita e ben definita per i costrutti della rete, e di unacaratterizzazione chiara delle inferenze consentite dal sistema, che fosse indipendente dall'implementazione e che nonfosse basata sulle "intuizioni" dell'utente. Non è casuale che a partire da KL-ONE si sia sviluppata una tradizione diricerca che è per molti versi emblematica dell'evoluzione di questo tipo di formalismi verso la logica.

In secondo luogo, le reti KL-ONE non ammettono eccezioni all'ereditarietà o valori attribuiti per default. Questoci consente di posporre il problema, semplificando per il momento la nostra trattazione.

Infine, KL-ONE e i suoi successori sono basati sulla distinzione, introdotta anch'essa in (Woods 1975), fraconoscenza terminologica e conoscenza asserzionale. La conoscenza terminologica (o definitoria, o descrizionale)concerne le definizioni dei termini usati in un certo dominio di conoscenza. Essa dovrebbe costituire una sorta di lessicoconcettuale applicabile a ogni specifico contesto. In quanto tale, è contrapposta alla conoscenza asserzionale, che invecedovrebbe comprendere informazioni fattuali, vere in contesti specifici. Woods sottolineava come conoscenzaterminologica e asserzionale siano mescolate arbitrariamente in molti sistemi a rete semantica. Per risolvere questoproblema, in KL-ONE e nei suoi successori il formalismo a rete semantica viene riservato alla rappresentazione dellaconoscenza terminologica. La conoscenza asserzionale è rappresentata in un secondo modulo del sistema, che utilizzaun linguaggio di rappresentazione differente. La distinzione terminologico/asserzionale non è sempre chiara. Di volta involta, conoscenza terminologica sembra sinonimo di conoscenza lessicale, o di verità analitica, o di verità necessaria, ela distinzione terminologico/asserzionale si confonde talvolta con la distinzione fra intensione ed estensione. In ognicaso, tuttavia, sembra chiaro che con conoscenza terminologica si intende la conoscenza del significato dei termini, cioèdei simboli primitivi extra logici di un certo linguaggio di rappresentazione. Inoltre, soprattutto agli inizi, KL-ONE èstato progettato anche con l'intento di fornire uno strumento per la rappresentazione del significato lessicale in sistemi dielaborazione del linguaggio naturale. Ad esempio, Woods e Schmolze (1992) affermano che "inizialmente, il progettoKL-ONE si accingeva a sviluppare un insieme di convenzioni rappresentazionali che fossero sufficienti a esprimere ogniconcetto esprimibile in linguaggio naturale" (p. 134). Inoltre, Brachman (1977) a proposito delle SI-Net affermaentusiasticamente: "mentre i testi di filosofia non ci dicono mai a che cosa assomigli un'intensione primitiva, le retisemantiche offrono un'opportunità di esaminare un potenziale schema di rappresentazione per entità intensionali"(p.139, corsivo nostro). Quindi l'analisi di KL-ONE sembra particolarmente centrale per il problema che qui stiamoaffrontando.

5.1 Le reti KL-ONE

Nelle reti KL-ONE la rappresentazione della conoscenza è organizzata a partire dalla rappresentazione diconcetti. Ciascun concetto è rappresentato da un nodo della rete, ed è descritto per mezzo degli archi che lo connettonoad altri costrutti della rete semantica. I concetti sono organizzati in una tassonomia gerarchica, in maniera tale che iconcetti con un grado minore di generalità ereditino le caratteristiche che fanno parte della definizione dei concetti piùgenerali ai livelli più alti della tassonomia. Tale meccanismo va sotto il nome di principio di ereditarietà strutturata(structured inheritance). In una rete KL-ONE possono essere formulati vari tipi di concetti (generici, individuali eindividuali parametrici). Inizieremo con i concetti generici, in quanto svolgono il ruolo di gran lunga più importantenelle reti KL-ONE. 1Una presentazione generale dettagliata di KL-ONE si può trovare in (Brachman e Schmolze 1985); è a questaformulazione che faremo principalmente riferimento nelle pagine seguenti. Sulla storia di KL-ONE e dei suoidiscendenti si vedano ad esempio (Woods e Schmolze 1992) e (Mac Gregor 1991).

Page 54: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

2

I concetti generici sono analoghi a termini generali, termini cioè che denotano classi di individui. Nellarappresentazione grafica di una rete, ogni concetto generico è rappresentato da un'ellisse. In fig. 5.1, ad esempio, sonopresenti i concetti generici mollusco, branchia, conchiglia, gasteropode.

fig. 5.1

Ogni concetto generico può essere descritto rappresentando le sue relazioni con altri concetti generici medianteruoli (role)2. Nella rappresentazione grafica di una rete, un ruolo è rappresentato da un arco orientato contrassegnatocon un quadrato inscritto in un cerchio, ed etichettato col nome del ruolo stesso. Nella figura 5.1, ad esempio, il concettomollusco ha due ruoli, organo respiratorio e scheletro. Un ruolo generico è un modo per esprimere una relazionepotenziale fra le istanze dei concetti che connette. Nell'esempio di fig. 5.1, il ruolo organo respiratorio indica che ogniistanza del concetto mollusco deve stare nella relazione organo respiratorio con un certo numero (per ora nonspecificato) di istanze del concetto branchia. Tali istanze vengono dette riempitori (filler) di un ruolo. Il concetto in cuitermina l'arco che rappresenta il ruolo viene detto restrizione di valore (value restriction) del ruolo. "Restrizione divalore" viene di solito abbreviato in V/R. In fig. 5.1 conchiglia è V/R di scheletro , e branchia è V/R di organorespiratorio. I ruoli di un concetto sono analoghi alle slot di un sistema a frame, con la differenza che ai ruoli di KL-ONE non possono essere assegnati valori per default. Ad ogni ruolo può inoltre essere associata una restrizione dinumero (number restriction), che esprime il limite minimo e il limite massimo di riempitori che un ruolo può avere. Adesempio, il ruolo scheletro di mollusco ha restrizione di numero 0,1: ogni mollusco può avere 0 o al più una conchigliacome riempitore del ruolo scheletro. Quando limite minimo e limite massimo coincidono, allora, per ogni istanza delconcetto, il ruolo deve avere esattamente quel numero di riempitori. La costante nil, che può essere assegnata comelimite superiore di numero a un ruolo, indica che non esiste un numero massimo predefinito di riempitori per quel ruolo.Se per un ruolo non è indicata alcuna restrizione di numero (come per il ruolo organo respiratorio della fig. 5.1), sideve assumere che valga implicitamente che il limite inferiore è 0 e che il limite superiore è nil.

In una rete KL-ONE i concetti generici sono organizzati in una tassonomia per mezzo di archi di sussunzione (odi superconcetto), rappresentati nelle figure mediante frecce a doppio tratto (come quella fra gasteropode e mollusco infig. 5.1). Un concetto è sussunto da un altro se è meno generale, vale a dire, se tutte le istanze del primo sono sempreanche istanze del secondo. Ad esempio, l'arco di superconcetto in fig. 5.1 indica che i gasteropodi sono un tipoparticolare di molluschi. Estensionalmente, la relazione di sussunzione corrisponde all'inclusione insiemistica: l'insiemedei gasteropodi è un sottoinsieme dell'insieme dei molluschi. L'arco di sussunzione è quindi transitivo: se un concetto Aè sottoconcetto di B, e B è sottoconcetto di C, allora A è sottoconcetto di C. Ogni concetto generico può essere sussuntoda più di un concetto. In fig. 5.2, il concetto triangolo equilatero è sottoconcetto sia di poligono regolare sia ditriangolo. In questo caso il concetto sussunto è parte della congiunzione logica dei suoi superconcetti: i triangoliequilateri sono elementi dell'intersezione dell'insieme dei triangoli e di quello dei poligoni regolari. Di solito, nelle retiKL-ONE vi è un concetto, chiamato cosa, che sta alla radice della tassonomia; è il concetto più generale che sussumetutti gli altri nella rete e non è sussunto da alcun concetto.

2I ruoli che riguardano i concetti generici vengono talvolta detti anche ruoli generici per distinguerli dai ruoli checoncernono altri tipi di concetti. Qui tuttavia, poiché tratteremo quasi esclusivamente di ruoli generici, ometteremoquesta specificazione.

Page 55: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

3

fig. 5.2

La relazione di sussunzione risulta fondamentale per il meccanismo dell'ereditarietà strutturata: ogni concettoeredita dai suoi immediati superconcetti tutti i ruoli con le relative strutture (restrizioni di numero e di valore). In fig. 5.1nessun ruolo è definito esplicitamente per il concetto gasteropode. gasteropode eredita organo respiratorio e scheletroda mollusco. Nuovi ruoli locali possono essere aggiunti a quelli ereditati. Ad esempio, in fig. 5.3, il ruolo arto è definitolocalmente per il concetto cefalopode. E' anche possibile effettuare modifiche locali alla struttura dei ruoli ereditati,purché non diano luogo a conflitti con le strutture ereditate. La rete della fig. 5.3 mostra diversi casi di questo genere.Ad esempio, la restrizione di numero di un ruolo può essere modificata se la nuova restrizione è più vincolante di quellaereditata. Cioè, il nuovo limite di numero inferiore (superiore) deve essere maggiore (minore) di quello ereditato(assumendo che nil sia più grande di qualsiasi numero naturale). Nella fig. 5.3, ad esempio, la restrizione di numero delconcetto scheletro è modificata a 1,1 per il concetto lamellibranco e a 0,0 per il concetto ottopode.

fig. 5.3

Page 56: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

4

Come abbiamo detto, le reti KL-ONE non prevedono la rappresentazione di eccezioni. Non si può rappresentaread esempio il fatto che i molluschi "tipici" hanno una conchiglia e che i cefalopodi "tipici" non ne hanno, come avvenivanella rete di fig. 4.8, o come si sarebbe potuto fare in un sistema a frame. Il ruolo scheletro ha quindi restrizione dinumero 0,1 sia per mollusco che per cefalopode. I motivi per cui in KL-ONE si è scelto di non ammettere eccezioniall'ereditarietà hanno a che fare sostanzialmente con il fatto che le eccezioni rendono impossibile il calcolo dellasussunzione fra concetti, che, come vedremo, è il meccanismo inferenziale fondamentale in KL-ONE3.

Anche la restrizione di valore di un ruolo può essere modificata, imponendo come nuova restrizione un concettodifferente dalla restrizione di valore ereditata. In fig. 5.3, la restrizione di valore di scheletro per gasteropode èmodificata in conchiglia monovalve e per lamellibranco in conchiglia bivalve. Anche qui non sono ammesse eccezioni:quando si modifica la V/R di un ruolo, l'ereditarietà impone che la nuova V/R non sia disgiunta da quella ereditata.

Un altro modo per modificare un ruolo ereditato è la differenziazione. Un ruolo ereditato può essere differenziatoin due o più ruoli distinti che esprimono relazioni più specifiche del ruolo originario. Nella fig. 5.4 il concetto triangoloè definito come un poligono che ha esattamente tre lati, e il concetto triangolo rettangolo come un triangolo nel quale ilruolo lato di è stato differenziato in due ruoli distinti cateto di e ipotenusa di. Se un ruolo R' differenzia un ruolo R,allora ogni coppia di oggetti nella relazione R' devono stare anche nella relazione R. Le restrizioni di valore e di numerodei ruoli ottenuti per differenziazione possono, a loro volta, essere modificati, a condizione che non sorgano conflitticon le restrizioni ereditate. Ad esempio, in fig. 5.4 i ruoli cateto di e ipotenusa di assumono rispettivamente le restrizionidi numero 1,1 e 2,2 che sono compatibili con la restrizione 3,3 del ruolo lato di del concetto triangolo.

fig. 5.4

Le strutture che caratterizzano i concetti in una rete KL-ONE (archi di sussunzione e ruoli) esprimono un insiemedi condizioni necessarie per l'applicazione di un concetto. Un lamellibranco deve essere un mollusco che ha perscheletro una conchiglia bivalve, un triangolo deve necessariamente essere un poligono, e così via. Se tali condizionidevono essere considerate, oltre che necessarie, anche sufficienti, allora il concetto si dice definito; altrimenti esso èprimitivo. Nella rappresentazione grafica, i concetti che devono essere considerati primitivi sono contrassegnati da unasterisco. Si assume che tutti gli altri concetti siano definiti. Ad esempio, nella rete di fig. 5.2 i concetti poligono,poligono regolare e triangolo sono primitivi, in quanto la rete non fornisce condizioni sufficienti a caratterizzarli.Viceversa, il concetto triangolo equilatero può essere considerato definito, dato che una figura è un triangolo equilaterose e soltanto se è un triangolo ed è allo stesso tempo un poligono regolare. In questo caso, i due archi di superconcetto ditriangolo equilatero esprimono condizioni necessarie e sufficienti a caratterizzare il concetto. triangolo risulta unconcetto definito nella rete di fig. 5.4: qualcosa è un triangolo se e soltanto se è un poligono con esattamente tre lati.Anche decapode nella rete di fig. 5.3 è un concetto definito: tutti i dibranchiati con esattamente dieci tentacoli sonodecapodi.

Abbiamo detto che un concetto è sussunto da un altro se tutte le istanze del primo sono anche, necessariamente,istanze anche del secondo. In una rete KL-ONE, perché due concetti stiano nella relazione di sussunzione non ènecessario che esista un arco di superconcetto esplicito (o una catena di archi di superconcetto) che li collega. Puòaccadere che un concetto ne sussuma un altro senza che ciò sia rappresentato esplicitamente nella rete. Si consideri larete in fig. 5.5. poliedro è un concetto definito. Le condizioni necessarie e sufficienti per essere un poliedro sono diessere un solido le cui facce siano almeno quattro e siano dei poligoni. Un parallelepipedo è definito come un solidocon esattamente sei facce rettangolari. Poiché rettangolo è un sottoconcetto di poligono, ogni parallelepipedo, per

3 Su questo problema si veda (Brachman 1985).

Page 57: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

5

definizione, soddisfa le condizioni sufficienti per essere un poliedro. Quindi il concetto parallelepipedo è sussunto dapoliedro: un legame di superconcetto fra parallelepipedo e poliedro è implicito nella fig. 5.5. Si noti che questo vale inquanto poliedro è un concetto definito. Se fosse stato un concetto primitivo, e se essere un solido con le facce poligonalifosse stata una condizione necessaria ma non sufficiente per essere un poliedro, sarebbe stato scorretto dedurre cheparallelepipedo è sottoconcetto di poliedro. Come vedremo, il calcolo delle relazioni di sussunzione fra concetti è unadelle forme di inferenza centrali nei sistemi di rappresentazione della famiglia di KL-ONE. Il procedimento perdeterminare se un concetto B è sussunto da un altro concetto A può essere descritto, in maniera informale, come segue:

• A deve essere un concetto definito (cioè, non primitivo);• tutti i superconcetti di A devono essere a loro volta superconcetti di B;• ogni ruolo di A deve essere anche un ruolo di B (eventualmente differenziato).

Inoltre, per ogni ruolo R di A:

• il V/R di R (o di ogni ruolo che lo differenzia) rispetto a B deve coincidere o essere sussunto dal V/R di Rrispetto ad A (per determinare ciò può essere necessaria un'applicazione ricorsiva del calcolo dellasussunzione);

• la restrizione di numero di R (o dei ruoli che lo differenziano) rispetto a B deve essere uguale o piùrestrittiva della restrizione di numero di R rispetto ad A.

Nella descrizione del procedimento si è fatto riferimento solamente ai costrutti di KL-ONE sin qui introdotti.Ovviamente, il compito di decidere la relazione di sussunzione fra due concetti si complica qualora siano presenti anchei costrutti che descriveremo in seguito.

fig. 5.5

Con l'introduzione dell'arco di superconcetto che lo collega a poliedro, il concetto parallelepipedo è stato messo"al posto giusto" nella rete individuando un legame di sussunzione implicito più specifico di quelli rappresentatiesplicitamente. Si tratta di un semplice caso di classificazione di un concetto in una rete. Classificare un concetto in unarete KL-ONE significa appunto metterlo "al posto giusto" nella tassonomia, identificandone i superconcetti più specificie i sottoconcetti più generali. Questo compito viene eseguito da un algoritmo di classificazione, o classificatore, che sibasa fondamentalmente sul procedimento per l'individuazione delle relazioni di sussunzione. Nella classificazione, laricerca dei superconcetti del concetto da classificare comincia dal vertice della tassonomia, controllando, per ogniconcetto definito, se sussume il concetto da classificare. Quando un concetto è eliminato perché non sussume il concettoda classificare, la ricerca fra i suoi discendenti viene abbandonata. Altrimenti, si controlla se esiste un superconcetto piùspecifico fra i suoi discendenti. Una volta che i superconcetti più specifici siano stati identificati, la ricerca deisottoconcetti più generali può essere limitata ai loro discendenti. Una trattazione più completa della classificazione sipuò trovare in Lipkis (1982) e in Schmolze e Lipkis (1983).

Abbiamo visto che la classificazione può essere ricondotta al calcolo della relazione di sussunzione fra concetti.Nei linguaggi di tipo terminologico vi sono altri tipi di inferenze che possono essere ricondotti al calcolo dellasussunzione. Un esempio è l'incoerenza di un concetto: un concetto è incoerente se non è possibile, per come è statodefinito, che abbia alcuna istanza. La incoerenza può essere ricondotta alla sussunzione, in quanto, per sapere se unconcetto è incoerente, basta chiedersi se è sussunto da un altro concetto la cui incoerenza sia nota. Un altro esempio è ladisgiunzione di due concetti. Due concetti sono disgiunti se, in virtù delle loro definizioni, non possono avere istanze in

Page 58: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

6

comune. La disgiunzione può essere ricondotta alla incoerenza, e quindi alla sussunzione: due concetti sono disgiunti sela loro congiunzione risulta incoerente. Per questo tipo di problemi si veda (Nebel 1988, pp. 372-373 e Nebel 1990a). Ilcalcolo della sussunzione ha quindi un posto centrale fra i vari tipi di inferenza definiti sui linguaggi di tipoterminologico, e questo spiega il motivo per cui le sue proprietà sono state studiate in maniera approfondita. Vedremo inseguito a quali risultati e a quali sviluppi si sia pervenuti su questa via.

I costrutti descritti sino ad ora danno soltanto una caratterizzazione parziale della struttura di un concetto. Inparticolare, sino ad ora non sono stati introdotti strumenti formali per rappresentare le relazioni fra i ruoli checaratterizzano un concetto. Si consideri ad esempio la rete della figura 5.4. Per caratterizzare adeguatamente il concettotriangolo rettangolo, bisognerebbe poter rappresentare il fatto che nei triangoli rettangoli i due cateti sono fra loroperpendicolari. Per affrontare questo tipo di problemi KL-ONE dispone di una classe di costrutti detti descrizionistrutturali. Ci sono fondamentalmente due tipi di descrizioni strutturali in KL-ONE, le role value map (RVM) e ledescrizioni strutturali in senso stretto (structural description - SD).

Lo scopo della role value map (RVM) è di imporre condizioni di uguaglianza o di inclusione insiemistica fra gliinsiemi di riempitori di due ruoli di un dato concetto. Per esempio, si supponga di aver descritto il concetto cilindrocome nella parte superiore della rete di fig. 5.6 (cioè mediante un ruolo altezza con V/R lunghezza, e un ruolo base conV/R cerchio). Si vuole poi definire il concetto cilindro equilatero come sottoconcetto di cilindro (un cilindro equilateroè un cilindro in cui l'altezza è uguale al diametro della base). Dobbiamo imporre che, per ogni istanza del concettocilindro equilatero, l'insieme dei riempitori del ruolo altezza (che, in questo caso, consiste di un solo elemento) coincidacon l'insieme dei riempitori del ruolo ottenuto componendo i due ruoli base e diametro. La composizione di ruoli èun'operazione analoga alla composizione di funzioni. Per esempio, se per il concetto bambino il ruolo genitore di èdefinito con V/R persona, e per persona è definito a sua volta il ruolo età, allora il ruolo di bambino ottenutocomponendo i ruoli genitore di ed età avrà per riempitori, per ogni istanza di bambino, le età dei genitori. Nel caso dicilindro, l'insieme dei riempitori del ruolo ottenuto componendo base e diametro è il singleton che ha come elemento ildiametro della base del cilindro. Per cilindro equilatero, una RVM esprime, per ogni istanza del concetto, l'identitàdell'insieme dei riempitori di altezza con l'insieme dei riempitori della composizione di base con diametro. Questa RVMè mostrata nella fig. 5.6 da un segno di uguaglianza inscritto in una losanga, la quale è connessa al concetto cilindroequilatero da un arco a tratto continuo. Dalla losanga partono due puntatori (linee tratteggiate) ai ruoli i cui insiemi diriempitori devono essere uguagliati.

fig. 5.6

KL-ONE prevede anche RVM per rappresentare l'inclusione insiemistica fra insiemi di riempitori di ruoli (taliRVM sono indicate graficamente in modo analogo alle precedenti, sostituendo nella losanga il segno di inclusioneinsiemistica a quello di identità - si veda oltre, la fig. 5.10).

Rispetto alle RVM, le descrizioni strutturali in senso stretto (SD) rendono possibile istituire relazioni piùgenerali fra gli insiemi di riempitori dei ruoli, non limitate all'uguaglianza e all'inclusione. Si consideri ad esempio ilconcetto tavolo quale è rappresentato nella parte inferiore della rete di fig. 5.7; tavolo è descritto per mezzo di due ruoli,piano e sostegno. In questo caso vorremmo almeno poter rappresentare il fatto che, per ogni istanza di tavolo, ilriempitore del ruolo piano deve star sopra i riempitori del ruolo sostegno. In base al meccanismo delle descrizionistrutturali, la relazione che deve valere fra i riempitori dei ruoli (nel nostro caso la relazione di stare sopra) deve a suavolta essere rappresentata per mezzo di un concetto KL-ONE. Nel nostro esempio, il concetto stare sopra saràrappresentato come nella parte superiore di fig. 5.7. Tale concetto ha due ruoli, sta sopra e sta sotto, che corrispondonoagli argomenti della relazione; entrambi hanno come V/R oggetto fisico. La parte centrale della rete di fig. 5.7 mostra ladescrizione strutturale che connette i ruoli piano e sostegno del concetto tavolo. Graficamente, una descrizione

Page 59: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

7

strutturale è rappresentata da una losanga connessa da un arco al concetto corrispondente (tavolo nel nostro esempio).Entrano in gioco a questo punto i concetti parametrici individuali (parametric individual concepts), un'altra classe diconcetti KL-ONE, utilizzata esclusivamente per le SD. Un concetto parametrico individuale è una versione di unconcetto generico "parametrizzata" in relazione a un contesto specifico. Graficamente, essi sono rappresentati da unadoppia ellisse. Il legame fra un concetto parametrico individuale e il concetto generico dal quale esso è stato ottenuto èrappresentato mediante una freccia a triplo tratto. Nel nostro esempio, viene creata una versione parametrica individualedel concetto stare sopra, chiamata in fig. 5.7 stare sopra n.1. Intuitivamente, il significato di stare sopra n.1 potrebbeessere qualcosa del tipo di: "quel particolare tipo di stare sopra che mette in relazione il piano di un tavolo con il suosostegno". L'ellisse che rappresenta stare sopra n.1 è collegata da un arco alla losanga che rappresenta la SD. L'analogodi un ruolo generico rispetto a un concetto parametrico individuale è un ruolo coreferente (rappresentato graficamenteda un doppio quadrato). I ruoli coreferenti connettono i ruoli i cui riempitori devono essere messi in relazione con i ruolidel concetto che rappresenta la relazione stessa. Comunque, a prescindere dai dettagli, tutto il meccanismo delle SDrisulta estremamente complesso e poco intuitivo, e, soprattutto, non è chiaro il significato da assegnare ai vari costrutti(si pensi ai concetti parametrici individuali). Gli stessi Brachman e Schmolze (1985) ammettono che le SD risultano"unhappily complicated". Ad esempio, lascia perplessi l'uso di concetti come stare sopra. Mentre in generale in KL-ONE vale il principio che ai concetti generici corrispondono estensionalmente classi di individui, e che i ruolicorrispondono a relazioni, le SD costringono ad introdurre concetti generici che rappresentano relazioni, e in cui i ruolicorrispondono ai posti degli argomenti. In generale quindi, non stupisce che le SD siano in seguito scomparse dallamaggior parte dei formalismi terminologici successivi.

fig. 5.7

KL-ONE prevede inoltre la possibilità di introdurre concetti individuali, ossia concetti che possono essereistanziati al più da un solo individuo. Per mezzo dei concetti individuali è possibile esprimere descrizioni del tipo "iltriangolo tale che ......", e così via. In KL-ONE i concetti individuali non comportano alcuna assunzione di tipoesistenziale: l'introduzione di un concetto individuale in una rete non equivale ad asserire l'esistenza di un'istanza di taleconcetto. Ogni concetto individuale può essere sussunto da uno o più concetti generici. Un legame di sussunzione fra unconcetto individuale e un suo superconcetto viene rappresentato per mezzo di un arco di individuazione (individuationlink). I concetti individuali ereditano le strutture dei loro superconcetti, e tali strutture possono essere ulteriormentemodificate, o ne possono essere aggiunte localmente di nuove, mediante opportuni costrutti (si veda Brachman eSchmolze 1985).

Si è detto che in KL-ONE la rete semantica dovrebbe avere come unico scopo la rappresentazione di conoscenzadi tipo terminologico o descrizionale, vale a dire di informazioni concernenti il significato dei termini utilizzati nellabase di conoscenza, senza alcun riferimento all'asserzione di informazioni fattuali specifiche (neppure, abbiamo visto, allivello dei concetti individuali). Il compito di formulare la conoscenza di tipo fattuale avrebbe dovuto essere riservato auna opportuna componente asserzionale, esterna alla rete semantica. Ad esempio, per esprimere il fatto che, in una datasituazione, esiste un certa istanza di un determinato concetto (generico o individuale), viene introdotta una costante nellacomponente asserzionale (un nexus, nella terminologia di KL-ONE), che viene connessa per mezzo di un arco di tipospecifico (detto un descritpion wire) al concetto corrispondente della rete. Un contesto viene definito come un insiemedi nexus e di description wire che rappresentano un determinato stato di cose. Una base di conoscenza KL-ONE avrebbedovuto consentire di definire più contesti contemporaneamente, per rappresentare ad esempio diverse situazionicontrofattuali, o situazioni corrispondenti a fasi temporali diverse. I meccanismi relativi alla componente asserzionale di

Page 60: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

8

KL-ONE non sono stati tuttavia mai sviluppati a fondo. In ogni caso, il potere espressivo della componente asserzionaledi KL-ONE è estremamente limitato. Di fatto, si possono formulare soltanto asserzioni relative all'esistenza di istanze diconcetti, e relazioni di coreferenza fra concetti individuali. Ad esempio, manca completamente la possibilità diesprimere relazioni, o di esprimere asserzioni quantificate. Così, di fatto, KL-ONE costringe a rappresentare gran partedelle conoscenze di tipo asserzionale all'interno della componente a rete semantica.

Considerazioni di questo genere hanno fatto sì che nei sistemi derivati da KL-ONE il potere espressivo dellinguaggio asserzionale venisse potenziato. KRYPTON (Brachman et al. 1983, Brachman et al. 1985), che,storicamente, è stato il primo dei successori di KL-ONE, è composto due componenti distinte, dotate di linguaggi emeccanismi inferenziali diversi. I sistemi di questo tipo vengono detti usualmente sistemi ibridi. La prima componente,la T-Box (Terminological Box), serve per la formulazione della conoscenza terminologica, mentre la seconda, la A-Box(Assertional Box), serve per la rappresentazione della conoscenza asserzionale. In KRYPTON, la T-Box utilizza unformalismo che è un diretto discendente delle reti semantiche di KL-ONE (anche se meno espressivo: mancano adesempio RVM, SD e concetti individuali). Il linguaggio della A-Box consiste nel linguaggio dei predicati del primoordine completo. Nella A-Box concetti e ruoli della parte terminologica corrispondono rispettivamente a predicati a unoe a due argomenti, e il sistema garantisce una corretta interazione fra le due componenti.

5.2 KL-ONE e calcolo dei predicati del primo ordine

Questo paragrafo descrive la possibilità di tradurre una rete KL-ONE in calcolo dei predicati con identità. Latecnica adottata è analoga a quella utilizzata da Hayes per i linguaggi a frame descritta nel paragrafo 4.5. Per unatraduzione del genere si veda anche Schmolze e Israel (1983) (i quali utilizzano la λ-notazione). In questo modo,vedremo che forme di inferenza quali l'ereditarietà, la sussunzione e la classificazione possono essere assimilate a usualiinferenze logiche. Quindi, la tassonomia KL-ONE con il sistema dei ruoli generici può essere considerata come unavariante notazionale di un sottoinsieme del calcolo dei predicati del primo ordine con identità.

In primo luogo, ogni concetto generico P viene tradotto per mezzo di un predicato monadico P(x). Per esempio,ai concetti mollusco, triangolo, conchiglia corrispondono i predicati mollusco(x), triangolo(x), conchiglia(x).

Gli archi di superconcetto sono tradotti per mezzo di implicazioni quantificate universalmente. Per esempio, unarco di sussunzione in base a cui un concetto B è sottoconcetto di un concetto A è tradotto dalla formula:

∀x (B(x)→ A(x)).

La transitività della sussunzione è garantita dalle usuali leggi logiche. Per esempio, se B è sottoconcetto di A e C èsottoconcetto di B, dalla traduzione dei due archi di superconcetto, per mezzo di eliminazione del quantificatoreuniversale, concatenazione logica e generalizzazione, si può dedurre:

∀x (C(x) → A(x)),

che esprime la sussunzione fra C e A.Dal punto di vista di una semantica tarskiana estensionale, fissata un'interpretazione (D, ϕ) (dove, al solito, ϕ è la

funzione interpretazione e D è il dominio), la traduzione sopra descritta comporta che, per ogni concetto C della rete, siabbia ϕ[C] ⊆ D; vale a dire, l'interpretazione di ogni concetto corrisponde a un sottoinsieme del dominio. Inoltre, perogni coppia A e B di concetti, se B è sottoconcetto di A, allora si ha che ϕ[B] ⊆ ϕ[A]. Ne segue per esempio che, se C èsottoconcetto di due concetti A e B, si ha che ϕ[C] ⊆ ϕ[A] ∩ ϕ[B]. Tutto ciò è coerente con le nozioni intuitive espressenel paragrafo precedente. Si può anche assumere plausibilmente che l'interpretazione del concetto cosa coincida conl'intero dominio, che cioè: ϕ[cosa] = D.

I ruoli rappresentano relazioni a due posti: a ogni ruolo R della rete corrisponde quindi un predicato a dueargomenti R(x,y). Per esempio, ai ruoli scheletro, lato, base corrisponderanno i predicati: scheletro(x,y), lato(x,y),base(x,y). Dal punto di vista semantico, l'interpretazione di un ruolo consiste di un sottoinsieme dell'insieme delle coppieordinate di elementi del dominio. Cioè, per ogni ruolo R, ϕ[R] ⊆ D × D.

Per quanto riguarda la restrizione di valore sui ruoli, una situazione come quella della fig. 5.8 sarà quindi tradottadalla formula:

∀x (A(x) → ∀y(R(x,y) → B(y))).

Page 61: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

9

fig. 5.8

Per definire la restrizione di numero sui ruoli, è necessario disporre della relazione di identità. Innanzi tutto,introduciamo i seguenti quantificatori esistenziali limitati. Intuitivamente, "∃

nx ... " significa "esistono almeno n

individui x tali che ... "). ∃n

è definito come segue:

per n = 0 : ∃0

x α(x) =def ∃x α(x) ∨ ¬ ∃x α(x),

per n = 1: ∃1

x α(x) =def ∃x α(x),

per n>1: ∃n

x α(x) =def ∃ x1 , ... , xn (α( x1) ∧ ... ∧ α( xn ) ∧ x1 ≠ x2 ∧ x1 ≠ x3

∧ ... ∧ x1≠ xn ∧ ... ∧ xn−1 ≠ xn ).

I quantificatori ∃n

(dove, intuitivamente, "∃n

x ... " significa "esistono al più n individui x tali che ... ") sono definiti comesegue:

∃0

x α(x) =def ¬ ∃x α(x)

∃1

x α(x) =def ∃x (α(x) ∧ ∀z (α(z) → z=x))

∃2

x α(x) =def ∃x,y (α(x) ∧ α(y) ∧ ∀z (α(z) → z=x ∨ z=y))

e, per ogni generico n ∈ IN :

∃n

x α(x) =def ∃ x1 , ... , xn (α( x1) ∧ .... ∧ α( xn ) ∧ ∀z (α(z) → z= x1 ∨ ... ∨ z= xn ))

Ora, per ogni n, m ∈ IN (con m ≤ n) il quantificatore ∃m

n (dove "∃

m

n x ..." significa intuitivamente: "esistono

almeno m individui x e al più n individui x tali che ... ") può essere definito come segue:

∃m

nx α(x) =def ∃

mx α(x) ∧ ∃

nx α(x).

In questo modo, la traduzione in calcolo dei predicati della restrizione di numero di un ruolo come R in fig. 5.8,con m, n ∈ IN, è data dalla formula:

∀x (A(x) → ∃m

ny R(x,y)).

Se, nella restrizione di numero di un ruolo, il limite superiore non è definito (cioè, nei termini di KL-ONE, se il

limite superiore corrisponde a nil), allora, invece di un quantificatore di tipo ∃m

n, deve essere utilizzato un quantificatore

di tipo ∃n

. Nel seguito assumeremo che, per ogni coppia (m,n) che esprime la restrizione di numero di un ruolo, valga

che m ∈ IN, n ∈ IN ∪ {nil}.

Page 62: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

10

L'ereditarietà dei ruoli è assicurata dalle usuali leggi logiche. In fig. 5.8, il fatto che il ruolo R sia definito per ilconcetto C con V/R B e con restrizione di numero (m,n) può essere dedotto dalle formule che traducono la definizione diR per A e l'arco di sussunzione fra B e C.

La modifica di V/R di un ruolo è espressa nel modo seguente. Nella fig. 5.8, si supponga di volere restringere aun concetto D i valori del ruolo R per il concetto C. Ciò equivale ad aggiungere la formula:

∀x (C(x) → ∀y(R(x,y) → D(y))).

Analogamente, modificare nella rete di fig. 5.8 la restrizione di numero del ruolo R per il concetto C imponendouna nuova restrizione (m1,n1) equivale ad aggiungere:

∀x (C(x) → ∃m

n

1

1y R(x,y)).

Si noti che se la nuova restrizione di numero (m1,n1) è incompatibile con la restrizione ereditata (m,n) (ad esempio, sem1<m oppure n1>n), allora dalla traduzione della rete segue una contraddizione.

La differenziazione di un ruolo, come nel caso di fig. 5.4, è espressa dalla formula:

∀x (triangolo_rettangolo(x) → ∀y (lato(x,y) → cateto(x,y) ∨ ipotenusa(x,y))).

Si deve imporre inoltre che:

∀x,y (cateto(x,y) → lato(x,y))∀x,y (ipotenusa(x,y) → lato(x,y)).

Questo comporta che, a livello semantico, valga che ϕ[cateto] ⊆ ϕ[lato] e ϕ[ipotenusa] ⊆ ϕ[lato].Per quanto riguarda le role value map (RVM), prima di procedere alla loro traduzione in calcolo dei predicati,

bisogna definire la composizione di ruoli. siano R1, ..., Rn una catena di ruoli che connettono due concetti (come adesempio i concetti A e B della fig. 5.9). Chiameremo allora comp(R1, ..., Rn) il ruolo ottenuto per composizione di R1,...,Rn. Nella traduzione logica, a comp(R1, ..., Rn) corrisponderà, come a tutti i ruoli, un predicato a due argomenti, ilquale sarà definito come segue:

comp(R1, ..., Rn)(x,y) ↔ ∃ x1 , ..., xn−1 (R1(x, x1) ∧ ... ∧ Rn(xn−1,y)).

fig. 5.9

A questo punto, una RVM di inclusione, come quella della fig. 5.10, viene tradotta dalla seguente formula:

∀x (A(x) → ∀y (comp(S1, ..., Sm)(x,y) → comp(R1, ..., Rn)(x,y))).

Nel caso di una RVM di uguaglianza, è sufficiente sostituire un bicondizionale all'implicazione nel conseguente dellaformula precedente.

Page 63: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

11

fig. 5.10

Per quanto riguarda le SD, abbiamo già notato nel paragrafo precedente come esse diano adito ad alcuneambiguità interpretative. In particolare, una traduzione nella logica del primo ordine per le SD non risulta immediatacome per gli altri costrutti di KL-ONE. Presenteremo qui un tipo di traduzione che è stato talvolta proposto. Abbiamovisto che il meccanismo delle SD si basa sul fatto di rappresentare relazioni a più argomenti come concetti generici. Ciòè compatibile con la trattazione di tipo logico che abbiamo adottato a patto di assumere la possibilità di "oggettivare" lerelazioni, di assumere cioè che esistano nel dominio individui che corrispondono a singole istanze di una relazione. Sitratta di una tecnica adottata abbastanza frequentemente nelle reti semantiche per rappresentare relazioni a più di dueargomenti. Mentre infatti in una rete è abbastanza naturale rappresentare predicati a un posto come nodi e relazioni adue posti come archi, la rappresentazione di generiche relazioni n-arie risulta problematica. Di solito si procede nelmodo seguente. Si consideri il seguente esempio tratto da Levesque e Brachman (1985). Vogliamo rappresentare il fattoche il voto di John di cs100 (un certo corso) è stato 85, cioè, in calcolo dei predicati:

voto(John, cs100, 85).

In una rete semantica di solito si introduce un concetto (un predicato a un posto) per esprimere, in maniera complessa,una relazione ternaria, postulando ad esempio l'esistenza di oggetti chiamati "assegnamenti di voto", e rappresentando ilfatto su John nei termini di una particolare istanza av_1 di assegnamento di voto4:

assegnamento_di_voto(av_1) ∧ studente(av_1, John) ∧∧ corso(av_1, cs100) ∧ voto(av_1,85).

Si consideri ora l'esempio di SD in fig. 5.7. Si vuole esprimere che, per ogni istanza del concetto tavolo, iriempitori dei ruoli piano e sostegno stanno fra loro nella relazione stare_sopra. Oggettivando stare_sopra secondo latecnica sopra descritta, ciò equivale a dire che, per ogni istanza itavolo di tavolo, esiste un'istanza di stare_sopra, diciamoistare sopra_ , tale che i riempitori di piano e sostegno per itavolo sono rispettivamente riempitori dei ruoli sta_sopra esta_sotto per istare sopra_ . Questo può essere espresso da una formula come la seguente:

∀x (tavolo(x) → ∃y(stare_sopra(y) ∧∀z (piano(x,z) ↔ sta_sopra(y,z)) ∧∀z (sostegno(x,z) ↔ sta_sotto(y,z)))).

Questo tipo di soluzione lascia certamente molte perplessità. Si supponga ad esempio di avere una relazione binariarappresentata in una rete come un ruolo, e che, per utilizzarla in una SD, essa venga rappresentata in seguito anche comeconcetto. Non vi è alcun modo in KL-ONE per esprimere il fatto che quel ruolo e quel concetto esprimono la stessarelazione. Tutto il meccanismo appare inoltre astruso ed inutilmente complesso. In calcolo dei predicati, le informazionidi fig. 5.7 potrebbero essere rappresentate molto più semplicemente come segue:

∀x (tavolo(x) → ∀ y,z (piano(x,y) ∧ sostegno(x,z) → sta_sopra(y,z))).

4Su questo argomento si veda anche (Deliyanni e Kowalski 1979), che considerano l'enfasi su predicati unari e binarianziché n-ari uno dei contributi delle reti semantiche alla ricerca in rappresentazione della conoscenza.

Page 64: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

12

E' quindi comprensibile che le SD siano scomparse dal linguaggio terminologico di quasi tutti i discendenti di KL-ONE.Sin qui abbiamo preso in considerazione soltanto concetti primitivi, per i quali la rete semantica esprime

condizioni necessarie ma non sufficienti. Nel caso di concetti definiti, la traduzione in calcolo dei predicati deve anchecomprendere una formula che esprima la condizione sufficiente per l'applicabilità del concetto. Per esempio, nella retedi fig. 5.2, essere ad un tempo un poligono regolare e un triangolo è una condizione sufficiente per essere un triangoloequilatero. La traduzione di questa rete in calcolo dei predicati deve quindi comprendere, oltre alle due implicazioni chetraducono gli archi di superconcetto, la formula seguente:

∀x (poligono_regolare(x) ∧ triangolo(x) → triangolo_equilatero(x)).

Sul piano semantico abbiamo quindi che ϕ[triangolo_equilatero] = ϕ[poligono_regolare] ∩ ϕ[triangolo]. Cioè,l'interpretazione di C coincide con l'intersezione delle interpretazioni di B e di A.

Più in generale, dato un concetto A, le condizioni necessarie espresse da una rete KL-ONE per A possono esseretradotte in calcolo dei predicati da un insieme di formule del tipo: ∀x (A(x) → α(x)). Siano dunque

∀x (A(x) → α1(x)), ..., ∀x (A(x) → αn (x))

le formule che esprimono tutte le condizioni necessarie per A in una data rete. In tal caso, se A è un concetto definito, lacondizione sufficiente per A sarà espressa dalla formula:

∀x (α1(x) ∧ ... ∧αn (x) → A(x)).

Ad esempio, nella rete di fig. 5.5, poliedro è definito dal fatto di essere un sottoconcetto di solido, con i riempitori delruolo faccia ristretti al concetto poligono e la cardinalità di faccia ristretta a (4,nil). In questo caso, la traduzione incalcolo dei predicati dovrà includere, oltre alle formule che esprimono le condizioni necessarie per poliedro, la formulaseguente:

∀x (solido(x) ∧ ∃4

y faccia(x,y) ∧ ∀y (faccia(x,y) → poligono(y)) → poliedro(x)).

Data questa traduzione in calcolo dei predicati, anche il problema di determinare la sussunzione di due concetti ariconducibile a un problema di inferenza logica. Dati due concetti A e B di una rete, per stabilire se A sussume B èsufficiente stabilire se la formula ∀x (B(x) → A(x)) segue dalla traduzione logica della rete. Si consideri ancora la rete difig. 5.5, in cui esiste un legame di sussunzione implicito fra i concetti parallelepipedo e poliedro. Si considerino leseguenti formule, che costituiscono la traduzione logica delle condizioni necessarie per parallelepipedo e sufficienti perpoliedro, più la traduzione dell'arco di superconcetto fra rettangolo e poligono:

∀x (parallelepipedo (x) → solido(x))∀x (parallelepipedo (x) → ∀y(faccia(x,y) → rettangolo(y))).

∀x (parallelepipedo (x) → ∃6

6y faccia(x,y)).

∀x (solido(x) ∧ ∃4

y faccia(x,y) ∧ ∀y (faccia(x,y) → poligono(y)) → poliedro(x))

∀x (rettangolo(x) → poligono(x)).

Da tale insieme di formule segue che ∀x (parallelepipedo(x) → poliedro(x)), che esprime appunto la sussunzione fra iconcetti parallelepipedo e poliedro.

Per quanto riguarda i concetti individuali, anch'essi vengono tradotti mediante predicati a un argomento, con inpiù la condizione che possano avere al massimo una sola istanza. Così, se I è un concetto individuale, ad essocorrisponde nella traduzione un predicato I(x), per cui valga:

∀x (I(x) → ∀y (I(y) → y=x)).

Per quanto riguarda la componente asserzionale di KL-ONE, ogni nexus corrisponde a una costante individualedel linguaggio. Così, ad esempio, un description wire fra un concetto C e un nexus n corrisponde alla formula atomicaC(n).

Page 65: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

13

5.3 Dalle reti semantiche alle logiche terminologiche

La traduzione che abbiamo presentato mostra come il linguaggio a rete semantica di KL-ONE sia riconducibilead un sottoinsieme del calcolo dei predicati del primo ordine con identità, e come, di conseguenza, sia possibileassociare, in maniera indiretta, una semantica di tipo model teoretico a questo genere di formalismi. Nei sistemiterminologici successivi (a partire da KRYPTON) questa constatazione è stata assunta come dato di partenza, e taliformalismi sono nati "già interpretati" sin dall'inizio, nel senso che essi venivano definiti associando loro direttamenteuna semantica modellistica, senza passare attraverso la traduzione nella notazione logica tradizionale. Tutto ciò ha resoevidente come non fosse essenziale pensare in termini di "reti" questi sistemi di rappresentazione, ed ha fatto sì che lanotazione a grafo e lo stesso termine "rete semantica" venissero di fatto abbandonati. Patel-Schneider (1989a) adesempio ha utilizzato per questo tipo di formalismi il nome di logiche terminologiche.

Introdurremo ora un formalismo terminologico, che chiameremo LT, il quale costituisce un'estensione dellacomponente terminologica di KL-ONE (fatta eccezione per alcuni costrutti come i concetti individuali, che non sonopresenti in LT). LT non corrisponde ad alcun sistema effettivamente proposto, ma è stato ottenuto riunendo in un unicosistema la maggior parte delle primitive nei vari formalismi terminologici esistenti5.

Lo scopo per cui presentiamo LT è duplice. Da un lato, costituisce un esempio di come vengano definiti iformalismi terminologici, prescindendo sia dalla notazione a grafo delle reti semantiche, sia dalla notazione logicaclassica del primo ordine, e di come a questi formalismi venga associata direttamente una semantica di tipo modelteoretico. D'altro canto, LT è un repertorio pressoché completo delle primitive terminologiche usate nei sistemisuccessivi a KL-ONE, il che ci consentirà di effettuare alcune considerazioni globali sullo sviluppo delle logicheterminologiche.

Chiameremo una terminologia una base di conoscenza di LT. Ciascuna terminologia è costituita da una serie diespressioni che introducono termini o che esprimono relazioni fra di essi. Sono ammessi due tipi di termini: concetti eruoli. Come in KL-ONE, l'interpretazione intesa è che i concetti corrispondano a predicati ad un argomento, e i ruoli arelazioni a due argomenti. Tuttavia, mentre in KL-ONE i ruoli svolgevano un ruolo subalterno rispetto ai concetti (inquanto la loro unica funzione era quella di contribuire alla descrizione di concetti), in LT, come in praticamente tutti iformalismi terminologici da KRYPTON in poi, essi hanno un ruolo del tutto autonomo, e possono essere organizzati inuna tassonomia indipendente, parallela a quella dei concetti.

La sintassi di LT (formulata mediante la notazione BNF6) è la seguente.

<terminologia> ::= <introduzione-termine>* | <disgiunzione>*

<introduzione-termine> ::=(cprim <nome-concetto> <concetto>) |(cdef <nome-concetto> <concetto>) |(rprim <nome-ruolo> <ruolo>) |(rdef <nome-ruolo> <ruolo>) |

<concetto> ::= top |<nome-concetto> |(and <concetto> + ) |(or <concetto> + ) |(not <concetto>) |(all <ruolo><concetto>) |(some <ruolo>) |(atleast <limite_minimo><ruolo>) |(atmost <limite_massimo><ruolo>) |(rvm <ruolo><ruolo>) |(rvm= <ruolo><ruolo>) |(sd <concetto> (<ruolo><ruolo>) + )

5In questo senso è analogo al sistema U di Patel-Schneider (1987) (si veda anche Nebel 1990a), e al sistema KLpresentato in (Woods e Schmolze 1992), del quale LT è una versione con lievi modifiche (rispetto a LT, KL ha anche iconcetti individuali).6La BNF (Bachus normal form, o Bachus-Naur form) è una notazione per grammatiche libere da contesto usualmenteutilizzata nella descrizione della sintassi dei linguaggi di programmazione. Si veda ad esempio il cap. 3 di (Luccio1972).

Page 66: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

14

<ruolo> ::= top-role |<nome-ruolo> |(and-role <ruolo> + ) |(or-role <ruolo> + ) |(not-role <ruolo>) |(restr <ruolo><concetto>) |(domain <concetto>) |(range <concetto>) |(inv <ruolo>) |(chain <ruolo><ruolo> + )

<disgiunzione> ::=(disjoint <concetto><concetto>) |(disjoint-role <ruolo><ruolo>)

<limite-minimo> ::= <numero-intero><limite-massimo> ::= <numero-intero> | nil

In base a questa definizione, una terminologia è costituita da un insieme (eventualmente vuoto) di introduzioni ditermini e da un insieme (eventualmente vuoto) di disgiunzioni fra termini. L'introduzione di un termine avviene permezzo di opportuni operatori. L'operatore cprim serve per introdurre un concetto come concetto primitivo: cprimassume come argomenti il nome del concetto che viene introdotto e la sua descrizione. Il significato inteso è che taledescrizione esprima le condizioni necessarie per il concetto introdotto, mentre cdef serve per introdurre concettidefiniti. In questo caso la descrizione del concetto esprime le condizioni sia necessarie che sufficienti per il concettointrodotto. Analogamente, rprim e rdef servono per introdurre rispettivamente ruoli primitivi e definiti.

La descrizione di un concetto si ottiene applicando ricorsivamente alcuni operatori a partire da nomi di terminiatomici. Il linguaggio di LT prevede inoltre una costante concettuale predefinita, il concetto top, che è l'analogo delconcetto cosa di KL-ONE. L'operatore and serve per descrivere un concetto come la congiunzione di altri concetti. Sec1 , ..., cn sono concetti, allora (and c1 ... cn ) è il concetto che si ottiene congiungendo c1 , ..., cn . Ad esempio, (andfemmina umano) è una possibile descrizione del concetto "donna". In modo analogo, l'operatore or serve per descrivereun concetto come disgiunzione di altri concetti. Con not un concetto viene descritto come il complemento rispetto aldominio di un altro concetto. Ad esempio, (not animale) è il concetto che ha per istanze tutti gli individui del dominioche non sono animali. L'operatore all è analogo alla restrizione di valore di un ruolo nella descrizione di un concetto inKL-ONE. Se r è un ruolo, e c è un concetto, allora (all r c) è il concetto che denota la classe di individui del dominio chesono nella relazione r esclusivamente con oggetti che sono dei c. Ad esempio (all figlio_di maschio) denota coloro chehanno per figli esclusivamente dei maschi. Per quanto riguarda l'operatore some, (some r c) è il concetto che denota laclasse di individui che sono nella relazione r con almeno un c: (some figlio_di maschio) è il concetto che ha comeistanze coloro che hanno almeno un figlio maschio. Gli operatori atleast e atmost introducono le restrizioni di numerodi un ruolo. Scopo di atleast è quello di imporre il limite inferiore di numero a un ruolo. Se r è un ruolo, e se n ∈ IN,allora (atleast n r) denota la classe degli individui che sono nella relazione r con almeno n oggetti. Ad esempio,(atleast 3 figlio_di) denota gli individui che hanno almeno 3 figli. Analogamente, atmost serve per imporre il limite dinumero superiore ad un ruolo. Se r è un ruolo, e se n ∈ IN ∪ {nil}, allora (atmost n r) denota la classe degli individuiche sono nella relazione r con al più n oggetti. rvm è l'operatore per definire un concetto sulla base di una role valuemap di inclusione, e (rvm r1 r2 ) denota l'insieme degli individui per cui tutti i riempitori del ruolo r1 sono ancheriempitori di r2 . Analogamente, rvm= è l'operatore per definire un concetto sulla base di una role value map di identità.Ad esempio:

(and cilindro (rvm= diametro_base altezza))

è una descrizione di cilindro equilatero analoga a quella della fig. 5.6. L'operatore sd infine introduce le structuraldescription, sulla base del criterio descritto più sopra. Il primo argomento di sd è un concetto che rappresenta unarelazione "oggettivata". Ad esempio:

(sd stare_sopra (piano sta_sopra) (sostegno sta_sotto))

corrisponde alla structural description della fig. 5.7.Un ulteriore insieme di operatori è previsto per la costruzione di descrizioni di ruoli. Gli operatori top-role, and-

role, or-role e not-role sono l'analogo per i ruoli rispettivamente degli operatori top, and, or e not per i concetti,

Page 67: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

15

mentre restr descrive un ruolo restringendo ad un dato concetto l'insieme dei riempitori di un ruolo. Ad esempio, (restrfiglio_di maschio) rappresenta la relazione "avere figli maschi". domain e range descrivono un ruolo fissandonerispettivamente il dominio e il codominio. Ad esempio, (range c) descrive il predicato binario "stare in relazione con unc". inv serve per ottenere l'inverso di un ruolo: ad esempio, se figlio_di è il ruolo che esprime la relazione "avere comefiglio ....", (inv figlio_di) rappresenta la relazione "essere figlio di ...". Infine, chain serve per definire un ruolo tramiteconcatenazione di ruoli.

Il linguaggio di LT dispone infine di due operatori, disjoint e disjoint-role, per asserire in una terminologia chedue termini (rispettivamente concetti o ruoli) sono disgiunti.

Vediamo ora alcuni esempi di introduzione di termini in LT, riprendendo esempi utilizzati in precedenza.L'espressione:

(cprim C A)

corrisponde al modo in cui è introdotto il concetto C nella rete di fig. 5.8: C è un concetto primitivo caratterizzato dalsolo fatto di essere un sottoconcetto di A. Al modo in cui è descritto il concetto A, sempre nella rete di fig. 5.8,corrisponde invece in LT:

(cprim (and (all R B) (atleast m R) (atmost n R))),

vale a dire: A è un concetto primitivo, caratterizzato dal fatto di avere i valori del ruolo R ristretti al concetto B, con unlimite inferiore di numero pari a m e un limite superiore di numero pari a n. L'equivalente della definizione del concettotriangolo equilatero in fig. 5.2 è:

(cdef triangolo_equilatero (and poligono_regolare triangolo)).

Cioè, il concetto triangolo_equilatero è definito dal fatto di essere contemporaneamente un poligono_regolare e untriangolo. La definizione del concetto parallelepipedo nella rete in fig. 5.5 viene invece rappresentata come segue:

(cdef parallelepipedo (and solido (all faccia rettangolo) (atleast 6 faccia) (atmost 6 faccia)).

Ossia, parallelepipedo è definito dal fatto di essere un solido , con restrizione di valore rettangolo e restrizione dinumero (6,6) per il ruolo faccia.

Vi sono operatori di LT che non corrispondono ad alcun costrutto KL-ONE. Ne sono esempi or e not per iconcetti, e, in generale, la maggior parte degli operatori per la descrizione di ruoli.

L'analogo della differenziazione di un ruolo in KL-ONE può essere espressa in LT mediante gli operatori diintroduzione per i ruoli. Ad esempio, il fatto che, in fig. 5.4, i ruoli cateto e ipotenusa differenzino il ruolo lato, vieneespresso in LT nel modo seguente:

(rprim cateto lato)(rprim ipotenusa lato).

Cioè, cateto e ipotenusa sono sottoruoli primitivi del ruolo lato.La semantica di LT è definita nel modo seguente. Sia (D, ϕ) una interpretazione, dove, come usuale, ϕ è la

funzione interpretazione e D è il dominio. Per ogni concetto c, si ha che ϕ[c] ⊆ D, mentre, per ogni ruolo r, ϕ[r] ⊆ D ×D. Diremo che (D, ϕ) è un modello di una data terminologia T, se e soltanto se, rispetto a T, (D, ϕ) soddisfa i vincoliseguenti.

Concetti:

ϕ[top] = D

ϕ[(and c1 ... cn )] = i

n

=1I ϕ[ci ]

ϕ[(or c1 ... cn )] = i

n

=1U ϕ[ci ]

ϕ[(not c)] = D - ϕ[c]ϕ[(all r c)] = {x ∈ D | per ogni y, se (x,y) ∈ ϕ[r], allora y ∈ ϕ[c]}ϕ[(some r)] = {x ∈ D | esiste y tale che (x,y) ∈ ϕ[r]}ϕ[(atleast n r)] = {x ∈ D | card({y ∈ D | (x,y) ∈ ϕ[r]}) ≥ n}ϕ[(atmost n r)] = {x ∈ D | card({y ∈ D | (x,y) ∈ ϕ[r]}) ≤ n}

Page 68: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

16

ϕ[(rvm r1 r2 )] = {x ∈ D | per ogni y, se (x,y) ∈ ϕ[r1 ], allora (x,y) ∈ ϕ[r2 ]}ϕ[(rvm= r1 r2 )] = {x ∈ D | per ogni y, se (x,y) ∈ ϕ[r1 ], se e soltanto se (x,y) ∈ ϕ[r2 ]}ϕ[(sd s (r c

1 r s1 ) ... (rn

c rns ))] = {x ∈ D | esiste y ∈ ϕ[s] tale che, per ogni 1≤ i≤n:

per ogni z, (x,z) ∈ ϕ[ric ] se e soltanto se (y,z) ∈ ϕ[ri

s ] }

ruoli:

ϕ[top-role] = D2

ϕ[(and-role r1 ... rn )] = In

i 1=ϕ[ri ]

ϕ[(or-role r1 ... rn )] = i

n

=1U ϕ[ri ]

ϕ[(not-role r)] = D2 - ϕ[r]ϕ[(restr r c )] = {(x,y) ∈ ϕ[r] | y ∈ ϕ[c]}ϕ[(domain c )] = {(x,y) ∈ D2 | x ∈ ϕ[c]}ϕ[(range c )] = {(x,y) ∈ D2 | y ∈ ϕ[c]}ϕ[(inv r )] = {(x,y) ∈ D2 | (y,x) ∈ ϕ[r]}ϕ[(chain r1 , ..., rn )] = {(x,y) ∈ D2 | esistono z1 , ..., zn−1 tali che:

(x,z1) ∈ ϕ[r1 ] e (z1 , z2 ) ∈ ϕ[r2 ] e .... e (zn−1,y) ∈ ϕ[rn ]}

introduzione di termini:

se (cprim nC c), allora ϕ[nC ] ⊆ ϕ[c]se (cdef nC c), allora ϕ[nC ] = ϕ[c]se (rprim nR r), allora ϕ[nR ]⊆ ϕ[r]se (rdef nR r), allora ϕ[nR ] = ϕ[r]

asserzioni di disgiunzione:

se (disjoint c1 c2 ), allora ϕ[c1] ∩ ϕ[c2 ] = ∅se (disjoint-role r1 r2 ), allora ϕ[r1 ] ∩ ϕ[r2 ] = ∅

(dove, dato un insieme I, card(I) è la cardinalità di I, e dove, per ogni x ∈ IN, x < nil).Si può notare che non tutti gli operatori di LT devono essere introdotti come primitivi. Alcuni possono essere

definiti in base ad altri. Ad esempio, (some r) equivale a (atleast 1 r); mentre (restr r c) equivale a (and r (range c)).La possibilità di associare una semantica modellistica (direttamente, o attraverso una traduzione in calcolo dei

predicati) ai vari formalismi di tipo terminologico rende evidente che la funzione di una base di dati terminologica è deltutto analoga alla funzione di un insieme di postulati di significato: una rete KL-ONE restringe il numero dei modelliammissibili di una base di conoscenza ponendo vincoli sull'interpretazione di alcuni simboli primitivi del linguaggio,senza tuttavia riuscire a vincolare l'interpretazione dei simboli all'interpretazione intesa. La presa d'atto di ciò è statacontemporanea ad uno spostamento di interesse dalle motivazioni epistemologiche originarie a istanze di ricerca di tipodiverso. A partire dallo sviluppo di KRYPTON l'enfasi si è spostata sulle proprietà computazionali (decidibilità etrattabilità computazionale) di questi sistemi. Abbiamo visto che il calcolo della sussunzione fra termini è il tipo diinferenza privilegiato nei sistemi terminologici. Le proprietà computazionali degli algoritmi che calcolano lasussunzione dipendono strettamente dal tipo di linguaggio terminologico adottato (si veda Brachman e Levesque 1984).Lo studio formale della sussunzione risale a Schmolze e Israel (1983), che diedero la prima semantica formale di KL-ONE. Essi dimostrarono che la procedura che calcola la sussunzione implementata in KL-ONE (Lipkis 1982; Schmolzee Lipkis 1983) è corretta ma non completa: tutte le sussunzioni individuate da tali procedure sono valide rispetto allasemantica, tuttavia, ci possono essere sussunzioni valide rispetto alla semantica, ma che la procedura non puòindividuare. Più recentemente (Schmidt-Schauss 1989) è stato dimostrato che la sussunzione in KL-ONE non èdecidibile ma solo semidecidibile: non esiste alcun algoritmo che, data una qualsiasi rete KL-ONE e due concetti dellarete, possa sempre stabilire se il primo concetto sussume il secondo o no. Lo stesso risultato (Patel-Schneider 1989b) èstato dimostrato per il formalismo NIKL (Moser 1983), che costituisce la componente terminologica di KL-TWO, unodei discendenti di KL-ONE. Più in generale, Schmidt-Schauss dimostra che la sussunzione è indecidibile in qualunquelogica terminologica che comprenda gli operatori per la formazione di concetti and, all e rvm=. Ci si è quindi

Page 69: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 5

17

concentrati sullo studio di sistemi terminologici meno espressivi (come ad esempio la componente terminologica diKRYPTON). Ulteriori problemi derivano dal fatto che, anche nei casi in cui la sussunzione è decidibile, non è detto cheessa sia trattabile computazionalmente, non è detto cioè che sia possibile calcolarla in un lasso "ragionevole" di tempo.

Levesque e Brachman (1985) parlano di un tradeoff nei formalismi di rappresentazione fra potere espressivo etrattabilità computazionale: quando il primo cresce, la seconda inevitabilmente diminuisce. In base a questi parametri èpossibile individuare uno spettro di linguaggi di rappresentazione, in cui, ad un estremo, Brachman e Levesquecollocano i linguaggi dei data base relazionali: dal punto di vista espressivo, sono un sottoinsieme estremamente poverodel calcolo dei predicati del primo ordine, ma sono facilmente trattabili computazionalmente. All'estremo opposto sitrova il calcolo dei predicati del primo ordine completo, che è molto espressivo ma con pessime proprietàcomputazionali (non è decidibile). Per quanto riguarda formalismi come le reti semantiche o i sistemi a regole diproduzione, è impossibile dire in modo assoluto quale sia "meglio" degli altri. Semplicemente, hanno posizioni diverserispetto al tradeoff fra espressività e trattabilità. Quindi, per gli scopi della ricerca in rappresentazione della conoscenza,ha senso continuare a progettare e studiare linguaggi anche se risultano essere nient'altro che sottoinsiemi del calcolo deipredicati del primo ordine.

Il linguaggio di KRYPTON, ad esempio, - dicono Brachman e Levesque - include tutta la logicadel primo ordine e un linguaggio descrizionale a frame. Per effettuare le inferenze necessarie, il sistemacomprende sia un dimostratore di teoremi che un meccanismo per la sussunzione di descrizioni, sebbene ilprimo possa fare anche il lavoro del secondo (ma in maniera molto meno efficiente). Il trucco in questosistema ibrido è di scorporare il processo di ragionamento in maniera che i vari specialisti siano in gradodi collaborare e di applicare i loro algoritmi ottimizzati senza interferire l'uno con l'altro. (Brachman eLevesque 1985, p. 67).

Ripensando alle dispute sulla logica e sull'utilità di sistemi come le reti semantiche, è interessante (e in un certo sensoparadossale) notare come qui il punto di maggiore interesse delle reti semantiche venga individuato nel fatto che esserisultano meno potenti in quanto a capacità espressive rispetto al calcolo dei predicati.

Nelle logiche terminologiche, anche nei casi in cui esista una procedura di sussunzione completa, l'esigenza dellatrattabilità computazionale pone seri problemi. In Brachman e Levesque (1984) è stato dimostrato che, nelle logicheterminologiche, un aumento apparentemente insignificante del potere espressivo ha effetti disastrosi sulla trattabilitàcomputazionale. Brachman e Levesque definiscono un semplice linguaggio terminologico, FL − , che comprende i treoperatori and, all and some. Dimostrano quindi che la sussunzione in FL − è computazionalmente trattabile. Gli autoridefiniscono quindi il linguaggio FL, ottenuto aggiungendo l'operatore restr per la formazione di ruoli a FL − . In FL ilproblema della sussunzione diventa computazionalmente intrattabile. Nebel (1988, 1990b) ha proseguito questa linea diricerca, studiando quali combinazioni di operatori terminologici conducono all'intrattabilità. Ne emerge che, per ogniinsieme di primitive di sufficiente interesse per la rappresentazione della conoscenza terminologica, non esistonoprocedure complete per calcolare la sussunzione che siano trattabili computazionalmente. In pratica, la soluzione piùplausibile sembra essere quella di usare procedure incomplete che siano tuttavia computazionalmente trattabili, e checoprano tutti i casi "ovvi" da un punto di vista intuitivo.

Da un lato quindi la ricerca sui sistemi terminologici si è sviluppata sulla strada segnata da KRYPTON, badandocioè soprattutto alle proprietà computazionali del sistema, allo scopo di individuare un buon equilibrio fra potereespressivo di T-Box e A-Box7. Contemporaneamente tuttavia altre ricerche proseguivano su una linea più simile aquella originaria di KL-ONE, studiando formalismi terminologici che fossero il più espressivi possibile8.

Anche in questi casi, tuttavia, il formalismo terminologico risulta comunque meno espressivo di un insieme dipostulati di significato espressi direttamente nel calcolo dei predicati del primo ordine. Ad esempio, nelle logicheterminologiche non è possibile esprimere il fatto che la relazione espressa da un ruolo è transitiva o simmetrica. Dinorma, non è possibile separare condizioni necessarie e sufficienti nella descrizione di un termine (ad esempio,esprimendo condizioni sufficienti che non siano a loro volta necessarie). In generale, continua poi a valerel'impossibilità di definire relazioni a più di due argomenti9. Doyle e Patil (1991) forniscono una ricca casistica di tipi didefinizioni che non sono esprimibili nei linguaggi terminologici. Restano poi alcuni problemi teorici di fondo, quali adesempio la plausibilità di una separazione netta e definitiva fra conoscenza dei termini e asserzioni di tipo fattuale.Torneremo in seguito su questo tema. Anche Mac Gregor (1991) ammette tuttavia che: "la distinzione formale fraconoscenza terminologica e asserzionale [...] è piuttosto esoterica" (p. 394), e prosegue affermando che l'interesse dellaricerca sui sistemi terminologici consiste soprattutto nell'individuazione di sottoinsiemi del calcolo dei predicati adeguatialle proprie esigenze computazionali e di rappresentazione.

7Si veda ad esempio il sistema KANDOR (Patel-Schneider 1984).8 In questa tradizione, ricordiamo sistemi come KL-TWO (Vilain 1985; Vilain e McAllester 1983) e LOOM (MacGregor 1990).9Anche se sistemi terminologici che ammettano termini n-ari sono stati proposti. Si veda ad esempio (Schmolze 1989).

Page 70: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

6. Frame, reti semantiche e ragionamento non monotòno

E' facile constatare che un tipo di traduzione logica quale quella utilizzata per KL-ONE non è adeguata neiconfronti dei sistemi a frame e delle reti semantiche che ammettono eccezioni. Si consideri ad esempio la coppia diframe tigre e tigre da circo del paragrafo 4.3. Lo slot è un del frame tigre da circo può essere plausibilmente tradottoper mezzo di un'implicazione quantificata di questo genere:

(1) ∀x (tigre_da_circo(x) → tigre(x)),

cioè, tutte le tigri da circo sono tigri. Adottando una tecnica analoga a quella utilizzata per i ruoli di KL-ONE, ai dueslot habitat dei frame corrisponderebbero le due seguenti formule di calcolo dei predicati:

(2) ∀xy (tigre(x) ∧ habitat(x,y) → giungla(y))(3) ∀xy (tigre_da_circo(x) ∧ habitat(x,y) → circo(y)).

Tuttavia, da (1)-(3) è ora possibile dedurre che:

∀xy (tigre_da_circo(x) ∧ habitat(x,y)) → (giungla(y) ∧ circo(y)),

che certamente non corrisponde all'intuizione che si intendeva catturare. Se inoltre si assume che valga il ragionevoleassioma:

(4) ∀x ¬(circo(x) ∧ giungla(x)),

(1)-(4) rendono contraddittorio assumere che una tigre da circo abbia un habitat.Nel caso di una rete semantica in cui compaia un arco di tipo isa che ammetta delle eccezioni, tale arco non può

essere tradotto mediante una implicazione quantificata universalmente come nel caso degli archi di superconcetto in KL-ONE. Prendiamo ad esempio una rete in cui compaia un arco isa fra il concetto uccello e il concetto vola (come nellafig. 6.1). Supponiamo di tradurlo mediante la formula seguente:

(5) ∀x (uccello(x) → vola(x)).

In tal caso, l'esistenza di un uccello che non sia in grado di volare (ad esempio perché è un pinguino) genererebbeimmediatamente una contraddizione. I tradizionali sistemi logici non consentono di affrontare in modo soddisfacente ilproblema. Si potrebbe pensare di aggirare la difficoltà indebolendo la premessa della (5), trasformandola ad esempio in:

(5') ∀x (uccello(x) ∧ ¬ pinguino(x) → vola(x)).

Tuttavia tale soluzione pone immediatamente difficoltà ulteriori. In primo luogo, i pinguini non sono certo l'unico casodi uccelli che non sono in grado di volare. Ci sono, ad esempio, anche gli struzzi. C'è il dodo. Ci sono gli uccelli appenanati. Ci sono gli uccelli legati, gli uccelli morti, gli uccelli con le ali spezzate, quelli paralitici, quelli ipnotizzati, e cosìvia. In generale, non è possibile enumerare tutte le possibili eccezioni che ammette una regola che esprime unaconnessione di carattere "prototipico" fra due concetti1. Inoltre, anche assumendo che questo sia possibile, il problemanon sarebbe comunque risolto. Supponiamo infatti di avere ottenuto la regola seguente:

(5'') ∀x (uccello(x) ∧ ¬α(x) → vola(x)),

dove α(x) sia la disgiunzione di tutte le possibili "eccezioni", di tutti i possibili casi cioè in cui qualcosa è un uccello etuttavia non vola. Ebbene, in tal caso, l'informazione che, poniamo, Tweety è un uccello non è sufficiente per inferireche Tweety vola. Per poter concludere che Tweety vola si deve disporre di tutte le informazioni relative al fatto che nonsi tratti di un uccello anomalo. Si deve cioè sapere che Tweety non è un pinguino, che non è uno struzzo, che non ha leali rotte, e così via. Ciò non è certamente adeguato dal punto di vista di una forma di ragionamento basato su prototipi,che è appunto il tipo di ragionamento che frame e reti semantiche con eccezioni intendono catturare. Ciò che si desideraè che, in mancanza di informazioni più specifiche, si possa assumere che valgano le proprietà del prototipo. Ad esempio,sapendo che Tweety è un uccello, in mancanza di altre informazioni più specifiche, si vuole assumere che Tweety è unuccello tipico e quindi poter inferire che vola. Qualora diventassero disponibili altre informazioni più specifiche incontrasto con tale inferenza (ad esempio che Tweety è un pinguino) si vuole poter eliminare la conclusione tratta

1Tale problema è una forma del cosiddetto qualification problem - si veda più oltre in questo paragrafo.

Page 71: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

2

precedentemente. Questo tipo di esigenza è in contrasto con una caratteristica condivisa dalla quasi totalità dei sistemilogici tradizionali, vale a dire con la cosiddetta proprietà di monotonia. In un sistema logico monotòno l'insieme delleconclusioni cresce monotonicamente al crescere del numero delle premesse. Vale a dire, aggiungendo nuove premessel'insieme delle conclusioni può eventualmente crescere, ma non può diminuire; non può cioè succedere che aggiungendonuove premesse debbano essere eliminate alcune delle conclusione tratte precedentemente. In maniera più formale, laproprietà di monotonia può essere caratterizzata dicendo che un sistema logico L è monotòno se vale quanto segue. Datauna formula α e due insiemi ∆ e Γ di formule di L, se α è derivabile in L da ∆, e se ∆ ⊂ Γ, allora α è derivabile in L da Γ. Dall'esempio sopra riportato risulta invece evidente che il ragionamento basato su prototipi è tipicamente nonmonotòno.

fig. 6.1

Lo sviluppo di sistemi logici che consentano di formalizzare il ragionamento non monotòno è stato, fin dallaseconda metà degli anni settanta, uno dei settori di ricerca più attivi e più originali nell'ambito dell'IA di impostazionelogica. Ciò è dovuto al fatto che la non monotonicità è una delle caratteristiche più diffuse del ragionamento di sensocomune. Oltre al problema della rappresentazione prototipica di concetti, vi è ad esempio il caso del ragionamento sueventi e azioni. In questo ambito sorge il cosiddetto frame problem2, messo in evidenza originariamente da McCarthy eda Hayes (McCarthy e Hayes 1969). In uno dei suoi aspetti, il frame problem riguarda la possibilità di fare previsionisul futuro senza prendere in considerazione ogni evento passato. Si consideri una regola del tipo "se qualcosa è vero inun certo istante, allora qualcosa d'altro sarà vero ad un istante successivo". Anche qui abbiamo a che fare con ilqualification problem: in ogni situazione reale, l'antecedente di una regola del genere dovrebbe essere di lunghezzapraticamente infinita: ad esempio, per essere certi che una palla da biliardo rotoli in una certa direzione non basta sapereche è stata colpita in un certo modo e con una certa forza, ma anche che non ci siano fori o irregolarità sul piano, chesulla sua traiettoria non si vengano a trovare altre palle o altri oggetti, che rotolando non cambi la sua struttura fisica, ecosì via. Quindi, se non si vuole presupporre irrealisticamente una conoscenza perfetta del mondo, si deve utilizzare unaforma di ragionamento non monotòno: in mancanza di altre informazioni, si inferisce che, tipicamente, la palla andrà inuna certa direzione; nel momento in cui nuove informazioni fossero disponibili (presenza di buchi sul piano, o altro) sidevono poter eliminare le conclusioni tratte in precedenza. Si noti che, sebbene il frame problem sembri distante dalproblema della rappresentazione del significato lessicale, di cui qui ci stiamo occupando, tuttavia è in relazione conesso. Ad esempio, nel momento in cui si cerca di definire il significato di molti verbi, ci si trova di fronte ad aspetti delframe problem. Si vedano gli esempi citati nel par. 4.2 a proposito della teoria di Schank: se si definisce il significato dispingere, si vuole poter rappresentare che quando si spinge qualcosa, di solito quella cosa si sposta, ma vi sono casi inquesto può non accadere Esistono quindi delle relazioni fra frame problem, valori di default e significato lessicale.

Tali problemi hanno portato all'elaborazione e allo studio di numerosi sistemi di logica non monotòna3. Il settoreè estremamente ricco e complesso, ed è del tutto impossibile in questa sede darne anche soltanto una panoramicasoddisfacente. Ci limiteremo quindi a prendere in esame, nel prossimo paragrafo, il formalismo della circumscription.

2Si noti che l'espressione frame problem storicamente non ha nulla a che fare con i frame quali sono stati esposti nelparagrafo precedente: sebbene vi possano essere relazioni fra questi due concetti, l'espressione frame è stata introdottanei due casi in maniera del tutto indipendente.3La diffusione dell'interesse per le logiche non monotòne nella comunità dei ricercatori di intelligenza artificiale puòessere fatto risalire a un numero speciale della rivista Artificial Intelligence del 1980 (Artificial Intelligence 1980). Sullelogiche non monotòne in generale si possono consultare (Lukaszewicz 1990); (Ginsberg 1987); (Brewka 1991);(Reinfrank et al. 1988).

Page 72: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

3

Tale analisi ovviamente non pretende di essere esaustiva, ma ha esclusivamente lo scopo di mettere a disposizionealcuni elementi necessari per lo sviluppo della nostra argomentazione. Nel paragrafo successivo passeremo rapidamentein rassegna altri due fra gli approcci più diffusi alla logica non monotòna: la default logic e le logiche non monotònemodali. Daremo infine qualche cenno sulla preferential semantics di Shoham, una teoria che intende fornire una visioneunificata dal punto di vista model teoretico dei vari approcci al ragionamento non monotòno.

6.1 La formalizzazione del ragionamento non monotòno: la circumscription

La circumscription è un approccio al ragionamento non monotòno proposto originariamente da John McCarthy(1977, 1980, 1984)4. Vi sono predicati che valgono solo, per così dire, in casi eccezionali, mentre di solito non siapplicano in situazioni tipiche. Nel ragionamento di senso comune normalmente si assume implicitamente che talipredicati non valgano a meno che non si sappia esplicitamente che non è così. Un esempio potrebbe essere il predicatoalbino. Le persone albine sono un sottoinsieme molto ristretto degli esseri umani. Solitamente nessuno, ragionando su diuna persona che non conosce, prende in considerazione la possibilità che sia albino, a meno che non abbia qualcheinformazione esplicita in proposito. L'idea di fondo che sta alla base del formalismo della circumscription è che, in unateoria logica, si "circoscrivano" i predicati di questo genere, dove circoscrivere un predicato P in una teoria T vuol direassumere che P abbia l'estensione più piccola possibile compatibilmente con le informazioni presenti in T stessa. Adesempio, si supponga di avere la seguente teoria (scritta nel linguaggio del calcolo dei predicati del primo ordine conidentità):

T = {albino(Gigi), Piero ≠ Gigi, Pippo ≠ Gigi, Pippo ≠ Piero}.

Circoscrivere il predicato albino in T significa assumere che Gigi sia l'unica persona albina nel dominio della teoria.Circoscrivendo albino in T si deve cioè poter derivare:

∀x(albino(x) → x=Gigi).

In questo modo si potranno derivare a loro volta le formule:

¬ albino(Piero)¬ albino(Pippo),

che non seguono dalla sola teoria T. E' facile constatare che la circumscription dà luogo a forme di inferenza nonmonotòna. Si supponga di venire a sapere che anche Piero è albino. In tal caso si passerà dalla teoria T alla teoria T' cosìdefinita:

T' = T ∪ {albino(Piero)}.

Circoscrivendo albino in T' si otterrà:

∀x(albino(x) → x=Gigi ∨ x=Piero),

per cui non sarà più possibile ottenere ¬ albino(Piero).Per rappresentare regole non monotòne mediante la circumscription si ricorre all'introduzione di un predicato ab,

dove ab sta per abnormal (McCarthy 1984; Grosof 1984). Ad esempio, che gli uccelli di solito volino vienerappresentato mediante la formula seguente:

∀x (uccello(x) ∧ ¬ ab(x) → vola(x)),

vale a dire, se qualcosa è un uccello e non è atipico, allora vola. Dopo di che, per ottenere le conseguenze volute, sicircoscrive il predicato ab. Si consideri ad esempio la teoria seguente:

T = {∀x (uccello(x) ∧ ¬ ab(x) → vola(x)), uccello(Tweety)}.

Date le informazioni in T, di nessun individuo si riesce a derivare che è abnormal. Circoscrivendo ab in T si otterràquindi che:

4Sull'uso della circumscription per formalizzare frame e reti semantiche con eccezioni si vedano ad esempio (Brewka1987); (Haugh 1988); (Krishnaprasad et al. 1989).

Page 73: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

4

∀x ¬ ab(x).

Di conseguenza si avrà:

∀x (uccello(x) → vola(x))e

vola(Tweety).

Supponiamo ora di passare da T alla seguente teoria T':

T' = T ∪ {uccello(Fred), ¬ vola(Fred), Fred ≠ Tweety}.

Da T' è possibile derivare

ab(Fred).

Quindi, circoscrivendo ab in T' avremo:

∀x (ab(x) → x=Fred),

e, di conseguenza,

∀x (uccello(x) ∧ x≠Fred → vola(x)).

Si possono utilizzare predicati di abnormality a più di un argomento. Ad esempio, utilizzando un predicato a dueargomenti ab(x,y), si può esprimere una regola non monotòna come la seguente

∀xy (compleanno(x) ∧ amico(x,y) ∧ ¬ab(x,y) → fa_regalo(y,x))

che può essere letta nel modo seguente: "se è il compleanno di x, se x e y sono amici, e se la loro non è una relazione diamicizia atipica, allora y fa un regalo a x". Inoltre, in una teoria si possono circoscrivere più predicaticontemporaneamente.

Dal punto di vista formale, effettuare la circumscription di alcuni predicati in una teoria T equivale ad aggiungerea T un opportuno assioma del secondo ordine. Esistono numerosi tipi diversi di circumscription, con diverso potereespressivo, e idonei a formalizzare tipi diversi di ragionamento non monotòno. Iniziamo descrivendo brevemente lapredicate circumscription (McCarthy 1980), che costituisce la forma di circumscription più semplice e meno potente.Introduciamo la seguente convenzione notazionale. Siano U e V due espressioni che denotano due predicati ad nargomenti. Indicheremo con U ≤ V il fatto che l'estensione di U è un sottoinsieme dell'estensione di V o coincide conessa. In altri termini, la relazione ≤ può essere definita come segue:

U ≤ V =def ∀ x1 , ..., xn (U(x1 , ..., xn ) → V(x1 , ..., xn )).

Con U = V indicheremo che U ≤ V e V ≤ U; cioè, U = V equivale a ∀x (U(x1 . ..., xn ) ↔ V(x1 , ..., xn )).Data una teoria T del primo ordine, scriveremo T( P1, ..., Pn ) per mettere in evidenza che P1, ..., Pn sono alcuni

dei simboli predicativi del linguaggio di T (che possono eventualmente anche non comparire in T).Sia T(P) una teoria del primo ordine. Supponiamo di voler circoscrivere P in T(P). Ciò che si vuole ottenere è

che l'estensione di P sia minimale rispetto a T, cioè che sia la più piccola possibile senza violare T. Ciò può essereottenuto aggiungendo a T il seguente assioma del secondo ordine:

(†) ∀Φ (T(Φ) ∧ Φ≤P → P≤Φ),

dove T(Φ) è la formula ottenuta congiungendo tutti gli assiomi di T e sostituendo la variabile predicativa Φ ad ognioccorrenza della lettera predicativa P. Intuitivamente, (†) dice che, per ogni predicato Φ, se:

(a) Φ può essere sostituito a P in T(P) senza violare la teoria,(b) Φ ha estensione minore di P,

Page 74: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

5

allora si assume che Φ e P coincidano. Fra i vari predicati Φ che soddisfano (a) e (b) ci sarà anche quello conl'estensione minimale compatibile con T(P).

Quanto detto può essere facilmente generalizzato a un numero qualsiasi di predicati. Sia T( P1, ..., Pn ) una teoriadel primo ordine in cui si vogliano circoscrivere P1, ..., Pn . Ciò si ottiene aggiungendo a T( P1, ..., Pn ) l'assioma:

(††) ∀Φ1, ..., Φn (T(Φ1, ..., Φn ) ∧ Φ1≤ P1 ∧ ... ∧ Φn ≤ Pn → P1≤Φ1 ∧ ... ∧ Pn ≤Φn ),

dove, analogamente a sopra, T(Φ1, ..., Φn ) è la formula ottenuta congiungendo tutti gli assiomi di T( P1, ..., Pn ) esostituendovi rispettivamente tutte le occorrenze di P1, ..., Pn con le variabili predicative Φ1, ..., Φn .

Chiameremo predicate circumscription di P1, ..., Pn in T (in simboli: CIRCPR (T; P1, ..., Pn )) l'insieme di formuleT ∪ {(††)}. Diremo che una formula α è una conseguenza della predicate circumscription di P1, ..., Pn in T se esoltanto se CIRCPR (T; P1, ..., Pn ) α, dove è la relazione di conseguenza logica della logica dei predicati del secondoordine classica.

Vediamo un semplice esempio. Consideriamo la seguente teoria:

T = {albino(Gigi)}.

Vogliamo circoscrivere il predicato albino in T. L'assioma di circumscription per T(albino) è il seguente:

(‡) ∀Φ (Φ(Gigi) ∧ ∀x(Φ(x) → albino(x)) → ∀x(albino(x) → Φ(x)),

(ottenuto sostituendo albino a P in (†), ed esplicitando ≤ in base alla definizione). Il nostro scopo è minimizzarel'estensione di albino in T; vogliamo cioè ottenere:

(‡‡) ∀x(albino(x) → x=Gigi).

In altri termini vogliamo assumere che il predicato albino risulti estensionalmente equivalente al predicato"essere Gigi" (in simboli, usando la λ-notazione5, λx.x=Gigi). Sostituendo λx.x=Gigi al posto di Φ in (‡), otteniamo:

(‡‡‡) (Gigi=Gigi ∧ ∀x(x=Gigi → albino(x)) → ∀x(albino(x) → x=Gigi).

(‡‡‡) è chiaramente una conseguenza di (‡). D'altro canto,

(‡‡‡‡) Gigi=Gigi ∧ ∀x(x=Gigi → albino(x))

è una conseguenza classica (monotòna) di T. Poiché (‡‡) è una conseguenza classica del primo ordine di (‡‡‡) e di(‡‡‡‡), ne segue che:

CIRCPR (T;albino) = T ∪ {(‡)} (‡‡),

che è quanto si desiderava.McCarthy (1980) ha fornito un semantica in termini di teoria dei modelli per la predicate circumscription. Tale

semantica si base sul concetto di modello minimale di una teoria rispetto a un certo insieme di predicati. Introduciamo leseguenti definizioni.

5La λ-notazione è stata introdotta da Alonzo Church per eliminare un'ambiguità dell'usuale notazione matematicainerente le funzioni. Ad esempio, l'espressione sen(x) viene usata abitualmente in maniera ambigua, in quanto denotatalvolta la funzione seno (come nella frase "sen(x) è periodica"), talvolta un generico valore della funzione seno (comein "sen(x) è compreso fra 1 e -1"). Con la λ-notazione tale ambiguità viene risolta indicando con λx.sen(x) la funzione, eriservando sen(x) per il valore della funzione per l'argomento x. In logica, un'ambiguità simile sorge fra formule aperte epredicati. Ad esempio,

(*) cane(x) ∨ gatto(x)

può indicare sia una formula aperta con la variabile x libera, sia il predicato "essere un cane o un gatto". Utilizzando la λ-notazione, si usa (*) per indicare la formula, e si scrive λx.(cane(x) ∨ gatto(x)) per indicare il predicato.

Page 75: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

6

Definizione: sia T( P1,..., Pn ) una teoria del primo ordine, e siano M=(D,ϕ) e M'=(D',ϕ') due modelli diT( P1,..., Pn ). Sia inoltre P = ( P1,..., Pn ). Diremo che M' è un P -sottomodello di M della teoria T (in simboli: M'≤ P M),se e soltanto se:

(i) D' = D;(ii) ϕ'[ Pi ] ⊆ ϕ[ Pi ], per ogni i tale che 1 ≤ i ≤ n;(iii) ϕ'[K]=ϕ[K] per ogni costante (predicativa, funzionale o individuale) del linguaggio di T che non siaun membro di P .

Definizione: diciamo che M è un modello P -minimale di T se e soltanto se ogni modello di T che è un P -sottomodello di M è identico a M.

Si può dimostrare allora il seguente:

Teorema: per ogni teoria T e per ogni ennupla P di costanti predicative del linguaggio di T, i modelli diCIRCPR(T; P ) sono tutti e soli i modelli P -minimali di T.

La semantica dei modelli minimali cattura appunto l'intuizione che i modelli della circumscription di una teoriaT( P1, ..., Pn ) siano quei modelli di T in cui i predicati P1, ..., Pn abbiano la più piccola estensione possibile.

Sin qui abbiamo dato per la circumscription una definizione di conseguenza semantica, senza specificare unconcetto corrispondente di derivazione sintattica. Il punto è che, come è ben noto, per la logica dei predicati del secondoordine non è in generale disponibile una teoria della dimostrazione completa, e questo rende problematica unacaratterizzazione a livello sintattico della circumscription. Nella formulazione originaria della predicatecircumscription, McCarthy evitava il problema sostituendo all'assioma del secondo ordine (††) uno schema di assiomidel primo ordine (††'). (††') si ottiene eliminando la quantificazione universale sulle variabili predicative da (††). Seindichiamo con CS(††') l'insieme delle formule (del primo ordine) che si ottengono sostituendo in maniera appropriatain (††') espressioni predicative esprimibili al primo ordine alle variabili Φ1, ..., Φn , allora si possono definire i teoremidella circumscription dei predicati P1, ..., Pn nella teoria T come quelle formula α tali che:

T ∪ CS(††') α,

dove è la relazione di derivabilità del calcolo dei predicati del primo ordine classico. Il problema è che questaformulazione è meno potente di quella che utilizza un assioma del secondo ordine. Infatti, in (††) si quantifica su tutti ipredicati, mentre con (††') si catturano solo quei predicati che sono esprimibili in un linguaggio del primo ordine, e chesono, come è noto, un sottoinsieme proprio dei primi. Di conseguenza, la formulazione al primo ordine della predicatecircumscription è corretta ma non completa rispetto alla semantica dei modelli minimali. E' tuttavia possibile definireuna semantica rispetto alla quale la predicate circumscription al primo ordine sia corretta e completa. Tale semantica èbasata sul concetto di modelli minimali deboli (weakly minimal model) (Besnard et al. 1989). In generale, questo tipo diproblemi si ripropone per tutte le forme più potenti di circumscription che vedremo in seguito, e il problema diindividuare forme di circumscription esprimibili al primo ordine è uno fra i più studiati in letteratura.

La predicate circumscription è la forma più semplice e meno potente di circumscription. In particolare, non èabbastanza potente per trattare regole non monotòne formulate per mezzo di predicati di abnormality (cfr. ad es.Etherington et al. 1985). Il problema è che nella predicate circumscription soltanto ai predicati che vengono minimizzatiè consentito variare la propria estensione durante il processo di minimalizzazione. Viceversa, minimizzando il predicatoab in una regola come:

∀x(uccello(x) ∧ ¬ab(x) → vola(x)),

si vuole che anche il predicato vola cambi la propria estensione (l'idea intuitiva è che quanti meno sono gli uccelliabnormal, tanti più saranno gli uccelli in grado di volare). Ma questo non è possibile in predicate circumscription. Siconsideri ad esempio la teoria:

T = {∀x (uccello(x) ∧ ¬ ab(x) → vola(x)), uccello(Tweety)}.

La predicate circumscription di T(ab) si ottiene aggiungendo a T il seguente assioma:

(§) ∀Φ (uccello(Tweety) ∧ ∀x(uccello(x) ∧ ¬Φ(x) → vola(x)) ∧ Φ≤ab → ab≤Φ).

Page 76: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

7

Si vorrebbe che ab avesse estensione nulla, ossia si vorrebbe sostituire a Φ il predicato λx.false. Sostituendo però λx.false al posto di ab in (§) si ottiene:

(§ §) uccello(Tweety) ∧ ∀x(uccello(x)→vola(x)) ∧ ∀x(false→ab(x)) → ∀x(ab(x)→false);

ma (§ §) non consente di ottenere ∀x(ab(x) → false). In particolare, non si può usare lo stesso tipo di ragionamentousato nell'esempio precedente: l'antecedente di (§ §) non segue da T (in quanto da T non segue ∀x(uccello(x) →vola(x))).

Che la predicate circumscription non consenta di ottenere i risultati voluti nel caso della teoria T è chiaroragionando dal punto di vista semantico. Si consideri una interpretazione M=(D,ϕ), in cui D={Tweety}, e in cui siabbia: ϕ[Tweety]=Tweety, ϕ[uccello]=ϕ[ab]={Tweety} e ϕ[vola]=∅. M è certamente un modello di T. Il punto è che, inbase alla definizione data sopra, M è anche un modello ab-minimale di T. Non si può infatti ridurre l'estensione di ablasciando intatta l'estensione di tutti gli altri predicati (in particolare di vola). Quindi, poiché esiste un modello ab-minimale di T in cui vola(Tweety) è falsa, vola(Tweety) non segue da CIRCPR (T;ab). Il problema è appunto che lapredicate circumscription non consente di modificare l'estensione di alcun altro predicato eccetto ab.

In casi di questo genere, per ottenere i risultati voluti è necessaria una forma di circumscription più potente, cheMcCarthy ha chiamato formula circumscription (McCarthy 1984). Ciò che caratterizza la formula circumscriptionrispetto alla predicate circumscription è appunto il fatto che nella formula circumscription si consente ad altri predicati,oltre a quelli che vengono minimizzati, di variare la propria estensione nel corso del processo di minimalizzazione.Nella esposizione seguente useremo una formulazione che si discosta per certi versi da quella originale di McCarthy, edè più vicina alla second order circumscription di Lifschitz (1985, 1986), la quale tuttavia risulta essere sostanzialmenteuna variante notazionale della formula circumscription originale.

Sia T( P1, ..., Pn , Q1, ..., Qm ) una teoria del primo ordine, dove ( P1, ..., Pn ) e (Q1, ..., Qm ) sono disgiunti. Sivogliono circoscrivere P1, ..., Pn lasciando Q1, ..., Qm liberi di variare durante il processo di minimalizzazione. Loschema di assiomi del secondo ordine che si deve aggiungere a T( P1, ..., Pn , Q1, ..., Qm ) per ottenerne la formulacircumscription è il seguente:

(¶) ∀Φ1, ..., Φn , Ψ1, ..., Ψm(T(Φ1, ..., Φn , Ψ1, ..., Ψm) ∧ Φ1≤ P1 ∧ ... ∧ Φn ≤ Pn→ P1≤Φ1 ∧ ... ∧ Pn ≤Φn ),

dove, analogamente a sopra, T(Φ1,...,Φn ,Ψ1,...,Ψm) è la formula ottenuta congiungendo tutti gli assiomi diT( P1,..., Pn ,Q1,...,Qm ) e sostituendovi rispettivamente tutte le occorrenze di P1, ..., Pn , Q1, ..., Qm con le variabilipredicative Φ1,...,Φn ,Ψ1,...,Ψm.

Chiameremo formula circumscription di P1,..., Pn in T con Q1,...,Qm variabili (in simboli:CIRCFC(T; P1,..., Pn ;Q1,...,Qm )) l'insieme di formule T ∪ {(¶)}. Diremo che una formula α è una conseguenza dellaformula circumscription di P1,..., Pn in T con Q1,...,Qm variabili se e soltanto se CIRCFC(T; P1,..., Pn ;Q1, ...,Qm ) α,dove è la relazione di conseguenza della logica dei predicati del secondo ordine classica.

Riprendiamo l'esempio di Tweety. Sia:

T = {∀x (uccello(x) ∧ ¬ ab(x) → vola(x)), uccello(Tweety)}.

Facendo la formula circumscription di ab in T con il predicato vola libero di variare, si risolve il problema visto inprecedenza. Si vuole che ab abbia estensione nulla. Questo può essere ottenuto sostituendo Φ con λx.false e Ψ con λx.uccello(x) nell'assioma di formula circumscription per T(ab;vola). Questa seconda sostituzione risolve i problemi chesorgevano con la predicate circumscription. In particolare, si avrà che:

CIRCFC(T;ab;vola) ∀x (ab(x) → false);CIRCFC(T;ab;vola) ¬ ab(Tweety);CIRCFC(T;ab;vola) vola(Tweety).

La semantica basata sui modelli minimali può essere estesa alla formula circumscription. E' sufficientemodificare le precedenti definizioni nel modo seguente.

Definizione: sia T( P1,..., Pn ,Q1,...,Qm ) una teoria del primo ordine, e siano M=(D,ϕ) e M'=(D',ϕ') due modelli diT( P1,..., Pn ,Q1,...,Qm ). Siano inoltre P = ( P1,..., Pn ) e Q = (Q1,..., Qm ). Diremo che M' è un ( P ; Q )-sottomodello di Mdella teoria T (in simboli: M'≤( ; )P Q M), se e soltanto se:

Page 77: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

8

(i) D' = D;(ii) ϕ'[ Pi ] ⊆ ϕ[ Pi ], per ogni i tale che 1 ≤ i ≤ n;(iii) ϕ'[K]=ϕ[K] per ogni costante (predicativa, funzionale o individuale) del linguaggio di T che non siaun membro di P o di Q .

Definizione: diciamo che M è un modello ( P ; Q )-minimale di T se e soltanto se ogni modello di T che è un ( P ;Q )-sottomodello di M è identico a M.

Si può dimostrare allora il seguente:

Teorema: per ogni teoria T e per ogni P , Q disgiunti, i modelli di CIRCFC(T; P ; Q ) sono tutti e soli i modelli( P ; Q )-minimali di T.

Anche la formula circumscription non risolve tuttavia tutti i problemi. Consideriamo una rete come quella in fig.6.2, da leggersi nel modo seguente: "gli uccelli, tipicamente, volano; gli struzzi sono uccelli; gli struzzi, tipicamente, nonvolano". Si vuole che il legame di tipo is not fra i concetti struzzo e vola venga letto come un arco che ammetteeccezioni. Si vuole cioè che si mantenga aperta la possibilità che esistano struzzi atipici in grado di volare. Tradurre talerete in calcolo dei predicati utilizzando la tecnica dei predicati di anormalità darà quindi luogo al seguente insieme diformule:

(i) ∀x (uccello(x) ∧ ¬ ab2(x) → vola(x))(ii) ∀x (struzzo(x) ∧ ¬ ab1(x) → ¬ vola(x))(iii) ∀(x) (struzzo(x) → uccello(x)).

Va notato innanzi tutto che nelle formule (i) e (ii), che traducono i due archi delle rete che ammettono eccezioni, sonostati utilizzati due predicati di abnormality distinti: ab1 e ab2. Questo è necessario per evitare conclusioni indesiderate:se in (i) e (ii) si fosse usato lo stesso predicato ab, aggiungendo la formula

(iv) struzzo(Fred)

si avrebbe avuto

(i) - (iv) ¬ ab(Fred) → vola(Fred) ∧ ¬ vola(Fred),

che non corrisponde certamente all'intuizione che si intendeva formalizzare.

fig. 6.2

Page 78: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

9

Sia dunque T = {(i), (ii), (iii), (iv)}. Minimizzare in T l'estensione di ab1 è in conflitto con la minimizzazione diab2. Assumere che ab1 abbia l'estensione vuota comporta che valga ab2(Fred), e viceversa. Quindi, praticando laformula circumscription di T(ab2 , ab1; vola), il massimo che si può ottenere è che:

¬ ab2(Fred) ∨ ¬ ab1(Fred);

cioè, per quanto riguarda la capacità di Fred di volare:

vola(Fred) ∨ ¬ vola(Fred),

che è certamente troppo poco. Intuitivamente, una rete come quella della fig. 6.2. avrebbe dovuto consentire di derivareche Fred, in quanto struzzo, in mancanza di informazioni più precise, non vola. Infatti, abbiamo visto che in questo tipodi reti si assume che le informazioni a carattere più specifico godano una sorta di "priorità" su quelle a carattere piùgenerale. Se Fred è una struzzo, e se gli struzzi di solito non volano, si vuole concludere, in assenza di altreinformazioni, che Fred non vola, in quanto l'informazione che Fred è uno struzzo dice qualcosa di più rispettoall'informazione che Fred è genericamente un uccello.

Per risolvere questo tipo di problemi mediante la circumscription, Vladimir Lifschitz ha introdotto una tecnica, laprioritized circumscription (Lifschitz 1985, 1986) che consente appunto di istituire un ordine di priorità nelcircoscrivere i predicati di una teoria.

Consideriamo il caso più semplice, in cui in una teoria T( P1, P2 ; S) si abbiano due soli predicati da circoscrivere,P1 e P2 , e si intenda circoscrivere P1 con priorità su P2 . Come nella formula circumscription, si vuol lasciare ilpredicato S libero di variare durante il processo di minimalizzazione.

E' necessario innanzi tutto introdurre una relazione d'ordine fra predicati più complessa della relazione ≤utilizzata fino a ora. Sia ≤≤ una relazione fra coppie di predicati definita come segue:

(U1 ,U2 ) ≤≤ (V1,V2) =def U1 ≤ V1 ∧ (U1 = V1 → U2 ≤ V2).

Si noti che (U1 ,U2 ) ≤≤ (V1,V2) non comporta che si abbia U2 ≤ V2. Questo vale soltanto nel caso che U1 = V1.Per ottenere la prioritized circumscription di T( P1, P2 ;S) con priorità di P1 su P2 e S variabile (che indicheremo

con CIRCPC(T; P1> P2 ;S)) si aggiunge a T il seguente assioma del secondo ordine:

(PC) ∀Φ1,Φ2 ,Ψ (T(Φ1,Φ2 ,Ψ) ∧ (Φ1,Φ2 ) ≤≤ ( P1, P2 ) → ( P1, P2 ) ≤≤ (Φ1,Φ2 )).

Sia CIRCPC(T; P1> P2 ;S) l'unione degli assiomi di T con (PC).Vediamo ora come la prioritized circumscription possa risolvere il problema dell'esempio visto sopra. Di nuovo,

sia T={(i)-(iv)}. Per ottenere CIRCPC(T;ab1>ab2;vola) si aggiunge a T lo schema di assiomi (PC) in cui P1 e P2 sonorispettivamente ab1 e ab2. Per ottenere i risultati voluti si devono praticare le seguenti sostituzioni delle variabilipredicative. Si deve sostituire λx.false a Φ1, λx.struzzo(x) a Φ2 e λx.uccello(x) ∧ ¬struzzo(x) a Ψ. E' facile constatareche tali sostituzioni risultano consistenti in T. Inoltre, in base alla definizione di ≤≤, si ha che:

(λx.false, λx.struzzo(x)) ≤≤ (ab1, ab2).

Si ha quindi che:

CIRCPC(T;ab1>ab2;vola) (ab1,ab2)≤≤(λx.false, λx.struzzo(x));

cioè, in base alla definizione di ≤≤:

CIRCPC(T;ab1>ab2;vola) ab1 ≤ λx.false ∧ (ab1=λx.false) → (ab2 ≤ λx.struzzo(x)).

Si ha quindi che:

CIRCPC(T;ab1>ab2;vola) ∀x ¬(ab1(x));

e quindi:

CIRCPC(T;ab1>ab2;vola) ¬ vola(Fred).

Page 79: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

10

D'altra parte:

CIRCPC(T;ab1>ab2;vola) ∀(x) (ab2(x) ↔ struzzo(x));

da (i) non segue quindi che vola(Fred).L'assioma (PC) può essere generalizzato a un assioma di prioritized circumscription (PC') che consenta di

circoscrivere un numero qualsiasi di predicati. Qui, per brevità, non definiremo (PC'), limitandoci a dare lacaratterizzazione semantica della prioritized circumscription nel caso più generale. Sia T una teoria del primo ordine, esiano P1 ,..., P n ,Q insiemi ordinati disgiunti di costanti predicative del linguaggio di T. Indicheremo conCIRCPC(T; P1>... > P n ;Q ) la prioritized circumscription di P1 ,..., P n con i predicati Q liberi di variare, e con prioritàdi Pi su Pi 1+ per ogni i tale che 1≤i<n-1. Analogamente agli altri tipi di circumscription, CIRCPC(T; P1>...> P n ;Q )sarà ottenuta aggiungendo l'assioma (PC') agli assiomi della teoria T. Le conseguenze della prioritized circumscriptiondi (T; P1>...> P n ;Q ) sono tutte e sole le formule che seguono da CIRCPC(T; P1>...> P n ;Q ) in base alla relazione diconseguenza logica classica per la logica del secondo ordine.

La semantica della prioritized circumscription può essere sviluppata generalizzando ulteriormente la semanticadei modelli minimali nella maniera seguente:

Definizione: siano P1 ,..., P n , Q insiemi ordinati disgiunti di costanti predicative del linguaggio di una teoria T.Siano M = (D, ϕ) e M' = (D', ϕ') due modelli di T. Diremo che M' è un ( P1>...> P n ;Q )-sottomodello di M (in simboli

M' ≤≤ > >( ... ; )P P Qn1M) se e soltanto se vale quanto segue:

(i) D' = D(ii) ϕ'[k] = ϕ[k] per ogni costante k non compresa in P1 , ..., P n , Q ;(iii) ϕ'[P] ⊆ ϕ[P] per ogni P ∈ P1 , e, per ogni 1<i≤n, se

ϕ'[P] = ϕ[P] per ogni P ∈ ( P1 ,..., Pi−1),allora

ϕ'[P] ⊆ ϕ[P] per ogni P ∈ Pi .

Definizione: Un modello M di T è ( P1>...> P n ;Q )-minimale se e soltanto se ogni modello di T che sia un( P1>...> P n ;Q )-sottomodello di M è identico a M.

Anche in questo caso si può dimostrare il seguente:

Teorema: per ogni teoria T e per ogni P1 ,..., P n ,Q disgiunti, i modelli di CIRCPC(T; P1>...> P n ;Q ) sono tutti esoli i modelli ( P1>...> P n ;Q )-minimali di T.

6.2 Altre logiche per il ragionamento non monotòno

In questo paragrafo daremo alcuni rapidi cenni a due approcci al ragionamento non monotòno diversi dallacircumscription, vale a dire la default logic e le logiche non monotòne modali. Assieme, circumscription, default logic elogiche modali non monotòne costituiscono un quadro abbastanza completo delle principali linee di ricerca sulragionamento non monotòno.

La default logic (Reiter 1980; Etherington 1988) è un sistema di logica non monotòna che si basa sull'estensionedell'apparato deduttivo di una teoria classica del primo ordine per mezzo di regole di inferenza non monotòne, dettedefault rule. Nella caso più generale, una default rule ha la forma seguente:

(R1) α : β β

γ , ... , 1 n

dove α, β1, ..., βn e γ sono formule del primo ordine classiche (aperte). Il significato intuitivo di una regola del genere è:se può essere derivato α, e se non è contraddittorio assumere che β1, ..., βn (cioè, se non possono essere derivate ¬β1,..., ¬βn ), allora si derivi γ. In una regola di default come (R1) α è detta il prerequisito, β1, ..., βn sono dette

Page 80: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

11

giustificazioni e γ il conseguente. Il fatto che gli uccelli tipici possono volare può essere espresso in default logic permezzo di una regola del genere:

(R2) uccello x vola xvola x( ) :

( ) ( )

che esprime appunto che si vuole assumere che un uccello voli a meno che non si disponga dell'evidenza esplicita delcontrario.

Una teoria di default (default theory) è una coppia ∆ = (D, W), dove D è un insieme di regole di default del tipodella (R1), e W è un insieme di formule del primo ordine. Intuitivamente, una formula è derivabile da una teoria didefault ∆ se è derivabile a partire dalle formule di W per mezzo delle regole di inferenza della logica classica e permezzo delle default rule in D. Il concetto di insieme di formule derivabili da una teoria di default può essereformalizzato per mezzo del concetto di estensione di una teoria di default. Una estensione E di una teoria ∆ = (D, W)6 èun insieme minimale di formule tale che:

1) W ⊆ E;2) E è chiuso rispetto alla deduzione classica;3) E rispetta le regole in D, cioè, per ogni regola (R1) in D, se α ∈ E, e se ¬β1,...,¬βn ∉ E, allora γ ∈ E.

Vi sono casi in cui una teoria di default ammette più di un'estensione. Consideriamo tuttavia un semplice esempio in cuil'estensione è unica. L'insieme D abbia come unico elemento la regola (R2) sopra riportata, e si abbia:

W = {uccello(Tweety), ∀x(pinguino(x) → ¬ vola(x)}.

Poiché dalle formule di W non è possibile derivare ¬vola(Tweety), allora, in base alla regola (R2), all'estensione diquesta teoria appartiene la formula vola(Tweety). Aggiungendo tuttavia a W la premessa pinguino(Tweety), allora èpossibile derivare ¬ vola(Tweety), e l'inferenza di vola(Tweety) mediante (R2) viene bloccata.

Storicamente, la default logic è stata la prima logica non monotòna utilizzata per ridurre alla logica le retisemantiche che ammettono eccezioni all'ereditarietà. Etherington e Reiter (1983) e Reiter e Criscuolo (1980, 1983)propongono una traduzione in default logic delle reti semantiche tipo NETL. In base a tale traduzione, gli archi di tipoisa e di tipo is not che ammettono eccezioni vengono tradotti mediante regole di default (mentre la traduzione degliarchi che non ammettono eccezioni consiste di formule della logica del primo ordine) (si veda anche Etheringthon 1988,cap. 4). Si consideri ad esempio il "rombo di Nixon" (fig. 4.9). L'arco fra quacchero e pacifista e quello frarepubblicano e pacifista vengono tradotti rispettivamente mediante le due regole seguenti:

(Nix1) quacchero x pacifista xpacifista x

( ) : ( )

( )

e

(Nix2) repubblicano x pacifista xpacifista x

( ) : ( )

¬¬

( )

mentre gli archi isa dal nodo Nixon ai concetti quacchero e repubblicano corrispondono rispettivamente alle formule:

(Nix3) quacchero(Nixon)e

(Nix4) repubblicano(Nixon).

Si noti che la default theory che ne deriva, in cui D = {(Nix1), (Nix2)} e W = {(Nix3), (Nix4)}, ammette due estensioni,una che comprende pacifista(Nixon), e un'altra che comprende ¬ pacifista(Nixon). Quale sia l'estensione ottenutadipende dall'ordine in cui vengono applicati i default a partire dalle formule di W. Ciò è dovuto alla sostanzialeambiguità della rete della fig. 4.9. Se, d'altra parte, si volesse che, ad esempio, le tendenze repubblicane prevalessero suquelle quacchere, basterebbe sostituire a (Nix1) la seguente regola di default, più debole:

(Nix1') quacchero x pacifista x repubblicano xpacifista x

( ) : ( )

( ) ( )∧ ¬ ,

6La presente definizione di estensione si applica a teorie di default chiuse, in cui cioè prerequisiti, giustificazioni econseguenti di tutte le regole di default non contengono alcuna variabile libera. Per applicare la definizione a teorie checomprendono regole in cui compaiono variabili libere (come ad esempio la regola R2), tali regole devono essereconsiderate schemi, che devono essere rimpiazzate da tutte le loro possibili istanziazioni.

Page 81: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

12

che fa si che, in mancanza di informazioni più specifiche, venga preferita l'estensione che comprende ¬pacifista(Nixon).

Se si vuole tradurre in default logic la rete di fig. 6.2, l'arco fra struzzo e uccello, che non ammette eccezioni,viene tradotto con la formula:

(Bird1) ∀x (struzzo(x) → uccello(x)).

Gli archi che ammettono eccezioni vengono tradotti con regole di default. L'arco fra struzzo e vola corrisponde allaregola:

(Bird2) struzzo x vola xvola x

( ) : ( ) ( )¬

¬,

mentre l'arco fra uccello e vola viene tradotto dalla regola:

(Bird3) uccello x vola x struzzo xvola x

( ) : ( )

( ) ( )∧ ¬ .

Cioè, se qualcosa è un uccello, ed è consistente credere che voli e che non sia un struzzo, allora si assume che voli. Ilfatto che nella giustificazione vada specificato che sia consistente credere che non si tratta di uno struzzo, corrisponde,in un certo senso, alla necessità di circoscrivere ab1 con priorità su ab2 nel trattamento di questo stesso esempiomediante la prioritized circumscription. Se, invece di (Bird3), si utilizzasse infatti la regola:

(Bird3') uccello x vola xvola x( ) :

( ) ( ) .

Non si otterrebbero le conseguenze volute. Infatti, una teoria di default che avesse D = {(Bird2), (Bird3')} e W ={(Bird1), struzzo(Tweety)}, ammetterebbe due estensioni, una con vola(Tweety), e l'altra con ¬ vola(Tweety).

Un ulteriore approccio al problema dell'inferenza non monotòna è costituito dalle logiche non monotòne modali.In tali logiche il linguaggio viene esteso mediante opportuni operatori modali che esprimono che una certa informazioneè creduta, o che è consistente con le credenze del soggetto epistemico rappresentato. Questa linea di ricerca è statainaugurata dalla non monotonic logic di McDermott e Doyle (McDermott e Doyle 1980; McDermott 1982). La logicaautoepistemica è una logica modale elaborata da Moore (1985) a partire dal lavoro di McDermott e Doyle, ed è stata lalogica più ricca di sviluppi in questa tradizione7. Il linguaggio della logica autoepistemica comprende un operatoremodale L il cui significato inteso è "è creduto che ...". Lo scopo è quello di costruire un modello logico di un agenteepistemico che ragioni introspettivamente sulle proprie credenze. Una teoria in logica autoepistemica rappresental'insieme delle credenze di un tale agente. Se una formula α segue dalla teoria, allora α è una delle credenze dell'agenteepistemico. Per quanto riguarda le formule modali, il significato intuitivo di una formula del tipo Lα è che l'agentecrede di sé stesso di credere α. Per cui, se una certa formula α è derivabile dalla teoria, allora l'agente introspettivamenteinferisce di credere α (inferisce cioè che valga Lα). L'aspetto non monotòno della logica autoepistemica deriva dal fattodi supporre inoltre che le formule derivabili dalla teoria costituiscano tutto ciò che l'agente crede. Quindi, se unaformula α non è derivabile, si assume che l'agente introspettivamente inferisca di non credere α (derivando ¬Lα).Questa, ovviamente, è una forma di inferenza non monotòna: se supponiamo di aggiungere α alla base di conoscenza,non deve più essere possibile ottenere ¬Lα. Questa idea intuitiva viene formalizzata per mezzo del concetto diespansione stabile (stable expansion) di un insieme di formule T. Dato T, l'espansione stabile di T è l'insieme delleconseguenze logiche classiche del seguente insieme di formule:

T ∪ {Lα | α ∈ T} ∪ {¬Lα | α ∉ T}.

Alla logica autoepistemica è possibile associare una semantica a mondi possibili basata su strutture di Kripke.In logica autoepistemica l'equivalente di una regola di default come (R2) è dato dalla formula:

(6) α ∧ ¬ L ¬β1 ∧ ... ∧ ¬ L ¬βn → γ,

7Su logica autoepistemica e sistemi non monotòni modali si vedano anche (Halpern e Moses 1984a) e (Levesque 1990).

Page 82: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

13

che può essere letta come segue: "se α, e se non sono credute le negazioni di β1, ... βn , allora γ". Il fatto che gli uccelli,salvo informazioni contrarie, volino, può essere formalizzato come segue:

(7) uccello(x) ∧ ¬ L ¬vola(x) → vola(x).

E' importante notare che in logica autoepistemica le regole di default vengono espresse come formule del linguaggio, enon come regole di inferenza metateoriche come accade in default logic. Questo consente ad esempio di esprimeredefault che vertono su altri default mediante iterazione dell'operatore L, il che non è possibile in default logic. Adesempio l'equivalente di formule come:

¬LL¬α¬L¬ (¬L¬α → β)

non è esprimibile direttamente nella logica di default. Sull'uso della logica autoepistemica per tradurre reti semantichecon eccezioni si veda Gelfond e Przymusinka (1989). Altri lavori sulla formalizzazione delle reti con eccezioni in logicanon monotòna sono ad esempio (Doherty 1989) e (Gregoire 1989).

6.3 Semantica preferenziale delle logiche non monotòne

Esistono varie relazioni fra i diversi tipi di logica non monotòna, e vari risultati di equivalenza sono statidimostrati, sui quali qui non ci soffermeremo8. E' tuttavia interessante ai nostri scopi prendere in considerazione laproposta di Shoham (1987, 1988), che ha elaborato un quadro generale di tipo semantico allo scopo di offrire unavisione unitaria del ragionamento non monòtono, in maniera da ricondurvi e da generalizzare le logiche non monotòneesistenti9. La proposta di Shoham si basa sul concetto di modello preferito (preferred model). Dal punto di vistaintuitivo, l'idea di fondo è che, ragionando in maniera non monotòna, si prende in considerazione soltanto unsottoinsieme dei modelli della teoria, quelli che godono di alcune caratteristiche particolari, che sono cioè "preferiti"sotto qualche punto di vista. Ciò è evidente nella circumscription, dove sono preferiti quei modelli in cui i predicati dacircoscrivere hanno estensione minore. Di fatto, la teoria di Shoham nasce proprio come una generalizzazione dellasemantica dei modelli minimali di McCarthy per la circumscription. Criteri di preferenza diversi danno origine a logichenon monotòne diverse. La teoria che ne risulta viene detta teoria della semantica preferenziale (preferential semantics).In generale, il motivo per cui restringendosi a un sottoinsieme di modelli preferiti di una teoria si ottengano conseguenzenon monotòne è semplice. Siano ∆ e Γ insiemi di formule. In logica monotòna, una formula α segue da ∆ se e soltantose α è vera in tutti i modelli di ∆. Poiché tutti i modelli di ∆ ∪ Γ sono anche modelli di ∆, allora, se α segue da ∆, αsegue anche da ∆ ∪ Γ. In una logica non monotòna, α segue (non monotonicamente) da ∆ se e soltanto se α è vera intutti i modelli preferiti di ∆. Ma nulla ci assicura che i modelli preferiti di ∆ ∪ Γ siano un sottoinsieme dei modellipreferiti di ∆. Quindi non è detto che α segua da ∆ ∪ Γ.

Shoham formula la sua teoria in termini molto generali. Sia L una logica standard. Per logica standard Shohamintende una logica monotòna classica, ad esempio la logica proposizionale o la logica dei predicati del primo ordine,oppure una logica modale, proposizionale o predicativa. Si ottiene una logica non monotòna a partire da L definendo unordinamento di preferenza sulle interpretazioni di L. Per interpretazione Shoham intende "qualunque cosa che stia allasinistra di ", dove è l'usuale simbolo di conseguenza semantica. Quindi, si deve intendere come interpretazione siauna interpretazione in senso stretto (ad esempio, una interpretazione tarskiana per la logica del primo ordine), sia, adesempio, nel caso di una logica modale, una coppia (I,w), dove I è una struttura di Kripke e w è un mondo possibile.Questo consente, ad esempio, di ricondurre al quadro della semantica preferenziale anche le logiche autoepistemiche,che come abbiamo visto, si basano su un linguaggio modale e hanno una semantica a mondi possibili. Sia dunque p unordinamento parziale stretto definito sulle interpretazioni di L, e M1 e M2 siano interpretazioni di L. M M1 2p

significa che M2 è preferita rispetto a M1 . L assieme a p definiscono una nuova logica preferenziale Lp . Siano α e βformule del linguaggio di L. I concetti di soddisfazione e di conseguenza logica per Lp sono definiti come segue.

Definizione: un'interpretazione M soddisfa preferenzialmente α (in simboli, M p α) se M α, e se non esistenessuna altra interpretazione M' tale che MpM' e M' α. In tal caso si dice che M è un modello preferito di α.

Definizione: β è conseguenza preferenziale di α (in simboli, α p β) se, per ogni interpretazione M, se M p α, allora M β (o, in altri termini, se i modelli di β, preferiti o meno, sono un soprainsieme dei modelli preferiti di α).

8Si vedano ad esempio (Imielinsky 1987), (Etherington 1987), (Konolige 1988, 1989).9Si veda anche (Lin e Shoham 1992).

Page 83: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 6

14

E' agevole constatare che i vari tipi di circumscription risultano casi particolari di logica preferenziale ottenuti apartire dalla logica dei predicati del primo ordine. Le relazioni di ordinamento fra i modelli introdotte dalla semanticadei modelli minimali possono essere viste come relazioni di preferenza in una semantica preferenziale. Shoham adesempio fornisce la seguente definizione di preferenza per la predicate circumscription. Fare la predicatecircumscription di un predicato P ad un argomento significa adottare un ordinamento per cui si ha M M1 2p se:

1) M1 e M2 coincidono per l'interpretazione delle costanti diverse da P;2) per ogni x, se M2 P(x), allora M1 P(x);3) esiste un y tale che M1 P(y) ma M2 P(y).

E' facile constatare che tale definizione è sostanzialmente equivalente a quella di McCarthy data in precedenza. Oltreche alla circumscription, la semantica preferenziale è stata applicata ad altri sistemi non monotòni, fra cui la logicaautoepistemica e la default logic (si veda anche Lin e Shoham 1990).

Page 84: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

7. Rappresentazione dei concetti lessicali: nient'altro che postulati di significato?7.1 Frame, reti semantiche e logica: la "Tesi di Hayes"

I due capitoli precedenti sono stati sviluppati seguendo le indicazioni fornite da Hayes (cfr. par. 4.5), nellaprospettiva cioè che i frame e le reti semantiche possano essere ricondotti a varianti notazionali di formalismi di tipologico. In realtà la situazione è per molti versi più complicata di quanto possa apparire dalle pagine precedenti. Adesempio, anche considerando reti semantiche completamente monotòne, che cioè non ammettono eccezioniall'ereditarietà, una traduzione in logica classica del primo ordine come quella che abbiamo applicato alle retisemantiche ad ereditarietà strutturata non sempre è del tutto adeguata. Thomason, Horty e Touretzky (1986 e 1987)mettono in luce i problemi che possono nascere nella traduzione logica di reti monotòne che ammettono archi di tipo isnot qualora si prendano in considerazioni reti inconsistenti. Si consideri una rete come quella di fig. 7.1. Assumiamo chenessuno degli archi della rete ammetta eccezioni. Questa rete è inconsistente in quanto il concetto B è collegato alconcetto C sia da un arco di tipo isa che da un arco di tipo is not. Quindi, ad esempio, l'individuo a risulta sia essere chenon essere un'istanza di C. Se si traduce in maniera usuale questa rete in calcolo dei predicati classico, si ottiene ilseguente insieme di formule:

B(a)∀x(B(x) → D(x))∀x(E(x) → D(x))∀x(B(x) → C(x))∀x(B(x) → ¬C(x)).

Come previsto, da tale insieme di formule segue questa contraddizione:

C(a) ∧ ¬C(a).

Tuttavia, il fatto che questo insieme di formule sia contraddittorio comporta anche che da esso segua qualsiasi formula,ad esempio:

¬D(a)E(a).

Ma questo non è quanto accade nella rete semantica. Se si utilizzano le usuali tecniche inferenziali definite su questotipo di reti, sebbene nella rete sia presente un'inconsistenza non è possibile individuare un percorso di archi isa dal nodoa al nodo E (il che permetterebbe di concludere che a è un E), né è possibile inferire che a non sia un D. La retesemantica quindi, al contrario della sua traduzione in calcolo dei predicati classico, "localizza" l'inconsistenza, evitandoche l'intera base di conoscenza collassi e consenta di derivare qualsiasi cosa. Al fine di conservare queste caratteristiche,Thomason, Horty e Touretzky abbandonano la logica classica e propongono di utilizzare una logica paraconsistente: latraduzione da loro proposta è basata su una logica della rilevanza a quattro valori (Belnap 1975, 1977). In base a talelogica un enunciato può risultare vero, falso, sia vero che falso, oppure né vero né falso. Questo consente di far sì che,ad esempio, una formula come α ∧ ¬α → β non risulti valida, e che quindi una contraddizione non banalizzi la teoria1.Altrove (Thomason e Horty 1988) viene proposta un'estensione non monotòna di questa logica (basata sull'aggiunta diun operatore modale di tipo autoepistemico) che consente di trattare anche alcuni tipi di reti che ammettono eccezioni.E' interessante notare come questo tipo di logica a quattro valori sia stata utilizzata anche da Patel-Schneider (1989a)per fornire una semantica ai linguaggi terminologici alternativa a quella tarskiana classica. Le motivazioni di Patel-Schneider sono differenti da quelle di Thomason, Horty e Touretzky, e sono basate su esigenze di trattabilitàcomputazionale. Nel par. 5.3 abbiamo visto che i linguaggi terminologici pongono seri problemi di trattabilità, e che,per i linguaggi basati sulla semantica tarskiana classica, due alternative possibili sono o utilizzare linguaggiespressivamente molto poveri, oppure rinunciare alla possibilità di disporre di algoritmi completi per il calcolo dellasussunzione. Poiché le logiche basate sulla semantica a quattro valori di Belnap godono di migliori proprietà dal puntodi vista computazionale, Patel-Schneider propone come terza alternativa quella di interpretare le logiche terminologicheutilizzando una semantica di questo genere, rispetto alla quale è possibile disporre di algoritmi completi e trattabili per ilcalcolo della sussunzione anche in linguaggi espressivamente più ricchi. La proposta di Patel-Schneider prende origine asua volta dalla proposta di Levesque (1984a, 1984b), che esamineremo in dettaglio nel capitolo 10, in cui una logicadella rilevanza basata su una semantica a quattro valori viene utilizzata per definire una logica proposizionale dellacredenza che non soffra del problema dell'onniscienza logica. In (Patel-Schneider 1990) lo stesso tipo di semantica

1Nel capitolo 10 prenderemo in considerazione questo tipo di logica in maniera più approfondita nell'ambito di uncontesto differente.

Page 85: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

2

viene utilizzato per definire una logica del primo ordine decidibile. Tutte queste ricerche si collocano quindi nellaprospettiva di individuare logiche che modellino le prestazioni di soggetti razionali che dispongano di capacitàinferenziali più "limitate" rispetto a quelle presupposte dalla logica classica, problema che riprenderemo più volte nelseguito di questo lavoro.

fig. 7.1

In generale, il fatto che frame e reti semantiche siano in linea di massima riconducibili a formalismi di tipo logiconon significa che si possa affermare che essi non siano niente altro che una notazione alternativa per qualche tipo dilogica. In realtà in questi sistemi vi sono elementi che le varie trattazioni logiche non riescono a catturare. Un esempio ècostituito da vari aspetti del collegamento procedurale nei frame. In certi casi, le procedure collegate agli slot di unframe possono essere ricondotte a regole di deduzione specifiche, o ad assiomi. E' il caso ad esempio della procedura ifneeded associata allo slot antenato del frame persona nel par. 4.3. Essa è equivalente alle due formule seguenti delcalcolo dei predicati del primo ordine:

∀x,y (persona(x) ∧ genitore(x,y) → antenato(x,y))∀x,y,z (persona(x) ∧ antenato(x,y) ∧ genitore(y,z) → antenato(x,z)).

Se tuttavia col collegamento procedurale si assume che agli slot dei frame possano essere associati frammenti diprogramma e procedure qualunque, che possono manipolare arbitrariamente la base di conoscenza, allora un trattamentodi tipo logico del collegamento procedurale risulterebbe impossibile. Il problema è che vi sono elementi di questo tipodi formalismi che sfuggono a un trattamento di tipo logico in quanto sono definiti in maniera decisamente vaga e pocoprecisa.

Si sarebbe allora tentati di dire che frame e reti semantiche sono riconducibili alla logica nella misura in cui sonodefiniti chiaramente. Il rischio di un affermazione del genere è che essa risulti puramente circolare e tautologica: che siconsiderino cioè definite chiaramente tutte e sole quelle caratteristiche che, di fatto, possono essere ricondotte a untrattamento di tipo logico. Che però non si tratti di una tautologia è dimostrato dal fatto che tale affermazione potrebbeanche risultare falsa. Esistono cioè aspetti dei formalismi a rete semantica il cui trattamento logico pone dei problemi,ma che risultano "definiti chiaramente", nella misura in cui è stato possibile affrontarli con strumenti formali rigorosi dialtro tipo. L'esempio cui ci riferiamo è costituito da alcuni aspetti dell'ereditarietà con eccezioni e del path basedreasoning, che risultano di difficile trattamento in logica, ma che sono stati formalizzati in maniera soddisfacenteutilizzando strumenti di tipo algebrico2. Vediamo in che cosa consiste il problema. Nel capitolo precedente abbiamovisto che è possibile tradurre una tassonomia con eccezioni in una logica non monotòna. Tuttavia vi è una profondadifferenza fra il tipo di traduzione in calcolo dei predicati di reti monotòne, come quelle di KL-ONE, e la traduzione inlogica non monotòna delle reti con eccezioni. Una rete KL-ONE ammette una traduzione logica di tipo locale, in cuiogni costrutto della rete viene fatto corrispondere ad una o più formule del calcolo dei predicati in maniera indipendentedal contesto. Quando si traduce in logica, poniamo, un arco di superconcetto, non è necessario esaminare l'intera rete incui esso compare per trovare la formula equivalente. Questo è invece necessario per la traduzione in logica nonmonotòna di una rete con eccezioni. Usando la terminologia di Thomason, le traduzioni in logica non monotòna delle 2Si veda (Touretzky 1986), e, per una rassegna recente, (Thomason 1992).

Page 86: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

3

reti semantiche con eccezioni non sono modulari (Thomason 1992, Thomason e Horty 1988). Si consideri la traduzionein default logic della rete di fig. 6.2. La regola di default che traduce l'arco isa fra uccello e vola deve tenere conto diuna proprietà globale della rete, ossia del fatto che nella rete sono rappresentati gli struzzi, che sono uccelli ma nonvolano. In generale, tutte le possibili eccezioni a un arco isa che sono rappresentate nella rete devono essere elencateesplicitamente fra le giustificazioni della regola corrispondente. Nel caso della circumscription, si pone il problemaanalogo di introdurre esplicitamente un ordine di priorità nel circoscrivere i predicati di abnormality. Viceversa, "isistemi ad ereditarietà usano l'ordinamento gerarchico per controllare implicitamente le inferenze" (Touretzky 1986, p.20). Il fatto che la traduzione di ogni arco dipenda dal contesto dell'intera rete comporta anche che, ogni qual volta siaggiorni la base di conoscenza aggiungendo un nuovo arco alla rete, non basti aggiungere alla traduzione della reteprecedente la traduzione del nuovo arco, ma che si debba rivedere l'intera traduzione.

Il fatto che vi siano aspetti "ben definiti" dell'ereditarietà che pure sfuggono in parte ad un trattamento di tipologico non esclude ovviamente che un tale trattamento sia in linea di principio impossibile, e ricerche sull'argomentosono attualmente in corso. Un caso per certi versi analogo ha a che fare con il frame problem e con il ragionamento nonmonotòno sul tempo e sugli eventi. Il problema delle reti con eccezioni consiste nel fatto che una traduzione puramentelocale in logica non monotòna (ad esempio una traduzione in default logic della rete di fig. 6.2 che utilizzasse la regola(Bird3') anziché la regola (Bird3) del par. 6.2) genererebbe più estensioni di quelle che si vorrebbero (nel caso delladefault logic), oppure (nel caso della circumscription) ammetterebbe più modelli minimali che non quelli checorrispondono alle conseguenze intuitive che si vorrebbero trarre. Anche nel caso del ragionamento sugli eventi ilproblema è che le teorie non monotòne possono non produrre le conseguenze volute, o che, in altri termini, fra i modelliminimali di una teoria ve ne sono alcuni che non corrispondono alle intuizioni che si vorrebbero formalizzare. Adesempio, parlando di logiche non monotòne e di ragionamento temporale, McDermott afferma:

Il problema di tutte le logiche è che concetti come "minimizzazione" o "insieme stabile dicredenze" non sono appropriati per il dominio temporale. La regola non monotòna che avremmo volutoera (in termini informali) "gli stati del mondo tendono a rimanere indisturbati". Tutte le logiche traggonoconclusioni che minimizzano le perturbazioni, ma questo non era ciò che volevamo davvero. Piuttosto,volevamo evitare perturbazioni con cause ignote. Quello che stiamo cercando di affermare è che una"storia" continua a meno che non sia esplicitamente "interrotta" da eventi successivi. Si consideri questasequenza di eventi:

1. Fred è nato. Fred comincia ad essere VIVO.2. Una pistola è stata caricata. La pistola comincia ad essere CARICA.3. A Fred viene sparato con quella pistola. Fred diventa MORTO.

Vorremmo essere in grado di concludere che ora Fred è morto (scusate per la violenza). Ma un altroscenario minimizzerebbe le perturbazioni in modo altrettanto efficace. In esso, la pistola cesserebbe deessere carica prima dell'evento 3, senza alcuna ragione particolare eccetto quella di non disturbare il fattoche Fred è vivo. (McDermott 1987, p. 156).

Questo problema è noto in letteratura col nome di Yale shooting problem (si veda ad esempio Hanks e McDermott 1987e Brewka 1991). In questo esempio vi sono due modelli minimali (o due estensioni, o due punti fissi), uno in cui Fred èvivo e uno in cui Fred è morto. Si considerino ad esempio le seguenti regole, formulate in maniera informale nei terminidi predicati di abnormality, come nella circumscription:

a) "se qualcuno nasce, e non accade nulla di anomalo, allora resta vivo"b) "se una pistola viene caricata, e non accade nulla di anomalo, allora resta carica"c) "se sparano a qualcuno, e non accade nulla di anomalo, allora quello muore".

Il problema è che vi sono dei conflitti fra la minimalizzazione dei predicati di anormalità in a), b) e c). Se vieneminimizzata l'anormalità in c), allora si ottiene la risposta voluta. Ma vi sono modelli minimali in cui viene resaminimale l'anormalità in a), introducendo un evento anomalo in b) che ha l'effetto di rendere scarica la pistola prima chesi spari a Fred. Bisogna quindi individuare dei criteri per scegliere quei modelli minimali che corrispondono alleintuizioni che si intendono formalizzare, e scartare gli altri. Una soluzione si basa su una versione della circumscriptiondetta pointwise circumscription3 (Lifschitz 1987), mediante la quale è possibile individuare i modelli desiderati. Ilproblema è che, in pratica, si ha l'impressione che con la pointwise circumscription solo conoscendo già la soluzionedesiderata si possano introdurre gli assiomi di circumscription adatti alla circostanza, per cui questi ultimi nonaggiungono alcuna nuova informazione: "Non possiamo mai ottenere dalla circumscription di più di quanto già

3Un'altra soluzione proposta è quella basata sulla teoria della ignoranza cronologica (chronological ignorance)(Shoham 1988).

Page 87: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

4

sapessimo, e, se non lo facciamo nel modo giusto, possiamo ottenere molto meno ancora" (Hanks e McDermott 1987, p.409). Una soluzione di tipo diverso era stata sviluppata nell'ambito della programmazione logica, e sembrava produrrele risposte volute in modo molto naturale, anche se i risultati ottenuti non sembravano dipendere da caratteristichestrettamente logiche del modello. Si immagini un programma (scritto, ad esempio, in PROLOG) che comprenda treclausole corrispondenti alle regole a)-c). E' possibile fare in modo che tale programma fornisca la risposta correttautilizzando l'ordine in cui le clausole sono scritte nel data base, e in cui quindi esse vengono consultate ed utilizzatedall'interprete PROLOG. L'ordine di interpretazione delle clausole contiene cioè in modo implicito l'informazionesull'ordinamento cronologico rilevante per la soluzione corretta del problema, in una maniera che forse potrebberisultare analoga al modo in cui una tassonomia con eccezioni esprime in maniera implicita un ordinamento sullarilevanza delle eccezioni stesse, senza che, ad esempio, si debba esprimere esplicitamente "a mano" un ordine di prioritàper la minimizzazione dei predicati di abnormality. Il punto interessante è che in origine si era ritenuto che il fatto che vifossero programmi che davano la risposta intuitivamente corretta per lo Yale shooting problem dipendesseesclusivamente da aspetti procedurali o "implementativi" legati all'ordine di esecuzione delle clausole, che nonammettono una spiegazione di tipo propriamente logico. Le analogie fra questo esempio e il problema dell'ereditarietàcon eccezioni sono evidenti: in entrambi i casi si hanno casi di ragionamento non monotòno in cui si pone il problema diridurre il numero dei modelli minimali di una teoria; in entrambi i casi i trattamenti logici che forniscono i risultatiadeguati sembrano per alcuni versi poco naturali ed insoddisfacenti; ed infine in entrambi i casi sono state individuatesoluzioni eleganti e naturali che tuttavia sembrano a prima vista non completamente riconducibili ad un trattamento ditipo logico. In seguito tuttavia è stato possibile individuare un trattamento di tipo logico e modellistico che rendesseconto di quelle proprietà dei programmi logici che risultano importanti per lo Yale shooting problem. Non si può quindiescludere a priori che si riesca ad ottenere una soluzione logica più naturale anche per il problema dell'ereditarietà coneccezioni.

Che, in generale, la traducibilità in logica di frame e reti semantiche non possa essere assunta come un dato difatto definitivo è ovvio se si considera che questi sistemi di rappresentazione nella maggior parte dei casi mancano diuna definizione formale precisa4. In questo senso, si potrebbe avanzare un'analogia fra la tesi della riducibilità allalogica delle reti semantiche e la tesi di Church, in quanto in entrambi i casi si ha a che fare con il tentativo di ridurre aconcetti formali rigorosi una serie di idee e di definizioni informali, con la conseguenza che, in linea di principio, unarisposta ultima e definitiva non potrà mai essere trovata. Si tratta di una semplice analogia, la cui portata è ovviamentelimitata. Prendendola per buona, tuttavia, potremmo chiamare "Tesi di Hayes" la tesi della traducibilità in logica deisistemi di rappresentazione a frame e a rete semantica. La tesi di Hayes costituisce una ipotesi di lavoro e una linea diricerca che per ora si è rivelata estremamente fruttuosa, e che di fatto è condivisa, almeno come obiettivo a cui tendere,da tutti coloro che svolgono ricerca nell'ambito di rappresentazione della conoscenza di impostazione logica. Non vasottovalutato in questa prospettiva l'impulso che questi problemi hanno dato allo sviluppo e all'affinamento di nuovistrumenti di tipo logico. Thomason, ad esempio, a proposito del problema di un trattamento logico adeguatodell'ereditarietà con eccezioni, afferma che "le teorie logiche esistenti del defeasible reasoning avrebbero bisogno diessere in qualche modo modificate per fornire una cornice davvero illuminante per l'ereditarietà. Io preferisco usarequesta come una guida nella ricerca per la costruzione di teorie logiche - ma ciò potrebbe essere dovuto in parte al fattoche, da logico, io tendo a cercare opportunità per costruire nuove logiche" (Thomason 1992, p. 199).

7.2 Nient'altro che postulati di significato?

Se si accetta la Tesi di Hayes, frame e reti semantiche sono riconducibili a rappresentazioni di tipo logico. Ciòsignifica che, nella prospettiva della rappresentazione del significato lessicale, una rete semantica o un sistema di frameequivale di fatto a un insieme di postulati di significato di qualche tipo. In particolare, si tratterà di postulati disignificato di tipo tradizionale per le reti semantiche ad ereditarietà strutturata, che, abbiamo visto, sono riducibili allalogica dei predicati classica, e postulati di significato scritti in una logica non monotòna per i frame e le reti semanticheche ammettono eccezioni.

Queste considerazioni si possono in linea di massima estendere ad altri sistemi a rete semantica proposti in IA.Possono essere generalizzate ad esempio alle reti semantiche basate su insiemi di primitive che si collocano al livelloconcettuale (nel senso di Brachman 1979), ossia entità concettuali e relazioni che si assume siano semanticamenteatomiche e non ulteriormente analizzabili o definibili. Componendo tali primitive dovrebbe essere possibile in teoriaesprimere qualsiasi contenuto concettuale. L'esempio più noto di sistema a rete semantica di questo tipo è la teoria delladipendenza concettuale di Schank (cfr. par. 4.2). Questo tipo di modelli presenta analogie con le teorie dell'analisi

4Da questo punto di vista ha ragione Israel (1983) quando critica un'affermazione di Reiter e Criscuolo (1980) secondocui "che le reti (semantiche) siano varianti notazionali di formule logiche è oggi una verità lapalissiana nei circolidell'IA". Meno chiare e convincenti sono tuttavia le argomentazioni offerte da Israel contro tale identificazione, adesempio a proposito dei vantaggi che offrirebbe KL-ONE rispetto ai postulati di significato tradizionali.

Page 88: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

5

componenziale del lessico per mezzo di tratti semantici5. In base a tali teorie, il significato di ogni elemento del lessicodi un linguaggio naturale può essere analizzato nei termini di un insieme finito di tratti semantici primitivi. Nellaprospettiva logicista, i sistemi a rete di questo tipo sono riconducibili a insiemi di postulati di significato di formaparticolare. Questo genere di reti e di sistemi di rappresentazione può ammettere o meno la possibilità di inferenze ditipo non monotòno (ad esempio, abbiamo visto che le reti di Schank prevedono un trattamento delle eccezioni). Qui, persemplicità, ci limiteremo al caso puramente monotòno. In generale, un sistema basato su un insieme di primitiveconcettuali è equivalente, dal punto di vista logico, a un insieme di postulati di significato della forma:

∀ x1 ,..., xn P(x1 ,..., xn ) ↔ α( x1 ,..., xn )

dove P è il predicato a n argomenti che corrisponde al concetto rappresentato, e α( x1 ,..., xn ) è una formula conesattamente n variabili libere in cui appaiono come uniche costanti non logiche predicati e relazioni che corrispondono aprimitive concettuali. Ad esempio, il concetto uomo potrebbe essere scomposto in primitive come maschio, umano eadulto. Questa analisi corrisponde al postulato di significato:

∀x (uomo(x) ↔ maschio(x) ∧ adulto(x) ∧ umano(x)).

In questo esempio α(x) è una semplice congiunzione di formule atomiche; in generale, tuttavia, può avere una strutturalogica più complessa. Con postulati di questo tipo ogni concetto semanticamente non primitivo può essere "eliminato" esostituito da espressioni in cui compaiono solo primitive semantiche. A prescindere dalla plausibilità empirica (di ordinepsicologico o linguistico) di questi modelli, è evidente che essi non mutano di molto il panorama tracciato nelle pagineprecedenti.

Nel par. 2.2 abbiamo visto che, rispetto al problema della rappresentazione del significato lessicale, alcunifilosofi del linguaggio erano stati attratti dalle teorie di tipo psicologico concernenti la rappresentazione mentale delsignificato dei concetti lessicali6. Può essere interessante vedere in che rapporto stiano con tali teorie i formalismi dirappresentazione esaminati negli ultimi capitoli. Gli psicologi D.L. Medin e E.E. Smith (Medin e Smith 1984; Smith eMedin 1981) hanno proposto una classificazione in tre gruppi dei modelli psicologici per la rappresentazioneconcettuale. Ciascun gruppo corrisponde a un diverso punto di vista: il punto di vista classico (classical view), il puntodi vista probabilistico (probabilistic view), e il punto di vista basato su esemplari (exemplar view). Secondo il punto divista classico tutte le istanze di un concetto condividono un certo numero di caratteristiche comuni, e larappresentazione dei concetti può essere effettuata nei termini di insiemi di condizioni necessarie e sufficienti. Il puntodi vista probabilistico nega la possibilità di individuare proprietà definitorie. I concetti sono rappresentati per mezzo diproprietà, che sono soltanto probabili per le istanze del concetto. Non si tratta quindi di tratti definitori, ma soltanto ditratti tipici, o caratteristici della categoria. Un individuo è un'istanza di una data categoria se gode di un numerosufficiente dei tratti corrispondenti, ad un grado tale da superare una certa soglia. L'appartenenza a una categoria non èpiù quindi un questione del tipo tutto o niente, ma è questione di grado. Anche secondo il punto di vista basato suesemplari non è possibile di norma individuare tratti definitori per un concetto, ma in questo caso si assume che lecategorie concettuali vengano rappresentate mediante la descrizioni di un insieme di esemplari individuali tipici.Un'istanza appartiene a una categoria se è abbastanza simile ad almeno uno di tali esemplari. Il punto di vistaprobabilistico e quello basato su esemplari hanno in comune il fatto di negare la possibilità, in generale, di individuaretratti definitori per l'applicazione dei concetti. Medin e Smith quindi li comprendono entrambi sotto l'etichetta di puntodi vista prototipico (prototype view).

E' abbastanza evidente che sistemi di rappresentazione come il KL-ONE sono l'equivalente in IA dei modellipsicologici catalogati da Medin e Smith come appartenenti al punto di vista classico (come del resto anche i postulati disignificato classici in logica e in filosofia del linguaggio). Modelli come i sistemi a frame, e i loro equivalenti in logicanon monotòna, sono vicini al punto di vista basato su esemplari, o comunque, più in generale, si rifanno ad un modellodi tipo prototipico. I frame presentano anche analogie con il modello di rappresentazione concettuale di Miller eJohnson-Laird (1976) che, in un certo senso, ha caratteristiche "ibride" fra i punti di vista classico e prototipico.Abbiamo visto che in un frame alcuni slot (quelli che corrispondono ai "livelli più alti" del frame) corrispondono adattributi "stabili" del concetto rappresentato, ossia a caratteristiche necessarie, mentre agli slot collocati ai livelli piùbassi sono assegnati valori attribuiti per default. Questa distinzione è in parte analoga alla distinzione fra nucleoconcettuale (conceptual core) e procedure di identificazione associate a un concetto secondo la teoria di Miller eJohnson-Laird. Secondo questi autori, in molti concetti si può individuare un nucleo di tratti necessari e/o sufficienti chelo caratterizzano (il core appunto), che possono obbedire a quello che Medin e Smith chiamano punto di vista classico.

5Si vedano ad esempio (Katz e Fodor 1964; Katz 1972). Sulle relazioni fra tali teorie, semantica modellistica e postulatidi significato si veda anche (Cresswell 1978).6Per una rassegna sulle teorie della rappresentazione mentale dei concetti in psicologia cognitiva si veda ad esempio(Tabossi 1985).

Page 89: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

6

Tuttavia, ciò non esaurisce la rappresentazione del concetto, in quanto, nella pratica, i criteri utilizzati per individuareeffettivamente le singole istanze del concetto (criteri che sono detti appunto procedure di identificazione) sonosostanzialmente di tipo prototipico. Ad esempio, per un concetto come ragazzo, il core comprende le proprietà di essereun essere umano giovane di sesso maschile, mentre le procedure di identificazione si basano su proprietà tipiche comel'altezza, il modo di vestire, e così via.

Oltre alle logiche non monotòne, in ambito logicista possono essere individuati altri strumenti adatti a trattare larappresentazione concettuale secondo il punto di vista prototipico. Un esempio è costituito dalle logiche sfumate (fuzzylogic) (Zadeh 1971, 1975). In logica classica il fatto che un concetto si applichi o meno a un certo oggetto (o,estensionalmente, che un oggetto sia membro di una certa classe) è una faccenda di tipo tutto o niente: o l'oggetto èmembro dell'insieme, oppure non lo è. Formulando la questione nei termini di funzioni caratteristiche di insiemi, si hache, dato un insieme di oggetti I, la sua funzione caratteristica φI può assumere come valori esclusivamente 0 oppure 1.Tuttavia, per molti concetti del ragionamento di senso comune, e per molti termini del linguaggio naturale, untrattamento di questo tipo sembra inadeguato. Si consideri un predicato come anziano. Esso si presenta comeintrinsecamente "sfumato". Una persona di novant'anni è certamente anziana, mentre una persona di venti certamentenon lo è. Tuttavia non vi è un confine netto per l'applicabilità di questo predicato. Per i valori di età intermedi,l'appartenenza all'insieme degli anziani è in larga parte una questione di grado. La logica fuzzy si propone diformalizzare questo tipo di fenomeni. La funzione caratteristica φF di un insieme fuzzy F assume come valori numerireali compresi nell'intervallo fra 0 e 1. Tali valori indicano il grado di appartenenza di un individuo all'insieme. Così, adesempio, dato un certo individuo i, φF (i) = .65 significa che i appartiene a F con grado .65. Per una persona dinovant'anni, il suo grado di appartenenza all'insieme degli anziani sarà 1; per una persona di venti sarà 0; per le etàintermedie si avranno gradi di appartenenza diversi compresi fra 0 e 1. La logica fuzzy consente di combinare fra lorodiversi enunciati fuzzy (definendo ad esempio unione ed intersezione per i fuzzy set)7.

In ogni caso, poiché tutti questi approcci sono in linea di massima riconducibili a un trattamento di tipo logico(tutti ammettono, come abbiamo visto, una traduzione in un formalismo logico, con associata una semantica modellisticaopportuna), essi equivalgono a insiemi di postulati di significato di qualche genere. Da questo punto di vista, il casomeno innovativo è certamente quello di KL-ONE e delle logiche terminologiche: una rete KL-ONE corrisponde a uninsieme di postulati di significato scritti in (un sottoinsieme del) calcolo dei predicati del primo ordine con identità. Nonoffre quindi nulla di nuovo, dal punto di vista espressivo, rispetto a ciò che già erano in grado di fare i filosofi dellinguaggio. In più, se si accettano le motivazioni filosofiche originarie in base alle quali era stata proposta la distinzionefra conoscenza di tipo terminologico e conoscenza asserzionale, KL-ONE e i sistemi ibridi ripropongono di fatto unaseparazione netta fra informazioni di tipo analitico, o definitorio, e informazioni fattuali. Abbiamo già visto (par. 2.1)che tale separazione risulta problematica e difficilmente sostenibile rispetto al problema della rappresentazione dellessico delle lingue naturali e della conoscenza di senso comune. Non è un caso che per tutti gli esempi di rete semanticariportati nel cap. 5 abbiamo utilizzato domini di tipo "artificiale" e specialistico, come la geometria o classificazioni ditipo zoologico: di fatto KL-ONE e le logiche terminologiche risultano molto più adatti a tali domini che allarappresentazione dei concetti lessicali di senso comune. D'altra parte, abbiamo già messo in luce che la linea di ricercasulle logiche terminologiche ha esplicitamente abbandonato molte delle ambizioni originarie con cui erano statesviluppate le reti semantiche. Un esempio di come questa linea di ricerca rinneghi tali pretese consiste nel rifiuto diconsiderare le rappresentazioni a rete semantica come un modello dei nessi associativi fra concetti in una base diconoscenza. Avevamo visto che uno dei motivi per contrapporre le reti semantiche alla logica era stato individuato nelfatto che le prime avrebbero dovute essere più adatte a rappresentare una base di conoscenza in maniera strutturata,consentendo ad esempio di misurare la "distanza semantica" fra due concetti in base al numero di archi che li separanonella rete. Questo aspetto viene esplicitamente rifiutato nei sistemi discendenti dal KL-ONE. In Brachman et al. (1983)si sottolinea che ogni sistema di rappresentazione della conoscenza concretamente realizzato presenta caratteristiche chenon sono rilevanti ai fini della rappresentazione, e che dipendono esclusivamente dalla particolare notazione adoperata odalle caratteristiche di una implementazione specifica. Qualora il sistema di rappresentazione venga utilizzatoscorrettamente, in maniera da assegnare un valore rappresentativo a tali caratteristiche, le inferenze che ne vengonotratte possono essere errate, e sono comunque infondate. In KRYPTON questo tipo di problemi viene evitato adottandoun approccio di tipo funzionale (Levesque 1984c), secondo il quale una base di conoscenza è definita esclusivamentesulla base di un insieme di operazioni che consentono di modificarla o di interrogarla, senza che nulla venga assuntosulla struttura interna del sistema di rappresentazione. In altre parole, una volta specificato esattamente cosa può esseredetto e cosa può essere chiesto a una base di conoscenza, ciò che definisce il formalismo è esattamente questa specificafunzionale. Le operazioni che definiscono funzionalmente la base di conoscenza sono fondamentalmente di due tipi:funzioni TELL, che consentono di inserire nuove informazioni nella base di conoscenza, e funzioni ASK, che consentonodi interrogarla. Ebbene, in KRYPTON, come in generale nelle logiche terminologiche, gli aspetti associativi, come la 7Le logiche fuzzy sono state effettivamente proposte come formalizzazioni dei modelli psicologici dellacategorizzazione concettuale basata su prototipi (si veda ad esempio Lakoff 1972; Oden 1977). Tuttavia tale proposta vaincontro a varie difficoltà di tipo empirico (Osherson e Smith 1981; Roth e Mervis 1983). Su questo tema si veda anche(Tabossi 1985).

Page 90: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

7

distanza fra due concetti nei termini del numero di archi che li separano, sono considerati caratteristiche irrilevanti ai finirappresentativi, cui quindi le funzioni ASK non possono accedere. Gli archi (ruoli, legami di superconcetto, etc.) hannosignificato esclusivamente logico e non associativo, e non possono essere utilizzati per inferire la "vicinanza semantica"di due concetti. Ad esempio, rappresentazioni concettuali sostanzialmente equivalenti possono essere realizzate in modidiversi, in maniera che risulti modificata la distanza fra due concetti. Si supponga di voler definire il concetto rettangolocome un poligono con quattro lati e con tutti gli angoli retti. Questo può essere fatto, equivalentemente, come nellafigura 7.2a oppure come nella figura 7.2b. Tuttavia, nella fig. 7.2b rettangolo è collegato direttamente a poligono,mentre in 7.2a vi è sempre un sottoconcetto intermedio.

fig. 7.2a

Il fatto stesso che, come abbiamo visto, uno dei motivi principali di interesse dei formalismi terminologici siastato individuato nell'essere sottoinsiemi meno espressivi del tradizionale calcolo dei predicati del primo ordine appareuna specie di nemesi storica, di ironia della sorte se si ripensa alle motivazioni originarie di chi aveva proposto esostenuto i sistemi di rappresentazione a rete semantica (e lo stesso KL-ONE). Per quanto ci concerne quindi, quandonel seguito ci occuperemo di logiche terminologiche non sarà in relazione al problema della rappresentazione delsignificato lessicale, quanto piuttosto in relazione al problema di individuare formalismi logici che possano esseretrattati computazionalmente da soggetti finiti e dotati di risorse di calcolo limitate.

fig. 7.2b

Diverso e più interessante è il caso dei frame e delle reti semantiche che ammettono eccezioni, e della lorocontroparte logica, le logiche non monotòne, oppure il caso delle logiche fuzzy. Questi formalismi sembrano offrire deglistrumenti per affrontare alcuni dei problemi che avevamo posto all'inizio, riguardo al problema della rappresentazionedel lessico in semantica modellistica. In particolare, sembrano aprire una via formale alla rappresentazione dei concettilessicali nei termini di caratteristiche tipiche, permettendo di formalizzare concetti quali quello di prototipo o distereotipo. Resta tuttavia irrisolto l'altro problema della semantica modellistica che abbiamo evidenziato nel par. 2.1:nessuno di questi sistemi può offrire una soluzione al problema dell'interpretazione dei simboli primitivi del sistema.Una rete semantica o un sistema a frame, interpretati in chiave model teoretica riescono a porre alcuni vincoli suimodelli. Lo stesso dicasi per un insieme di postulati di significato basati sulla logica fuzzy (dove si tratterà di modellibasati su fuzzy set anziché su insiemi classici). Ma in nessun caso si dispone di strumenti per determinarel'interpretazione intesa dei simboli primitivi. Anzi, in un certo senso, da questo punto di vista, un insieme di postulati disignificato non monotòni riesce a fare persino "meno" di un insieme di postulati di significato classici. Il punto è che se i

Page 91: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

8

postulati di significato ammettono eccezioni, allora i vincoli da essi imposti sui modelli possono essere violati. Iproblemi che sorgono con le eccezioni sono illustrati in maniera efficace da una celebre storiella di Ettore Petrolini:

Due persone giocano agli indovinelli."Mi sai dire cos'è quella cosa verde che sta sul pianoforte e fa cri-cri?"L'altro pensa e ripensa e finalmente risponde:"Non lo so, dillo tu.""E' l'aringa.""Ma l'aringa non è verde!""E tu la tingi.""Non sta mica sul pianoforte!""E tu ce la metti.""E poi l'aringa non fa cri-cri.""Bravo! E se non dicevo questo era troppo facile indovinare!" (Petrolini 1971, p. 172)

Vale a dire, le aringhe tipiche sono grigiastre, mute e stanno in fondo al mare, ma se queste sono caratteristicheprototipiche, che in linea di principio possono essere violate da esemplari atipici, allora anche un oggetto verde che stasul pianoforte può far parte dell'interpretazione del predicato aringa. Questo problema è stato sottolineato da Brachmanin un articolo dal titolo "I lied about the trees". (Il titolo deriva da un indovinello simile a quello di Petrolini: la domandain questo caso è: "cos'è che è grosso e grigio, ha una proboscide, e vive sugli alberi?". La risposta è "un elefante - homentito a proposito degli alberi"). Come caso limite, per una rete semantica in cui tutti gli archi ammettessero eccezioni,tutte le interpretazioni costituirebbero un modello. Abbiamo visto (par. 2.1) che due postulati di significato come:

∀x (leone(x) → mammifero(x))∀x (mammifero(x) → ¬ uccello(x))

possono ammettere come modelli interpretazioni in cui il predicato leone è interpretato sull'insieme degli elettrotreni,mammifero sull'insieme dei treni e uccello su quello delle querce. Nel caso delle teorie circoscrittive, può esserci unateoria che comprenda, ad esempio, i postulati di significato

∀x (pennuto(x) ∧ ¬ab1(x) → vola(x))∀x (uccello(x) ∧ ¬ab2(x) → pennuto(x))

e che non riesca a escludere fra i suoi modelli interpretazioni in cui, poniamo, il predicato pennuto è interpretatosull'insieme dei cani, vola è interpretato sull'insieme dei bradipi e uccello sull'insieme delle biciclette. Nei termini dellasemantica preferenziale di Shoham, il problema è che i postulati di significato non monotòni non pongono restrizioni sututti i modelli di una teoria, ma solo sui suoi modelli preferiti. Ad esempio, il secondo dei postulati di significatocircoscrittivi sopra riportati impone che siano preferiti quei modelli in cui il maggior numero possibile dei membridell'interpretazione di uccello sono membri anche dell'interpretazione di pennuto. Ma nulla esclude che in certi modellinessun uccello sia un pennuto. In altri termini, i postulati di significato non monotòni escludono certi modelli, ma solo inmaniera "provvisoria". Si deve sempre ammettere la possibilità che tali modelli vadano di nuovo presi in considerazionequalora diventino disponibili nuove informazioni.

Comunque vadano le cose con la tesi di Hayes, sembra in ogni caso impossibile che una soluzione definitiva alproblema del significato dei termini primitivi possa essere trovata su questa linea. A questo proposito meritano qualcheriflessione le affermazioni di Woods citate nel par. 4.4, per cui una semantica di tipo procedurale potrebbe risolvere ilproblema dell'interpretazione dei simboli primitivi. Un trattamento più approfondito dell'idea che delle procedurepossano fornire il significato (nel senso di computare il riferimento) dei simboli primitivi si trova in Woods 1980. Itermini in cui Woods formula il problema lasciano tuttavia adito a qualche perplessità. Un linguaggio diprogrammazione ha molte caratteristiche in comune con un linguaggio di tipo logico: vi è un insieme di simboliprimitivi, a partire dai quali è definita una classe di espressioni complesse, ottenibili dai primi attraverso un insieme diregole di composizione sintattica. I metodi per definire la semantica dei linguaggi di programmazione sono riconducibilia due gruppi. Il primo è quello delle semantiche di tipo procedurale, che costituiscono una semantica in un senso moltodebole, in quanto si limitano a specificare regole di trasformazione sintattica fra le espressioni di un linguaggio. Essenon sono dunque interessanti dal nostro punto di vista. Il secondo gruppo è quello delle semantiche di tipodenotazionale che, per il tipo di strumenti e di metodi utilizzati, sono di fatto riconducibili a una generalizzazione dellasemantica di tipo modellistico. Anche in questo caso, vi è una funzione interpretazione che associa un significato aisimboli primitivi, e lo scopo della teoria è quello di calcolare il significato di espressioni complesse (ad esempioprocedure, programmi) in funzione del significato dei simboli primitivi. Se quindi le procedure cui si riferisce Woodssono procedure che elaborano i simboli del sistema di rappresentazione della conoscenza cui dovrebbero garantire unasemantica, allora si ripropone il problema di stabilire il significato di tali simboli in quanto simboli che compaiono in

Page 92: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 7

9

queste procedure. Per quanto riguarda l'affermazione che le procedure "possono essere caratterizzate dal lorofunzionamento su macchine reali, ed essere in questo modo ancorate alla fisica", va notato innanzi tutto che gran partedel processo di sviluppo e di maturazione dell'informatica teorica è andando esattamente nella direzione opposta, nelladirezione cioè di svincolare la definizione della semantica dei vari costrutti dalle caratteristiche di implementazionispecifiche (è curioso notare come questa linea di sviluppo ponesse esigenze analoghe a quelle poste dallo stesso Woodsquando reclamava la necessità di definire una semantica per i sistemi a rete semantica). Infine, non è chiaro in chetermini l'ancoramento alla fisica nei termini di hardware del dispositivo computazionale utilizzato possa risolvere ilproblema del riferimento dei simboli primitivi: non è certo allo hardware del calcolatore che i simboli devono essereancorati, ma a oggetti ed eventi del mondo esterno. Torneremo su questi problemi in sede di conclusioni generali.

Page 93: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

8. Logiche modali epistemiche e mondi possibili8.1 Logica epistemica, onniscienza logica e intelligenza artificiale

La storia del trattamento logico degli atteggiamenti proposizionali, e, in particolare, del credere, può essere fattarisalire al lavoro di Hintikka del 1962 (Hintikka 1962), da cui prese le mosse gran parte della ricerca successiva inquesto settore. In quell'opera la logica del credere veniva formulata per mezzo di un linguaggio di tipo modale, cuiveniva associata una semantica non ancora definita in termini di mondi possibili, ma (in maniera sostanzialmenteequivalente) per mezzo di strutture dette model set. La riformulazione in termini di mondi possibili avvenne più tardi, adopera dello stesso Hintikka (1969), dopo la diffusione dei lavori di Kripke. L'individuazione dell'onniscienza logicacome di un problema cruciale posto dalla formulazione model teoretiche della semantica per la logica epistemica èvecchio praticamente quanto la logica epistemica stessa, e numerosi tentativi di affrontarlo furono compiuti in ambitofilosofico1.

Con l'affermarsi dell'intelligenza artificiale di impostazione logica, lo studio del problema ricevette nuoviimpulsi. In intelligenza artificiale il ragionamento di tipo, in senso lato, epistemico presenta molteplici motivi diinteresse. Oltre al problema della rappresentazione del significato di enunciati di atteggiamento proposizionalenell'ambito dell'elaborazione del linguaggio naturale, il ragionamento sulle credenze è coinvolto nell'elaborazione dimodelli di agenti artificiali che interagiscano con altri agenti, e che debbano quindi costruirsi rappresentazioni delleproprie e delle altrui credenze, e compiere inferenze su di esse. Nella progettazione di basi di conoscenza complesse èspesso necessario mettere in grado il sistema di ragionare sulle proprie conoscenze e sulle proprie capacità inferenziali.Da un punto di vista più specificamente informatico, le logiche della credenza possono essere applicate allo studio edalla definizione dei sistemi di calcolo distribuiti ed alla computazione parallela. D'altro canto, poiché lo scopo dell'IA èquello di modellare le "competenze inferenziali" di soggetti razionali finiti e sottoposti a limiti di risorse realistici, leidealizzazioni imposte dal modello classico basato sui mondi possibili, prima fra tutte l'onniscienza logica, risultano deltutto inaccettabili2. Da un punto di vista tecnico, le logiche tradizionali per il ragionamento epistemico presentano seriproblemi in una prospettiva computazionale. I formalismi che comportano l'assunzione dell'onniscienza logicapresentano generalmente caratteristiche computazionali poco allettanti, nel senso che, anche nel caso in cui essi sianodecidibili, non risultano in generale computazionalmente trattabili. Quindi, la ricerca di formalismi in cui le capacitàinferenziali dei soggetti epistemici risultino più deboli è motivata anche dalla prospettiva di individuare strumenti dirappresentazione e di ragionamento dotati di migliori proprietà computazionali. Dal punto di vista di una teoria globaledella razionalità, vi sono considerazioni in base alle quali per un soggetto finito l'onniscienza logica non risulta neppureun obiettivo ideale a cui è auspicabile avvicinarsi quanto più possibile. Gilbert Harman (1986) ad esempio sottolineache, dal punto di vista logico, ogni credenza implica infinite conseguenze del tutto triviali, che non rivestono alcuninteresse per gli scopi di un agente. Per un agente razionale finito sarebbe controproducente "ingombrare" la propriamente con tali credenze inutili. Nella prospettiva di una razionalità limitata, può essere svantaggioso destinare tropperisorse a fare inferenze da ciò che si crede, senza passare all'azione (Cherniak 1986).

I tentativi di affrontare il problema dell'onniscienza logica nell'ambito dell'intelligenza artificiale di impostazionelogicista possono essere classificati, in prima approssimazione, in due grandi gruppi3. Il primo gruppo comprende quelleche si potrebbero definire soluzioni "sintattiche", il cui denominatore comune consiste nell'inserimento nella semanticadella logica di entità di tipo sintattico quali enunciati e regole di derivazione. Il secondo gruppo comprende invece lesoluzioni di tipo "semantico" in senso stretto, in cui i modelli sono definiti sulla base di strutture insiemistichetradizionali. Fra le soluzioni di tipo semantico possono a loro volta essere distinte quelle che utilizzano mondi possibiliclassici, e quelle che fanno uso di strutture semantiche non classiche, quali mondi incoerenti o incompleti. Esistono poisoluzioni ibride o intermedie, che, ad esempio, adottano mondi possibili classici sovrapponendovi una sorta di"filtraggio" di tipo sintattico. Nei prossimi paragrafi passeremo in rassegna alcuni fra gli esempi più significativi di taliricerche. Tutte queste linee presentano punti di collegamento con ricerche svolte in ambito filosofico, sulle quali cisoffermeremo di volta in volta4.

1Si veda (Bäuerle e Cresswell 1988) per una rassegna.2Questo aspetto è ben sintetizzato da Stalnaker (1991), che afferma "ogni tipo di elaborazione dell'informazione o dicomputazione è priva di senso se riferita a un agente onnisciente dal punto di vista deduttivo" (p. 429).3Per questa distinzione si vedano ad esempio (Halpern 1986b) e (McArthur 1988).4E' opportuno ricordare che la ricerca sul ragionamento epistemico in IA non è limitata al solo problemadell'onniscienza logica. Vi sono altri aspetti che, per quanto non vengano trattati se non marginalmente nelle pagineseguenti, presentano notevoli punti di interesse logico e filosofico. Un esempio è costituito dal ragionamento di tipoautoepistemico, che rientra nella linea di ricerca sul ragionamento non monotòno, e cui abbiamo già accennato nel par.6.2. Un altro ambito di ricerca legato alla logica epistemica è quello in cui si studiano le credenze o le conoscenze digruppi di attori, e le loro interazioni reciproche. Vengono quindi indagati concetti quali la conoscenza comune (commonknowledge) o la conoscenza implicita (implicit knowledge) (si veda ad esempio Halpern e Moses 1984b). In generale,sui vari temi e sui problemi posti dal ragionamento epistemico in IA possono essere consultate le seguenti rassegne:

Page 94: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

2

In questo lavoro, per semplicità, ci limiteremo ai soli calcoli proposizionali, in quanto i problemi dell'onniscienzalogica si presentano in tutta la loro complessità già a questo livello. Affrontare il caso predicativo comporterebbeprendere in considerazione problemi ulteriori, estremamente complessi e di natura controversa, quali ad esempio ilproblema dell'interpretazione de dicto e dell'interpretazione de re dei contesti di atteggiamento proposizionale, e quellodella quantificazione all'interno di tali contesti (quantifying in)5. Si tratta di temi in parte connessi a quellodell'onniscienza logica, ma che richiederebbero una trattazione indipendente, e che amplierebbero troppo i confini dellapresente ricerca. Inoltre, per alcune delle logiche descritte qui di seguito esiste esclusivamente una trattazione del casoproposizionale, e non è stata elaborata per il momento un'estensione al primo ordine.

Il presente capitolo e i seguenti sono strutturati come segue. Il par. 8.2 comprende un'introduzione sintetica allasemantica tradizionale di Kripke per la logica epistemica basata sui mondi possibili; in tale paragrafo vengonoanalizzate in dettaglio le fonti del problema dell'onniscienza logica. Il par. 8.3 tratta dei cosiddetti modelli minimali perle logiche modali, o modelli di Scott-Montague, che costituiscono un indebolimento della semantica di Kripke, ancorchéelaborato nella tradizione dei mondi possibili classici. L'analisi dei modelli minimali per le logiche epistemiche consentedi indagare, in un certo senso, le "possibilità estreme" delle semantiche classiche a mondi possibili nei confronti delproblema dell'onniscienza logica. Nel cap. 9 vengono esaminate le cosiddette semantiche enunciative per le logichedella credenza, ossia quelle semantiche basate sull'introduzione di entità di tipo sintattico (ad esempio formule oenunciati) nell'interpretazione. In particolare, verrà presa in considerazione la logica della credenza elaborata daKonolige (1984, 1985a, 1986). Il cap. 10 tratta dell'utilizzo di situazioni, ossia di "mondi" non classici, eventualmenteincoerenti o incompleti, per la semantica delle logiche della credenza. Il cap. 11, infine, verte sul lavoro di Fagin eHalpern sul ragionamento epistemico limitato. Questi autori argomentano che i vari modelli proposti in letteraturapossono essere utilizzati per affrontare aspetti diversi del problema dell'onniscienza logica, e propongono tre tipi dilogica che sviluppano differenti possibilità: una logica della consapevolezza che utilizza mondi incompleti, una logicadella "consapevolezza generalizzata" che introduce elementi di tipo sintattico in una semantica modellistica tradizionale,e una logica per il ragionamento locale che mostra come alcune classi di modelli minimali possano modellare tipiinteressanti di ragionamento limitato.

8.2 Strutture di Kripke per la logica del credere

Nelle logiche epistemiche di tipo modale i contesti epistemici, come quelli di credenza e di conoscenza, sonorappresentati mediante operatori modali, che assumono come argomenti formule del linguaggio della teoria. In questoparagrafo utilizzeremo principalmente due operatori, uno per il credere e uno per il conoscere, che indicheremorispettivamente per mezzo dei simboli B e K (rispettivamente da Belief e Knowledge). Data una formula ϕ dellinguaggio, l'espressione Bϕ può essere letta come "è creduto che ϕ", e l'espressione Kϕ può essere letta come "si sa che ϕ"6. Si è visto che l'idea che sta alla base della semantica dei mondi possibili consiste nel prendere in considerazione,per la valutazione delle espressioni della teoria logica che comprendano operatori di tipo intensionale, oltre che ilmondo reale, anche altre possibili situazioni alternative, i mondi possibili appunto. Nel caso delle logiche epistemiche,la semantica a mondi possibili si basa sull'idea intuitiva che ad un soggetto epistemico sia associato un insieme dimondi, che corrispondono a tutte le situazioni compatibili con le credenze del soggetto epistemico stesso. Ad esempio,un soggetto epistemico può credere che la capitale d'Italia sia Roma e che la capitale degli Stati Uniti sia New York. Intal caso, in tutti i mondi possibili compatibili con le sue credenze sarà vero che la capitale d'Italia è Roma e che lacapitale degli Stati Uniti è New York. Inoltre, lo stesso soggetto potrebbe non avere alcuna opinione circa il fatto cheAtene sia o meno la capitale della Grecia. Allora, in alcuni dei mondi compatibili con le sue credenze sarà vero cheAtene è la capitale della Grecia, mentre in altri sarà falso. Così, affinché sia vero che è creduta una certa formula α, cioèsia vera la formula Bα, allora α dovrà essere vera in tutti i mondi che il soggetto epistemico considera possibili.Affinché invece si sappia che α, cioè Kα sia vera, α deve risultare vera, oltre che in tutti i mondi ritenuti possibili dalsoggetto epistemico, anche nel mondo reale. La conoscenza viene infatti caratterizzata rispetto alla semplice credenzadal fatto di essere credenza vera7. Nell'esempio precedente, è plausibile che il soggetto epistemico sappia che Roma è la

(Halpern 1986b), (Halpern e Moses 1985), (McArthur 1988), (Parikh 1990b), (Halpern 1992), (Fagin et al. 1993),(Zanaboni 1992). Da alcuni anni a questa parte, la sede di discussione privilegiata per questo tipo di argomenti è ilconvegno Theoretical Aspects of Reasoning about Knowledge (TARK), che si tiene ogni due anni negli Stati Uniti.Questi convegni raccolgono contributi ampiamente interdisciplinari (ad esempio di logici, informatici, filosofi,economisti), di cui sono testimonianza i vari volumi di atti (Halpern 1986a; Vardi 1988; Parikh 1990a; Moses 1992).5Su questi problemi in relazione alla credenza e agli atteggiamenti proposizionali si veda ad esempio (Linsky 1971).6Per ora prendiamo in considerazione esclusivamente il caso in cui venga modellato il comportamento di un solosoggetto epistemico; vedremo in seguito come estendere questo tipo di trattamento ad un numero qualunque di soggetti.7Che un certo fatto sia creduto e al tempo stesso sia vero costituisce una condizione necessaria ma non sufficiente perpoter affermare che quel fatto è conosciuto (lo si potrebbe credere ad esempio per la ragione sbagliata). Dal punto divista filosofico, caratterizzare il conoscere rispetto al credere pone problemi complessi: si veda ad esempio (Gettier

Page 95: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

3

capitale d'Italia, mentre non è certamente vero che sa che la capitale degli Stati Uniti sia New York (perché ciò è falsonel mondo reale). Vedremo come vengono formalizzate queste intuizioni nella semantica a mondi possibili.

Formalmente, una Struttura di Kripke, o Struttura a Mondi Possibili, per la logica proposizionale è una terna M= (W, ϕ, R)8. W è un insieme di mondi possibili. ϕ è la funzione interpretazione che, per ogni mondo possibile, assegnaun valore di verità ad ogni formula primitiva del linguaggio; vale a dire, per ogni mondo possibile w ∈ W e per ogniformula primitiva p, ϕ[w,p] ∈ {v,f}: ϕ[w,p] = v sse p è vera nel mondo w, e ϕ[w,p] = f sse p è falsa nel mondo w. ϕassegna uno ed un solo valore ad ogni formula primitiva; ogni mondo possibile w è dunque coerente (non può accadereche una formula primitiva sia contemporaneamente vera e falsa in w) e completo (ogni formula primitiva ha un valore diverità in w). R è una relazione binaria di accessibilità fra i mondi di W. La semantica di Kripke per le logicheepistemiche si basa sul fatto che R(w,w') vale se e solo se il mondo w' è compatibile con le credenze del soggettoepistemico nel mondo w. Proprietà diverse degli operatori di credenza o di conoscenza dipendono dalle differentiproprietà di cui può godere la relazione di accessibilità R.

Iniziamo col prendere in considerazione l'operatore modale per la conoscenza K. Definiamo innanzi tutto unlinguaggio proposizionale per la conoscenza.

.L'alfabeto sia definito nel modo seguente:

a) un insieme Φ infinito numerabile di lettere proposizionali per formule primitive: p,q,r, p1, p2 , ......;b) i connettivi verofunzionali ∧ e ¬;c) l'operatore proposizionale K;d) segni ausiliari: (,).

L'insieme delle formule viene definito come il più piccolo insieme tale che:

i. ogni lettera proposizionale è una formula;ii. se α è una formula, allora (¬ α) è una formula;iii. se α e β sono formule, allora (α ∧ β) è una formula;iv. se α è una formula, allora (Kα) è una formula.

Alcune parentesi si possono omettere imponendo le usuali condizioni di priorità sui connettivi. Gli altri connettiviverofunzionali si possono definire nel modo usuale. In particolare, si avrà:

α → β =def ¬(α ∧ ¬β)α ∨ β =def ¬(¬α ∧ ¬β)

α ↔ β =def (α → β) ∧ (β → α).

Ovunque nel seguito compaiano formule con connettivi logici diversi da ∧ e ¬, le si deve intendere quali abbreviazionidi formule in cui compaiano esclusivamente ∧ e ¬.

Data una interpretazione M, un mondo w e una formula α, l'espressione M,w α può essere letta "α è vera nelmondo w rispetto all'interpretazione M", oppure "il mondo w soddisfa α rispetto all'interpretazione M". Se si sottintendel'interpretazione, w α può essere letta "α è vera nel mondo w", oppure "il mondo w soddisfa α". Definiamoformalmente la relazione come segue:

i. M,w α (per α appartenente all'insieme Φ delle formule primitive) sse ϕ[w,α]=v;ii. M,w ¬ α sse M,w α;iii. M,w α ∧ β sse M,w α e M,w β;iv. M,w Kα sse M,w' α in tutti i w' t.c. R(w,w').

L'ultima clausola della definizione afferma che una formula del tipo Kα è vera in un mondo possibile w se e soltanto se α è vera in tutti i mondi accessibili da w, cioè, secondo l'intuizione da cui siamo partiti, se α è vera in tutte le situazionicompatibili con le credenze del soggetto epistemico in w.

Diremo che una formula α è valida se e solo se M,w α per ogni interpretazione M e per tutti i mondi w in W.Diremo che una formula α è soddisfacibile se e solo se, per qualche interpretazione M, esiste un w t.c. M,w α. Se α è 1963). Qui non approfondiremo tuttavia tali aspetti, e ci limiteremo a considerare la verità come una condizionenecessaria perché si abbia conoscenza.8Si tratta della stessa definizione data nel paragrafo 1.3, semplificata per il fatto che qui si ha a che fare con il casoproposizionale anziché con quello predicativo. Per questa ragione non viene specificato il dominio dell'interpretazioneD.

Page 96: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

4

valida, scriveremo α. Da questa definizione di validità consegue che α è soddisfacibile sse ¬α non è valida. Possonoinoltre essere dimostrate le seguenti proposizioni:

(1) Tutte le tautologie proposizionali sono formule valide.(2) Date due formule qualunque α e β del linguaggio, la formula (Kα ∧ K(α → β)) → Kβ è valida.(3) Date due formule qualunque α e β del linguaggio, se α e α → β, allora β.(4) Per ogni formula α del linguaggio, se α allora Kα.

Diremo inoltre che una formula β è conseguenza logica di α se, per ogni interpretazione M e per ogni mondo w, ogniqual volta si ha che M,w α, allora si ha anche che M,w β.

Vediamo ora quali restrizioni debbano essere imposte sulla relazione R affinché l'operatore K rifletta la nozioneintuitiva di conoscenza. Abbiamo visto che, affinché il soggetto epistemico sappia che α, α deve essere creduta dalsoggetto e deve inoltre essere vera. Quindi, affinché Kα sia vera nel mondo w, α deve essere a sua volta vera in w. Ciòpuò essere garantito imponendo che la relazione R di accessibilità sia riflessiva, cioè che, per ogni w ∈ W, debba valereR(w,w). In altri termini, dato qualsiasi mondo possibile, al soggetto epistemico deve sempre essere accessibile anche ilmondo in cui esso stesso si trova.

Definiamo ora un sistema di assiomi che caratterizzi questo tipo di logica della conoscenza. Esso comprende i treschemi di assiomi seguenti:

A1. Tutti gli assiomi del calcolo proposizionale.A2. Kα ∧ K(α → β) → KβA3. Kα → α

e le due seguenti regole di inferenza:

R1. da α e α → β segue β (Modus ponens)R2. da α segue Kα (Regola di necessitazione)

La regole R2 viene detta regola di necessitazione in quanto essa è stata elaborata originariamente rispetto alle logichemodali aletiche, dove viene utilizzata per introdurre l'operatore modale di necessità. L'assioma A2 può anche essereformulato in modo equivalente come segue:

K(α → β) → (Kα → Kβ),

e viene detto usualmente assioma distributivo.Il sistema modale caratterizzato da questo apparato deduttivo va sotto il nome di sistema T. Diremo che una

formula α è dimostrabile in T, in simboli T α (nel seguito adotteremo la norma di omettere T - o, in generale, il nomedel sistema formale - quando ciò non crei ambiguità), se e soltanto se α è un assioma di T, oppure α è ottenibilemediante le regole R1 o R2 a partire da formule dimostrabili in T. Si noti l'analogia fra gli assiomi A1 e A2 e leproposizioni (1) e (2) sopra enunciate. Analogamente, le regole R1 e R2 sono il corrispettivo sintattico delleproposizioni (3) e (4). L'assioma A3 è ciò che caratterizza T come una logica della conoscenza: il fatto che una formula α sia conosciuta implica che α sia vera. A3 è il corrispettivo sintattico della riflessività della relazione R di accessibilità.Esso infatti impone sulle interpretazioni di T che, per ogni mondo w, ogni qual volta una formula sia vera in tutti imondi accessibili da w, essa sia vera anche in w stesso. Si noti che la regola R2 asserisce che da α si può derivare Kα se α è una formula dimostrabile, cioè se è un teorema della teoria, ottenibile a partire esclusivamente dagli assiomi logici,e non da eventuali assiomi propri (cioè assiomi specifici che non sono formule valide, ma che sono veri solo in alcunedelle interpretazioni). Se si ammettesse che R2 sia applicabile anche a formule derivabili da assiomi non logici, alloraR2 comporterebbe una sorta di "onniscienza fattuale" del tutto inaccettabile.

E' possibile dimostrare il seguente teorema:

Teorema: T è l'assiomatizzazione corretta e completa delle strutture di Kripke in cui la relazione di accessibilitàsia riflessiva.9.

In altri termini, se indichiamo con T α il fatto che la formula α è valida rispetto alle strutture a mondi possibiliin cui R è riflessiva, si ha, per ogni formula α, che T α sse T α.

9Per le dimostrazioni dei risultati enunciati in questo paragrafo si può far riferimento a manuali di logica modale, comead esempio (Hugues e Cresswell 1968) o (Chellas 1980).

Page 97: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

5

Le proprietà dell'operatore K possono essere ulteriormente specificate a livello sintattico aggiungendo altriassiomi, cui corrispondono, nell'interpretazione, ulteriori restrizioni sulla relazione di accessibilità R. Uno schema diassiomi che spesso viene ritenuto adeguato per la conoscenza è il seguente:

A4. Kα → KKα.

Si tratta del cosiddetto assioma dell'introspezione positiva, che impone che, ogni qualvolta il soggetto epistemicoconosca α, egli a sua volta sappia di sapere α. Il sistema modale che comprende tutti gli assiomi e le regole di T più A4viene detto S4. Semanticamente, A4 equivale ad imporre che R sia transitiva, vale a dire che, per ogni w,w',w''∈W, seR(w,w') e R(w',w''), allora R(w,w''). A4 asserisce infatti che condizione necessaria perché Kα sia vera in un mondo w èche in w sia vera KKα. KKα è vera in w sse α è vera in tutti i mondi w1, ...,wn accessibili dai mondi che sono accessibilida w. Quindi non deve essere possibile che α sia falsa in uno dei w1, ...,wn e che contemporaneamente Kα sia vera in w.Non deve cioè succedere che esista un mondo wi accessibile da un mondo accessibile da w senza che wi sia accessibileda w stesso. Nei modelli di S4 la relazione di accessibilità R deve quindi essere, oltre che riflessiva, transitiva. E'possibili dimostrare il seguente teorema:

Teorema: S4 è l'assiomatizzazione corretta e completa delle strutture di Kripke in cui la relazione di accessibilitàsia riflessiva e transitiva.

Cioè, se indichiamo con S4 α il fatto che la formula α è valida rispetto alle strutture a mondi possibili in cui R èriflessiva e transitiva, si ha, per ogni formula α, che S4 α sse S4 α.

Un ulteriore schema di assiomi che può essere imposto su K è il seguente:

A5. ¬Kα → K¬Kα,

che impone che il soggetto epistemico sappia di non conoscere ciò che non conosce. A5 è detto usualmente assiomadell'introspezione negativa. Il sistema che comprende gli assiomi e le regole di S4 più A5 viene detto sistema S5.Semanticamente, A5 equivale ad imporre che la relazione di accessibilità fra mondi sia euclidea. Una relazione R si diceeuclidea se vale quanto segue: per ogni x,y,z, se R(x,y) e R(x,z), allora R(y,z). Intuitivamente, il fatto che R sia euclideaserve ad evitare che si verifichino situazioni come quella in fig. 8.1. Nella figura ogni nodo del grafo è un mondo, e gliarchi rappresentano la relazione di accessibilità. Nei mondi w1 e w2 è vera la formula α, mentre in w3 è vera ¬α. Datoun mondo w, A4 vuole escludere che in w sia vera ¬Kα, e che al tempo stesso non sia vera K¬Kα, il che equivarrebbead avere un mondo accessibile da w in cui non valga ¬Kα. Questo è quanto accadrebbe appunto in fig. 8.1, dove,benché ¬Kα sia vera in w, in w1 è vera Kα. Se tuttavia si impone che R sia euclidea, w3 deve essere accessibile a partireanche da w1, nel quale quindi non sarebbe più vera Kα.

fig. 8.1

Nei modelli di S5 R deve essere ad un tempo riflessiva, transitiva ed euclidea. Una relazione R si dice simmetricase, per ogni x,y, R(x,y) comporta R(y,x). E' possibile dimostrare che ogni relazione che sia ad un tempo riflessiva edeuclidea è anche simmetrica. D'altro canto, ogni relazione simmetrica e riflessiva è anche euclidea. Una relazione che siacontemporaneamente riflessiva simmetrica e transitiva viene detta una relazione di equivalenza. Quindi, nei modelli diS5 la relazione R di accessibilità è una relazione di equivalenza.

Page 98: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

6

E' possibile dimostrare che:

Teorema: S5 è l'assiomatizzazione corretta e completa delle strutture di Kripke in cui la relazione di accessibilitàsia una relazione di equivalenza.

Cioè, se indichiamo con S5 α il fatto che la formula α è valida rispetto alle strutture a mondi possibili in cui R è unarelazione di equivalenza, si ha, per ogni formula α, che S5 α sse S5 α.

Il comportamento logico dell'operatore modale B per la credenza è fondamentalmente analogo a quello di K,eccetto per il fatto che, perché una formula del tipo Bα sia vera in un mondo possibile w, non è richiesto che α sia verain w (è cioè possibile che il soggetto epistemico creda cose false). Definiamo un linguaggio logico proposizionale per lacredenza in maniera del tutto analoga a quello per la conoscenza, eccetto per il fatto che la clausola c) per la definizionedell'alfabeto e la clausola iv. per la definizione delle formule vengono sostituite rispettivamente da due clausole c') e iv'.in cui il simbolo K viene sostituito dal simbolo B. Analogamente, la definizione della relazione resta uguale, eccettoper il fatto che la clausola iv. viene sostituita dalla seguente:

iv'. M,w Bα sse M,w' α in tutti i w' t.c. R(w,w').

Le proposizioni (1), (2) e (3) sopra enunciate continuano a valere, mentre al posto della (4) vale la (4'), ottenutasostituendo nella (4) B a K.

A livello sintattico, di teoria della dimostrazione, gli schemi di assiomi A1 e A2 (in cui tutte le occorrenze delsimbolo K siano state sostituite dal simbolo B) sono validi per la logica della credenza. Analogamente, le regole R1 e R2continuano ad essere corrette rispetto alla semantica data. Poiché, a differenza di ciò che si sa, ciò che si crede non devenecessariamente essere vero, nelle strutture di Kripke per la credenza il mondo reale non deve necessariamente essereaccessibile per il soggetto epistemico. Cade quindi il vincolo che la relazione di accessibilità fra mondi possibili siariflessiva. Analogamente, a livello sintattico, non vale il corrispettivo dell'assioma A3. D'altra parte, se si vuole che ilsoggetto epistemico non abbia credenze contraddittorie, si deve aggiungere il seguente assioma:

P. ¬B(α ∧ ¬α).

(Si noti che, per come è definita la semantica, un soggetto epistemico che creda una contraddizione crederebbequalunque cosa; cioè, per ogni formula ben formata α del linguaggio, varrebbe Bα). Nelle strutture di Kripke, l'assiomaP equivale ad imporre che la relazione R di accessibilità sia seriale. Una relazione R è seriale sse, per ogni x, esiste un y,tale che R(x,y). Il fatto che la relazione di accessibilità sia seriale impone che da ogni mondo possibile sia accessibilesempre almeno un mondo. Questo, dato che i mondi sono coerenti, evita che il soggetto epistemico possa credere unacontraddizione10.

Chiamiamo KP il sistema caratterizzato dagli assiomi A1, A2 e P, e dalle regole R1 e R2. Si può dimostrare che:

Teorema: KP è l'assiomatizzazione corretta e completa delle strutture di Kripke in cui la relazione di accessibilitàsia seriale.

Lo schema di assiomi A4 dell'introspezione positiva può essere riformulato per l'operatore di credenza B:

A4. Bα → BBα.

Il sistema formale che comprende l'apparato deduttivo di KP più A4 viene detto S4 debole. Come per S4, A4equivale ad imporre che la relazione di accessibilità sia transitiva, per cui si può dimostrare che:

10Si noti che, nelle logiche per la conoscenza, l'equivalente di P segue facilmente da A3, e non deve quindi essereaggiunto come assioma:

1) K(α ∧ ¬α) → (α ∧ ¬α)2) ¬(α∧ ¬α) → ¬K(α∧ ¬α)3) ¬(α∧ ¬α)4) ¬K(α∧ ¬α).

1) è un esempio di A3; 2) è ottenuto da 1) per contrapposizione; 3) è una tautologia proposizionale, e 4) e ottenuto da 2)e 3) per Modus Ponens. Analogamente, per quanto riguarda la semantica, ogni relazione riflessiva è a sua volta seriale:per ogni w∈W, il fatto che esista almeno un w' t.c. R(w,w') è soddisfatto in quanto R(w,w). Quindi, nei modelli dellelogiche che comprendono lo schema A3, la relazione di accessibilità R è seriale.

Page 99: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

7

Teorema: S4 debole è l'assiomatizzazione corretta e completa delle strutture di Kripke in cui la relazione diaccessibilità sia seriale e transitiva.

Infine, riformulando in termini di credenza lo schema di assiomi per l'introspezione negativa:

A5. ¬Bα → B¬Bα,

e aggiungendolo all'apparato deduttivo di S4 debole si ottiene il sistema formale S5 debole. Anche in questo caso, A5comporta che la relazione di accessibilità sia euclidea, per cui vale il seguente teorema:

Teorema: S5 debole è l'assiomatizzazione corretta e completa delle strutture di Kripke in cui la relazione diaccessibilità sia seriale, transitiva ed euclidea.

In S5 debole risulta valido lo schema lo schema BBα → Bα, il quale, assieme allo schema di assiomi A4,consente di eliminare tutte le iterazioni dell'operatore modale B. Vale a dire, in S5 debole tutte le formule del tipo B ... Bα risultano equivalenti a Bα. Per quanto riguarda le logiche della conoscenza, lo schema corrispondente KKα→ Kα valegià in K, in quanto si tratta di un esempio dello schema di assiomi A3.

In ambito filosofico vi è stato un ampio dibattito su quanto i principi di introspezione positiva e negativa fosseroadeguati a caratterizzare i concetti di conoscenza e di credenza. Tuttavia, tali problemi non sono rilevanti in questa sede,e rimandiamo chi fosse interessato a (Lenzen 1978).

Quanto visto sino ad ora può essere generalizzato al caso in cui i soggetti epistemici siano in numero maggiore diuno. Il linguaggio di una logica della conoscenza o della credenza per n soggetti epistemici comprenderà n operatoridistinti Ki , o, rispettivamente, Bi (con 1≤i ≤ n). Una struttura di Kripke per una logica epistemica a n attori è una n + 2-pla M = (W, ϕ, R1, ... , Rn ), dove R1, ... , Rn sono le relazioni di accessibilità relative a ciascun soggetto. La definizionedella relazione di soddisfacibilità resta identica alla precedente, con l'unica differenza che la clausola iv. deve esseremodificata in modo da tenere conto degli n operatori epistemici. Ad esempio, nel caso della credenza, si avrà:

iv''. M,w Bi α sse M,w' α in tutti i w' t.c. Ri (w,w'), con 1 ≤ i ≤ n.

Cioè, il soggetto i-esimo crede l'enunciato α nel mondo w se e solo se α è vero in tutti i mondi a lui accessibili da w,cioè in tutti i mondi che sono nella relazione Ri con w. Analogamente, assiomi e regole di inferenza devono esseregeneralizzati a n attori. Ad esempio, lo schema A2 per la credenza diventerà:

A2'. Bi α ∧ Bi (α → β) → Bi β, con i = 1, ... , n.

Per ogni sistema formale sopra descritto, esistono i corrispettivi sistemi ad n soggetti epistemici. Ad esempio, alsistema S4 corrispondono i sistemi S4n , e così via. Per tali sistemi valgono le generalizzazioni dei teoremi di correttezzae completezza sopra enunciati11.

Il problema con la semantica dei mondi possibili per il trattamento dei contesti epistemici nasce dallo schema diassiomi A2 e dalla regola di necessitazione (R2). Semanticamente, A2 equivale ad affermare che l'insieme dellecredenze di un soggetto epistemico è chiuso rispetto alla relazione di conseguenza logica: un soggetto deve credere tuttele conseguenze logiche delle sue credenze. R2 comporta invece che debbano essere credute tutte le formule valide, 11Un aspetto particolarmente interessante legato alle logiche del credere che prevedono più soggetti epistemici sono iproblemi legati alla conoscenza comune (common knowledge), che non affronteremo in questa sede, ma che meritanoqualche rapido cenno. Data una formula α, si dice che α è conoscenza comune di un gruppo di attori quando vale che:

1) ogni attore sa che α;2) ogni attore sa che ogni attore sa che α;3) ogni attore sa che ogni attore sa che ogni attore sa che α;

e così via. L'interesse per i problemi della conoscenza comune è nato con un libro del filosofo David Lewis (1969).Lewis ha mostrato che, affinché in un gruppo valga una convenzione (ad esempio, una convenzione di tipo linguistico),essa deve essere conoscenza comune fra i membri del gruppo. Ciò richiede infiniti livelli di conoscenza, e sorge quindiil problema di come le convenzioni possano essere istituite. Questo tipo di ricerche ha avuto interessanti riscontri invarie discipline, fra cui la teoria dei giochi, l'informatica, l'economia e le scienze sociali. Per maggiori informazioni suiproblemi della conoscenza comune si rimanda a (Geanakoplos 1992) e alle varie rassegne sul ragionamento sullaconoscenza citate nel par. 8.1.

Page 100: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

8

ossia, ad esempio, tutte le verità logiche della logica classica. I soggetti epistemici devono quindi essere logicamenteonniscienti. Il punto è che l'onniscienza logica è inevitabile all'interno del paradigma classico della semantica a mondipossibili. Si consideri il sistema formale definito dagli schemi di assiomi e dalle regole seguenti (definito per l'operatoredi credenza B e per un unico soggetto epistemico).

Schemi di assiomi:

A1. Tutti gli assiomi del calcolo proposizionale.A2. Bα ∧ B(α → β) → Bβ.

Regole di inferenza:

R1. da α e α → β segue β (Modus ponens)R2. da α segue Bα (Regola di necessitazione)

Tale sistema viene chiamato usualmente K. Esso comprende, oltre agli assiomi e alle regole (modus ponens) per ilcalcolo proposizionale classico, soltanto lo schema A2 e la regola di inferenza R2, responsabili dell'onniscienza logica.E' possibile dimostrare che:

Teorema: K è l'assiomatizzazione corretta e completa delle strutture di Kripke con relazione di accessibilitàqualsiasi.

Vale a dire, qualsiasi siano le restrizioni imposte sulla relazione R di accessibilità fra mondi possibili, gli schemidi assiomi A1 e A2 restano validi e le regole R1 e R2 continuano ad essere corrette nelle strutture di Kripke. K è percosì dire la base da cui partire per ogni sistema di logica epistemica basato sulla semantica dei mondi possibilitradizionale. La causa di tutto questo risiede nel fatto che i mondi sono logicamente coerenti e completi: la funzione ϕassegna, per ciascun membro di W, uno ed un solo valore di verità (v o f) a ciascuna formula atomica. Di conseguenza,tutte le verità logiche sono vere in ogni mondo possibile. Quindi, dato un mondo w, qualunque sia l'insieme dei mondiaccessibili da esso, le verità logiche valgono in ciascuno di essi, e, per come è stata definita la semantica di B (e di K),esse devono essere credute da ogni soggetto epistemico. Analogamente, sempre perché i mondi sono coerenti ecompleti, se in tutti i mondi accessibili da un mondo w è vero α ed è vero al tempo stesso α → β, allora in ciascuno diessi sarà vero anche β. Quindi l'insieme delle credenze di un soggetto epistemico deve essere chiuso rispettoall'implicazione logica.

Connessa con A2 e R2 è la validità in K del seguente schema:

Bα ∧ Bβ ↔ B(α ∧ β).

Vale a dire, l'operatore B è distributivo rispetto alla congiunzione. B non è tuttavia distributivo rispetto alladisgiunzione: B(α ∨ β) non implica Bα ∨ Bβ in nessuno dei sistemi qui esaminati (anche se l'implicazione inversa èvalida già in K). Analogamente, ¬Bα non implica B¬α (mentre l'implicazione inversa, B¬α → ¬Bα, è valida neisistemi con relazione di accessibilità seriale). Così, mentre Bα ∨ ¬Bα e B(α ∨ ¬α) sono entrambe valide in K, innessuno dei sistemi visti è valida Bα ∨ B¬α (considerazioni analoghe valgono ovviamente anche per l'operatore K diconoscenza)12.

Prima di passare a descrivere i vari approcci sviluppati nell'ambito dell'intelligenza artificiale di impostazionelogica per affrontare il problema dell'onniscienza logica, dedicheremo il prossimo paragrafo alla trattazione dei modelliminimali per le logiche modali. Tali modelli generalizzano la semantica a mondi possibili per le logiche modali, econsentono, per quanto qui ci concerne, di ottenere teorie logiche della credenza in cui il problema dell'onniscienzalogica risulti attenuato.

12Una formulazione alternativa della semantica per le logiche epistemiche è data dalle knowledge structure proposte daFagin, Halpern e Vardi (Vardi 1985, Hamilton e Delgrande 1989, Fagin, Halpern e Vardi 1991). Intuitivamente, unaknowledge structure costituisce l'analogo di una struttura di Kripke, e consiste in una gerarchia di livelli, dove il livello 0è un modello di ciò che è vero nel mondo reale (nel caso proposizionale corrisponde a un assegnamento di valori diverità alle lettere proposizionali del linguaggio), il livello 1 è un modello di ciò che gli agenti epistemici direttamentecredono a proposito del mondo reale, il livello 2 è un modello di ciò che gli agenti credono a proposito delle credenzedel livello 1, e così via. Si dimostra che le knowledge structure sono equivalenti alle strutture di Kripke per le logicheepistemiche proposizionali. Inoltre, Vardi (1986) estende l'approccio delle knowledge structure in maniera da rendereconto delle logiche dei modelli minimali che tratteremo nel prossimo paragrafo, e Hamilton e Delgrande le estendonoalle logiche epistemiche proposte da Levesque e Lakemayer che descriveremo nel cap. 10.

Page 101: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

9

8.3 Modelli minimali e ragionamento epistemico

I modelli minimali (o modelli di Scott-Montague, o neighborood model) generalizzano la semantica a mondipossibili per le logiche modali, in maniera tale che le strutture di Kripke ne costituiscano un caso particolare. Essi sonostati studiati originariamente da Montague (1968) e Scott (1970). Montague (1970) li ha proposti come una possibileformalizzazione per una logica della credenza che superasse alcune delle difficoltà che le strutture di Kripke comportanoper la logica epistemica. I modelli minimali forniscono le logiche della credenza più deboli dal punto di vistainferenziale che sia possibile elaborare all'interno del paradigma dei mondi possibili classici. Al di là della loroadeguatezza nel descrivere le prestazioni di agenti razionali limitati reali, i modelli minimali sono quindi interessanti perindividuare i limiti che l'approccio a mondi possibili pone da questo punto di vista. La presente esposizione è basatafondamentalmente su Chellas (1980). Una formulazione in termini epistemici della logica dei modelli minimali si puòtrovare in Vardi (1986).

Nella logica dei modelli minimali le credenze di un soggetto epistemico non sono chiuse rispetto allaconseguenza logica, e possono essere creduti enunciati contraddittori. Come vedremo, la parte modale della logica chesi ottiene in questo modo è estremamente debole dal punto di vista inferenziale. Di fatto, l'unico vincolo imposto daimodelli minimali sulle credenze è che, se è creduto un certo enunciato α, allora devono essere creduti tutti gli enunciatilogicamente equivalenti a α. Logiche meno deboli possono essere ottenute ponendo ulteriori restrizioni sui modelli.

L'idea intuitiva alla base dei modelli minimali per la logica epistemica consiste nel modellare le credenze di unsoggetto come insiemi arbitrari di proposizioni, ossia di intensioni di enunciati. Un insieme di proposizioni è associato aciascun soggetto epistemico in ciascun mondo possibile. Nessun vincolo viene imposto sulle proposizioni che fannoparte di ciascuno di questi insiemi. Abbiamo visto che, nella semantica a mondi possibili, le intensioni sono modellatecome funzioni da mondi possibili a oggetti semantici nel dominio (par. 1.3). Dato un elemento del linguaggio (adesempio una lettera predicativa, un termine individuale o un enunciato), la sua intensione è una funzione che associa adogni mondo possibile il suo riferimento in quel mondo. Così, ad esempio, in logica dei predicati, l'intensione di unalettera predicativa ad un argomento P è una funzione ψ P da mondi possibili a sottoinsiemi del dominio. Per ognimondo possibile w assunto come argomento, ψ P produce come valore il sottoinsieme del dominio che costituiscel'estensione di P in w. Poiché l'estensione di un enunciato è costituita da un valore di verità, la proposizionecorrispondente (vale a dire, l'intensione dell'enunciato) sarà una funzione da mondi possibili a valori di verità; inparticolare sarà la funzione che, per ogni mondo w, associa a w il valore v (vero) se l'enunciato è vero in w, il valore f(falso) se l'enunciato è falso in w. Nel caso di enunciati, l'intensione può quindi essere caratterizzata in modo equivalentecome un insieme di mondi possibili: l'insieme dei mondi in cui l'enunciato è vero. Vale a dire, data una struttura a mondipossibili M analoga a quelle descritte nel paragrafo precedente, e dato l'insieme W dei mondi possibili, l'intensione di unenunciato α può essere definita come l'insieme {w| M,w α}. Poiché in quanto segue avremo a che fare esclusivamentecon proposizioni (intensioni di enunciati), adotteremo questa seconda formulazione, che ci eviterà inutili complicazioninella formulazione della semantica.

Premesso ciò, possiamo passare alla presentazione formale dei modelli minimali per la logica della credenza. Persemplicità, ci limiteremo al caso in cui si abbia un solo soggetto di credenza. Quanto segue è tuttavia facilmentegeneralizzabile a un numero qualunque di soggetti epistemici. Assumiamo che il linguaggio sia lo stesso definito nelparagrafo precedente. Seguendo Vardi (1986), chiamiamo struttura di credenza un modello minimale per la credenza.Una struttura di credenza è una terna M = (W, ϕ, N), dove, come nelle strutture di Kripke, W è l'insieme dei mondipossibili, e ϕ è una funzione a due argomenti che assegna un valore di verità (v o f) alle proposizioni primitive dellinguaggio in ogni mondo possibile. N è una funzione che assegna al soggetto epistemico un insieme di proposizioni inciascun mondo possibile. Intuitivamente, le proposizioni assegnate da N in ciascun mondo sono le proposizioni credutedal soggetto in quel mondo. D'ora in avanti, data una formula α, indicheremo con propα la sua intensione. Quindi, datele proposizioni propα1

, ..., propnα e un mondo w, N(w) = { propα1

, ..., propnα } significa che α1, ..., αn sono credute in

w. Poiché, come abbiamo visto, ciascuna proposizione è modellata come un insieme di mondi possibili, N sarà unafunzione da mondi possibili a insiemi di insiemi di mondi possibili; quindi, N sarà una funzione di tipo N: W → 22W

.Definiamo ora la relazione come segue:

i. M,w α (per α appartenente all'insieme Φ delle formule primitive) sse ϕ[w,α]=vii. M,w ¬ α sse M,w αiii. M,w α ∧ β sse M,w α e M,w βiv. M,w Bα sse {w'| M,w' α} ∈ N(w).

Le clausole i.-iii. sono identiche a quelle corrispondenti per le strutture di Kripke standard definite nel par. 8.2 Laclausola iv. riflette invece l'idea intuitiva che abbiamo enunciato sopra: una formula di tipo Bα è vera in un mondo w see soltanto se la sua intensione fa parte dell'insieme delle proposizioni credute in w.

Page 102: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

10

Le definizioni di soddisfacibilità, di validità e di conseguenza logica sono analoghe a quelle introdotte nelparagrafo precedente per le strutture di Kripke standard.

Secondo Vardi (1986) i modelli minimali costituiscono, in un certo senso, l'analogo, in una prospettiva modelteoretica tradizionale, delle semantiche per le logiche della credenza basate su insiemi di enunciati, che descriveremo nelprossimo capitolo. Come vedremo, nelle semantiche basati su enunciati si assume che gli oggetti della credenza nonsiano proposizioni, ma formule o enunciati, vale a dire oggetti di tipo sintattico. Ciò che è creduto da un soggetto èrappresentato come un insieme di formule che, come caso limite, può essere del tutto arbitrario. Analogamente, diceVardi, nei modelli minimali le credenze di un soggetto sono rappresentate da un insieme potenzialmente del tuttoarbitrario di proposizioni: per ogni w, non viene posta alcuna condizione sull'insieme N(w) delle proposizioni credute.Unico vincolo, che discende direttamente dalla natura stessa della semantica a mondi possibili, è quello per cui, se dueformule α e β sono logicamente equivalenti, allora, se in un'interpretazione è vera Bα, deve essere vera anche Bβ.Infatti, se α e β sono logicamente equivalenti, esse sono vere esattamente negli stessi mondi possibili. Vale cioè che:

α ↔ β sse propα = propβ .

Se α e β sono logicamente equivalenti, allora hanno la stessa intensione, e sono quindi del tutto indiscernibili dal puntodi vista della semantica qui formulata.

La logica definita dalla classe di modelli sopra descritta non è chiusa né rispetto all'implicazione, né rispettoall'implicazione valida (cioè, se è creduto α, e se α → β, non deve essere creduto necessariamente β). In essa inoltrenon devono essere credute tutte le formule valide. Riguardo a quest'ultimo punto, infatti, una formula del tipo ¬B(α ∨ ¬α) è soddisfacibile. Perché, in un'interpretazione M, si abbia che M,w ¬B(α ∨ ¬α) basta infatti che W ∉ N(w).L'insieme W di tutti i mondi possibili coincide infatti con l'intensione di tutte le tautologie; si ha quindi W= propa a∨¬ .Non è valido quindi lo schema di formule seguente:

N. B(α ∨ ¬α)

Non è neppure valida la regola R1 di necessitazione:

da α si inferisce Bα.

D'altra parte, il fatto che tutte le tautologie abbiano la stessa intensione comporta che, in questa logica, data unatautologia ϕ, se è vero Bϕ, allora, per ogni altra tautologia ψ, sia vero Bψ. Analogamente, possono essere credute dellecontraddizioni: è soddisfacibile, ad esempio, B(α ∧ ¬α). Perché, in un'interpretazione M, si abbia M,w B(α ∧ ¬α) sideve avere che ∅ ∈ N(w). ∅ è infatti l'intensione di tutte le contraddizioni (che, appunto, non sono vere in alcun mondopossibile). Anche in questo caso, quindi, data una contraddizione ϕ, se Bϕ è vera, allora, per ogni altra contraddizione ψ, si avrà che è vero Bψ. Inoltre, è possibile che siano credute formule fra loro contraddittorie, senza che venga credutauna contraddizione esplicita. Ad esempio, si può avere che M,w Bα e M,w B¬α senza che M,w B(α ∧ ¬α): èsufficiente che sia propα , sia propα (cioè il complemento di propα rispetto a W) appartengano a N(w) senza chetuttavia vi appartenga ∅. Si noti infatti che prop¬α = propα . Per quanto concerne la chiusura rispetto all'implicazione,

Bα ∧ B(α→β) → Bβ

non è una formula valida: perché essa non sia soddisfatta in un mondo w è sufficiente che propα e propα β→ ∈ N(w),senza che propβ appartenga a N(w). Considerazioni analoghe valgono per la chiusura rispetto all'implicazione valida. E'facile constatare che anche i due schemi seguenti non sono validi nella logica delle strutture di credenza:

M. B(α ∧ β) → (Bα ∧ Bβ)C. (Bα ∧ Bβ) → B(α ∧ β) .

Si noti infatti che, date due formula α e β, l'intensione della loro congiunzione coincide con l'intersezione delle dueformule, vale a dire: propα β∧ = propα ∩ propβ . Ora, dato un mondo w ∈ W, non è affatto detto che, se propα β∧

appartiene a N(w), vi appartengano anche propα e propβ ; né che, se vi appartengono propα e propβ , vi appartengaanche propα β∧ . Infine, è possibile che in un mondo w non venga creduto nulla, cioè che, per ogni formula α, si abbiaM,w Bα. Perché accada ciò, è sufficiente che si abbia N(w) = ∅ (si noti che, ovviamente, N(w) = ∅ non è la stessacosa di ∅ ∈ N(w)).

Page 103: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

11

La logica delle strutture di credenza quindi, non ponendo vincoli sull'insieme delle proposizioni credute da unsoggetto epistemico, corrisponde a un modello di attore epistemico con capacità inferenziali praticamente nulle. Perquanto concerne la sua assiomatizzazione, abbiamo visto che l'unico vincolo sulla parte modale della logica consiste nelfatto che, qualora venga creduta una formula, devono essere credute tutte le formule ad essa equivalenti. Per quantoconcerne la parte non modale, infine, è facile constatare sulla base delle regole semantiche date sopra, che essa coincidecon il calcolo proposizionale classico.

Possiamo quindi definire un sistema formale, che chiameremo E (Chellas 1980), il cui apparato deduttivo siacaratterizzato come segue:

Gli assiomi siano tutti gli assiomi del calcolo proposizionale.

Come regole di inferenza, avremo il modus ponens e la regola RE così definita:

RE. da α ↔ β si inferisce Bα ↔ Bβ

Si può dimostrare il seguente teorema:

Teorema: Il sistema formale E è l'assiomatizzazione corretta e completa della logica delle strutture di credenza13.

Logiche più potenti si possono ottenere ponendo vari vincoli sull'insieme di proposizioni associate al soggettoepistemico in ciascun mondo possibile. Prenderemo ora in considerazione alcune di tali restrizioni.

Un modello minimale M si dice chiuso rispetto ai soprainsiemi se e soltanto se, per ogni mondo w ∈ W e perogni proposizione (cioè per ogni insieme di mondi) X e Y in M vale la seguente condizione:

(m) se X ⊆ Y e X ∈ N(w), allora Y ∈ N(w).

Si noti che la condizione (m) può essere espressa in maniera equivalente come segue, nei termini di intersezioneinsiemistica:

(m') se X ∩ Y ∈ N(w), allora X ∈ N(w) e Y ∈ N(w).

E' facile constatare che nelle strutture di credenza chiuse rispetto ai soprainsiemi è valido lo schema di formule M sopraenunciato; infatti, per ogni mondo possibile w e per ogni modello M, se propα β∧ = propα ∩ propβ ∈ N(w), allora siavrà che propα ∈ N(w) e propβ ∈ N(w).

Sia EM il sistema formale ottenuto aggiungendo M ad E come schema di assiomi. Si può allora dimostrare ilseguente teorema:

Teorema: Il sistema formale EM è l'assiomatizzazione corretta e completa della logica delle strutture di credenzachiuse rispetto ai soprainsiemi.

Un modello minimale M si dice chiuso rispetto all'intersezione se e soltanto se, per ogni mondo w ∈ W e perogni proposizione (cioè per ogni insieme di mondi) X e Y in M, vale la seguente condizione:

(c) se X ∈ N(w) e Y ∈ N(w), allora X ∩ Y ∈ N(w).

Nelle strutture di credenza chiuse rispetto all'intersezione vale lo schema di formule C. Infatti, se propα ∈ N(w) epropβ ∈ N(w), allora propα β∧ ∈ N(w).

Sia allora EC il sistema formale ottenuto aggiungendo C ad E come schema di assiomi. Si può allora dimostrareil seguente teorema:

Teorema: Il sistema formale EC è l'assiomatizzazione corretta e completa della logica delle strutture di credenzachiuse rispetto all'intersezione.

Si dice che un modello minimale M contiene l'unità se e soltanto se, per ogni mondo w ∈ W, vale che:

13Per la dimostrazione di questo risultato e dei risultati enunciati nel seguito di questo paragrafo si rimanda a (Chellas1980), cap. 7.

Page 104: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

12

(n) W ∈ N(w).

Vale a dire, la proposizione costituita da tutti i mondi possibili deve essere creduta in tutti i mondi. Questo significa chein ogni mondo possibile sono credute tutte le formule valide (tutte le formule valide sono infatti logicamenteequivalenti). Cioè, nelle strutture di credenza contenenti l'unità vale lo schema di formule N.

Sia allora EN il sistema formale ottenuto aggiungendo N ad E come schema di assiomi. Si può allora dimostrareche:

Teorema: Il sistema formale EN è l'assiomatizzazione corretta e completa della logica delle strutture di credenzache contengono l'unità.

Ovviamente, tali condizioni sui modelli possono essere variamente combinate. In particolare, chiameremo filtroun modello minimale che rispetti contemporaneamente le tre condizioni (m), (n) e (c). Sia EMNC il sistema formaleottenuto aggiungendo ad E gli schemi di assiomi M, N e C. Si dimostra che:

Teorema: Il sistema formale EMNC è corretto e completo rispetto all'insieme dei filtri.

E' possibile dimostrare che EMNC è un'assiomatizzazione equivalente del sistema modale K descritto nelparagrafo precedente. La logica delle strutture di credenza risulta in questo modo essere una generalizzazione dellalogica delle strutture standard a mondi possibili di Kripke, che ne sono casi particolari. In particolare, K risulta correttoe completo rispetto all'insieme dei filtri.

Vediamo, in maniera intuitiva, come gli assiomi e le regole modali di K risultino validi rispetto ai filtri. Comeabbiamo visto, il sistema modale K è caratterizzato dal seguente apparato deduttivo:

Schemi di assiomi:

A1. Gli assiomi del calcolo proposizionale.A2. Bα ∧ B(α → β) → Bβ.

Regole di inferenza:

R1. da α e α → β si inferisce β (Modus ponens)R2. da α si inferisce Bα (Necessitazione)

Iniziamo dalla regola di necessitazione. Che essa sia valida rispetto ai filtri segue facilmente dalla condizione (n)sopra enunciata. La necessitazione consente di dedurre Bα per ogni formula α valida. Se α è una formula valida, alloraessa è vera in ogni mondo possibile, pertanto propα = W. Ma, in base a (n), in ogni filtro la proposizione W è creduta inogni mondo possibile, quindi, per ogni w ∈ W, Bα è vera in w.

Per quanto riguarda la validità dello schema di assiomi A2, si deve mostrare che, per ogni filtro, ogni qual voltain un mondo possibile w siano vere Bα e B(α → β), allora in w è vero Bβ. Si noti innanzi tutto che, date due formule α e β, si ha quanto segue:

(*) propα β→ = propα ∪ propβ

vale a dire, l'intensione di α → β è l'unione dell'intensione di β con il complemento dell'intensione di α rispetto a W (α→ β è vera in tutti i mondi in cui è vera β oppure è falsa α). Si è detto inoltre che la proposizione di una congiunzioneè uguale all'intersezione delle proposizioni dei due disgiunti. Quindi:

propα (α β)∧ → = propα ∩ propα β→ .

Da (*) segue che:

propα ∩ propα β→ = propα ∩ propβ .

D'altra parte se Bα è vera in w, allora propα ∈ N(w). Analogamente, se B(α → β) è vera in w, allora propα β→ ∈ N(w).Quindi, per la condizione (c), propα (α β)∧ → ∈ N(w). E' poi ovvio che:

Page 105: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

13

propα (α β)∧ → = propα ∩ propβ ⊆ propβ .

Possiamo dunque concludere, sulla base di (m) (nella sua formulazione (m')), che

propβ ∈ N(w).

Quindi, Bβ è vero in w, e lo schema di assiomi A2 è quindi valido in tutti i modelli di EMNC.Ulteriori condizioni possono essere imposte sui modelli minimali affinché valgano i vari principi modali visti in

precedenza. Ad esempio, affinché in una struttura di credenza M valga lo schema di assiomi P:

P. ¬B(α ∧ ¬α)

basta imporre che valga la seguente condizione:

(p) per ogni w ∈ W, ∅ ∉ N(w),

in base alla quale in nessun mondo possibile può essere creduta una formula contraddittoria (poiché ∅ è l'intensione ditutte le contraddizioni). Abbiamo già messo in luce che, in generale, nei modelli minimali è possibile credere formule fraloro in contraddizione senza credere esplicitamente alcuna contraddizione. Quindi, la condizione (p) da sola non èsufficiente di norma a evitare che siano credute formule fra loro in contraddizione. Questo non accade tuttavia neimodelli chiusi rispetto all'intersezione. Ricordiamo che, data una formula α, α e la sua negazione sono credute entrambein un mondo w se e soltanto se sia propα che il suo complemento rispetto a W propα appartengono a N(w). Poichépropα ∩ propα = ∅, è evidente che (p) e (c) assieme vietano che si abbia sia propα ∈ N(W) che propα ∈ N(W). Sinoti infine che nelle strutture di credenza chiuse rispetto ai soprainsiemi non è possibile che sia creduta una formulacontraddittoria senza che sia creduta qualsiasi formula. Infatti, se per qualche mondo w si ha che ∅ ∈ N(w), allora,poiché l'insieme vuoto è sottoinsieme di qualsiasi insieme, in base a (m') si ha che, per ogni X ⊆ W, X ∈ N(w).

Per quanto riguarda l'introspezione positiva, affinché valga lo schema di assiomi:

A4. Bα → BBα

deve essere imposto sull'interpretazione che, per ogni proposizione X ⊆ W e per ogni w ∈ W, valga quanto segue:

(a4) se X ∈ N(w), allora {w'| X ∈ N(w')} ∈ N(w).

Si noti che, se X è l'intensione di una certa formula α, allora {w'| X ∈ N(w')} è l'insieme dei mondi in cui si crede α, cioèl'intensione di Bα. Quindi la condizione (a4) impone che, per ogni w, se α è creduta in w, allora vi sia creduta anche Bα.

Affinché valga lo schema di assiomi dell'introspezione negativa:

A5. ¬Bα → B¬Bα,

si deve imporre la seguente condizione. Per ogni proposizione X ⊆ W e per ogni w ∈ W, deve valere che:

(a5) se X ∉ N(w), allora {w'|X ∉ N(w')} ∈ N(w).

Analogamente al caso precedente, se X è l'intensione di α, allora {w'|X ∉ N(w')} è l'intensione di ¬Bα. Quindi, se X ∉N(w), cioè se α non è creduta in w, allora ¬Bα è creduta in w.

Se si intende definire una logica della conoscenza, deve valere l'assioma:

A3. Kα → α.

A3 è valido nei modelli in cui, per ogni w ∈ W e per ogni proposizione X ⊆ W,

(a3) se X ∈ N(w), allora w ∈ X.

Vale a dire, ponendo che X sia l'intensione di una formula α, se nel mondo w si sa che α, allora α deve essere vera anchein w (cioè, il mondo w deve appartenere all'intensione di α).

Page 106: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 8

14

Ponendo quindi restrizioni opportune sulle strutture di credenza, si possono ottenere logiche per la credenza e laconoscenza che corrispondono a vari tipi di capacità inferenziali di soggetti epistemici limitati. Vedremo nel seguito unesempio del genere (par. 11.3).

Tuttavia, l'assunzione che due enunciati logicamente equivalenti non siano distinguibili dal punto di vista delragionamento epistemico è una idealizzazione troppo forte, che deve in qualche modo essere mitigata. Come vedremo,in questa direzione è stata sviluppata la maggior parte delle logiche che prenderemo in esame nei prossimi paragrafi.

Page 107: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

9. Credere enunciati9.1 Modelli sintattici per gli atteggiamenti proposizionali

Abbiamo visto che, rispetto al problema dell'onniscienza logica, il limite delle semantiche a mondi possibili perle logiche della credenza può essere considerato una conseguenza del fatto di assumere come oggetto della credenzaproposizioni, ossia intensioni di enunciati. Nella semantica di tipo modellistico una proposizione è una funzione damondi possibili a valori di verità. Poiché due enunciati logicamente equivalenti sono veri esattamente negli stessi mondipossibili, allora due enunciati equivalenti hanno la stessa intensione, e sono quindi indiscernibili dal punto di vistasemantico: se è creduto uno, allora, inevitabilmente, deve essere creduto anche l'altro. Tuttavia, per come sono definitele intensioni, è del tutto legittimo che enunciati con la stessa intensione si comportino in maniera differente rispetto aicontesti di atteggiamento proposizionale. Una possibile soluzione può essere cercata tentando di introdurre unaclassificazione "a grana più fine" per gli oggetti degli atteggiamenti proposizionali. In questa direzione si muoveva già,ad esempio, la proposta dell'isomorfismo intensionale di Carnap, cui abbiamo fatto cenno nel paragrafo 2.1. Una viaestrema, esplorata in ambiti diversi (filosofico, cognitivo, e, appunto, in intelligenza artificiale) consiste nell'assumereche gli oggetti degli atteggiamenti proposizionali e, in particolare, del credere, siano enunciati, vale a dire oggettisintattici, espressioni linguistiche di qualche tipo di linguaggio1. Nell'ambito dell'intelligenza artificiale, un "manifesto"di questo modo di concepire la credenza può essere considerato il lavoro di Moore e Hendrix (1979 e 1982). Laposizione di Moore e Hendrix è formulata in termini di tipo psicologico, ed è legata all'ipotesi della mente come sistemasimbolico, e dell'esistenza di un linguaggio del pensiero. In questa prospettiva, quindi, gli oggetti degli atteggiamentiproposizionali vengono interpretati come espressioni di un linguaggio mentale interno. "Nel nostro modello - affermanoMoore e Hendrix - il credere è spiegato dal fatto che un sistema è in una certa relazione computazionale con espressionidi un linguaggio interno" (Moore e Hendrix 1982, p. 112). Secondo Moore e Hendrix, perché un'espressione dellinguaggio mentale esprima una credenza del soggetto cognitivo devono essere soddisfatte alcune condizioni. Innanzitutto, tale espressione deve essere presente esplicitamente nella memoria del sistema, o comunque deve stare in unarelazione opportunamente specificata (ad esempio nei termini di certi tipi di inferenza) con le espressioni immagazzinateesplicitamente in memoria. Inoltre, perché un'espressione esprima una credenza di un soggetto non è sufficiente che siaimmagazzinata nella sua memoria, in quanto altri atteggiamenti proposizionali oltre al credere (ad esempio temere,desiderare, e così via) possono essere spiegati nei termini di relazioni con espressioni memorizzate del linguaggiomentale. Perché possano essere differenziate dagli oggetti degli altri atteggiamenti proposizionali, le credenze devonoessere specificate funzionalmente, sulla base del tipo di processi (che qui non ci interessa indagare) che operano su diesse e che le connettono agli input e agli output del sistema.

L'insieme delle espressioni che costituiscono le credenze del sistema viene detto da Moore e Hendrix insieme dicredenza (belief set) del sistema stesso. Essi assumono che le espressioni di un belief set possano essere considerate,almeno in prima approssimazione, analoghe a formule del calcolo dei predicati del primo ordine, esteso con operatoriintensionali per gli atteggiamenti proposizionali.

E' chiaro che in questa prospettiva il problema dell'onniscienza logica, e in particolare il problema didiscriminare fra credenze logicamente equivalenti, non si pone. Nel caso di due credenze logicamente equivalenti, adesempio, se esse corrispondono a enunciati diversi, vale a dire a diverse espressioni simboliche del linguaggio internodel sistema, esse devono comunque essere considerate distinte, ed è del tutto concepibile che una di esse appartenga albelief set del sistema senza che vi appartenga anche l'altra.

Si supponga - dicono Moore e Hendrix - che le credenze siano individuate più o meno comeformule del linguaggio interno. Si supponga inoltre che il sistema abbia una particolare formula P nel suobelief set che sia logicamente equivalente a un'altra formula Q, nel senso che esiste un modo di applicarele procedure di inferenza di base del sistema per inferire P da Q e viceversa. Tuttavia, il sistema potrebbenon inserire Q nel suo belief set, perché non ha mai provato a derivare Q, o perché le sue euristiche perapplicare le sue procedure di inferenza non sono sufficienti per trovare la derivazione di Q, o perché laderivazione di Q è talmente lunga che esaurirebbe le risorse di tempo e di memoria del sistema.Solleviamo l'attenzione su questo punto perché la possibilità che 'A crede P' sia vera e 'A crede Q' siafalsa, sebbene P e Q siano logicamente equivalenti, è correntemente considerata uno dei problemiprincipali nella semantica degli enunciati di credenza, specialmente per teorie basate sulla semantica deimondi possibili. (Moore e Hendrix 1982, p. 114).

Moore e Hendrix non sviluppano in senso tecnico la loro proposta. La loro è una sorta di dichiarazione di intentisul metodo che ritengono adeguato per affrontare il problema degli atteggiamenti proposizionali. D'altro canto, in 1Nella letteratura filosofica sono state formulate numerose proposte di assumere come oggetti degli atteggiamentiproposizionali degli enunciati. Queste posizioni, dette anche di tipo citazionale, si distinguono da quelle analoghesviluppate in IA e nelle scienze cognitive per il fatto di utilizzare enunciati del linguaggio pubblico anzichérappresentazioni linguistiche "interne". Le due prospettive sono messe a confronto ad esempio in (Fodor 1978).

Page 108: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 9

2

letteratura si possono trovare esempi di modelli sintattici delle credenze formulati nei termini di insiemi di enunciatianche in lavori più antichi di quelli di Moore e Hendrix (come ad esempio Eberle 1974). Noi prenderemo inconsiderazione nel prossimo paragrafo il modello di Konolige (1984, 1985a, 1986a), il quale sviluppa la propostasintattica in termini che, dal punto di vista logico, risultano più ricchi ed articolati. Konolige utilizza un linguaggioepistemico modale al quale associa una semantica in cui le credenze dei soggetti di credenza sono modellate comeinsiemi di formule. In generale, tali insiemi di formule sono deduttivamente chiusi rispetto a insiemi di regole diinferenza logicamente incomplete.

Prima di procedere ad esporre il lavoro di Konolige è tuttavia opportuna una precisazione. Le trattazioni dellacredenza che prendiamo in considerazione in questo paragrafo sono caratterizzate dal fatto di considerare enunciati, cioèentità di tipo sintattico, quali oggetti del credere. Ciò ha fatto sì che a questo proposito si parlasse talvolta di trattamentisintattici della credenza (ad esempio Levesque (1984b) parla di syntactic approach a proposito di Konolige e di Mooree Hendrix). Questo ha generato alcune ambiguità terminologiche rispetto a un'altra linea di ricerca sul trattamento logicodegli atteggiamenti proposizionali e della credenza in particolare, che è stata anch'essa spesso qualificata comeapproccio sintattico al problema della credenza. Tale linea di ricerca è caratterizzata dal fatto di utilizzare un linguaggiopredicativo del primo ordine anziché un linguaggio modale per formulare la logica degli atteggiamenti proposizionali.Ad esempio, anziché introdurre nel linguaggio un operatore modale di credenza B che assuma come argomenti formuledel linguaggio (per cui "è creduto che α" si esprime mediante la formula Bα), la credenza viene espressa mediante unpredicato ad un posto (ad esempio bel(x)), che assume come argomenti nomi degli oggetti di credenza. Così, aprescindere dai dettagli tecnici, se "α" è il nome dell'oggetto di credenza espresso dalla formula α, "è creduto che α" siesprime mediante la formula bel("α")2. In intelligenza artificiale questo modo di procedere è stato proposto ad esempioda McCarthy(1979). Le formalizzazioni predicative al primo ordine degli atteggiamenti proposizionali sono, di norma,più espressive dei linguaggi proposizionali o del primo ordine modali. Il punto centrale è che, poiché gli oggetti degliatteggiamenti proposizionali sono rappresentati mediante termini del linguaggio, diventa possibile quantificare su diessi. Così, ad esempio, è possibile scrivere formule del tipo:

∃x(α(x) ∧ bel(x))oppure:

∀x(α(x) → bel(x))

(dove α(x) è una formula qualunque del linguaggio in cui compare libera la variabile x), le quali non hanno corrispettivoin un linguaggio modale del primo ordine.

Tale potenza espressiva comporta però l'insorgere di inconsistenze. Nel caso si utilizzi la tecnica dellagödelizzazione come strumento per far riferimento alle formule di una teoria dall'interno della teoria stessa, Montague(1963) ha dimostrato che teorie del primo ordine che includano assiomi corrispondenti a quelli del sistema modale Tassieme agli assiomi per l'aritmetica elementare sono inconsistenti3. Consideriamo una teoria del primo ordine PT il cuilinguaggio comprenda i simboli per l'aritmetica elementare e un predicato a un posto know (trattandosi di un"equivalente" di T, in termini epistemici avremo a che fare con una teoria della conoscenza anziché della credenza).Assumiamo inoltre che, per ogni formula α del linguaggio di PT , "α" sia il numerale che corrisponde al numero diGödel di α. Montague dimostra che, se PT comprende l'assioma per l'aritmetica di Robinson, e se in PT si ha che, perqualsiasi formula α e β, sono dimostrabili:

(i) know("α") → α;(ii) know("α→β") → (know("α") → know("β"));

e se inoltre vale la regola:

PNec: da α segue know("α"),

allora PT è inconsistente. Si noti che (i) è l'equivalente, in un linguaggio del primo ordine, dell'assioma T, (ii)corrisponde all'assioma di distribuzione, e PNec è l'equivalente della regola di necessitazione. La fontedell'inconsistenza sta nel fatto che la rappresentabilità dell'aritmetica in PT fa sì che il linguaggio sia autoreferenziale,per cui è possibile derivare in PT una formula "paradossale" analoga a quella utilizzata da Tarski per dimostrare

2Nel caso di una logica a più soggetti epistemici bel può essere definito come un predicato a due argomenti, di cui ilprimo è un termine che denota un soggetto epistemico, e il secondo è il nome di un oggetto di credenza. Ad esempio,bel(Nicola,"α") significherebbe che Nicola crede che α.3Montague (1963) faceva riferimento al trattamento delle modalità aletiche, ma il suo risultato è automaticamenteestendibile ai contesti epistemici.

Page 109: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 9

3

l'impossibilità di introdurre in maniera consistente un predicato di verità in un linguaggio dotato di autoriferimento. Ladimostrazione del teorema di Tarski si basa sul fatto che in un sistema formale del primo ordine che comprenda ilproprio predicato di verità e che sia in grado di far riferimento alle sue stesse espressioni, può essere dimostrata unaformula equivalente al paradosso del mentitore, ossia un enunciato che asserisce la propria falsità (vale a dire, qualcosadel tipo: "questo enunciato è falso"). Analogamente, in una formalizzazione al primo ordine di una logica dellaconoscenza che comprenda l'aritmetica di Robinson, esiste una formula α per la quale è possibile dimostrare:

(iii) α ↔ know("¬ α").

Intuitivamente, α afferma che è conosciuta la sua stessa negazione4. La formula (iii), assieme a (i), (ii) e PNec, consentedi derivare una contraddizione5. Si tratta di quello che è usualmente noto come the knower paradox.

Il risultato di Montague non dipende dal fatto di utilizzare la gödelizzazione. E' possibile derivare il paradossoogni qual volta si disponga in una teoria del primo ordine di termini che denotano gli oggetti della conoscenza, e sidisponga inoltre di un apparato di operatori sintattici che garantiscano la possibilità di effettuare le necessariemanipolazioni formali sulla struttura di tali termini (come ad esempio un operatore di sostituzione che operi sui nomidelle formule)6.

Thomason (1980) ha mostrato che un risultato analogo a quello di Montague può essere esteso a taluni casi diteorie per la credenza espresse mediante un linguaggio del primo ordine. In particolare, sorgono problemi di consistenzanel trattamento mediante un linguaggio predicativo del primo ordine di S5 debole. Sia PWS5 una teoria del primo ordine,il cui linguaggio comprenda i simboli per l'aritmetica e un predicato a un posto bel. Per ogni formula α e β dellinguaggio, in PWS5 sia dimostrabile quanto segue:

(i') bel("Q"), dove Q è l'assioma per l'aritmetica di Robinson;(ii') bel("α→β") → (bel("α") → bel("β"));(iii') bel("α") → bel("bel("α")");(iv') ¬bel("α") → bel("¬bel("α")");

e inoltre valga la regola:

PNec': da α segue bel("α").

4La possibilità di dimostrare (iii) in PT è una conseguenza del cosiddetto lemma diagonale (diagonal lemma) (si vedaad esempio il cap. 15 di Boolos e Jeffrey 1974). Secondo il lemma diagonale, in una teoria del primo ordine checomprenda l'aritmetica di Robinson (e nella quale quindi sono rappresentabili tutte le funzioni ricorsive) vale quantosegue: per ogni formula β(x) della teoria, con x come unica variabile libera, esiste una formula chiusa α tale che èdimostrabile:

α ↔ β("α").

5Il risultato di Montague è più forte. Per derivare l'inconsistenza da (iii) è sufficiente disporre di (i) e di PNec. Infatti,mediante la logica proposizionale, da (i) e da (iii) si ottiene:

α → ¬αe quindi:

(*) ¬α ,da cui, applicando PNec, si ottiene:

K("¬α").

K("¬α"), in base a (iii), è equivalente ad α, ed è quindi in contraddizione con (*). Alternativamente, Montague dimostrache si ottiene l'inconsistenza qualora in una teoria del primo ordine si disponga, oltre che dell'aritmetica di Robinson, di(i), (ii) e di:

(iv) know("α"), dove α è un assioma della logica del primo ordine;(v) know("know("α") → α")

(dove (iv) e (v), assieme, costituiscono un indebolimento di PNec).6Un tale apparato è necessario ad esempio per mettere in relazione un termine come "α" (ossia, il nome della formula α)con il termine "α → β" (il nome della formula α → β). Nel caso che si adotti una tecnica di gödelizzazione, talistrumenti sono garantiti dalla presenza degli assiomi dell'aritmetica (e dalla conseguente possibilità di rappresentare lefunzioni ricorsive nella teoria).

Page 110: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 9

4

PWS5 , a differenza di PT , non è inconsistente, ma, per ogni formula β, si può derivare bel("β"): essa è, per così dire,inconsistente "dentro" i contesti di credenza. E, ovviamente, diventa inconsistente non appena si aggiunga una premessadel tipo ¬bel("β"). Come si può constatare, (iii') e (iv') sono gli equivalenti nel linguaggio di PWS5 rispettivamente degliassiomi di introspezione positiva e negativa (si noti tuttavia che, per ottenere il risultato sopra enunciato, l'introspezionenegativa è un requisito eccessivo; è sufficiente che sia derivabile lo schema seguente, più debole: (v') bel("bel("α") → α")).

I linguaggi modali, proposizionali e del primo ordine, non presentano questo tipo di problemi, e ciò è dovuto alfatto che il loro potere espressivo è più limitato. E' possibile dimostrare infatti che neppure le formalizzazionipredicative al primo ordine degli atteggiamenti proposizionali danno luogo a inconsistenze qualora il loro potereespressivo venga ridotto a quello dei linguaggi modali (des Rivieres e Levesque 1986). Varie ricerche sono stateeffettuate per individuare teorie per gli atteggiamenti proposizionali formulate al primo ordine estendendonel'espressività al di là di quella dei linguaggi modali senza tuttavia presentare problemi di inconsistenza. Poiché questitemi hanno vaste implicazioni teoriche per l'intelligenza artificiale e per la semantica cognitiva, torneremo su questopunto in sede di conclusioni generali. Il punto che qui ci interessa tuttavia è che l'impostazione di Moore e Hendrix,ripresa da Konolige, ha a che fare con il problema di come interpretare una teoria degli atteggiamenti proposizionali, enon del tipo di linguaggio adeguato per esprimerla (che è il problema posto dalla contrapposizione fra linguaggi modalie linguaggi del primo ordine non modali). Le due istanze, quella che verte sul tipo di linguaggio da adottare e quella cheverte su come interpretare gli enunciati di atteggiamento proposizionale, sono fra loro ortogonali (Konolige 1984,McArthur 1988). Sebbene vi sia una sorta di "affinità storica" fra linguaggi modali e semantica a mondi possibili da unlato, e fra semantica basata su enunciati e linguaggi del primo ordine non modali dall'altro, tuttavia si può elaborare unasemantica basata su insiemi di enunciati per un linguaggio modale, così come una semantica a mondi possibili puòessere associata a un linguaggio predicativo non modale. Konolige (1984) cita esempi per ciascuna di queste possibilità.In un lavoro precedente Konolige aveva proposto un sistema basato su un linguaggio del primo ordine con semantica amondi possibili7, mentre un esempio di linguaggio modale con semantica enunciativa è quello che verrà descritto nelresto di questo capitolo.

9.2 Il sistema di Konolige

Passiamo ora ad esporre il sistema di Konolige per la logica della credenza. Prima di iniziare è necessariaqualche premessa sulla formulazione utilizzata. Konolige formula la sua logica in un linguaggio modale del primoordine (escludendo in un primo tempo la quantificazione all'interno dei contesti epistemici, ed estendendo in seguito lalogica in maniera da affrontare il problema del quantifying in - Konolige 1984, 1986a). Per la teoria delladimostrazione, Konolige non utilizza una formulazione in termini hilbertiani, bensì adotta una variante del calcolo deisequenti di Gentzen, ossia il sistema dei block tableau sviluppato da Beth e da Hintikka (si veda a questo propositoSmullyan 1968). Qui, per uniformità con la trattazione degli altri sistemi presentati, ci limiteremo al casoproposizionale, e presenteremo il sistema di Konolige in maniera più omogenea possibile ad una formulazione di tipohilbertiano.

Konolige parte dall'assunto che le credenze di un agente possano essere descritte ipotizzando un sottosistemadelle credenze (belief subsystem), vale a dire, un insieme di enunciati formulati in un linguaggio interno, cherappresentano le credenze di base dell'agente, su cui sono definiti dei meccanismi che consentano di derivare nuovecredenze a partire dalle credenze di base. Si assume inoltre che come linguaggio interno venga utilizzato un linguaggiodi tipo logico, e che i meccanismi inferenziali siano formulabili in termini di regole logiche. Tale modello, che Konoligechiama deduction model, viene proposto come un modello astratto delle capacità effettive di agenti epistemici reali(siano essi naturali o artificiali). In particolare, non vengono presi in considerazione tutta una serie di aspetti quali ladistinzione fra memoria a lungo e breve termine, il ragionamento su informazioni incerte, il dimenticare, la revisionedelle credenze in presenza di informazioni inconsistenti. Vengono presi in considerazione esclusivamente quelli che,secondo Konolige, sono i due aspetti più importanti del credere e del ragionamento di senso comune: il fatto che lagente può trarre conseguenze da ciò che crede, e il fatto che non ne può trarre tutte le conseguenze logicamentepossibili.

Formalmente, nella logica di Konolige i belief subsystem vengono modellati per mezzo di strutture di deduzione(deduction structure). La deduction structure associata a un soggetto di credenza i è una coppia d(i) = <b(i),ρ(i)>, doveb(i) è un insieme di formule di qualche linguaggio logico L, le quali rappresentano le credenze di base del soggettoepistemico, e ρ(i) è l'apparato deduttivo associato al soggetto epistemico. In linea di principio, deduction structurediverse potrebbero essere dotate di linguaggi diversi. Nel seguito, tuttavia, assumeremo che il linguaggio sia lo stessoper tutte le deduction structure. In una formulazione nello stile della deduzione naturale l'insieme ρ(i) sarebbe costituitoesclusivamente da regole in senso stretto; se invece, come nel nostro caso, si adotta una formulazione di tipo hilbertiano,

7A questo proposito egli cita un suo lavoro inedito dal titolo "Modal logics for belief".

Page 111: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 9

5

ρ(i) deve comprendere, oltre alle regole di inferenza vere e proprie, anche un certo numero di assiomi logici. Tuttavia,poiché gli assiomi logici possono essere considerati regole a zero premesse, assumeremo, per semplicità, che anche nelnostro caso tutti i membri di ρ(i) siano regole.

Konolige impone una serie di condizioni che devono essere soddisfatte dalle deduction structure. Una è lacosiddetta proprietà di chiusura (closure property), in base alla quale l'insieme delle credenze di ogni soggettoepistemico i deve essere chiuso rispetto alle deduzioni consentite da ρ(i). Data una deduction structure <b(i),ρ(i)>, siaBel(<b(i),ρ(i)>) l'insieme delle credenze associato a <b(i),ρ(i)>. Indichiamo con Γ ρ( )i α il fatto che la formula α èderivabile dall'insieme di formule Γ per mezzo delle regole ρ(i). Allora, in base alla proprietà di chiusura, l'insieme dellecredenze di i può essere definito come segue:

Bel(<b(i),ρ(i)>) = {α | b(i) ρ( )i α},

vale a dire, l'insieme delle credenze associate a <b(i),ρ(i)> è l'insieme di formule α che sono derivabili a partire dallecredenze di base b(i) per mezzo delle regole di ρ(i).

La richiesta di chiusura potrebbe sembrare di primo acchito in conflitto con l'esigenza di modellare le prestazionidi soggetti epistemici che non siano logicamente onniscienti. Tuttavia il problema non si pone in quanto una dellecaratteristiche centrali delle deduction structure consiste nell'ammettere la possibilità che l'insieme ρ(i) di regole sialogicamente incompleto. In questo modo la chiusura deduttiva richiesta da Konolige non coincide con la chiusurarispetto alla conseguenza logica. La prima è una proprietà sintattica del processo di derivazione, mentre la seconda è unaproprietà di tipo semantico, che impone che ogni conseguenza logica delle formule dell'insieme sia a sua volta membrodell'insieme. Se le regole in ρ(i) non sono logicamente complete, allora un insieme di formule può essere deduttivamentechiuso senza per questo essere chiuso rispetto alla conseguenza logica. Dal punto di vista della definizione del modello,risulta più conveniente utilizzare un apparato deduttivo incompleto e richiedere la chiusura deduttiva, piuttosto cherinunciare a quest'ultima proprietà mantenendo completo l'insieme delle regole di inferenza. Un modello in cui sidovesse tenere conto di complesse strategie di controllo della derivazione risulterebbe estremamente complicato edinelegante. D'altra parte, l'impiego di regole incomplete consente di prendere in considerazione gran parte dei fenomenirilevanti di incompletezza logica. Due tipi di incompletezza logica delle credenze sono individuati da Konolige comeimputabili rispettivamente a ignoranza di alcune regole di inferenza oppure a limiti nelle risorse computazionali deisoggetti epistemici. Come esempio del primo tipo Konolige cita uno studente che non è in grado di risolvereun'equazione del tipo x+a = b semplicemente perché non conosce la regola che consente di sottrarre la stessa grandezzada entrambi i termini di un'eguaglianza. Un altro esempio di questo genere potrebbe essere individuato nella difficoltà,studiata sperimentalmente dagli psicologi (Wason e Johnson-Laird 1972; Johnson-Laird 1983), che molti soggettipresentano nell'applicare la regola di contrapposizione. Come esempio del secondo tipo si può citare il gioco degliscacchi: ogni giocatore è perfettamente in grado di effettuare ogni singola inferenza che gli consentirebbe, in linea diprincipio, di esaminare tutti i possibili esiti di una partita, tuttavia il numero di tali inferenze è talmente grande daeccedere le possibilità computazionali di ogni soggetto razionale sottoposto a vincoli di finitezza realistici.

E' chiaro che è possibile modellare l'ignoranza di regole logiche mediante insiemi di credenze deduttivamentechiusi: è sufficiente che le regole che il soggetto non conosce non siano disponibili, né in forma esplicita, né comeregole derivate, nella deduction structure che ne modella le credenze. Anche nel secondo caso, quello di incompletezzalogica dovuta a limiti di risorse, ci si può spesso ricondurre a insiemi di credenze chiusi rispetto a un insieme di regoledi inferenza parziali. Si consideri il caso in cui si voglia imporre un vincolo locale sulle risorse disponibili per ognisingola derivazione. In generale, è sempre possibile ricondurre casi di questo genere a processi di derivazione chegodano della proprietà di chiusura. Konolige fa l'esempio di un sistema che disponga del modus ponens come regola diinferenza, e che sia sottoposto a un vincolo in base al quale in ogni derivazione il modus ponens non possa essereapplicato più di un certo numero k di volte. Per modellare questa situazione con una deduction structure che goda dellaproprietà di chiusura, è possibile introdurre una regola analoga al modus ponens tradizionale, cui tuttavia sia associatouna sorta di "contatore" che viene incrementato ad ogni applicazione della regola stessa, in maniera da controllare che laregola non venga applicata più di k volte.

Benché le regole di ρ(i) possano essere incomplete, Konolige assume tuttavia che esse siano logicamente corretterispetto alla semantica del linguaggio. Egli assume infatti che al linguaggio di ogni deduction structure, che, comeabbiamo visto, deve essere un linguaggio di tipo logico, sia possibile associare una semantica di tipo modellistico bendefinita. Questo affinché sia possibile, ad esempio, stabilire quando le credenze di un soggetto sono vere rispetto ad uncerto dominio, o per poter imporre che gli agenti siano razionali, nel senso, appunto, che le regole di inferenza cheutilizzano siano corrette. Tuttavia, sottolinea Konolige, deve essere ben chiaro che l'interpretazione semantica non è unprocesso che avviene "nella testa" del soggetto epistemico. Essa fa parte della metateoria utilizzata da un osservatoreesterno per analizzare la natura delle credenze di un agente. Dal punto di vista dell'agente, un belief subsystem non ènulla di più di un insieme di formule e di processi computazionali definiti su di esse. Inoltre viene richiesto che, in ognideduction structure, le regole in ρ(i) siano effettive, nel senso che deve sempre esistere una procedura algoritmica perottenere la conclusione a partire dalle premesse. Esse devono inoltre godere della proprietà di "provincialità"

Page 112: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 9

6

(provinciality): il numero delle premesse di ogni regola deve sempre essere fissato e finito. Questo garantisce che ogniinferenza effettuata a partire da un certo insieme di credenze valga a prescindere dall'insieme globale delle credenze nelbelief set.

Un'ulteriore proprietà viene imposta da Konolige sulle deduction structure, al fine di rendere conto dellecredenze iterate. Si tratta della cosiddetta proprietà di ricorsione (recursion property), in base alla quale ogni soggettodi credenza ragiona sulle credenze di altri agenti (comprese le proprie) associandogli a loro volta altre deductionstructure, che costituiscono un modello di come il soggetto stesso si rappresenta i sistemi di credenze degli altri agenti(o le sue proprie). Così, ad esempio, se Tizio crede che Caio creda che α, Tizio assocerà a Caio una deduction structurein cui sia derivabile α. Ovviamente, tale deduction structure non è quella che rappresenta nel modello le credenze diCaio, bensì quella che rappresenta il punto di vista di Tizio sulle credenze di Caio. Così, se d(Caio) è la deductionstructure che rappresenta le credenze di Caio, indicheremo con d(Tizio,Caio) la deduction structure che rappresenta ciòche Tizio crede che creda Caio. d(Tizio,Caio), come ogni deduction structure, comprenderà un insieme b(Tizio,Caio) dicredenze di base, e un insieme ρ(Tizio,Caio) di regole di inferenza (di norma, logicamente incomplete). Tali insiemicostituiscono rispettivamente l'insieme delle credenze di base e l'insieme delle regole di inferenza che Tizio attribuisce aCaio. In generale, si avrà che sia b(Tizio,Caio) che ρ(Tizio,Caio) saranno diversi da b(Caio) e ρ(Caio). Questoprocedimento può essere iterato ricorsivamente per rendere conto di qualsiasi livello arbitrario di annidamento dioperatori epistemici. Quindi, ad esempio, d(Tizio,Caio,Sempronio) sarà la deduction structure che rappresenta ciò cheTizio crede che Caio creda a proposito di ciò che crede Sempronio. Chiameremo punto di vista (view) una sequenza dinomi di soggetti epistemici che corrisponde alla descrizione di un sistema di credenze ad un qualsiasi livello diiterazione. Così, v' = Tizio,Caio,Sempronio, v'' = Sempronio,Caio sono esempi di punti di vista. Per ogni punto di vistav, d(v) sarà la deduction structure associata a v. Considereremo i singoli soggetti epistemici come casi limite di punti divista. Così, ad esempio, v''' = i (dove i è un soggetto epistemico) è il punto di vista "oggettivo" sulle credenze di i. Perogni punto di vista v, nella deduction structure che gli è associata si potrà derivare che il soggetto i crede che α se α èderivabile nella deduction structure d(v,i). Per ogni punto di vista v, d(v) deve ottemperare alle condizioni sopraformulate per le deduction structure (proprietà di chiusura, decidibilità delle regole di inferenza in ρ(v), e così via). Casiparticolari di punti di vista sono quelli di tipo v = i,i (dove i è un soggetto epistemico), che rappresentano i punti di vistadei vari soggetti sui loro stessi sistemi di credenze. Ad esempio, d(Tizio,Tizio) è la deduction structure che corrisponde aciò che Tizio crede a proposito del suo stesso sistema di credenze.

Partendo dal concetto di deduction structure, Konolige definisce una classe di logiche della credenza in cui unadeduction structure d(i) viene associata a ciascun soggetto epistemico i, e, ricorsivamente, una deduction structure d(v)viene associata a ciascun punto di vista v. Poiché Konolige prende in considerazione il caso con un numero n di soggettiepistemici, il linguaggio utilizzato sarà un linguaggio modale Ln dotato di n operatori modali di credenza Bi (con 1≤i≤n), uno per ciascun agente epistemico i. Per semplicità, assumeremo che il linguaggio utilizzato in tutte le deductionstructure d(v) sia sempre Ln (in linea di principio tale assunzione non è necessaria, e ogni agente potrebbe utilizzare unlinguaggio "interno" differente, ma questo complicherebbe notevolmente la notazione). Come nel capitolo precedenteutilizzeremo esclusivamente i connettivi ¬ e ∧, assumendo che gli altri operatori verofunzionali vengano introdottimediante definizioni. Si noti che assumere che valga l'interdefinibilità dei connettivi nei linguaggi "interni" dellededuction structure è arbitrario. Anche questa assunzione tuttavia è dovuta esclusivamente a comodità espositiva, e puòfacilmente essere evitata.

Semanticamente, la parte non modale del linguaggio viene interpretata mediante le usuali tecniche di teoria deimodelli, mentre, per quanto riguarda le formule modali, per ogni soggetto i, una formula del tipo Bi α viene consideratavera nel caso che α sia deducibile in d(i). Quindi, una interpretazione M per una logica delle deduction structure è unacoppia M = (ϕ,D), dove ϕ è una funzione interpretazione che assegna valori di verità alle formule del linguaggio, e D èun insieme di deduction structure d(v), una per ciascun punto di vista v. La relazione è così definita:

M p (per p atomica) se e solo se ϕ[p]=v;M ¬α se e soltanto se M α;M α ∧ β se e soltanto se M α e M β;M Bi α se e soltanto se α ∈ Bel(d(i)) (dove d(i) ∈ D).

Come usuale, una formula α si dice valida se e soltanto se, per ogni interpretazione M, si ha che M α. Una formula α èsoddisfacibile se esiste un'interpretazione M per cui M α.

Si noti che le prime tre clausole della definizione di sono del tutto analoghe alle corrispondenti clausole per lalogica proposizionale classica. Per quanto riguarda la verità delle formule modali, come si è detto essa è definita sullabase degli insiemi di credenza associati alle deduction structure dei vari soggetti epistemici. Tali insiemi di credenzesono appunto oggetti sintattici, che Konolige inserisce nei modelli della sua logica a fianco agli usuali costrutti di tipoinsiemistico. Un soggetto epistemico i crede che α (cioè, è vera la formula Bi α) se e soltanto se α è derivabiledall'insieme b(i) delle formule che rappresentano le credenze di base di i per mezzo delle regole di inferenza ρ(i)associate alla sua deduction structure. Quindi, i è logicamente onnisciente se e solo se le regole di ρ(i) sono logicamente

Page 113: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 9

7

complete. E' evidente inoltre che, in generale, se un soggetto i crede che α e α è logicamente equivalente a β, non èdetto che i creda anche β: nel modello α e β, in quanto oggetti di credenza, sono formule, e quindi entità sintattichedistinte.

Per quanto riguarda la teoria della dimostrazione, le logiche delle deduction structure possono essereassiomatizzate mediante un sistema formale BK caratterizzato dal seguente apparato deduttivo:

assiomi:- assiomi del calcolo proposizionale

regole di inferenza:

- da α e da α → β segue β (modus ponens)- da Biα1 ... Bi kα e da α1.... α k ρ( )i β segue Biβ (Regola di collegamento RC)- un insieme di regole ρ(v) per ciascun punto di vista v (fra cui un insieme di regole ρ(i) per ciascunsoggetto di credenza i)

Le inferenze che coinvolgono formule nell'ambito degli operatori modali di credenza vengono effettuate per mezzo dellaregola di collegamento procedurale RC (procedural attachment rule), che consente di effettuare inferenze in BK"collegandosi" alle strutture sintattiche comprese nel modello. RC fa infatti riferimento esplicito alle relazioni diderivazione ρ( )i comprese nelle varie deduction structure associate ai vari soggetti epistemici. In base a RC, date leformule Bi α1 ... Bi α k , se da α1 ... α k segue β sulla base delle regole ρ(i) della deduction structure d(i), allora si puòinferire che il soggetto i-esimo crede che β (è derivabile cioè Bi β).

Il meccanismo delle regole di collegamento procedurale è anche ciò che permette di dedurre formule conmodalità iterate in BK, consentendo di mettere fra loro in relazione le deduction structure corrispondenti ai diversi puntidi vista. Si è detto che il linguaggio "interno" associato alle deduction structure relative ai vari soggetti epistemici è lostesso linguaggio modale Ln della teoria. Per come è definito il modello, la possibilità di derivare formule con modalitàiterate è legata alla possibilità di dedurre formule modali nelle deduction structure associate ai soggetti di credenza. Ciòè garantito da regole di collegamento interne alle deduction structure relative ai vari punti di vista. Dato un punto divista v' = v,i (dove v è a sua volta un punto di vista e i è un soggetto epistemico), le formule derivabili in d(v,i) devonopoter influire sulle formule modali derivabili in d(v). Così, per ogni punto di vista v, ρ(v) comprenderà la regola dicollegamento relativa ad ogni soggetto "visibile" da v, vale a dire la regola:

da ρ( )v Bi α1 ... ρ( )v Bi α k e da α1 .... α k ρ( , )v i β segue ρ( )v Bi β

per ogni soggetto epistemico i "collegato" al punto di vista v.Si può dimostrare che BK è corretto e completo rispetto alla semantica delle deduction structure sopra definita.Si è visto che, nella logica di Konolige, ogni soggetto epistemico i è logicamente onnisciente se e soltanto se le

regole comprese in ρ(i) sono classicamente complete. Generalizzando questa condizione ad ogni punto di vista v, si puòdimostrare che, come caso limite, la logica BK equivale alla logica epistemica classica, basata sulla semantica a mondipossibili. Diremo che una logica è satura se, per ogni punto di vista v, le regole associate a v sono proposizionalmentecomplete e se comprendono una regola di collegamento definita per ogni soggetto i. Chiameremo BKS la versionesatura del sistema BK. E' possibile dimostrare l'equivalenza fra BKS e K n (il sistema K ad n soggetti epistemici). Valecioè il seguente risultato:

Teorema (Konolige 1984, 1986a): per ogni formula α,

Kn α se e soltanto se BKsα.

Varie proprietà degli operatori di credenza possono essere ottenute imponendo ulteriori vincoli sulle deductionstructure. Ad esempio, affinché valga il principio di introspezione positiva:

Bi α → Bi Bi α,

deve valere che, per ogni soggetto i e per ogni formula α:

α ∈ Bel(d(i)) ⇒ Bi α ∈ Bel(d(i)).

Page 114: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 9

8

In questo caso, secondo la terminologia di Konolige, la deduction structure d(i) gode della proprietà di completamentopositivo (positive fullfillment). Affinché valga il principio di introspezione negativa:

¬ Bi α → Bi ¬ Bi α,

deve valere che, per ogni soggetto i e per ogni formula α:

α ∉ Bel(d(i)) ⇒ ¬ Bi α ∈ Bel(d(i)).

In tal caso d(i) gode della proprietà di completamento negativo (negative fullfillment). Per un trattamento approfonditodei principi di introspezione nelle logiche delle deduction structure e dei problemi che essi pongono si vedano(Konolige 1984, 1985b, 1986a).

Il modello di Konolige, come d'altronde tutti i modelli sintattici della credenza, ha suscitato molte perplessità inambito logico. Levesque (1984a, 1984b) ad esempio, sostiene che i modelli sintattici presentano il difetto oppostorispetto alla semantica dei mondi possibili: se quella è di grana troppo grossolana per modellare gli atteggiamentiproposizionali, questi, considerando ogni enunciato un'entità semantica distinta, ammettono distinzioni di grana troppofine. Levesque sceglie come esempio la disgiunzione di due formule α e β. Dal punto di vista intuitivo, ai fini delragionamento epistemico l'ordinamento dei due disgiunti sembra essere del tutto irrilevante: non c'è ragione di pensareche si possa credere "α oppure β" senza credere anche "β oppure α". Tuttavia, α ∨ β e β ∨ α sono formulesintatticamente distinte, e perciò, in linea di principio, una di esse può comparire in un belief set senza che vi compaiaanche l'altra. Che in una disgiunzione i due disgiunti debbano apparire in un certo ordine è un fatto puramenteaccidentale, dovuto esclusivamente alla natura della notazione. Tuttavia, "l'approccio sintattico - dice Levesque - rendel'ordinamento da sinistra a destra dei disgiunti semanticamente significativo, in quanto possiamo credere un ordinamentosenza credere l'altro" (Levesque 1984b, p. 5). Ovviamente si può risolvere il problema ponendo restrizioni sulla strutturadei belief set. Ad esempio, nel modello di Konolige, si può imporre che ogni ρ(v) comprenda la regola:

da ρ( )v α∨β segue ρ( )v β∨α.

Tuttavia si tratta di una soluzione ad hoc, che, secondo Levesque, risulta del tutto immotivata dal punto di vistasemantico. Quali altre condizioni di questo tipo dovrebbero essere imposte sui belief set? Si potrebbe richiedere,continua Levesque, che, se in un belief set è compresa la formula ¬¬α, allora vi debba essere compresa anche laformula α; che se vi sono due formule α e β, allora vi debba essere anche la loro congiunzione α∧β, che tutte letautologie "ovvie", come ad esempio α→α, siano comprese in ogni belief set (con tutti i problemi che derivano dallostabilire quali tautologie siano "ovvie"). Il modello non dice assolutamente nulla su quali di queste scelte effettuare.

Il problema principale è che la "semantica" di Konolige si può definire tale solo in un senso estremamentedebole: il significato di un sottoinsieme del linguaggio (quello più problematico, cioè le formule che compaiononell'ambito degli operatori modali di credenza) viene definito semplicemente mappando le strutture del linguaggio suloro stesse. In questo modo tutto si appiattisce su di un livello sintattico indistinto. Il vincolo che pone Konolige, in baseal quale il linguaggio delle deduction structure deve essere a sua volta un linguaggio logico cui sia possibile associareuna semantica di tipo modellistico, resta lettera morta, rimane cioè del tutto estrinseco rispetto a come la semantica dellalogica viene definita. Così, anche la richiesta che le regole di inferenza di ogni deduction structure siano logicamentecorrette risulta del tutto "immotivata" ed ininfluente dal punto di vista di come i modelli sono definiti. Anche lo stessomeccanismo dei punti di vista e delle regole di collegamento procedurale che connettono i vari punti di vista fra loro,introdotto per giustificare le modalità iterate, resta completamente "opaco" per la semantica del sistema, rimane cioè unpuro meccanismo formale, in quanto nel modello tutto quanto si trovi nell'ambito di un operatore modale si riduce ad unpiano puramente sintattico. La semantica del sistema resterebbe esattamente la stessa qualunque cosa ci fosse all'internodegli insiemi di credenza Bel(d(i)) associati ai soggetti epistemici.

Nei paragrafi seguenti esamineremo alcuni tentativi per superare, almeno in parte, questo genere di problemi. Nelprossimo paragrafo, in particolare, prenderemo in considerazione la proposta di Levesque di fornire una logica per ilragionamento epistemico limitato dotata di "una semantica che (come quella dei mondi possibili) sia basata su qualcheconcetto di verità piuttosto che su di una collezione di restrizioni ad hoc su insiemi di enunciati" (Levesque 1984b, p.5).

Page 115: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

10. Credenze esplicite e mondi non classici10.1 La logica della credenza esplicita ed implicita di Levesque

Dati i limiti e i problemi posti dai trattamenti sintattici della credenza, Levesque (1984) propose un trattamento ditipo "semantico" per la logica del credere, in cui il problema dell'onniscienza logica fosse affrontato utilizzando, anzichéi mondi possibili classici della semantica di Kripke, strutture semantiche di tipo non classico. Abbiamo visto nel par. 8.2che il problema dell'onniscienza logica nelle logiche epistemiche basate sulla semantica di Kripke è legato al fatto cheogni mondo possibile deve essere coerente (deve cioè assegnare al più un valore di verità a ciascuna formula primitiva)e completo (deve cioè assegnare almeno un valore di verità a ciascuna formula primitiva). La soluzione proposta daLevesque consiste nel sostituire ai mondi della semantica kripkeana entità semantiche che possano eventualmente essereincomplete (che cioè non assegnino alcun valore di verità ad alcune delle formule primitive del linguaggio) e/oincoerenti (che cioè assegnino entrambi i valori di verità ad alcune delle formule primitive). Utilizzando la terminologiadi Barwise e Perry (1983), Levesque chiama tali strutture semantiche situazioni (situations)1. L'idea intuitiva che motival'utilizzo di situazioni incomplete consiste nel fatto che le situazioni dovrebbero modellare la parte di realtà che si ritienerilevante rispetto alle credenze di un soggetto epistemico, lasciando indeterminato tutto il resto. "Si consideri - diceLevesque - la situazione in cui io siedo al mio terminale al lavoro. Potremmo dire che questa situazione giustifica il fattoche io sono al lavoro, che qualcuno è al mio terminale, che c'è un libro oppure un terminale sulla mia scrivania, e cosìvia. D'altro canto, essa non motiva l'opinione che mia moglie è a casa, che non è fuori a fare acquisti, e neppurel'opinione che essa è oppure non è a casa. Benché quest'ultimo fatto sia certamente vero, io che siedo al mio terminalenon ha nulla a che fare con tutto ciò" (Levesque 1984a, p. 199). L'uso di situazioni incoerenti viene motivato sulla basedel fatto che un soggetto epistemico può avere concezioni o informazioni sbagliate che lo portano a ritenere possibilistati di cose che di fatto non lo sono.

Come vedremo, l'uso di situazioni anziché di mondi possibili consente di elaborare modelli del ragionamentoepistemico in cui le credenze di un attore epistemico non siano logicamente chiuse rispetto alla conseguenza logicaclassica. Tuttavia Levesque propone di mantenere nella logica da lui proposta anche il concetto di credenza tipico dellelogiche epistemiche tradizionali (che implica appunto la chiusura deduttiva rispetto all'implicazione classica),distinguendo due modi diversi di caratterizzare la credenza. Secondo Levesque non è produttivo considerarel'onniscienza logica come un'idealizzazione delle capacità inferenziali di un soggetto razionale. Le logiche epistemichetradizionali modellerebbero piuttosto quella che Levesque chiama credenza implicita (implicit belief)2. La credenzaimplicita ha a che fare con tutto ciò che è implicito in ciò che di fatto è creduto da un soggetto. In altri termini, dal puntodi vista delle credenza implicita si prende in considerazione "non ciò che un agente crede direttamente, ma cosa sarebbeil mondo se ciò che egli crede fosse vero" (p. 198). Così, se è creduta α, e α implica logicamente β, allora è credutaimplicitamente anche β, in quanto non sarebbe possibile un mondo in cui sia vera α e falsa β. E' quindi corretto che lacredenza implicita sia chiusa rispetto alla conseguenza logica. Viceversa, il problema dell'onniscienza logica si ponerispetto alle credenze effettive di un soggetto epistemico. Tutto ciò che un soggetto epistemico ritiene effettivamentevero (oppure, potremmo dire, tutte quelle credenze che hanno un potenziale riscontro sul suo comportamento) è detto daLevesque una credenza esplicita (explicit belief).

La logica che Levesque propone è una logica della credenza implicita ed esplicita, che consente di prendere inconsiderazione contemporaneamente i due tipi di credenza. Il linguaggio di tale logica comprende quindi due operatorimodali distinti, uno per la credenza implicita ed uno per la credenza esplicita, che indicheremo rispettivamente con isimboli B ed E3.

Levesque ha formulato originariamente la logica della credenza implicita ed esplicita in maniera da nonammettere modalità iterate. Il linguaggio della logica della credenza implicita ed esplicita è dunque il seguente.L'alfabeto è lo stesso dei sistemi del par. 8.2, con in più l'operatore modale E per la credenza esplicita. L'insieme delleformule ben formate è definito come il più piccolo insieme tale che:

i. ogni lettera proposizionale è una formula;ii. se α è una formula, allora (¬ α) è una formula;

1Si noti tuttavia che la situations semantics ha, in generale, poco a che fare con le logiche che esamineremo in questocapitolo. L'analogia non va oltre il fatto che in entrambi i casi le situazioni rappresentano stati di cose parziali.2Sul fatto che le logiche epistemiche tradizionali possono essere viste come logiche della credenza implicita si veda adesempio (Lenzen 1978). Un'analisi dei concetti di conoscenza implicita ed esplicita viene affrontata in (Stalnaker 1991),il quale, ad esempio, analizza diverse motivazioni in base alle quali accettare l'idealizzazione della conoscenzaimplicita.3Questa scelta notazionale è dovuta a ragioni di comodità. Come vedremo infatti l'operatore per la credenza implicita sicomporta in maniera analoga all'operatore B delle logiche epistemiche viste nel par. 8.2. La notazione di Levesque èdiversa: egli utilizza B per la credenza esplicita e adotta come operatore di credenza implicita il simbolo L, solitamenteutilizzato in logica come operatore modale aletico di necessità.

Page 116: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

2

iii. se α e β sono formule, allora (α ∧ β) è una formula;iv. se α è una formula che non contiene alcuna occorrenza di B o di E , allora (Bα) e (Eα) sonoformule.

Per quanto riguarda l'uso delle parentesi e la definizione degli altri operatori verofunzionali, assumiamo che valgano lestesse convenzioni del par. 8.2.

Vediamo ora la semantica per la logica di Levesque. Definiamo un'interpretazione M per la logica della credenzaimplicita ed esplicita come una terna M = (S, B, ϕ), dove S è l'insieme di tutte le situazioni, B è l'insieme delle situazionicompatibili con ciò che è creduto dal soggetto epistemico4, e ϕ è una funzione interpretazione a due argomenti che, perogni situazione s, assegna i valori di verità alle formule primitive del linguaggio. Si noti che, a differenza di quantoavviene nelle strutture di Kripke (cfr. par. 8.2), i valori di ϕ non possono essere singoli valori di verità, ma devonoessere sottoinsiemi dell'insieme {v, f}. Questo è dovuto al fatto che le situazioni, a differenza dei mondi, possono essereincoerenti o incomplete, così che, data una situazione s ∈ S e una formula primitiva α, vi sono casi in cui ϕ deve poterassociare come valore all'argomento [s, α] una coppia di valori di verità, oppure nessun valore di verità. Così, adesempio, se α è vera nella situazione s si avrà ϕ[s, α] = {v}, se α è sia vera che falsa in s si avrà che ϕ[s, α] = {v, f}, se α non è né vera né falsa in s si avrà che ϕ[s, α] = ∅. Così, se Φ è l'insieme delle formule primitive, ϕ è una funzione ditipo ϕ: S × Φ→ 2 v f,l q.

E' chiaro che i mondi possibili classici utilizzati nelle strutture di Kripke sono casi particolari delle situazionidella presente semantica. Diremo quindi che una situazione s ∈ S è un mondo se e soltanto se, per ogni formulaprimitiva α del linguaggio, si ha che ϕ[s,α] è uguale a {v} oppure a {f}. Sono mondi cioè tutte le situazioni che sianocoerenti e complete. Definiamo ora l'insieme W(s) dei mondi compatibili con una situazione s in un'interpretazione M:

W(s) = {w∈S |a) w è un mondo;e, per ogni formula atomica α del linguaggio:b) se v ∈ ϕ[s,α], allora v ∈ ϕ[w,α];c) se f ∈ ϕ[s,α], allora f ∈ ϕ[w,α]}.

W(s) è dunque l'insieme di tutti i mondi che concordano con s dove s è definita (o, in altri termini, l'insieme dei mondiche "completano" la situazione s in tutte le maniere possibili). Si noti che, se s è una situazione incoerente, allora nessunmondo possibile è compatibile con s, cioè W(s) = ∅ (infatti, se s è incoerente, allora, per qualche α, si dovrà avere ϕ[s,α] = {v, f}; in tal caso, per ogni w ∈ W(s), si dovrebbe avere v, f ∈ ϕ[α,w], il che è incompatibile con la definizione dimondo data sopra). Sia S' un sottoinsieme di S. Definiamo allora W(S') come l'unione di tutti i W(s) per ogni s in S'.Così, ad esempio, in un'interpretazione M, W(B) è l'insieme di tutti i mondi compatibili con le situazioni ritenutepossibili dal soggetto epistemico. Si noti inoltre che, dato l'insieme S, W(S) è l'insieme di tutti i mondi compresi in S.

Prima di passare a definire le regole semantiche, si noti che in un'interpretazione così definita, data una formula αe una situazione s, non è detto che α sia vera se e soltanto se ¬α è falsa: può accadere che α e ¬α siano entrambe verein s, o che nessuna delle due lo sia. Quindi, nella definizione delle regole semantiche per il linguaggio non è sufficienteuna relazione di soddisfacibilità definita come per le strutture di Kripke standard (par. 8.2). Vengono quindiintrodotte due relazioni distinte v e f , dette da Levesque relazioni di sostegno (support relation), dove M,s v αe M,s f α possono essere lette rispettivamente come "la situazione s sostiene la verità della formula αnell'interpretazione M" e "la situazione s sostiene la falsità della formula α nell'interpretazione M". v e f sonodefinite dalle seguenti clausole:

M,s v p dove p è una formula primitiva, sse v ∈ ϕ[s,p],M,s f p dove p è una formula primitiva, sse f ∈ ϕ[s,p],

M,s v ¬ α sse M,s f α,M,s f ¬ α sse M,s v α,

M,s v α ∧ β sse M,s v α e M,s v β,M,s f α ∧ β sse M,s f α oppure M,s f β,

M,s v Eα sse M,s' v α per tutte le situazioni s' ∈ B,

4Poiché non sono ammesse modalità iterate, non è necessario introdurre una relazione di accessibilità fra situazioni, maè sufficiente indicare quali sono le situazioni accessibili al soggetto epistemico nel mondo reale.

Page 117: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

3

M,s f Eα sse M,s v Eα,

M,s v Bα sse M,s' v α per tutte le s' ∈ W(B),M,s f Bα sse M,s v Bα.

E' facile constatare che, se ci si limita a mondi anziché a situazioni, la parte non modale della logica così definitaequivale alla logica proposizionale classica (in particolare, per ogni interpretazione M e per ogni w ∈ W(S), si avrà cheM,w v ¬α sse M,w v α). Dato un mondo w ∈ W(S) e un'interpretazione M, diremo che una formula α è vera in w see soltanto se M,w v α. Altrimenti, diremo che α è falsa in w. Si noti che definire la verità rispetto a mondi anzichérispetto a generiche situazioni equivale, dal punto di vista intuitivo, a compiere l'assunzione che il mondo reale,qualunque esso sia, sia appunto un "mondo", sia cioè coerente e completo. In questo modo le situazioni incoerenti e/oincomplete vengono considerate entità semantiche con lo scopo esclusivo di modellare gli stati cognitivi di un soggettoepistemico. In base a questa definizione di verità una formula è vera se e soltanto se essa non è falsa, se e soltanto se lasua negazione è vera. Diremo che una formula α è valida (in simboli α) se e soltanto se per ogni interpretazione M eper ogni mondo w ∈ W(S), si ha che M,w v α. Diremo che una formula è soddisfacibile se e soltanto se la suanegazione non è valida.

Per quanto concerne la credenza implicita, si può facilmente constatare che la logica così definita, rispettoall'operatore B, coincide con il sottoinsieme di K (par. 8.1) che non comprende modalità iterate. In particolare, sonocredute implicitamente tutte le formule (non modali) valide. Vale cioè che:

se α, allora Bα.

Inoltre, la credenza implicita è chiusa rispetto all'implicazione materiale, è cioè valida la formula seguente:

B α ∧ B(α → β) → Bβ.

Più interessante è il comportamento dell'operatore E per la credenza esplicita. Si può constatare innanzi tutto chela credenza esplicita non è chiusa rispetto all'implicazione materiale. E' soddisfacibile, ad esempio, il seguente insiemedi formule:

(*) {Ep, E(p → q), ¬Eq}.

Per comprendere perché ciò avvenga, si consideri innanzi tutto che, sulla base delle definizioni delle relazioni disostegno e del connettivo "→", si ha che, per ogni interpretazione M e per ogni situazione s:

M,s v α → β se e soltanto se M,s f α oppure M,s v β.

Affinché le formule di (*) siano soddisfatte in un'interpretazione M è necessario che, per ogni s ∈ B, p e p → q sianovere in s, mentre deve esistere almeno un s' ∈ B per cui q è falso in s'. Che ciò sia possibile è evidente se si considerauna situazione s' per la quale valga quanto segue:

ϕ[s',p] = {v, f},ϕ[s',q] = {f}.

In s' è vera p (in quanto v ∈ ϕ[s',p]), ed è vera anche p → q (in quanto f ∈ ϕ[s',p]), ma al contempo q risulta esserefalsa.

Le formule valide non devono necessariamente essere credute esplicitamente. Ad esempio, è soddisfacibile laseguente formula:

(**) ¬E(p ∨ ¬p).

Perché ciò accada p ∨ ¬p deve essere falsa in almeno una situazione s ∈ B. A tal fine è sufficiente che in s il valore diverità di p non sia definito, che si abbia cioè ϕ[s,p] = ∅.

Si noti inoltre che, a differenza delle logiche basate sui modelli minimali (par. 8.3), nella logica della credenzaimplicita ed esplicita di Levesque è possibile che una formula valida sia creduta esplicitamente senza che al contemposia creduta esplicitamente ogni formula valida. In generale, possono non essere credute esplicitamente le formulelogicamente equivalenti a una formula creduta esplicitamente. Così, è soddisfacibile il seguente insieme di formule:

Page 118: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

4

(***) {Ep, ¬E(p ∧ (q ∨ ¬q))}.

Questo accade se p è vera in tutte le situazioni di B, ma, al contempo, esiste una situazione s ∈ B in cui il valore diverità di q non è definito.

Infine, una contraddizione può essere creduta esplicitamente, senza che al tempo stesso sia creduta esplicitamentequalsiasi formula. Possono ad esempio essere soddisfatte le seguenti formule:

(****) {Ep, E¬p, ¬Eq}.

E' sufficiente che, per ogni s ∈ B, ϕ[s,p] = {v, f}, ma che al contempo esista s' ∈ B per cui v ∉ ϕ[s',q].Per quanto concerne le relazioni fra conoscenza implicita ed esplicita, nella logica qui descritta tutto ciò che è

creduto esplicitamente è anche una credenza implicita del soggetto epistemico. E' valida cioè la seguente formula:

Eα → Bα.

Ciò è chiaro se si considera che, per ogni situazione s, se s è coerente, allora tutti i mondi in W(s) "completano" s,mantenendo i valori di verità che valgono in s dove s è definita; d'altra parte, se s è incoerente, allora W(B) = ∅. Quindi,le formule che sono vere in tutte le situazioni s ∈ B sono vere anche in tutti i mondi w ∈ W(B).

Si noti inoltre che se un soggetto epistemico crede esplicitamente una contraddizione, allora egli credeimplicitamente ogni formula proposizionale. Cioè, se β è una formula proposizionale qualunque, vale che:

E(α ∧ ¬α) → Bβ.

Infatti, se è vero E(α ∧ ¬α), allora, per ogni s ∈ B, s è incoerente e W(s) = ∅. Quindi W(B) = ∅, e, di conseguenza,ogni formula è vera in tutti gli elementi di W(B).

Per quanto riguarda la teoria della dimostrazione, Levesque fornisce la seguente assiomatizzazione della logicada lui proposta:

assiomi:

(1) assiomi del calcolo proposizionale(2) Bα ∧ B(α → β) → Bβ(3) Eα → Bα(4) E(α ∧ β) ↔ E(β ∧ α)(5) E(α ∨ β) ↔ E(β ∨ α)(6) E(α ∧ (β ∧ γ)) ↔ E((α ∧ β) ∧ γ)(7) E(α ∨ (β ∨ γ)) ↔ E((α ∨ β) ∨ γ)(8) E(α ∧ (β ∨ γ)) ↔ E((α ∧ β) ∨ (α ∧ γ))(9) E(α ∨ (β ∧ γ)) ↔ E((α ∨ β) ∧ (α ∨ γ))(10) E¬(α ∨ β) ↔ E(¬α ∧ ¬β)(11) E¬(α ∧ β) ↔ E(¬α ∨ ¬β)(12) E¬¬α ↔ Eα(13) Eα ∧ Eβ ↔ E(α ∧ β)(14) Eα ∨ Eβ → E(α ∨ β).

Regole:

- da α e α →β segue β (modus ponens)- da α segue Bα (regola di necessitazione).

Si può quindi dimostrare il seguente risultato:

Teorema: La precedente assiomatizzazione è corretta e completa rispetto alla logica della credenza implicita edesplicita. (Levesque 1984a, b)

Un'assiomatizzazione più sintetica della logica della credenza implicita ed esplicita è riportata inMcArthur(1988), che fornisce il seguente sistema di assiomi:

assiomi:

Page 119: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

5

(1-3) (come sopra)(4) E¬¬α ↔ Eα(5) Eα ∧ Eβ ↔ E(α ∧ β)(6) Eα ∨ Eβ → E(α ∨ β).(7) E(α ∧ (β ∨ γ)) → E((α ∧ β) ∨ γ)

Regole

- modus ponens (come sopra)- regola di necessitazione (come sopra)- da ((Eα ∨ Eβ) → Eγ) segue B(α ∨ β) → Eγ- da (Eα → Eβ) segue E¬β → E¬α

La logica della credenza implicita ed esplicita presenta punti di contatto con le logiche rilevanti5. In particolare,la logica che vale all'interno dei contesti di credenza esplicita ha forti legami con la logica del tautological entailment(Anderson e Belnap 1962; Belnap 1975, 1977). Belnap (1977) sostiene che questo tipo di logica risulta particolarmenteadatto per formalizzare i processi deduttivi di un calcolatore, che deve essere in grado di trattare informazioni incoerentio incomplete6. Un'interpretazione per una logica proposizionale del tautological entailment (da McArthur 1988) è unacoppia I = (S,ϕ), dove S è un insieme di situazioni s e ϕ è una funzione interpretazione da formule a sottoinsiemi di {v,f}, come nella logica di Levesque. Anche in questo caso abbiamo due relazioni di supporto distinte, una per il vero e unaper il falso, definite come segue:

s v p se e solo se v ∈ ϕ[s,p],s f p se e solo se f ∈ ϕ[s,p],

s v ¬α se e solo se s f αs f ¬α se e solo se s v α

s v α ∧ β se e solo se s v α e s v βs f α ∧ β se e solo se s f α oppure s f β

Come si vede, in questa logica i connettivi si comportano in maniera analoga a quanto accade per la conoscenzaesplicita nella logica di Levesque. Definiamo come segue la relazione di tautological entailment (per cui useremo ilsimbolo →TE ) fra due formule. Date due formule α e β, α →TE β se e soltanto se, per ogni interpretazione I = (S,ϕ) eper ogni situazione s∈S, se s v α, allora s v β, e se s f β, allora s f α. La nozione di tautological entailment è piùdebole della nozione di implicazione materiale classica (e, in generale, risulta più facilmente trattabile dal punto di vistacomputazionale - cfr. oltre, par. 12.3). Si può dimostrare che si ha Eα → Eβ nella logica di Levesque se e soltanto se α →TE β.

10.2 Estensioni e sviluppi della logica di Levesque

Un limite della logica di Levesque è costituito dal fatto di non ammettere modalità iterate. D'altro canto,estendere in maniera ovvia la semantica sopra descritta per consentire di valutare formule con operatori modali iterati(sostituendo, ad esempio, all'insieme B una relazione di accessibilità binaria fra situazioni) comporterebbe conseguenzenon desiderabili. In base alla semantica data da Levesque, una formula modale è falsa in una situazione s se e soltanto seessa non è vera in s. Pertanto tutte le situazioni risultano corrette e complete rispetto alle formule modali. Quindi,estendendo la semantica in maniera da consentire di iterare gli operatori di credenza si avrebbe come conseguenza che i

5Il problema centrale affrontato dalle logiche rilevanti (si veda ad esempio Dunn 1986) consiste nell'individuare unconcetto di implicazione che sia più restrittivo rispetto all'implicazione materiale della logica classica, nel senso che,affinché un'implicazione sia vera, la verità delle premesse sia rilevante per la verità delle conclusioni. Ad esempio, sivuole evitare che da una contraddizione si possa derivare qualsiasi formula, o che tutte le tautologie siano implicate dauna formula qualunque.6La logica proposta da Belnap è il tipo di logica rilevante utilizzata anche da Thomason e Horty (1988) e da Patel-Schneider (1989a, 1990) (cfr. par. 7.1).

Page 120: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

6

soggetti epistemici risulterebbero logicamente onniscienti rispetto alle loro credenze. Ad esempio, risulterebbe valido ilseguente caso particolare dell'assioma di chiusura deduttiva:

EEα ∧ E(Eα → Eβ) → EEβ,

il che non è certamente adeguato allo spirito con cui è stato introdotto il concetto di credenza esplicita.Una generalizzazione della logica della credenza implicita ed esplicita che permetta di iterare gli operatori di

credenza evitando questi problemi è stata proposta da Lakemeyer (1987)7. Nella logica di Levesque il fatto che siacreduta esplicitamente una certa formula è in un certo senso scorrelato dal fatto che sia creduta la sua negazione. In uncerto senso, è come se il soggetto epistemico utilizzasse fonti di evidenza diverse per confermare o per disconfermare glioggetti della sua credenza. Lakemeyer generalizza quest'idea nell'ambito di una semantica di tipo, in senso lato,kripkeano. L'idea intuitiva è che in una situazione un soggetto epistemico, per confermare una sua credenza, facciariferimento ad un certo insieme di situazioni accessibili, e che lo stesso accada quando egli intende escludere unacredenza. Il punto è che i due insiemi, in generale, non devono necessariamente coincidere. E' come se, sottolineaLakemeyer, un agente utilizzasse modalità di pensiero differenti quando ottiene credenze positive o negative sui propristati epistemici (Lakemeyer mette in guardia che il modello da lui proposto non va inteso come una caratterizzazionepsicologicamente adeguata delle prestazioni inferenziali umane, ma come un modello plausibile delle capacitàinferenziali di un soggetto razionale artificiale limitato). Dal punto di vista formale, questo si traduce nell'introdurre duerelazioni di accessibilità fra situazioni, R e R , utilizzate rispettivamente per determinare le credenze positive e quellenegative. Data una situazione s, una formula α è creduta vera in s se e soltanto se α è vera in tutte le situazioni che sonoaccessibili da s tramite la relazione di accessibilità R, mentre α è creduta falsa in s se e soltanto se α è falsa in tutte lesituazioni che sono accessibili da s tramite la relazione di accessibilità R .

Anche la logica di Lakemeyer è formulata come una logica della credenza implicita ed esplicita. Le credenzeimplicite di un soggetto epistemico non hanno direttamente a che fare con gli stati cognitivi del soggetto stesso, macostituiscono una caratterizzazione puramente "esterna" di ciò che è implicito nelle credenze del soggetto. Lakemeyerassume quindi che non abbia senso parlare di credenze esplicite relative alle proprie credenze implicite, ed escludequindi che l'operatore B di credenza implicita possa comparire nell'ambito dell'operatore di credenza esplicita E8.

Il linguaggio della logica di Lakemeyer, che egli chiama sistema BLK, è dunque lo stesso di quello della logicadi Levesque, eccetto per il fatto che la clausola iv. della definizione dell'insieme delle formule è sostituita dalle dueclausole seguenti:

iv. se α è una formula che non contiene alcuna occorrenza di B, allora (Eα) è una formula;

iv'. se α è una formula, allora (Bα) è una formula.

Per quanto concerne la semantica, un'interpretazione per BLK è una quadrupla M = (S,ϕ,R, R ), dove S è uninsieme di situazioni, ϕ è definita come nella semantica per la logica di Levesque, e R e R sono relazioni binariedefinite su S. Una situazione w ∈ S è un mondo se e soltanto se, come nella logica di Levesque, ϕ rispetto a w assegnauno ed un solo valore di verità ad ogni formula primitiva del linguaggio, e se inoltre R e R coincidono rispetto a w, secioè vale che:

per ogni s ∈ S, R(w,s) sse R (w,s).

Inoltre Lakemeyer impone che, per tutti i mondi w e w' ∈ S, e per tutte le situazioni s ∈ S, valga che:

(a) se R(w,w') e R(w',s), allora R(w,s)

(b) se R(w,w') e R(w,s), allora R(w',s).

La condizione (a) è il corrispettivo della transitività della relazione di accessibilità nelle interpretazioni di Kripke,mentre (b) corrisponde a imporre che la relazione di accessibilità sia euclidea. Come vedremo, poiché R e R 7Lakemeyer ha proposto ulteriori sviluppi della logica di Levesque anche in (Lakemeyer 1991a). Egli ne ha inoltrestudiato l'estensione al primo ordine (Lakemeyer 1986), e ha utilizzato questi formalismi nell'ambito del ragionamentonon monotòno di tipo autoepistemico, elaborando modelli di ragionatori autoepistemici classicamente non onniscienti(Lakemeyer e Levesque 1988; Lakemeyer 1990; Lakemeyer 1991b).8Questo tipo di restrizione non sembra più adeguato nel caso si abbia a che fare con una logica che prevede più attoriepistemici. In tal caso, ad esempio, sarebbe del tutto plausibile che un attore i creda esplicitamente che un altro attore jcreda implicitamente che α, cioè che si abbia che E Bi j α.

Page 121: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

7

coincidono rispetto ai mondi, (a) e (b) fanno sì che l'operatore di credenza implicita si comporti in maniera analogaall'operatore modale B in S5 debole.

Data un'interpretazione M, le seguenti regole definiscono cosa significhi per una situazione s sostenere la verità( v ) o la falsità ( f ) di una formula.

M,s v p dove p è una formula primitiva, sse v ∈ ϕ[s,p],M,s f p dove p è una formula primitiva, sse f ∈ ϕ[s,p],

M,s v ¬ α sse M,s f α,M,s f ¬ α sse M,s v α,

M,s v α ∧ β sse M,s v α e M,s v β,M,s f α ∧ β sse M,s f α oppure M,s f β,

M,s v Eα sse M,s' v α per tutte le situazioni s' tali che R(s,s'),M,s f Eα sse M,s' v α per qualche situazione s' tale che R (s,s'),

M,s v Bα sse M,w v α per tutti i mondi w tali che R(s,w),M,s f Bα sse M,s v Bα.

Le definizioni di verità in un'interpretazione e di validità sono le stesse della logica di Levesque.E' facile constatare come dalla definizione della semantica segue che BLK è un'estensione della logica della

credenza implicita ed esplicita di Levesque. Quindi, tutte le formule che sono valide o soddisfacibili in quest'ultima sonorispettivamente valide o soddisfacibili in BLK. Come nella logica di Levesque, anche in BLK tutto ciò che è credutoesplicitamente è creduto anche implicitamente, si ha cioè che:

Eα → Bα.

Si noti però che ora α può contenere anche occorrenze dell'operatore E. Anche in BLK gli insiemi di formule (*)-(****)del paragrafo precedente sono soddisfacibili. Cioè, le credenze esplicite non sono chiuse rispetto all'implicazione, leformule valide non devono essere credute esplicitamente, una formula logicamente equivalente ad una credenza esplicitanon deve essere creduta esplicitamente, e le credenze esplicite possono essere incoerenti senza che sia credutaesplicitamente ogni formula.

Come conseguenza delle restrizioni (a) e (b) imposte sulla relazione di accessibilità R, l'operatore B di credenzaimplicita si comporta esattamente come in S5 debole. Quindi, la credenza implicita è chiusa rispetto all'implicazione ealla regola di necessitazione, e si ha inoltre che:

Bα → BBα ¬Bα → B¬Bα.

Valgono cioè i principi di introspezione positiva e negativa rispetto alla conoscenza implicita. Inoltre, per come sonodefinite (a) e (b), valgono anche le seguenti forme di "introspezione" relative alle credenze esplicite:

Eα → BEα ¬Eα → B¬Eα.

Tuttavia, in BLK per la credenza esplicita non vale né il principio di introspezione positiva, né il principio diintrospezione negativa. E' facile constatare, ad esempio, che in BLK è soddisfacibile la formula:

Eα ∧ ¬EEα.

Consideriamo un'interpretazione M come in fig. 10.1. In tale interpretazione M,s1 v α e M,s2 v α, ma M,s3 v α.Poiché M,s3 v α, allora M,s2 v Eα (in base alla regola semantica per v Eα). Quindi, si ha che M,w f EEα, e, diconseguenza M, w v ¬EEα. D'altra parte, da (a) e da (b) non segue che R(w,s3) (in quanto la transitività vale rispettoai mondi e non alle situazioni); quindi si ha che M , w v Eα.

Page 122: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

8

fig. 10.1

Lakemeyer propone di modificare BLK in maniera da rendere valida l'introspezione positiva per la credenzaesplicita. Egli chiama BL4 la logica che ne risulta. Affinché valga Eα → EEα è sufficiente imporre che la relazione diaccessibilità R sia transitiva rispetto alle situazioni, cioè che si abbia:

(c) per ogni situazione s, s' e s'' in S, se R(s,s') e R(s',s''), allora R(s,s'').

Questa condizione da sola comporta tuttavia conseguenze indesiderabili. Contrariamente a quanto accadeva in BLK,non si avrebbe più che:

EEα → EEβ sse E¬Eβ → E¬Eα,

in quanto, in particolare, si avrebbe:

EEα → EEEαma

E¬EEα → E¬Eα.

Per constatare che E¬EEα → E¬Eα è sufficiente individuare un'interpretazione in cui sia soddisfacibile E¬EEα ∧ ¬E¬Eα. Si consideri un'interpretazione M come quella in fig. 10.2. In fig. 10.2 si ha che M,s3 v α. Quindi, per la regolache definisce v Eα, M,s2 v Eα. Di conseguenza, M,s1 f EEα, che, per la regola semantica della negazione,equivale a M,s1 v ¬EEα. Siccome poi s1 è l'unica situazione accessibile da w, allora si ha che M,w v E¬EEα.D'altra parte, si ha che M,s2 v α. Quindi, siccome s2 è l'unica situazione accessibile mediante R da s1, per la regola di

f Eα si ha che M,s1 f Eα. Questo, per la regola della negazione, equivale a M,s1 v ¬Eα. Ciò comporta cheM,w f E¬Eα, e quindi M,w v ¬E¬Eα.

Page 123: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

9

fig. 10.2

Per evitare ciò, è necessario aggiungere un'ulteriore condizione di transitività che metta in relazione R con Rnelle interpretazioni di BL4, vale a dire:

(d) per ogni situazione s, s' e s'' in S, se R (s,s') e R(s',s''), allora R (s,s'').

In BL4 le relazioni di accessibilità R e R godono dunque delle proprietà (a)-(d). Nell'esempio di fig. 10.2 la condizione(d) comporta che s1 stia nella relazione R con s3. Questo fa sì che si abbia M,s1 f Eα, e quindi M,s1 v ¬Eα eM,w v E¬Eα.

Un aspetto problematico delle logiche basate su situazioni incoerenti e incomplete, che, implicitamente, era giàevidente nel lavoro di Levesque (1984), ma che è stato messo successivamente in luce in maniera esplicita da diversiautori (Vardi 1986, Fagin e Halpern 1988), consiste nel fatto che, benché in queste logiche un soggetto epistemico nonsia logicamente onnisciente rispetto alla logica classica, esso risulta logicamente onnisciente rispetto a qualche tipo dilogica non classica (nel caso di Levesque rispetto alla logica del tautological entailment). Questo fatto emerge inmaniera particolarmente evidente se si considera la logica descritta in (Fagin, Halpern e Vardi 1990). Fagin, Halpern eVardi propongono un sistema non classico che chiamano nonstandard propositional logic (NPL), che generalizza isistemi di Levesque e Lakemeyer. NPL è correlato alle logiche basate sulle situazioni, ma segue un'impostazionedifferente: anziché utilizzare la logica classica per la componente non modale, e limitare la logica non classica all'ambitodegli operatori modali, in NPL viene interpretato in maniera non classica tutto il linguaggio, anche per la parte nonmodale. Poiché Fagin, Halpern e Vardi formulano la loro logica per un numero qualsiasi di soggetti epistemici, illinguaggio di NPL è un linguaggio proposizionale dotato di negazione e congiunzione ed esteso mediante n operatorimodali di credenza, uno per ciascun soggetto. Qui, per semplicità, ci limiteremo ad un solo soggetto, ed utilizzeremoquindi un solo operatore di credenza che, per analogia con le logiche sopra descritte, indicheremo con E.

Abbiamo visto che ciò che distingue le logiche basate su situazioni dalla logica classica consistefondamentalmente nel modo in cui vengono valutate le formule negate: il valore di verità assegnato a una formula è difatto scorrelato dal valore di verità assegnato alla sua negazione. Sulla base di ciò, per la semantica di NPL Fagin,Halpern e Vardi anziché utilizzare situazioni incoerenti o incomplete utilizzano mondi possibili classici. L'incoerenza el'incompletezza vengono ottenute impiegando una tecnica già utilizzata in logica rilevante (Routley e Routley 1972;Routley e Meyer 1973). Ad ogni mondo w nell'interpretazione è associato un altro mondo w*; una formula di tipo ¬α èvera in w se e soltanto se α è falsa in w*. Intuitivamente quindi w fornisce il supporto per la verità delle formule nonnegate, e w* fornisce il supporto per la verità delle formula negate. Così, data una formula α, può accadere che in unmondo né α né la sua negazione siano vere, oppure che siano vere entrambe. I mondi che, ai fini della semantica, sicomportano come mondi possibili classici sono quei w per cui si ha che w = w*. Definiamo quindi un'interpretazione perNPL come una quadrupla M = (W, ϕ, R,* ), dove W è un insieme di mondi, ϕ è un'assegnazione di valori di verità alleformule primitive del linguaggio e R è una relazione di accessibilità fra mondi. W, ϕ e R sono del tutto analoghi ai loro

Page 124: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

10

corrispettivi delle strutture di Kripke standard (par. 8.2). * è una funzione ad un argomento da membri di W a membridi W, tale che, per ogni w ∈ W, w**= w. La relazione è definita come segue. Per le formule negate si ha:

M,w ¬α sse M,w* α.

Per tutti gli altri tipi di formule la definizione è identica alla definizione di per le strutture di Kripke standard. Inparticolare, si ha:

M,w Eα sse M,w' α per ogni w' tale che R(w,w').

Le nozioni di validità e di conseguenza logica sono definite nella maniera usuale.Per la parte modale, NPL è equivalente alle logiche di Levesque e Lakemeyer. Si noti che l'implicazione

materiale definita in modo classico (dove cioè α → β è definito come ¬(¬α ∧ β)) è particolarmente debole in NPL. Inparticolare, non è vero che, se β è conseguenza logica di α, allora è valida α → β. Fagin, Halpern e Vardi definisconoquindi un nuovo operatore di implicazione forte (strong implication), che rappresentiamo mediante il simbolo "a ",dove α a β è vero in NPL ogni qual volta che, se α è vera, allora è vera β. La regola semantica corrispondente a èdunque la seguente:

M,w α a β sse M,w α oppure M,w β.

a risulta essere una generalizzazione di →TE . Ad esempio, le formule (α ∧ ¬α) a β e β a (α ∨ ¬α) non sonovalide in NPL. La cosa interessante tuttavia è che in NPL è valido l'assioma distributivo definito rispetto a a :

(Eα ∧ E(α a β)) a Eβ;

inoltre, in NPL sono credute tutte le formule valide (rispetto, ovviamente, alla semantica della logica non standard):

se α, allora Eα.

Quindi, i soggetti epistemici in NPL sono logicamente onniscienti rispetto alla logica dell'implicazione forte.Come abbiamo visto, si tratta di una logica più debole rispetto a quella classica. Tuttavia - come fa notare Vardi - nonsembra che un soggetto razionale finito possa essere un ragionatore perfetto in qualche logica non classica più di quantonon lo sia in logica classica.

Altri problemi posti dalle logiche epistemiche basate su situazioni incoerenti sono stati messi successivamente inluce in Fagin e Halpern (1988) e in McArthur (1988). Ad esempio, Fagin e Halpern (1988) distinguono tre casiparticolari del problema dell'onniscienza logica:

a) chiusura rispetto all'implicazione: se α e α→β sono credute, allora è creduta anche β;b) chiusura rispetto all'implicazione valida: se α è creduta, e α→β è una formula valida, allora β è

creduta;c) il fatto che siano credute tutte le formule valide.

La credenza esplicita nelle logiche di Levesque e Lakemeyer non gode di nessuna di queste tre proprietà. Per quantoriguarda la chiusura rispetto all'implicazione, abbiamo visto che, ad esempio, Eα ∧ E(α → β) ∧ ¬Eβ può esseresoddisfatta. Per quanto riguarda la chiusura rispetto all'implicazione, si può constatare facilmente che, benché α → (α ∧(β ∨ ¬β)) sia valida, tuttavia Eα ∧ ¬E(α ∧ (β ∨ ¬β)) è soddisfacibile. Infine, rispetto alla credenza delle formulavalide, abbiamo visto che è soddisfacibile ¬E(α ∨ ¬α).

Tuttavia, Fagin e Halpern mettono in luce che i motivi per cui la credenza esplicita non è chiusa rispettoall'implicazione sono diversi dai motivi per cui non sono credute esplicitamente tutte le formule valide. Inoltre, secondoFagin e Halpern, nelle logiche basate su situazioni la chiusura rispetto all'implicazione non vale per le ragioni sbagliate.

Infatti, per un verso, la mancanza di chiusura rispetto all'implicazione è strettamente connessa alla possibilità diavere situazioni incoerenti. Si consideri la ragione per cui l'insieme di formule {Ep, E(p → q), ¬Eq} risultasoddisfacibile: è necessario che in almeno una delle situazioni ritenute possibili p risulti sia vera che falsa. Nelle logichebasate sulle situazioni, o alcune delle situazioni ritenute possibili dal soggetto epistemico sono incoerenti, oppure lecredenze esplicite sono chiuse rispetto all'implicazione. Ciò è evidente se si considera il fatto che risulta valida laformula seguente:

Eα ∧ E(α → β) → E(β ∨ (α ∧ ¬α)).

Page 125: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 10

11

Se, intuitivamente, consideriamo le situazioni incoerenti come dovute al fatto che parte delle informazioni delsoggetto sono sbagliate, è come se la mancanza di chiusura rispetto all'implicazione derivasse dal fatto che un soggettoprende sempre in considerazione la possibilità che parte delle sue credenze siano false. Così, se un soggetto credecontemporaneamente α e α → β senza credere al tempo stesso β, è perché egli ammette la possibilità che la suacredenza in α sia in un certo senso inaffidabile. Tutto ciò è decisamente poco intuitivo, o comunque sembra avere pocoa che fare con le ragioni per cui le credenze dei soggetti epistemici reali non sono chiuse rispetto all'implicazione. Ingenerale, in questo tipo di logiche sono spesso problematiche le intuizioni su cui poggia la plausibilità dell'uso disituazioni incoerenti, o di altri costrutti semantici come ad esempio le relazioni di accessibilità nella logica diLakemeyer.

Diversa è la situazione per quanto riguarda il fatto che le formule valide non devono essere creduteesplicitamente. Questo ha a che fare piuttosto con l'incompletezza che non con l'incoerenza delle situazioni ritenutepossibili dal soggetto epistemico, ed è legato a quella che Fagin e Halpern chiamano consapevolezza. Diremo che unsoggetto epistemico è consapevole di una formula primitiva p se e solo se vale che E(p ∨ ¬ p). Indicheremo con Ap ilfatto che il soggetto è consapevole di p. E' evidente che, dal punto di vista semantico, un soggetto epistemico èconsapevole di una formula p se e soltanto se in ogni situazione ritenuta possibile p è vera o falsa (o, eventualmente, siavera che falsa); intuitivamente, quindi, il soggetto epistemico è consapevole di p se è in grado di figurarsi in ognisituazione cosa voglia dire che p è vera o falsa. Estendendo la consapevolezza a formule non atomiche, diremo che ilsoggetto epistemico è consapevole di una formula α qualunque (in simboli, Aα) se e soltanto se, per ogni formulaprimitiva p che compare in α, si ha che Ap. In base a questa definizione, nelle logiche delle situazioni sono creduteesplicitamente tutte le formule valide di cui il soggetto è consapevole. Si può infatti dimostrare che:

Proposizione: se α è una formula proposizionale valida, allora Aα → Eα. (Fagin e Halpern 1988)

Per quanto riguarda la chiusura rispetto all'implicazione valida, la situazione è in un certo senso intermedia, nelsenso che sia l'incoerenza delle situazioni ritenute possibili, sia la mancanza di consapevolezza possono contribuire a farsì che le credenze esplicite non siano chiuse rispetto all'implicazione valida. Se ad esempio si ha che è vera Eα, e inoltre α → β è una formula valida, perché non si abbia Eβ occorre che il soggetto epistemico non sia consapevole di α → β,oppure che ritenga possibile almeno una situazione in cui la formula α è sia vera che falsa.

Nel paragrafo seguente esamineremo le logiche che Fagin e Halpern hanno sviluppato a partire da taliconsiderazioni.

Page 126: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

11. Tre logiche per il ragionamento epistemico limitato

Fagin e Halpern (1985, 1988) prendono le mosse dai lavori che abbiamo esaminato nei capitoli precedenti pergeneralizzarli, sviluppando tecniche idonee ad affrontare i diversi aspetti connessi al problema dell'onniscienza logica.Secondo Fagin e Halpern, infatti, i tentativi precedenti si sono rivelati limitati in quanto non riconoscevano che lamancanza di onniscienza logica nei soggetti cognitivi reali dipende dall'interagire di cause differenti. Per questa ragione,ogni soluzione proposta affrontava di fatto soltanto alcuni aspetti del problema. Secondo Fagin e Halpern, la mancanzadi onniscienza logica può essere ricondotta a quattro fonti differenti.

1 - Mancanza di consapevolezza. Può accadere che un soggetto non abbia opinioni circa la verità o la falsità diun enunciato che consegue dall'insieme delle sue credenze per la semplice ragione che nella formulazione diquell'enunciato compaiono concetti che non conosce, di modo che egli non è assolutamente consapevole della verità ofalsità dell'enunciato stesso. Ad esempio, non ha molto senso chiedersi se un Bantu creda o meno nella veritàdell'enunciato "i prezzi dei calcolatori stanno scendendo" qualora egli non ha la più pallida idea di cosa sia uncalcolatore.

2 - Risorse limitate. Un soggetto razionale può ignorare certe verità logiche, o non conoscere alcune delleconseguenze logiche delle sue credenze perché non dispone del tempo o delle risorse di memoria per dedurle. Oppureperché sono formulate in maniera troppo complessa da poter essere comprese.

3 - Ignoranza di regole di derivazione. Spesso i ragionatori reali non conoscono o non sanno applicare alcuneregole di ragionamento. Secondo l'esempio di Konolige (1984) già citato, uno studente può non essere in grado dirisolvere un'equazione del tipo x + a = b perché non conosce la regola in base alla quale si possono sottrarre quantitàuguali su entrambi i lati dell'equazione. Le ricerche della psicologia cognitiva hanno messo in luce le difficoltà di moltisoggetti nell'utilizzare la regola di contrapposizione1.

4 - Molteplicità dei contesti mentali. Nel ragionamento le persone non utilizzano contemporaneamente tutte leinformazioni di cui dispongono. In particolare, sembra che gli esseri umani abbiano difficoltà nell'utilizzarecontemporaneamente informazioni che provengono da ambiti diversi. Sembra ragionevole pensare la memoria umanacome strutturata in contesti diversi, in diversi "quadri mentali" (frame of mind), che difficilmente comunicano fra loro.Potrebbe accadere che, pur essendo ogni quadro mentale coerente, le informazioni in quadri mentali diversi siano fraloro incoerenti.

Fagin e Halpern propongono tre sistemi logici, con ciascuno dei quali si propongono di modellare in manieraformale alcuni aspetti del problema dell'onniscienza logica. La prima di tali logiche, la logica della consapevolezza, èstata sviluppata a partire dalla logica della credenza implicita ed esplicita di Levesque. Rispetto alla logica di Levesque,la differenza principale consiste nel fatto che la logica proposta da Fagin e Halpern evita l'uso di situazioni incompletee/o inconsistenti nella semantica, introducendo in maniera esplicita nelle interpretazioni una funzione di consapevolezza(awareness). La seconda logica proposta, la logica della consapevolezza generalizzata, si basa su di un approccioibrido, in base al quale nella semantica vengono combinati elementi model teoretici tradizionali con elementi di tiposintattico. Ciò viene realizzato per mezzo di una funzione di consapevolezza generalizzata che è in grado di discriminareformule sulla base della loro struttura sintattica. La terza logica infine, la logica del ragionamento locale, viene propostacon l'intento di modellare le limitazioni inferenziali che dipendono dall'esistenza nella mente dei soggetti epistemici dipiù contesti o quadri mentali distinti, che non comunicano fra loro. La semantica di questa logica è basata sulla metaforadella mente individuale vista come una "società delle menti". Queste logiche possono essere variamente combinate fraloro, in modo da fornire modelli di aspetti più complessi del ragionamento epistemico di soggetti razionali limitati. Tuttele logiche di Fagin e Halpern mantengono la distinzione di Levesque fra credenza implicita ed esplicita. La semantica ditali logiche viene ottenuta modificando le strutture di Kripke basate su mondi possibili classici, senza che sianointrodotte strutture semantiche non classiche quali situazioni incoerenti o incomplete.

11.1 Una logica della consapevolezza

Alla fine del capitolo precedente abbiamo visto che Fagin e Halpern hanno individuato nella mancanza diconsapevolezza di alcune formule primitive la ragione per cui nella logica di Levesque i soggetti epistemici non sonoonniscienti rispetto alla conoscenza delle formule valide, e per cui (almeno in certi casi) non vale la chiusura rispettoalle implicazioni valide. Nella logica della consapevolezza Fagin e Halpern propongono di rendere esplicito mediantel'introduzione di una funzione di consapevolezza nella semantica il fatto che un soggetto epistemico possa non essereconsapevole del significato di alcune formule primitive . Allo stesso tempo, il modello di Levesque viene esteso inmaniera da rendere conto di operatori di credenza iterati, e in maniera da permettere di prendere in considerazione piùsoggetti epistemici. L'inserimento di funzioni di consapevolezza esplicite nella semantica rende inoltre possibileutilizzare mondi possibili classici, evitando l'uso di situazioni incomplete.

1Si vedano ad esempio (Wason e Johnson-Laird 1972) e (Johnson-Laird 1983).

Page 127: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

2

Il linguaggio della logica della consapevolezza comprende gli operatori E1 ,..., En e B1,..., Bn rispettivamente perla credenza esplicita e implicita di n attori. Sono consentite iterazioni arbitrarie di tutti gli operatori Ei e B j .

Una struttura di Kripke per la consapevolezza è una (2n+2)-pla M = (W, ϕ, A1,..., An , R1,..., Rn ). W è un insiemedi mondi possibili. ϕ è un'assegnazione di valori di verità alle formule primitive del linguaggio che si comportaesattamente come la funzione interpretazione delle strutture di Kripke classiche: ϕ assegna uno ed un solo valore diverità a ciascuna formula primitiva rispetto a ciascun w ∈ W. I mondi sono quindi classicamente coerenti e completi. Perogni i, Ri è la funzione di accessibilità fra mondi relativa all'i-esimo soggetto di credenza. Fagin e Halpern assumonoche le relazioni di accessibilità Ri siano seriali, transitive ed euclidee. Le Ai sono le funzioni di consapevolezza relativea ciascun soggetto i. Esse associano a ciascun mondo w ∈ W l'insieme Ai (w) delle formule primitive di cui il soggetto iè consapevole in w.

Intuitivamente, lo scopo delle Ai è quello di "ritagliare" delle situazioni parziali all'interno dei mondi possibili,situazioni che corrispondono al punto di vista dei diversi attori. Così, oltre alla relazione di soddisfacimento vengonodefinite le relazioni di sostegno v

Ψ e fΨ parametrizzate rispetto ad un insieme Ψ di formule primitive. Il loro

significato intuitivo è quello di restringere la valutazione di una formula ad una situazione parziale in cui soltanto leformule di Ψ sono definite. Tali relazioni di sostegno, di fatto, vengono utilizzate per valutare le formule che compaiononei contesti retti dagli operatori Ei per la credenza esplicita. L'insieme Ψ delle formule primitive rispetto al quale vienevalutata un formula che compare nell'ambito di operatori Ei è determinato dalle funzioni di consapevolezza Ai loroassociate. Come nella logica di Levesque, sono necessarie due relazioni di sostegno, una per la verità e una per la falsità,poiché, essendo le situazioni incomplete, non è detto che una situazione che non sostiene la verità di una formula nesostenga la falsità, e viceversa.

La definizione formale della relazione di soddisfacimento e delle relazioni di sostegno vΨ e f

Ψ è laseguente:

M,w vΨ p dove p è una formula primitiva, sse ϕ[w,p] = v e p ∈ Ψ,

M,w fΨ p dove p è una formula primitiva, sse ϕ[w,p] = f e p ∈ Ψ,

M,w p dove p è una formula primitiva, sse ϕ[w,p] = v;

M,w vΨ ¬ α sse M,w f

Ψ α,M,w f

Ψ ¬ α sse M,w vΨ α,

M,w ¬ α sse M,w α;

M,w vΨ α ∧ β sse M,w v

Ψ α e M,w vΨ β,

M,w fΨ α ∧ β sse M,w f

Ψ α oppure M,w fΨ β,

M,w α ∧ β sse M,w α e M,w β;

M,w vΨ Ei α sse M,w' v

Ψ∩ A wi ( )α per tutti i w' tali che Ri (w,w'),M,w f

Ψ Ei α sse M,w' fΨ∩ A wi ( )α per qualche w' tale che Ri (w,w'),

M,w Ei α sse M,w vΦ Ei α dove Φ è l'insieme di tutte le formule primitive;

M,w vΨ Bi α sse M,w' v

Ψ α per tutti i w' tali che Ri (w,w'),M,w f

Ψ Bi α sse M,w' fΨ α per qualche w' tale che Ri (w,w'),

M,w Bi α sse M,w' vΦ α per tutti i w' tali che Ri (w,w').

Anche qui, diremo che una formula α è valida (in simboli, α) se e soltanto se vale M,w α in tutte leinterpretazioni M e per tutti i mondi w in M.

Si noti che affinché un mondo w sostenga la verità di una formula del tipo ¬ α rispetto ad un insieme Ψ diformule primitive, w deve sostenere esplicitamente la falsità di α rispetto a Ψ (non basta che non sostenga la verità di α). Analogamente, perché un mondo w sostenga la falsità di una formula α ∧ β rispetto a Ψ, la falsità di α o di β deveessere sostenuta esplicitamente.

Abbiamo detto che le relazioni di sostegno vΨ e f

Ψ entrano in gioco per la valutazione delle formule in cuicompaiono gli operatori di credenza esplicita Ei . Infatti, nella definizione della relazione di soddisfacimento lerelazioni di sostegno compaiono solo per le formule di tipo Ei α. Dalla definizione consegue che una formula Ei α è

Page 128: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

3

vera rispetto a un mondo w se e soltanto se w' vA wi ( ) α per tutti i w' tali che Ri (w, w'). Nella definizione delle relazioni

di sostegno per le formule Ei α l'insieme Ψ viene ulteriormente ristretto a Ψ ∩ Ai (w), se ne considera cioè l'intersezionecon l'insieme delle formule primitive di cui i è consapevole rispetto al mondo w. Questo risolve il problema dellemodalità epistemiche iterate. Per formule del tipo E Ei j α si ha che:

M,w E Ei j α sse M,w' vA wi ( ) E j α per tutti i w' tali che Ri (w,w')

eM,w' v

A wi ( ) E j α sse M,w'' vA w A wi j( ) ( ')∩ α per tutti i w'' tali che R j (w',w'').

Per la valutazione della verità di formule rette dagli operatori di credenza implicita Bi le funzioni diconsapevolezza non vengono prese in considerazione. Di conseguenza, nella definizione delle relazioni di sostegno performule del tipo Bi α l'insieme Ψ non viene ulteriormente ristretto. La credenza implicita soddisfa gli assiomi di S5debole. Quindi, ogni soggetto di credenza crede tutte le formule valide e tutte le conseguenze logiche delle sue credenze.

Possono essere dimostrate le seguenti proposizioni:

1) è completa, vale a dire, per ogni M, w, α, vale M,w α oppure M,w ¬α.2.a) Se Ψ ⊆ Ψ' e se M,w v

Ψ α, allora M,w vΨ'α

2.b) Se Ψ ⊆ Ψ' e se M,w fΨ α, allora M,w f

Ψ'α3.a) Per ogni insieme Ψ di proposizioni primitive, se M,w v

Ψ α, allora M,w α.3.b) Per ogni insieme Ψ di proposizioni primitive, se M,w f

Ψ α, allora M,w ¬α.4) Ei α → Bi α.

La 4), che è una conseguenza immediata della 3.a), comporta che, come nella logica di Levesque, la credenzaesplicita implichi la credenza implicita. Come in Levesque, non tutte le formule valide devono necessariamente esserecredute esplicitamente. Ad esempio, ¬ Ei (α ∨ ¬ α) può essere soddisfatta (nel caso che α sia atomica, questo accadequando il soggetto i non è consapevole di α nel mondo preso in considerazione). Inoltre, anche qui la credenza esplicitanon è chiusa rispetto all'implicazione valida. Così, Ei p ∧ ¬ Ei (p ∧ (q ∨ ¬ q)) è una formula soddisfacibile. Tuttavia, ilfatto di non utilizzare situazioni incoerenti, comporta le seguenti differenze rispetto alla logica di Levesque: i) l'insiemedelle credenze esplicite di un agente è chiuso rispetto all'implicazione; ii) un agente non può avere credenzeinconsistenti, ad esempio una formula come Ei (p ∧ ¬ p) non è soddisfacibile.

Per quanto concerne le credenze iterate, vale ad esempio quanto segue: E Bi i α ↔ Ei α, vale a dire: un agente icrede esplicitamente di credere implicitamente α se e soltanto se egli crede esplicitamente α.

Per quanto concerne i rapporti fra credenza e consapevolezza, si noti che, per ogni formula primitiva p, vale cheM,w Ei (p ∨ ¬ p) sse p ∈ Ai (w). E' così possibile introdurre nel linguaggio una classe di operatori di consapevolezzaAi nel modo seguente. Per ogni formula primitiva p, si abbia

Ai p =def Ei (p ∨ ¬ p).

Per ogni formula α non primitiva, Ai α equivale per definizione alla congiunzione delle Ai p per tutte le formuleprimitive p che compaiono in α. Si può dimostrare che, analogamente a quanto accade nella logica di Levesque, si hache Ai α → Ei α per ogni formula valida α. Questo consente di mettere in luce alcune interessanti relazioni fracredenza implicita ed esplicita e consapevolezza. Ad esempio, si può dimostrare che:

Ei (p ∨ q) ↔ ( Ai p ∧ Bi p) ∨ ( Ai q ∧ Bi q) ∨ ( Ai p ∧ Ai q ∧ Bi (p ∨ q))

e che

Ei E j p ↔ ( Ai p ∧ Bi ( Aj p ∧ B j p)).

In entrambi i casi, le occorrenze dell'operatore di credenza esplicita vengono eliminate a favore degli operatori dicredenza implicita e di consapevolezza. Questo fatto può essere generalizzato. Vale infatti che:

Page 129: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

4

Proposizione: Data una formula ϕ, si può sempre determinare in modo effettivo una formula ϕ∗ tale che ϕ↔ ϕ∗ e tale che gli operatori Ei compaiano in ϕ∗ solo nel contesto Ei (p ∨ ¬ p), dove p è una proposizione primitiva.(Fagin e Halpern 1988)

Fagin e Halpern assiomatizzano la logica della consapevolezza aggiungendo all'apparato deduttivo di S5 debole per lacredenza implicita il seguente schema di assiomi per la credenza esplicita:

(*) ϕ ↔ ϕ∗ ,

dove ϕ∗ è la formula citata nella proposizione precedente. In questo modo, è possibile dimostrare che:

Teorema: gli assiomi di S5 n debole (formulati per gli operatori di credenza implicita Bi ) e l'assioma (*)forniscono un'assiomatizzazione corretta e completa della logica della consapevolezza generalizzata. (Fagin e Halpern1988)

Tale assiomatizzazione risulta tuttavia molto poco intuitiva. Fagin e Halpern auspicano che in futuro si possaindividuare un insieme di assiomi più "naturale".

11.2 Una logica della consapevolezza generalizzata

La seconda logica proposta da Fagin e Halpern si basa sulla generalizzazione delle funzioni di consapevolezzaAi , in maniera tale che esse possano assumere come valori insiemi di formule qualsiasi anziché esclusivamente formuleprimitive. Ciò comporta l'introduzione nel linguaggio di un insieme di operatori di consapevolezza Ai , uno associato aciascun soggetto epistemico, a fianco degli usuali operatori Ei e Bi per la credenza esplicita ed implicita. In generale,una formula del tipo Ai α può essere letta intuitivamente come: "il soggetto i è consapevole di α", "i può figurarsi cosasignifica che α sia vera". Ciò consente di incorporare in questa logica aspetti tipici del trattamento sintattico dellacredenza.

Una struttura di Kripke per la consapevolezza generalizzata è una (2n+2)-pla M = (W, ϕ, A1,..., An , R1,..., Rn ),dove, come di consueto, W è l'insieme dei mondi possibili, ϕ è la funzione interpretazione che assegna un valore diverità per ogni mondo w ∈ W alle formule primitive del linguaggio, e le varie Ri sono le relazioni di accessibilitàrelative ad ogni soggetto epistemico. Fagin e Halpern assumono che tali relazioni siano seriali transitive ed euclidee.Come nella logica del paragrafo precedente, le Ai (w) sono le funzioni di consapevolezza associate a ciascun attore.Come abbiamo detto, a differenza di quanto accadeva nella logica descritta nel paragrafo precedente, l'insieme diformule che tali funzioni associano ai soggetti epistemici nei vari mondi possibili è composto da formule arbitrarieanziché esclusivamente da formule primitive. Nel caso generale Fagin e Halpern non pongono alcuna restrizione sulcomportamento delle Ai .

Per la logica della consapevolezza generalizzata non sono necessarie relazioni di sostegno, ma è sufficiente unarelazione di verità classica a due valori definita come segue:

M,w p (per p appartenente all'insieme delle formule primitive) sse ϕ[w,p]=vM,w α ∧ β sse M,w α e M,w βM,w ¬ α sse M,w αM,w Ai α sse α∈ Ai (w)M,w Bi α sse M,w' α in tutti i w' t.c. Ri (w,w').M,w Ei α sse α∈ Ai (w) e M,w' α in tutti i w' t.c. Ri (w,w').

Anche qui, gli operatori di credenza implicita Bi si comportano come in S5 debole. Vale a dire, gli assiomi di S5debole, formulati per gli operatori di credenza implicita, sono validi nella logica della consapevolezza generalizzata. Perquanto concerne la credenza esplicita, come nella logica precedente, un soggetto epistemico non è tenuto a credere tuttele formule valide. Ad esempio, ¬ Ei (p ∧ ¬p) è soddisfacibile. Inoltre, in questo caso, la credenza esplicita non è neppurechiusa rispetto all'implicazione. Una formula come Ei p ∧ Ei (p → q) ∧ ¬ Ei q può essere soddisfatta, in quanto ilsoggetto i può essere, in linea di principio, consapevole di p e di p → q, ma non essere allo stesso tempo consapevole diq. La credenza esplicita, se relativizzata rispetto alla consapevolezza, presenta proprietà analoghe alla credenzaimplicita. Ad esempio, in corrispondenza dell'assioma di distribuzione, per la credenza esplicita vale il seguente schemadi formule:

Page 130: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

5

Ei α ∧ Ei (α → β) ∧ Ai β → Ei β,

vale a dire, se sono credute esplicitamente α e α → β, allora è creduta esplicitamente β, a patto di essere consapevoli diβ. In corrispondenza della regola di necessitazione, per la credenza esplicita è derivabile la seguente regola:

da α segue Ai α → Ei α.

In base alla definizione di , un agente i crede esplicitamente una formula α se e soltanto se i crede implicitamente α eal tempo stesso i è consapevole di α. In altri termini, nella logica della consapevolezza generalizzata il rapporto fracredenza implicita, credenza esplicita e consapevolezza è schematizzato dalla fig. 11.1 (da Konolige 1986b). Le formulecredute esplicitamente da un soggetto epistemico sono l'intersezione delle formule credute implicitamente con leformule di cui il soggetto è consapevole2. Vale quindi il seguente schema di formule:

(**) Ei α ↔ Bi α ∧ Ai α.

In questa logica (**) caratterizza completamente il comportamento degli operatori di credenza esplicita Ei . Fagin eHalpern utilizzano quindi (**) come assioma per la logica della consapevolezza generalizzata. E' possibile dimostrareche:

Teorema: gli assiomi di S5 n debole (formulati per gli operatori di credenza implicita Bi ) e l'assioma (**)forniscono un'assiomatizzazione corretta e completa della logica della consapevolezza generalizzata. (Fagin e Halpern1988)

fig. 11.1

Sin qui, si è assunto che gli insiemi di formule associati alle funzioni di consapevolezza fossero del tutto arbitrari.Ad esempio, un soggetto i in un mondo w potrebbe essere consapevole di una certa formula α senza essere al contempoconsapevole della sua negazione, potrebbe cioè accadere che α ∈ Ai (w), senza che ¬α ∈ Ai (w). Oppure, si potrebbeavere che α ∧ β ∈ Ai (w), senza che β ∧ α ∈ Ai (w) (questo, fanno notare Fagin e Halpern, può essere effettivamente ilcaso in molti esempi di prestazioni umane o di applicazioni di tipo computazionale, in cui l'ordine di presentazione deicongiunti in una congiunzione può essere rilevante). Volendo modellare tipi specifici di ragionamento epistemicolimitato, restrizioni sulle funzioni di consapevolezza diventano necessarie. Ulteriori assiomi che regolino ilcomportamento degli operatori Ai possono essere aggiunti qualora si intendano porre restrizioni sull'insieme delleformule di cui un agente può essere consapevole, precisando in questo modo il comportamento e il significato dellarelazione di consapevolezza. Alcuni esempi tipici elencati da Fagin e Halpern sono i seguenti.

1) Si può rendere irrilevante l'ordine dei congiunti ponendo α ∧ β ∈ Ai (w) sse β ∧ α ∈ Ai (w). A livello di teoriadella dimostrazione, ciò corrisponde all'assioma:

2Si noti che nella logica della consapevolezza esposta nel paragrafo precedente, questo vale solo per le formuleprimitive, mentre non vale in generale per le formule complesse. Abbiamo visto infatti che nella logica dellaconsapevolezza del paragrafo 11.1, dato un soggetto epistemico i e una formula α non primitiva, Ai α equivale allacongiunzione delle formule Ai pk per tutte le formule pk primitive che compaiono in α. Quindi, si ha ad esempio che:

Ai (α ∨ β) ↔ Ai α ∧ Ai β.

D'altra parte, si può constatare che Ei α → Ei (α ∨ β) risulta valida, a prescindere dal fatto che i sia consapevole di β.Quindi, può accadere che si abbia Ei (α ∨ β) senza che si abbia Ai (α ∨ β).

Page 131: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

6

Ai (α ∧ β) ↔ Ai (β ∧ α).

Analogamente, si può imporre che un soggetto sia consapevole di una formula se e soltanto se è consapevole della suanegazione, vale a dire α ∈ Ai (w) sse ¬α ∈ Ai (w). Questo equivale all'assioma:

Ai α ↔ Ai ¬α.

Nelle teorie che soddisfano quest'ultimo vincolo vale che: Ei α ↔ Ei ¬¬α.2) La consapevolezza può essere chiusa rispetto alle sottoformule: se α ∈ Ai (w), e se β è una sottoformula di α,

allora β ∈ Ai (w). Questo può essere espresso mediante i seguenti assiomi:

Ai (¬ α) → Ai αAi (α ∧ β) → Ai α ∧ Ai β (**)Ai (E j α) → Ai αAi (Bj α) → Ai αAi ( Aj α) → Ai α.

Se la consapevolezza è chiusa rispetto alle sottoformule, benché i soggetti epistemici non credano esplicitamente tutte leformule valide, tuttavia le loro credenze risultano chiuse rispetto all'implicazione, cioè lo schema Ei α ∧ Ei (α → β) →Ei β risulta valido. L'assunzione della chiusura della consapevolezza rispetto alle sottoformule non è quindi adeguata permodellare il comportamento di soggetti epistemici con risorse computazionali limitate. Inoltre, questa assiomatizzazionecorrisponde a un sistema che per computare la verità di una formula deve necessariamente computare la verità di tutte lesue sottoformule. E' tuttavia sensato immaginare che un soggetto epistemico possa credere esplicitamente α ∨ ¬α senzaaver computato il valore di verità di α. Vi sono quindi casi in cui sembra sensato adottare assunzioni più deboli, adesempio limitandosi a richiedere che, qualora α ∧ β ∈ Ai (w), allora si abbia α, β ∈ Ai (w). Sintatticamente, ciòcorrisponde ad adottare il solo assioma (**) dei precedenti.

3) La consapevolezza degli agenti epistemici può essere circoscritta ad un certo sottoinsieme Φ dell'insieme delleformule primitive del linguaggio; in questo caso, Ai (w) deve consistere di tutte e sole quelle formule in cui compaianocome formule primitive soltanto formule di Φ. Sintatticamente, questo si ottiene sostituendo con bicondizionali i segnidi implicazione degli assiomi formulati al punto precedente. In questo modo si ottiene una logica per molti versi analogaalla logica della consapevolezza descritta nel paragrafo precedente, ma con alcune differenze. Ad esempio, nella logicadella consapevolezza del paragrafo precedente la formula Ei α → Ei (α ∨ β) è valida, a prescindere dal fatto che i siaconsapevole o meno di β, mentre essa non è valida nella logica della consapevolezza generalizzata.

4) Si può fare in modo che un agente epistemico "non conosca" certi altri agenti, cioè si può fare in modo che unagente i non sia consapevole di alcuna formula in cui viene menzionato un altro agente j.

5) Un soggetto epistemico può essere consapevole di ciò di cui è consapevole, si può fare in modo cioè che valgache, ogni qual volta α ∈ Ai (w), allora si ha Ai α ∈ Ai (w). Sintatticamente, questo corrisponde all'assioma: Ai α → Ai Aiα .

6) Un soggetto epistemico può sapere di quali formule è consapevole. Nell'interpretazione, questo comporta chese Ri (w,w'), allora Ai (w) = Ai (w'). Ciò è espresso dagli assiomi:

Ai α → Bi Ai α¬ Ai α → Bi ¬ Ai α.

Aggiungendo questi assiomi, diventano valide le formule corrispondenti agli assiomi di introspezione (positiva enegativa) formulate mediante gli operatori di credenza esplicita, relativizzati rispetto alla consapevolezza, cioè:

Ei α ∧ Ai Ei α → Ei Ei αe

¬ Ei α ∧ Ai (¬ Ei α) → Ei ¬ Ei α.

7) Gli elementi di Ai (w) possono essere quelle formule che l'agente i può dedurre in un determinato lasso ditempo, o che non superano un certo grado di complessità strutturale.

Page 132: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

7

11.3 Una logica per il ragionamento locale

La logica presentata in questa sezione è stata proposta da Fagin e Halpern per sviluppare un modello formaledell'intuizione secondo cui uno dei motivi della mancanza di onniscienza logica dipende dal fatto che gli esseri umani (e,in generale, i soggetti cognitivi limitati) non riescono a focalizzare contemporaneamente la loro attenzione su tutte leinformazioni di cui dispongono, per cui le deduzioni effettivamente effettuate dipendono in realtà soltanto da una partedelle conoscenze (o delle credenze) loro disponibili. In questa prospettiva, le credenze degli attori epistemici vengonoconsiderate come organizzate in una serie di cornici mentali (frame of mind) separate e non comunicanti fra loro, e isoggetti epistemici vengono modellati come una sorta di "società delle menti"3. Soluzioni simili al problemadell'onniscienza logica sono state proposte (in maniera più o meno formalizzata) da diversi autori in ambito filosofico,fra cui ad esempio Lewis (1982), Stalnaker (1984) e Rescher e Brandom (1980). Poiché i vari quadri mentali possonocontenere informazioni fra loro in conflitto, questo tipo di logica è particolarmente adatto a spiegare il fatto che isoggetti epistemici possono avere delle credenze (globalmente) incoerenti. David Lewis cita, ad esempio, il casoseguente:

Ero solito pensare che Nassau Street corresse grosso modo da est a ovest, che la vicina ferroviacorresse grosso modo da nord a sud, e che le due fossero grosso modo parallele. [...] Così, ogni enunciatodi una terna inconsistente era vero secondo le mie credenze, senza che per questo ogni cosa risultasse verasecondo le mie credenze. E a proposito della congiunzione, palesemente inconsistente, dei tre enunciati?Io dico che essa non era vera secondo le mie credenze. Il mio sistema di credenze era spezzato inframmenti sovrapposti. Frammenti diversi entravano in azione in situazioni differenti, e l'intero sistema dicredenze non si era mai manifestato nella sua completezza. Il primo e il secondo enunciato della ternainconsistente appartenevano a frammenti diversi - erano veri in base a frammenti diversi. Il terzoapparteneva ad entrambi. La congiunzione inconsistente di tutti e tre non apparteneva, non era in nessunmodo implicata, né risultava vera in base ad alcun frammento. Perciò essa non era vera secondo il miosistema di credenze preso nel suo insieme. (Lewis 1982, p. 436).

Incorporando questa intuizione, la logica di Fagin e Halpern riesce ad ammettere credenze contraddittorie senzainserire nelle interpretazioni situazioni inconsistenti. Mentre nelle classiche strutture a mondi possibili ad ogni soggettoepistemico viene associato un insieme di mondi (i mondi compatibili con ciò che egli crede), nelle interpretazioni per lalogica del ragionamento locale ad ogni soggetto vengono associati più insiemi di mondi; ciascun insieme corrisponde aun "grappolo di credenze", ad un quadro mentale.

Dal punto di vista formale, una struttura di Kripke per il ragionamento locale è una n+2-pla M = (W, ϕ,C1,...,Cn ), dove, come di consueto, W è un insieme di mondi possibili, e ϕ è una funzione interpretazione che assegnaun valore di verità alle formule primitive del linguaggio per ogni mondo w ∈ W. Per ogni w ∈ W, Ci (w) è un insiemenon vuoto di sottoinsiemi non vuoti di W. Intuitivamente, se Ci (w) = {T1,...,Tk }, allora gli insiemi T1,...,Tk sono gliinsiemi di mondi possibili compatibili con le credenze comprese nei vari quadri mentali relativi al soggetto epistemico inel mondo possibile w. Il soggetto i nel mondo w, a seconda del quadro mentale in cui si trova, ossia del contesto su cuifocalizza la propria attenzione, crede talvolta che l'insieme di stati possibili sia T1, talvolta che sia T2 , e così via. Aglioperatori di credenza esplicita Ei viene assegnato in questa logica il seguente significato: una formula del tipo Ei αviene interpretata come "il soggetto i crede α in qualche quadro mentale". Questa nozione di credenza esplicita è quindiabbastanza diversa da quella discussa nei paragrafi precedenti. Fagin e Halpern chiamano credenza locale questo tipo dicredenza. Per quanto riguarda la credenza implicita, essa viene definita nel modo seguente: un soggetto epistemicocrede implicitamente α se α segue dal fatto di mettere insieme tutta la conoscenza presente nei vari quadri mentali. Cioè,una formula del tipo Bi α viene valutata in un mondo w valutando α rispetto all'insieme di mondi che si ottieneprendendo l'intersezione di tutti i quadri mentali Tj associati al soggetto i in w. In questo modo, ciò che è creduto da inei vari quadri mentali, è creduto, a maggior ragione, implicitamente da i. Quindi, anche in questo caso vale che Ei α →Bi α.

La relazione per la logica del ragionamento locale viene definita nel modo seguente:

M,w p (per p appartenente all'insieme delle formule primitive) sse ϕ[w,p]=vM,w α ∧ β sse M,w α e M,w βM,w ¬ α sse M,w αM,w Ei α sse esiste un T∈Ci (w) tale che M,w' α per tutti i w' ∈ T.

3Fagin e Halpern riprendono la metafora della società delle menti da Minsky (1986), che la introduce tuttavia in uncontesto diverso.

Page 133: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

8

M,w Bi α sse M,w' α per tutti i w' ∈ T C wi∈ ( )I .

In base a questa definizione, la credenza esplicita non è chiusa rispetto all'implicazione; è infatti possibile, adesempio, soddisfare formule del tipo: Ei α ∧ Ei (α → β) ∧ ¬ Ei β. Questo tuttavia non ha nulla a che fare con laconsapevolezza: ciò accade perché α e α → β sono creduti in quadri mentali diversi, e il soggetto epistemico i non èquindi in grado di "mettere assieme" queste informazioni per dedurre la formula β. Contrariamente a quanto accadevanelle logiche della consapevolezza, sono invece credute esplicitamente tutte le formule valide. Inoltre, la credenzaesplicita è chiusa rispetto all'implicazione valida: se α → β è valida, lo è anche Ei α → Ei β. Questo perché tutti i mondiw appartenenti ai vari Tj sono corretti e completi. In questa logica, i soggetti epistemici sono quindi ragionatori perfettiall'interno di ciascun quadro mentale. Poiché consapevolezza e ragionamento locale catturano aspetti differenti dellamancanza di onniscienza logica di soggetti razionali limitati, è possibile definire logiche ibride che combinino nellasemantica il meccanismo dei quadri mentali con l'adozione di funzioni di consapevolezza.

I soggetti epistemici possono avere credenze incoerenti: una formula del tipo Ei α ∧ Ei ¬α può esseresoddisfatta. Ciò accade se α è creduta in un quadro mentale, e ¬α è creduta in un quadro mentale differente. Tuttavia,poiché i mondi sono coerenti, una contraddizione non può essere creduta all'interno di un singolo quadro mentale, cioènon possono essere soddisfatte formule del tipo Ei (α ∧ ¬α). Si noti che, se in due quadri mentali diversi valgono dueformule che si contraddicono a vicenda, allora l'intersezione dei vari Tj è vuota. In tal caso viene soddisfatta la formula

Bi (p ∧ ¬p), e di conseguenza il soggetto epistemico i crede implicitamente qualunque formula4. Cioè, nella logica per ilragionamento locale è valido il seguente schema: Ei α ∧ Ei ¬α → Bi (p ∧ ¬p). Questo significa che in questa logica nonvale lo schema di assiomi P per la credenza implicita5. A differenza delle logiche dei paragrafi precedenti, quindi, glioperatori Bi non si comportano secondo gli assiomi di S5 debole. E' facile vedere che non valgono neppure gliequivalenti degli schemi di assiomi A4 ed A5. Per quanto riguarda l'assioma di introspezione positiva (A4), esso non èvalido in quanto in questo tipo di logica non vale l'equivalente della transitività delle relazioni di accessibilità Ri . Siadato un mondo w ∈ W ed un soggetto epistemico i. Supponiamo che w' sia un membro dell'intersezione dei Tj

appartenenti a Ci (w). Per come sono definite le interpretazioni, non è detto che tutti i w'' nell'intersezione degli elementidi Ci (w') stiano a loro volta nell'intersezione degli elementi di Ci (w). E' quindi possibile soddisfare Bi α ∧ ¬ Bi Bi α.Analogamente, per quanto riguarda l'introspezione negativa (schema di assiomi A5), non vale l'equivalente del fatto chele relazioni di accessibilità sono euclidee. Sia dato un mondo w ∈ W ed un soggetto epistemico i. Supponiamo che w' ew'' siano membri dell'intersezione degli elementi di Ci (w). Anche in questo caso, non è detto che w'' stianell'intersezione degli elementi di Ci (w'), e viceversa. Si può invece facilmente constatare che nella logica delragionamento locale valgono gli assiomi A1 (assiomi del calcolo proposizionale) e A2 (assioma distributivo, formulatoper gli operatori di cedenza implicita Bi ) Sono soddisfatte inoltre le regole di inferenza R1 (Modus ponens) e R2 (regoladi necessitazione per la credenza implicita). Per l'assiomatizzazione della logica del ragionamento locale prendiamoinoltre in considerazione i seguenti assiomi:

A8. ¬ Ei (α ∧ ¬α)A9. Ei α → Bi α.

Di entrambi abbiamo constatato la validità in modo intuitivo. Abbiamo inoltre visto che i soggetti epistemici credonoesplicitamente ogni formula valida, e che la credenza esplicita è chiusa rispetto all'implicazione valida. Questo giustificale due seguenti regole di inferenza:

R3. da α si inferisce Ei α (necessitazione per la credenza implicita)R4. da α → β si inferisce Ei α → Ei β.

Si noti che A9 e R3 rendono la regola R2 per la conoscenza implicita ridondante.Si può quindi dimostrare che:

Teorema: Il sistema formale che consiste degli assiomi A1, A2, A8 e A9, e delle regole di inferenza R1, R3 e R4costituisce un'assiomatizzazione corretta e completa per la logica del ragionamento locale. (Fagin e Halpern 1988)

4Che valga ¬ Ei (p ∧ ¬p) è garantito invece dal fatto che i membri dei Ci (w) non possono essere insiemi vuoti.5Qui e nel seguito del paragrafo facciamo riferimento alla denominazione degli assiomi e delle regole data nel par. 8.2.

Page 134: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

9

Ulteriori condizioni possono essere imposte sulle interpretazioni perché valgano gli equivalenti di A3, A4 e A5.Ad esempio, affinché sia valida ¬ Bi (p ∧ ¬p) bisogna fare in modo che, per ogni w ∈ W, l'intersezione dei Ci (w) non siamai vuota. Si noti tuttavia che questo impedisce che un soggetto possa avere credenza esplicite inconsistenti: Ei p ∧ Ei ¬p non può più essere soddisfatta. Se si impone che, per ogni w, w' ∈ W, si abbia che, se w' ∈ T ∈ Ci (w), allora T ∈Ci (w') (cioè, intuitivamente, se si richiede che in ogni quadro mentale un agente consideri possibile che egli si trovi inquel quadro mentale), allora valgono gli assiomi di introspezione positiva sia per la credenza implicita sia per quellaesplicita: Ei α → Ei Ei α e Bi α → Bi Bi α. Aggiungendo la condizione che, per ogni T ∈ Ci (w) e per ogni w' ∈ T, siabbia Ci (w') ⊆ Ci (w), valgono gli assiomi di introspezione negativa per la credenza esplicita ed implicita: ¬ Ei α → Ei¬ Ei α e ¬ Bi α → Bi ¬ Bi α.

Un caso particolare che Fagin e Halpern prendono in considerazione è quello in cui in ciascun quadro mentale unagente rifiuta di credere di potersi trovare in altri quadri mentali. Nella semantica, questo equivale ad imporre che, se w'∈ T ∈ Ci (w), allora Ci (w') è uguale al singleton {T}. Fagin e Halpern chiamano un'interpretazione di questo genere unaStruttura di Kripke per agenti di vedute ristrette. Un agente di vedute ristrette crede di essere consistente anche se, difatto, non lo è. Infatti, in queste strutture semantiche Ei (¬(Ei α ∧ Ei ¬α)) è valida, sebbene Ei α ∧ Ei ¬α possa esseresoddisfatta. Inoltre, poiché i soggetti epistemici sono ragionatori perfetti in ciascun quadro mentale, un ragionatoreepistemico di vedute ristrette crede di essere un ragionatore perfetto tout court. Infatti il seguente schema risulta valido:Ei (Ei α ∧ Ei (α → β) → Ei β).

Per costruire un modello del ragionamento locale per la conoscenza, bisogna imporre che il mondo reale siacompatibile con ciascun quadro mentale. Così, per ciascun w∈W, deve valere che w sia membro di ogni Tj appartenentea Ci (w). Questo fa sì che, per ogni i e per ogni w, l'intersezione di tutti i Tj appartenenti a Ci (w) non possa mai esserevuota. Quindi non è possibile che i soggetti epistemici abbiano credenze contraddittorie, neppure in quadri mentalidifferenti.

Fagin e Halpern evidenziano l'analogia fra un soggetto epistemico nelle logiche per il ragionamento locale e unacomunità di soggetti epistemici (abbiamo visto che nelle logiche del ragionamento locale un soggetto epistemico puòessere visto come una "società delle menti"). Sarebbe quindi possibile definire operatori modali che esprimano lerelazioni fra i vari quadri mentali, come ad esempio un operatore che esprima che una data formula è conoscenzacomune (cfr. par. 8.2) fra tutti i frame of mind. In (Fagin e Halpern 1985) era stato introdotto un operatore modale peresprimere che una data formula era creduta in tutti i quadri mentali.

E' interessante notare come la logica del ragionamento locale di Fagin e Halpern possa essere ottenuta come casoparticolare della logica delle strutture di credenza descritta nel paragrafo 8.3, ponendo opportune restrizioni sui modelliminimali utilizzati. Si consideri il sistema formale EMNP, che si ottiene aggiungendo al sistema formale E gli schemi diassiomi M,N e P (cfr. par. 8.3). L'apparato deduttivo di EMNP è quindi il seguente6:

assiomi:

- tutti gli assiomi del calcolo proposizionale;M. E(α ∧ β) → (Eα ∧ Eβ)N. E(α ∨ ¬α)P. ¬E(α ∧ ¬α)

regole di inferenza :

MP. da α e da α → β si inferisce β (modus ponens)RE. da α ↔ β si inferisce Eα ↔ Eβ

Semanticamente, EMNP risulta corretto e completo rispetto alle strutture di credenza chiuse rispetto aisoprainsiemi, contenenti l'unità e tali che, per ogni w ∈ W, ∅ ∉ N(w).

Limitandoci per semplicità al caso che prevede un solo soggetto epistemico, l'apparato deduttivo per la partedella logica per la conoscenza locale di Fagin e Halpern che concerne la credenza esplicita è il seguente:

assiomi:

- gli assiomi del calcolo proposizionaleA8. ¬E(α∧ ¬α)

6Rispetto alla formulazione del par. 8.3, abbiamo sostituito, per uniformità con la notazione utilizzata in questo capitolo,l'operatore B con l'operatore di credenza esplicita E.

Page 135: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

10

regole di inferenza:

R1. da α e da α → β si inferisce β (modus ponens)R3. da α si inferisce EαR4. da α → β si inferisce Eα → Eβ.

Si può provare che tutti i teoremi di EMNP sono anche teoremi della logica per la conoscenza locale, eviceversa. Infatti, tutti gli assiomi e le regole di EMNP sono ottenibili rispettivamente come teoremi o come regolederivate nella logica per la conoscenza locale. L'assioma P è lo stesso di A8, tutti gli esempi di N sono ottenibiliapplicando R3, e la regola RE è facilmente ottenibile come regola derivata utilizzando R4. Per quanto riguarda M, puòessere derivato come segue:

(1) α ∧ β → α(2) α ∧ β → β(3) E(α ∧ β) → Eα(4) E(α ∧ β) → Eβ(5) E(α ∧ β) → (Eα ∧ Eβ)

dove (1) e (2) sono tautologie proposizionali, (3) e (4) sono ottenute rispettivamente da (1) e (2) per mezzo di R4, e (5)è conseguenza proposizionale di (3) e (4).

Viceversa, tutti gli assiomi e le regole della logica per il ragionamento locale possono essere ottenutirispettivamente come teoremi o come regole derivate di EMNP. Di nuovo, A8 è la stessa cosa di P, R3 si ottienefacilmente come regola derivata utilizzando RE e N, R4 si ottiene come regola derivata nel modo seguente:

(1) α → β(2) α ↔ (α ∧ β)(3) Eα ↔ E(α ∧ β)(4) E(α ∧ β) → (Eα ∧ Eβ)(5) Eα → Eβ

(dove (1) è l'ipotesi, (2) si ottiene da (1) per mezzo delle leggi del calcolo proposizionale, (3) si ottiene da (2) per mezzodi RE, (4) è l'assioma M, e (5) segue da (3) e da (4) per le leggi del calcolo proposizionale). Quindi la logica delragionamento locale di Fagin e Halpern è corretta e completa (per la parte che concerne la credenza esplicita) rispettoalle strutture di credenza chiuse rispetto ai soprainsiemi, contenenti l'unità e tali che, per ogni w ∈ W,∅ ∉ N(w)7.

11.4 I diversi volti della credenza esplicita

Ciò che emerge a un primo esame del contenuto di questo capitolo e dei capitoli precedenti è probabilmentel'eterogeneità delle varie soluzioni proposte nell'ambito dell'IA logicista per evitare il problema dell'onniscienza logica8.Questa eterogeneità è analoga all'eterogeneità delle proposte avanzate in ambito filosofico9. Esistono anzi somiglianzeprecise fra le varie proposte avanzate in filosofia e nell'IA, e molte di queste ultime traggono ispirazione da ricerche diambito filosofico. Nelle pagine precedenti abbiamo rapidamente accennato ad alcuni dei punti di contatto fra queste duetradizioni, ed altri punti di contatto potrebbero essere individuati. Sarebbe indubbiamente interessante indagare a fondole relazioni fra questi due ambiti di ricerca, ma ciò costituirebbe un argomento di indagine ulteriore, che va oltre gliscopi di questo lavoro. Tuttavia, vale la pena sottolineare che la ricerca in IA ha messo in luce come l'eterogeneità dellevarie proposte non possa essere considerata un fattore del tutto accidentale. Molte proposte che originariamente eranostate interpretate come alternative per la soluzione di un unico problema, sono state invece in seguito inquadrate comepossibili vie per affrontare aspetti diversi di un problema complesso. Ci sembra infatti essenziale la consapevolezza,emersa ad esempio con il lavoro di Fagin e Halpern (cfr. l'introduzione di questo capitolo), che la mancanza dionniscienza logica è un fenomeno che dipende dall'interazione di più fattori diversi, e che quindi può essere proficuoaffrontare con strumenti differenti. Vardi (1986) sottolinea come alcuni problemi possano essere alleviati pur 7Anche una logica dell'inconsistenza basata su una intuizione simile a quella di Fagin e Halpern, proposta da Rescher eBrandom (1980), risulta equivalente al sistema EMNP - cfr. Vardi (1986).8Per un modello che sintetizzi in una cornice unitaria varie di queste proposte si veda (Giunchiglia et al. 1993). Ilquadro utilizzato è quello del ragionamento basato su contesti (Giunchiglia 1993). Per questo approccio al ragionamentomodale ed epistemico si veda anche (Giunchiglia e Serafini 1994).9Rimandiamo ancora alla già citata rassegna di Bäuerle e Cresswell (1988).

Page 136: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

11

mantenendo l'assunzione che gli atteggiamenti proposizionali siano atteggiamenti verso proposizioni intese nel sensomodel teoretico classico (come accade ad esempio nelle logiche basate su modelli minimali). Per altri aspetti ènecessario introdurre mondi non classici (come le situazioni incoerenti o incomplete di Levesque). Questo comporta undesiderabile indebolimento della logica, ma i soggetti epistemici così modellati sono pur tuttavia onniscienti rispetto aqualche tipo di logica non classica. Gli aspetti dell'onniscienza logica connessi in maniera più specifica alla finitezza deiprocessi deduttivi nei soggetti epistemici reali non sembrano risolvibili in altra via che tenendo conto, in qualche misura,delle proprietà sintattiche delle rappresentazioni utilizzate. Nella letteratura filosofica gli approcci al problema degliatteggiamenti proposizionali basati in qualche misura sulla forma sintattica delle rappresentazioni e quelli basati invecesu concetti esclusivamente modellistici, come la nozione di proposizione in quanto insieme di mondi possibili, sonoviste spesso come corrispondenti a visioni alternative del linguaggio e della mente. Ad esempio, Stalnaker (1984) aquesto proposito distingue fra un quadro linguistico (linguistic picture) e un quadro pragmatico (pragmatic picture)della mente. Secondo il quadro linguistico, la razionalità è considerata soprattutto come una faccenda di uso dellinguaggio. Gli stati mentali sono visti come rappresentazioni interne con una struttura simile a quella delle espressionilinguistiche. In generale, avere una certa credenza vuol dire stare in una relazione di un certo tipo con unarappresentazione linguistica (di tipo mentale o del linguaggio pubblico). Al contrario, il quadro pragmatico vede isoggetti razionali essenzialmente come agenti. Gli stati mentali sono visti soprattutto in relazione al loro ruolo neldeterminare il comportamento. Essere in un certo stato mentale vuol dire porsi in un certo atteggiamento rispetto a uninsieme di possibili stati del mondo. Ad esempio, in questa prospettiva, credere che α significa essere disposti ad agire(ad esempio per soddisfare i propri desideri o per ottenere i propri fini) come se nel mondo fosse vero α. In questo casogli oggetti della credenza (e, in generale, degli atteggiamenti proposizionali) vengono visti essenzialmente come insiemidi mondi possibili. Secondo il quadro pragmatico, con cui Stalnaker si identifica, non viene negato che agli stati mentalicorrisponda qualche forma di rappresentazione interna. Esso non si impegna tuttavia su quale tipo di rappresentazionicorrisponda agli stati mentali, e la forma delle rappresentazioni non viene considerata rilevante per affrontare, adesempio, il problema degli atteggiamenti proposizionali. Il lavoro in IA ha posto in evidenza che le soluzioni tecnicheche emergono dal quadro linguistico e dal quadro pragmatico rispondono ad esigenze in larga parte complementari. Adesempio, Stalnaker (1984), in linea con la sua visione pragmatica, elabora una soluzione al problema dell'onniscienzalogica che può essere assimilata alla logica del ragionamento locale di Fagin e Halpern (cfr. paragrafo precedente). Lasoluzione pragmatica ha l'indubbio pregio di non attribuire un ruolo prioritario all'uso del linguaggio (o di qualcherappresentazione di tipo simbolico) nella definizione e nell'attribuzione degli atteggiamenti proposizionali. In unaprospettiva cognitiva, non vincola a ipotesi specifiche sulla natura degli stati mentali o sulle strutture cognitive dautilizzare, e consente di rendere conto in modo plausibile della possibilità di attribuire atteggiamenti proposizionali asoggetti cognitivi che non esibiscono un comportamento di tipo linguistico o simbolico. Tuttavia, vi sono aspetti delproblema dell'onniscienza logica che non possono essere risolti in maniera naturale in una prospettiva del genere. Nesono un esempio gli aspetti della mancanza di onniscienza logica dovuti ai limiti nella lunghezza dei processiinferenziali effettuabili da un soggetto epistemico finito, aspetti che è difficile tentare di spiegare se non si prendono inconsiderazione le elaborazioni effettuate sulla struttura delle rappresentazioni interne10. Ad esempio, secondo il quadropragmatico così formulato, un giocatore di scacchi "finito", che non sia in grado di prendere in considerazione tutti ipossibili esiti delle proprie mosse, risulterebbe probabilmente irrazionale. (Un giocatore di scacchi che conosca laconfigurazione iniziale dei pezzi e le regole del gioco dovrebbe essere in grado di dedurre tutte le possibili evoluzionidella partita, e di decidere quindi la mossa ottimale; egli dispone inoltre contemporaneamente di tutte le informazionirilevanti, e non è quindi plausibile spiegare i suoi limiti in termini di frame of mind). Lo stesso dicasi di un matematicoche non riesca a prendere in considerazione tutte le conseguenze logiche delle proprie premesse. In particolare, se siassume che le verità matematiche siano necessarie, chi sapesse un solo enunciato matematicamente vero dovrebbesapere tutta la matematica. In questi casi sembra inevitabile prendere in considerazione qualche aspetto della sintassidelle rappresentazioni. La soluzione che propone Stalnaker a casi di questo genere è quella di considerare alcune formedi ragionamento come ad esempio il ragionamento matematico come forme di ragionamento di tipo metalinguistico:

Ora, se le verità matematiche sono tutte necessarie, allora l'analisi in termini di mondi possibili nonlascia spazio al dubbio circa la verità delle proposizioni stesse. Ci sono, sembra, solo due proposizionimatematiche, quella necessariamente vera e quella necessariamente falsa, e tutti noi sappiamo che laprima è vera e la seconda è falsa. Ma le funzioni che determinano quali delle due proposizioni sia espressada un dato enunciato matematico sono di quel tipo che è ragionevolmente complesso da dare luogo aragionevoli dubbi circa quale proposizione sia espressa da un enunciato. Quindi sembra ragionevoleassumere che gli oggetti della credenza e del dubbio in matematica siano proposizioni relative allarelazione fra enunciati e ciò che essi esprimono. [...] le proposizioni matematiche sono proposizioni chevertono su espressioni, o su strutture esibite dalle espressioni. (Stalnaker 1984, pp. 73-4; corsivo nostro).

10Di questo sembra consapevole lo stesso Stalnaker quando, in un passo di un lavoro successivo che abbiamo già citato,afferma: "ogni tipo di elaborazione dell'informazione o di computazione è priva di senso se riferita a un agenteonnisciente dal punto di vista deduttivo" (Stalnaker 1991, p. 429).

Page 137: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

12

Una posizione di questo genere dà luogo a molte perplessità. In primo luogo, sembra che le soluzioni di tiposintattico, cacciate dalla porta, siano rientrate dalla finestra. Inoltre, non si vede come su questa linea possa emergereuna soluzione convincente per problemi come quello del giocatore di scacchi. Poco convincente risulta anche la visionedella matematica (e della ricerca matematica) che ne emerge, e la possibilità di spiegare il ruolo che la conoscenzamatematica può avere nel determinare il comportamento pratico. Si consideri l'aritmetica. Se gli enunciati aritmeticisono veri in tutti i mondi possibili, hanno tutti la stessa estensione, ed esiste quindi un sola proposizione aritmetica vera.Poiché, ragionevolmente, nessuno è in grado di comportarsi come se tutti gli enunciati aritmetici fossero veri, ne segueche nessuno conosce l'unica proposizione aritmetica vera. Quindi, nessuno sa che 2 + 2 fa 4 (e nessuno è in grado dicomportarsi come se nel mondo 2 + 2 = 4 fosse vero, perché altrimenti dovrebbe essere in grado di comportarsi come senel mondo fossero vere tutte le verità aritmetiche). La gente al massimo può sapere (e può comportarsi come se fossevero che) elaborando in base a certe regole l'espressione "2 + 2" si ottiene l'espressione "4".

Il fatto che, almeno per alcuni aspetti del problema dell'onniscienza logica, sembri indispensabile tenere conto inqualche misura della forma sintattica delle rappresentazioni, non significa tuttavia che, per risolvere tali problemi, sidebba necessariamente capitolare di fronte a una concezione di tipo citazionale, o puramente sintattica degliatteggiamenti proposizionali (come ad esempio, in IA, quella proposta da Konolige - cfr. par. 9.2). Proposte come quelladi Fagin e Halpern di una logica della consapevolezza generalizzata (par. 11.2) consentono di affrontare il problemalimitandosi a iniettare "piccole dosi di sintassi" (l'espressione è di Vardi 1986) in un quadro teorico di tipogenuinamente semantico e model teoretico. La situazione è ben sintetizzata dalla seguente citazione di Barbara Partee(1982):

non intendo sostenere una teoria citazionale degli enunciati di atteggiamento proposizionale. Ma siassume che le persone non possano avere atteggiamenti verso insiemi di mondi possibili direttamente,senza dipendere da tutti i modi di rappresentarli in modo finito. (Partee 1982, p. 197 della trad. it.)

I motivi per rifiutare una soluzione puramente sintattica e citazionale sono molteplici. Ad alcuni abbiamo già fatto cennoalla fine del paragrafo 9.2. Alcune difficoltà ripetutamente esaminate nella letteratura filosofica sono legate al fatto diassumere enunciati "pubblici" di un linguaggio naturale come oggetti degli atteggiamenti proposizionali (che è la lineache è stata seguita dalla maggior parte delle situazioni di tipo "sintattico" e citazionale in ambito filosofico). Sisupponga ad esempio che un enunciato del tipo:

S crede che αsia analizzato come:

S è nella relazione di credenza con l'enunciato "α",

dove α è un certo enunciato dell'italiano. Questa strategia non funziona nel caso di un enunciato quale:

Mario crede che tutto quello che dico è vero,

che, evidentemente, non può essere parafrasato come:

Mario è nella relazione di credenza con l'enunciato "tutto quello che dico è vero".

In generale, la soluzione citazionale non è direttamente applicabile a tutti quei casi in cui il significato dell'enunciato cheè oggetto di atteggiamento proposizionale dipende dal proprio contesto, come nel caso che vi compaiano espressioniindicali o anaforiche. Vi è poi l'ovvia osservazione che il soggetto di credenza S potrebbe non conoscere la lingua in cuiè scritto α. Ad esempio, non avrebbe molto senso analizzare l'enunciato

(*) Aristotele credeva che gli uomini sono animali razionalicome:

Aristotele era nella relazione di credenza con l'enunciato "gli uomini sono animali razionali",

in quanto Aristotele certamente non poteva conoscere l'italiano. La difficoltà può essere aggirata facendo riferimento auna traduzione dell'oggetto di credenza, e parafrasando ad esempio (*) con

(**) Aristotele era nella relazione di credenza con un enunciato la cui traduzioneitaliana è "gli uomini sono animali razionali".

Page 138: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

13

Anche questa soluzione pone tuttavia problemi, come ha posto in luce Church (1950). Church sviluppa il seguenteargomento. In base a una teoria citazionale, (*) e (**) dovrebbero avere uguale significato. Tuttavia, si supponga ditradurre (*) e (**) in inglese, ottenendo rispettivamente:

(*') Aristotle believed that men are rational animalse

(**') Aristotle was in the belief relation with a sentence, whose Italian translation is "gli uomini sono animali razionali".

Traducendo nella stessa lingua due enunciati con uguale significato si dovrebbero ottenere enunciati con ugualesignificato, mentre, afferma Church, (*') e (**') hanno chiaramente significato diverso. Infatti, ad esempio, essicomunicano contenuti completamente diversi a un lettore inglese che non conosca l'italiano. Di conseguenza, (*) e (**)non possono essere a loro volta sinonimi.

Difficoltà di questo tipo sembrano poter essere superate facilmente qualora si assuma che gli atteggiamentiproposizionali possano essere spiegati non nei termini di relazioni con enunciati "pubblici" di una lingua naturale, bensìcon "enunciati interni" di un "linguaggio del pensiero" (una posizione di questo genere è sostenuta da Fodor 1978). Intal caso, tali difficoltà non costituirebbero un problema per le soluzioni puramente sintattiche di tipo cognitivo, o per imodelli sintattici proposti in IA, come ad esempio quello di Konolige. Secondo Cresswell (1980) tuttavia l'argomento diChurch è di portata più generale, e si applica a tutte le teorie di tipo citazionale degli atteggiamenti proposizionali. Inparticolare, non può essere aggirato facendo riferimento a un sistema di rappresentazioni interne anziché al linguaggiopubblico. A questo proposito Cresswell utilizza alcune argomentazioni, che egli riconduce a varianti dell'argomento diChurch, in cui non si fa uso del concetto di traduzione. Riportiamo uno di tali argomenti, dovuto a Bigelow (1978). Siconsideri l'enunciato

(1) Giorgio crede che la terra è piattae la sua parafrasi citazionale:

(2) Giorgio è nella relazione di credenza con l' enunciato "la terra è piatta".

Si considerino poi due interpretazioni modellistiche del linguaggio in cui sono state formulate (1) e (2). Siano ϕ e ψ lerispettive funzioni interpretazione. In particolare, si abbia che:

ϕ[Giorgio] = ψ[Giorgio]ϕ[crede] = ψ[crede]ϕ[che] = ψ[che]ϕ[la terra] = ψ[la terra]ϕ[è piatta] = ψ[è tonda] ≠ ψ[è piatta].

Ora, è evidente che, in generale, si avrà ϕ[(1)] ≠ ψ[(1)]. D'altra parte, se le virgolette indicano la citazione in entrambele interpretazioni, si ha che:

ϕ["la terra è piatta"] = ψ["la terra è piatta"].

Assumendo che ϕ e ψ differiscano esclusivamente per il significato che assegnano alle espressioni "è tonda" ed "èpiatta", si avrà quindi che ϕ[(2)] = ψ[(2)]. Dunque, il significato di (2) resta lo stesso nelle due interpretazioni, aprescindere dal fatto che in esse il significato intuitivo di (1) è completamente diverso. Ne segue che (2) non può essereconsiderata un'analisi adeguata del significato di (1). Questo argomento non dipende dal fatto che si assumano comeoggetti di credenza enunciati di un linguaggio pubblico, e può essere riformulato nel caso venga usato un sistema dirappresentazioni interne. In generale quindi, una spiegazione citazionale degli atteggiamenti proposizionali è inadeguata,a prescindere dal fatto che si faccia riferimento a un linguaggio pubblico o a un sistema di rappresentazione interne.Parafrasando Bäuerle e Creswell (1988), si può concludere che il problema centrale consiste nel fatto che la relazione dicredenza coinvolge il significato. "Credere" non può essere una relazione fra un soggetto di credenza e un enunciato, inquanto lo stesso enunciato può significare cose completamente diverse in base a diverse interpretazioni. Se quindi,almeno per certi aspetti dell'onniscienza logica, sembra necessario far riferimento in qualche misura alla forma sintatticadelle rappresentazioni, la soluzione delle "piccole dosi di sintassi" (come ad esempio nella logica della consapevolezzageneralizzata di Fagin e Halpern) sembra inevitabile. In ogni caso, gli argomenti di Church-Cresswell rendonoinaccettabile affermazioni come quella di Konolige (1986b), secondo cui l'impostazione alla base della logica dellaconsapevolezza generalizzata sarebbe "una cattiva idea: finisce per essere equivalente a una versione più complicata delsentential approach [cioè del modello sintattico proposto da Konolige stesso] in un quadro a mondi possibili" (Konolige1986b, p. 242).

Page 139: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 11

14

Un ulteriore punto che accomuna le ricerche sull'onniscienza logica in IA, distinguendole dal lavoro svolto a taleproposito in ambito model teoretico e filosofico, può essere individuato nell'abbandono del tentativo di individuare gli"oggetti" degli atteggiamenti proposizionali, nei termini di entità semantiche (di "significati"), che si collochino a unlivello intermedio fra enunciati e proposizioni, e che siano dotati di una consistenza ontologica di tipo extramentale eintersoggettivo, analoga a quella dei sensi fregeani. Questa è la prospettiva che viene adottata dalla maggior parte dellericerche nell'ambito della semantica filosofica, e fra esse da alcune che seguono la via di introdurre elementi sintatticinella semantica, o che comunque tengono conto della struttura sintattica delle rappresentazioni. L'esempio recente piùesplicito a questo proposito è la teoria dei significati strutturati (structured meaning) di Cresswell (1985), sviluppata apartire dall'isomorfismo intensionale di Carnap attraverso le proposte di Lewis (1972). Secondo Cresswell un significatostrutturato è "una 'entità pubblica' nel senso che la sua struttura dipende dalla struttura dell'enunciato usatonell'attribuzione della credenza" (Bäuerle e Cresswell 1988, p. 499). Queste affermazioni sono motivate in base aconsiderazioni di diretta ascendenza fregeana: "I significati non possono essere entità private. Due persone possonoavere la stessa credenza, e la credenza che essi hanno in comune deve essere qualcosa cui devono poter fare pubblicoriferimento" (ivi, p. 498). In ultima analisi, questo tipo di scelte è dettato da preoccupazioni di origine comportamentistae verificazionista (per questo tipo di critica applicata alla teoria dell'isomorfismo intensionale di Carnap si veda Fodor1978). Lo scopo dell'analisi degli enunciati di atteggiamento proposizionale viene visto in ultima istanzanell'individuazione di criteri per l'attribuzione degli atteggiamenti stessi, criteri che devono essere intersoggettivamenteaccessibili, e quindi non possono far riferimento a entità di tipo privato (ad esempio di tipo mentale). Viceversa, nellelogiche dell'IA il tentativo è comunque sempre quello di tener conto delle strutture e delle rappresentazioni, e deiprocessi computazionali, associati ai singoli soggetti epistemici, pure se in un quadro di tipo, in senso lato, logico.Torneremo su questi problemi nel prossimo capitolo. Per il momento, ci limitiamo ad osservare che l'attribuzione di unacredenza a un dato soggetto è sempre un'operazione a carattere ipotetico, sottodeterminata dal comportamento(linguistico o di altro tipo) del soggetto stesso. Non c'è nulla quindi di problematico nel fatto di riferirsi a costruttiteorici e a entità di tipo non "osservabile" (come appunto le rappresentazioni o gli stati mentali). D'altro canto, circa lapossibilità che più soggetti possano avere la stessa credenza, ciò non è incompatibile con l'assunzione della natura"mentale" degli oggetti di credenza se si accettano alcune assunzioni sulla natura degli stati mentali che sonoampiamente condivise nella psicologia contemporanea (si veda oltre, nel par. 12.4, la discussione sulla distinzione fracompetenza ed esecuzione nella psicologia cognitiva in rapporto all'antipsicologismo di Frege).

Page 140: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

12. Logica, significato, competenza e comprensione

Alla fine del secondo capitolo abbiamo individuato l'insorgere di una sorta di circolo vizioso nei rapporti frateorie modellistiche del significato e intelligenza artificiale di impostazione logicista. Alcuni filosofi del linguaggio sisono avvicinati all'IA per individuare possibili soluzioni ai problemi lasciati aperti del paradigma model teoretico nellostudio del significato. I ricercatori di IA di impostazione logica sostengono l'impiego della semantica logica di tipomodel teoretico per dare basi rigorose alla ricerca sui formalismi di rappresentazione e, in generale, sulle tecniche diragionamento utilizzate in IA. Nei capitoli precedenti abbiamo visto che esistono effettivamente molti punti di contattofra la ricerca logica in IA e il lavoro in semantica modellistica, sia a livello degli strumenti utilizzati, sia a livello delleproblematiche affrontate, sia ancora a livello dei riferimenti culturali. Qui giunti, abbiamo accumulato abbastanzamateriale per cercare di tracciare una sintesi, abbozzando al tempo stesso un primo tentativo di rispondere al problemadelle relazioni fra questi due ambiti disciplinari. Tale sintesi non può essere ovviamente che provvisoria e, per moltiaspetti, imprecisa, a causa di fattori quali lo stato di veloce evoluzione dell'IA negli ultimi anni, evoluzione che è tuttorain pieno corso, e la grande mole di ricerche svolte in questo ambito, che per di più hanno spesso un carattereframmentario. Si tratta dunque di un settore per molti versi ancora in via di assestamento. Tuttavia riteniamo che alcunelinee generali possano essere individuate.

12.1 Semantica lessicale, simboli e riferimento

E' evidente in primo luogo che l'IA di impostazione logica, e, più in generale l'IA classica di tipo simbolico, nonpossono offrire una soluzione a tutti i problemi lasciati insoluti dalla semantica di tipo modellistico. E' quanto emergenel caso del problema del significato dei termini primitivi extra logici (o, in termini linguistici, del problema delsignificato lessicale), come abbiamo già messo in evidenza nel paragrafo 7.2. Questo non significa tuttavia che nulla sisia ottenuto in questo settore. Diego Marconi (1989, 1992b) individua due componenti del significato lessicale, chepossono essere caratterizzate come segue.

(1) Da un lato, si ha un complesso insieme di connessioni fra i vari elementi del lessico, che esprimono relazionidi tipo non logico che sussistono fra le parole di una lingua. Esempi di questo genere sono che i cani sono mammiferi,che gli uccelli di solito volano, che un padre è un essere umano di sesso maschile il quale ha dei figli che sono, a lorovolta, esseri umani, che se qualcuno corre allora (di solito) si sposta, e così via. Tali informazioni vengono abitualmenteutilizzate per eseguire inferenze, e fanno parte, a tutti gli effetti, del significato lessicale: "se uno non sa che, permangiare, normalmente, si deve aprire la bocca diciamo che non sa cosa significa mangiare" (Marconi 1989, p. 79).Questa componente del significato lessicale viene detta da Marconi competenza inferenziale.

(2) L'altra componente del significato lessicale consiste nella capacità di mettere in relazione le parole conoggetti, eventi e situazioni nel mondo. Ad esempio, saper dire se un certo animale è un cane, o saperlo distinguere da ungatto, saper riconoscere qualcuno che corre, e così via. Tale capacità è quella che consente, si potrebbe dire, di"calcolare" i valori della funzione interpretazione per i simboli primitivi non logici di un linguaggio, e che consentequindi, in ultima istanza, di individuare le condizioni di verità effettive di un enunciato. Essa è detta da Marconicompetenza referenziale1.

Queste due componenti del significato lessicale sono in parte indipendenti fra loro: può accadere che siconoscano le relazioni che legano una parola ad altre parole della lingua senza per questo saper individuare a che cosaquella parola si riferisca. Oppure, si può essere in grado di individuare il riferimento di un termine senza conoscere tuttele relazioni rilevanti che intercorrono fra esso e le altre parole della lingua.

Di fatto, come abbiamo già visto nel par. 7.2, di questi due problemi soltanto il primo è affrontabile nell'ambitodell'IA logicista. La competenza referenziale, ossia quegli aspetti del significato lessicale che concernono il mapping fraelementi del lessico e mondo, non risulta affrontabile nell'IA di impostazione logica più di quanto non sia affrontabilenell'ambito del paradigma model teoretico tradizionale. Tutto quanto è stato detto all'inizio del par. 2.1 sul riferimentodei simboli primitivi in semantica modellistica si applica senza alcuna modifica al paradigma dell'IA logicista.Riprendiamo qui l'argomento per tentare di mostrare che analoghe considerazioni valgano per tutta l'IA classica diimpostazione simbolica. Un trattamento esauriente del problema della competenza referenziale eccede tuttavia gli scopidi questo lavoro. Per un'analisi approfondita dell'argomento rimandiamo a Marconi (1992b).

Prima di proseguire, è necessaria una precisazione. A proposito della competenza referenziale, Marconi affermache:

In generale, sembra che ci sia bisogno di una qualche proiezione, diretta o indiretta, degli itemlessicali sugli elementi di un altro sistema, che può essere il "mondo reale" stesso, o più comunemente unsistema che lo rappresenta, come un sistema di percezione, naturale o artificiale; o anche un altro

1Qui e nel caso precedente l'uso da parte di Marconi del termine competenza (anziché, ad esempio, significato) è dovutoalla volontà di sottolineare che, come vedremo più oltre, questi aspetti della semantica sono indissolubilmente legati albagaglio cognitivo dei singoli parlanti (sul concetto di competenza cfr. la nota al cap. 2).

Page 141: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

2

linguaggio, di cui sia già assicurata la connessione con il dominio di oggetti del primo linguaggio. Nonvedo nessuna differenza di principio tra proiettare le parole di una lingua naturale su pattern nel campovisivo di un robot o invece sulle espressioni di, mettiamo, un linguaggio di interrogazione che ha accessoai dati su cui stiamo ponendo domande in linguaggio naturale: non mi pare ci sia differenza fra unatraduzione in un linguaggio davvero interpretato e una proiezione su un sistema non linguistico che siaeffettivamente rappresentativo. (Marconi 1989, p. 79-80).

A nostro parere, questo passo rischia di causare fraintendimenti2. Riteniamo che, affinché il problema delriferimento dei simboli primitivi di un sistema possa dirsi effettivamente risolto, sia assolutamente necessario che alcunisimboli vengano effettivamente proiettati (direttamente o indirettamente) sul "mondo reale", e che far riferimento aqualche altro "sistema che lo rappresenta" sposti semplicemente il problema senza risolverlo. In particolare, riferirsi a unaltro linguaggio "davvero interpretato", "di cui sia già assicurata la connessione con il dominio di oggetti del primolinguaggio" sia particolarmente problematico. O tale linguaggio è a sua volta effettivamente proiettato sul mondo, esistecioè qualche dispositivo che calcola il riferimento (di alcuni) dei suoi simboli primitivi, e allora, in questo caso, anche isimboli primitivi del primo linguaggio sono proiettati sul mondo (in maniera indiretta, se si vuole), oppure ci si limita asupporre che esso sia interpretato, e in tal caso non si ha nulla di più di una traduzione in un "markerese", del tipo diquelle presupposte dalle teorie semantiche già criticate da Lewis (1972). In altri termini, si rientrerebbe nel concetto disemantica che Woods (1975) ha indicato come tipico dei linguisti, cioè semantica come traduzione in un linguaggio dirappresentazione di qualche tipo. A questo punto, si avrebbe addirittura qualcosa di meno delle funzioni interpretazionedella semantica modellistica 3.

Diversa è la situazione del caso di "un sistema di percezione, naturale o artificiale". Riteniamo che, per risolvereil problema del riferimento dei simboli primitivi di un sistema simbolico, il richiamo ad un sistema di tipo percettivo emotorio sia indispensabile. Se ci si pone da un punto di vista cognitivo, fare riferimento a un sistema di questo generecostituisce l'unica via per affrontare il problema. Ma questo non in quanto i simboli primitivi vengano proiettati sulsistema percettivo, quanto piuttosto in quanto un sistema percettivo/motorio di qualche tipo costituisce un tramite perproiettare il sistema di simboli sul mondo. A questo proposito è importante chiedersi cosa può significare dire che unsistema di percezione rappresenta il mondo. Se si intende che esso contribuisce a costruire un sistema dirappresentazione, e ad ancorarlo al mondo, allora è esattamente quello che intendiamo dicendo che esso è il tramite frarappresentazioni e mondo reale. Se si intende che sia esso stesso un sistema di rappresentazioni che, a loro volta, sicollegano al mondo chissà in quale maniera, allora ci sembra che questa sia una visione abbastanza inadeguata delproblema della percezione.

In altre parole, riteniamo che il problema del riferimento dei termini lessicali possa ritenersi risolto solo nellamisura in cui si possa risolvere il problema dell'ancoramento dei simboli4 (symbol grounding) di un sistemacomputazionale ad oggetti, situazioni ed eventi extralinguistici nel mondo. Riteniamo inoltre che si possa asserire diaver costruito un modello della competenza referenziale se si è in grado di costruire un sistema che superi il test diTuring totale5, vale a dire, una versione estesa del test di Turing che concerna il comportamento globale, simbolico enon simbolico, di un sistema, e che non sia limitato al comportamento linguistico come avveniva nel test di Turingtradizionale. Ad esempio, si potrà dire di aver costruito un modello adeguato della competenza referenziale relativa altermine "bicchiere" se si sarà in grado di costruire un sistema in grado di reagire in maniera adeguata, ad esempio, a unordine del tipo "prendi il bicchiere". Per reagire in maniera adeguata si intende, ad esempio, a seconda della situazione,prendere effettivamente il bicchiere, o rispondere "qui non c'è nessun bicchiere", o chiedere "quale bicchiere?" (se ibicchieri sono più di uno), e così via, tutto questo in relazione al mondo reale e non a un mondo simulato6.

2Non intendiamo quanto segue come una critica a Marconi, le cui posizioni al proposito risultano chiarite in (Marconi1992b) secondo una linea molto vicina a quella da noi adottata. Riteniamo tuttavia che il passo sopra riportato possaessere considerato sintomatico di alcune confusioni ricorrenti nelle discussioni su questi argomenti.3A questo proposito riteniamo che il problema della competenza referenziale non possa ritenersi risolto neppureipotizzando la proiezione delle rappresentazioni semantiche su modelli mentali del riferimento nel senso proposto daJohnson-Laird. Come si è visto nel par. 1.2, i modelli mentali costituiscono sistemi di rappresentazione che necessitanoa loro volta di essere interpretati sulla realtà. Rispetto al problema della semantica lessicale, riteniamo quindi che ilcontributo dei modelli mentali si debba ascrivere più all'aspetto della competenza inferenziale che non a quello dellacompetenza referenziale.4Nel senso ad esempio di (Harnad 1989, 1990).5Ancora nel senso di (Harnad 1989, 1990).6Si noti che qui non intendiamo assolutamente entrare nel merito se un sistema del genere sia dotato o meno diintenzionalità. Come è ben noto (Agazzi 1967, 1981; Searle 1980) l'intenzionalità è uno degli aspetti più problematiciper le tesi dell'IA forte (Searle 1980). Qui intendiamo mantenere distinto il problema della competenza referenziale, chesi può considerare risolto da un sistema che superi appunto il test di Turing totale, e che quindi ammette un controllo ditipo intersoggettivo, dal problema dell'intenzionalità. Quest'ultimo potrebbe essere caratterizzato come il problema di

Page 142: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

3

Riteniamo che il problema dell'ancoramento dei simboli al mondo non possa essere affrontato, oltre che con glistrumenti dell'IA di impostazione logica, neppure all'interno del paradigma simbolico dell'IA in senso più generale,almeno se si interpreta l'attributo "simbolico" in senso forte. A questo proposito è necessaria una precisazione. Quandoparliamo di paradigma simbolico in senso forte intendiamo fondamentalmente un'accezione di simbolico che coinvolgeun'ipotesi semantica sull'interpretazione dei costrutti impiegati nella costruzione di modelli computazionali delle attivitàcognitive. La distinzione è ben sintetizzata dal seguente passo di Smolensky:

Chiamando l'approccio tradizionale ai modelli cognitivi "paradigma simbolico" intendo porrel'accento sul fatto che in questo approccio le descrizioni cognitive sono costituite da entità che sonosimboli sia nel senso semantico di riferirsi ad oggetti esterni, sia nel senso sintattico di essere trattatetramite manipolazione simbolica. (Smolensky 1988, p. 61 della trad. it.).

La accezione semantica di "paradigma simbolico" è ben esemplificata dalla knowledge representation hypothesis diBrian Smith, a cui rimandiamo (par. 3.1). Per quanto riguarda l'accezione sintattica, l'ipotesi simbolica si limita apostulare che i costrutti computazionali e le strutture dati mediante cui è realizzato un modello computazionale siano icostrutti tipici della programmazione simbolica (come ad esempio alberi, strutture PROLOG o liste LISP), elaborate daun'architettura computazionale del tipo di quella della macchina di von Neumann. Una buona illustrazionedell'accezione sintattica di "simbolico" è il seguente passo di Levesque:

Userò il termine "simbolo" per indicare una configurazione di stati componenti relativamentepassivi, i quali possono essere riconosciuti, distinti fra loro e manipolati dai componenti più attivi di unaarchitettura computazionale. Sono esempi tipici stringhe di bit, di lettere o di cifre. I simboli possonorappresentare o meno qualcosa. Perciò, i termini "segno" [token] o "carattere" sarebbero forse piùappropriati. (Levesque, 1988, p. 385).

E' evidente che questa accezione di simbolo è molto più debole di quella implicata knowledge representation hypothesisdi Smith.

Qui sosterremo la tesi secondo cui il problema del riferimento dei simboli primitivi, o il problema del symbolgrounding, non possono essere affrontati nell'ambito di un paradigma puramente simbolico, se si assume "simbolico"nella sua accezione semantica. Il problema è che, dati i simboli primitivi di un sistema simbolico, se ne voglionomodellare i meccanismi di riferimento restando all'interno del paradigma simbolico inteso in senso semantico, non restaaltra via che ipotizzare altre computazioni che a loro volta dovranno fare riferimento a nuovi simboli, dei quali a lorovolta si dovrà spiegare il riferimento, entrando così in un regresso all'infinito. In altri termini, la questione può essereposta come segue. Si vuole individuare un dispositivo computazionale che calcoli i valori della funzione interpretazioneper i simboli primitivi del sistema. Tuttavia, se per fare ciò, si introducono nuovi simboli, ci si limita a spostare ilproblema, e si sarà costretti a calcolare il valore di una qualche funzione interpretazione anche per questi ultimi, e cosìvia all'infinito. Unica alternativa è quella di supporre che certi simboli siano connessi ai loro referenti in virtù di qualchequalità intrinseca, cadendo così in una "teoria magica del riferimento" del tipo di quelle già criticate da Wittgenstein(1958) e da Putnam (1981)7. Questo argomento è esposto in maggiori dettagli in (Frixione et al. 1989) e in (Frixione eSpinelli 1992), dove si suggerisce che una possibile via di uscita potrebbe consistere nell'ipotizzare un livello dicomputazione subsimbolico nel senso di Smolensky (1988), ossia di un livello computazionale in cui le unità minime dianalisi siano subsimboli, cioè entità computazionali cui non sia assegnata una semantica locale specifica, indipendentedal contesto, nel senso che non è possibile immaginare una funzione interpretazione che metta in corrispondenza talientità su oggetti del mondo, oggetti esterni al sistema, che fanno parte del suo "dominio di competenza". Si noti che taliunità (semanticamente) subsimboliche potrebbero (almeno in linea di principio) essere realizzate mediante entità di tiposimbolico nell'accezione sintattica del termine. Tuttavia, ciò su cui i "simboli" di un meccanismo subsimbolico delgenere vanno "interpretati" sono, in ultima analisi, stati interni del sistema stesso, come ad esempio stati di sensori o diattuatori, pixel di una matrice bitmap, celle di un automa cellulare, valori di attivazione delle unità di una rete neurale, ecosì via.

Secondo Woods (1980), come in parte abbiamo già visto, uno dei maggiori contributi dell'IA alla teoriasemantica consiste nello sviluppo di una semantica di tipo procedurale. Una semantica di questo genere estenderebbe latradizionale semantica modellistica dando corpo alla nozione di condizioni di verità mediante lo sviluppo di procedure

come una rappresentazione venga esperita soggettivamente come dotata di significato, e che in quanto tale quindi nonpuò ammettere un controllo intersoggettivo (si veda Frixione e Spinelli 1992).7 Z. Pylyshyn, uno dei maggiori teorici della linea simbolica nelle scienze cognitive, concorda sul fatto che i dispositiviche mettono in relazione i simboli con le entità extra-mentali (dispositivi che Pylyshyn chiama transducer) devonoessere di natura non simbolica. Per Pylyshyn tuttavia ne segue che tali dispositivi dal punto di vista cognitivo devonoessere assunti come primitivi: essi hanno natura esclusivcamente fisica e non computazionale, e la loro struttura non puòessere indagata dalle scienze cognitive (Pylyshyn 1984, cap. 6).

Page 143: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

4

in grado di calcolare il significato dei simboli primitivi del sistema di rappresentazione utilizzato. La semanticamodellistica della tradizione tarskiana, nella prospettiva di Woods, definisce le procedure in base alle quali può esserecalcolato il valore di verità di una formula complessa a partire dal significato dei suoi componenti. Tuttavia, essa siferma a livello di costituenti atomici. Per Woods l'approccio procedurale può essere esteso ulteriormente:

Se una persona comprende a pieno un termine che caratterizza una classe di entità, e se le sipresenta qualcosa che sia una chiara istanza di un membro di quella classe, allora quella persona puòriconoscerlo e dire "sì". Analogamente, può rifiutare qualcosa che chiaramente non sia un membro diquella classe. Se crediamo che nel fare ciò il cervello funzioni come qualche tipo di macchinafisico/elettrica, allora chiaramente c'è qualche procedura che viene eseguita e che riconosce i membridella classe e rifiuta i non membri. (Woods 1980, p. 316; corsivo nostro).

Per quanto riguarda la maniera di realizzare tali procedure, Woods afferma:

le primitive procedurali di un linguaggio di programmazione di alto livello come il LISP mettono adisposizione quello che sembra essere un utile insieme di operazioni di base mediante le quali costruirepotenziali "funzioni di significato" [...]. Per esempio, il paradigma procedurale permette di costruire"primitive" per misurare la forza di un pattern matching, correlazioni statistiche e somme pesate permezzo delle stesse primitive procedurali di base che si adoperano per caratterizzare il significato deitermini logici E, O, e PER OGNI. (Woods 1980, pp. 316-317).

Tutto questo potrebbe anche dimostrarsi vero. Quello che però si deve sottolineare è che, in base alla distinzione sopraintrodotta, nei due casi il LISP svolge due ruoli diversi. Nel caso delle costanti logiche, le strutture (sintatticamente)simboliche del LISP vengono usate per implementare i costrutti simbolici (in senso semantico) di un formalismo logicoe le procedure che li elaborano. Nel caso delle operazioni legate al grounding dei simboli primitivi, le strutture(sintatticamente) simboliche del LISP vengono usate per implementare processi di tipo subsimbolico, o comunque nondi tipo simbolico in senso semantico.

Per quanto riguarda invece la componente del significato lessicale di cui al punto (1), l'IA di tipo simbolico, el'IA di impostazione logicista in particolare, hanno offerto strumenti che possono risultare preziosi. Come abbiamovisto, i postulati di significato classici sono troppo poco espressivi per catturare molti tipi di relazioni lessicalmenterilevanti che sussistono fra le parole di una lingua. Postulati di significato scritti, ad esempio, in logica fuzzy o in qualchelogica non monotòna8 possono risultare estremamente utili allo scopo. Sulla rilevanza delle inferenze di tipo nonmonotòno per l'elaborazione di postulati di significato adeguati a rappresentare il lessico delle lingue naturali, lasituazione è ben sintetizzata in due recenti articoli di Richmond Thomason (1991a, 1991b). Thomason, ad esempio,afferma che:

Il lavoro logicista in IA ha generalmente riconosciuto l'esigenza di accrescere il quadro logicoproposto da Frege in maniera da affrontare i problemi del ragionamento di senso comune. La linea disviluppo più generalmente condivisa consiste nell'incorporare la non monotonicità nella logica. E questacaratteristica risulta essere precisamente quello che serve per risolvere molti dei problemi che emergononella semantica lessicale di stile montagoviano. [...] Il fatto che la semantica lessicale sia piena digeneralizzazioni che ammettono eccezioni non costituisce certo una sorpresa, e una tecnica generale peresprimere tali generalizzazioni potrebbe estendere in larga misura l'adeguatezza delle teorie logiciste delsignificato lessicale. (Thomason 1991a, p.4)

Thomason fa l'esempio di inferenze del linguaggio naturale come:

John sta attraversando la strada.Quindi, John avrà attraversato la strada.

E' ragionevole assumere che un'inferenza di questo tipo sia basata sul significato di "attraversare". Per poterne rendereconto, tuttavia, bisogna risolvere una forma di frame problem. Il punto è che quando qualcuno sta attraversando unastrada, di solito raggiunge l'altro marciapiede. Però può anche succedere che ciò non si realizzi. Ad esempio, Johnpotrebbe finire sotto una macchina. Inferenze di questo genere, dice Thomason, devono essere considerate dei "naturallanguage defaults". Qualche forma di non monotonicità deve essere implicita nel significato del verbo attraversare. Aproposito della circumscription di McCarthy, Thomason (1991b) afferma che essa potrebbe risultare appropriata peraffrontare dal punto di vista logico molti problemi rilevanti per la semantica lessicale. Ad esempio il problema di

8 Oppure in un sistema a frame o mediante una rete semantica che ammette eccezioni, che, se si accetta la "tesi diHayes", è la stessa cosa.

Page 144: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

5

costrutti generici come nelle frasi gli uccelli volano oppure io guido verso il posto di lavoro, oppure l'informazione cheun cacciavite è usato normalmente per avvitare viti. O ancora, il problema di fornire una teoria della causalità perinterpretare i costrutti linguistici di tipo causale. Gli aspetti connessi alla non monotonicità del ragionamento su azioni(ad esempio, il fatto che le cose continuano ad andare in un certo modo se non accade nulla di anomalo) erano già statiindividuati come rilevanti da chi aveva lavorato sulla rappresentazione del significato lessicale dal punto di vista dellasemantica di Montague, come ad esempio Dowty (1979). Tuttavia non erano ancora state sviluppate le tecniche formaliper affrontare il problema in maniera abbastanza sistematica.

Inoltre, Thomason sottolinea la continuità fra le ricerche sulla logica non monotòna e la tradizione modellistica insemantica:

Gli approcci alla non monotonicità disponibili potrebbero essere incorporati senza difficoltà nelloschema della semantica di tipo montagoviano senza alcun cambiamento alla parte della logica che nonammette eccezioni. (Thomason 1991a, p. 4)

E, più in particolare, a proposito della circumscription:

Fra le teorie disponibili del ragionamento con eccezioni che potrebbero essere applicate allasemantica lessicale, la circumscription è quella che forse può essere armonizzata in maniera più facile enaturale con il lavoro già esistente nel quadro proposto da Montague, in quanto essa mette a disposizioneun modulo logico integrato che si basa su una logica di ordine superiore. [...] Il progetto di sviluppare unaspiegazione logica ampiamente efficace delle relazioni semantiche fra gli elementi lessicali di una linguanaturale è, in quanto a scopo, grosso modo comparabile al progetto di sviluppare una teoria di alto livellodella conoscenza di senso comune. (1991b, pp. 457)9.

12.2 Un paradigma modellistico "liberalizzato"

Al di là della compatibilità formale fra i nuovi strumenti logici offerti dall'IA e le tradizionali tecniche dellasemantica modellistica, vi è tuttavia un punto che merita di essere evidenziato. Abbiamo già messo in luce (par. 2.1) che,rispetto al problema della semantica lessicale, non è in generale possibile una distinzione netta e definitiva frainformazioni semantiche da un lato (nel senso di informazioni di tipo analitico, che dipendono esclusivamente dalsignificato dei termini, e che sono vere in maniera necessaria) e informazioni fattuali, di tipo contingente, dall'altro10. Siconsideri la parola "gatto". Certe informazioni, come ad esempio che "gatto" è un nome comune, non hanno un caratterefattuale. Altre, concernenti ad esempio i dettagli dell'apparato riproduttivo dei gatti o le loro abitudini alimentari sonocertamente di natura fattuale, e ciò non costituisce un problema in quanto a nessuno verrebbe in mente di affermare cheil fatto che i gatti mangino certe cose faccia parte del significato del termine "gatto". Ma si consideri l'informazione che igatti sono animali. Certamente se qualcuno non sapesse che un gatto è un animale saremmo propensi ad affermare cheegli non sa cosa significhi "gatto". Tuttavia, si tratta pur sempre di un'informazione fattuale che, afferma ad esempioPutnam (1970), potrebbe risultare falsa qualora si scoprisse che in realtà i gatti sono robot inviati da Marte. Chi nonfosse convinto dall'esperimento mentale di Putnam, pensi ad altri esempi di informazioni dello stesso genere, cherisultano inequivocabilmente di natura non analitica e contingente. Ad esempio, che le balene sono mammiferi, o che icoralli o i batteri sono animali. Di norma, le informazioni di tipo prototipico che possono essere espresse mediantepostulati di significato non monotòni sono informazioni a carattere fattuale e contingente, ed esse costituiscono lamaggior parte delle informazioni relative ai concetti lessicali di senso comune. Questo punto è riconosciuto anche daThomason, il quale ad esempio afferma:

Conoscere tali significati [i significati lessicali] comporta l'accesso a un ampio spettro diconoscenza rilevante. [...] Molti domini di senso comune offrono trame relativamente blande diragionamento che ammette eccezioni, trame che sono basate su di un grande numero di concetti connessifra loro in modo vago. In molti casi è difficile separare quello che è primitivo da quello che è derivato.Mettendo a disposizione abbastanza conoscenza di sfondo è possibile caratterizzare i significati deitermini, ma ciò raramente prende la forma di condizioni necessarie e sufficienti. E' difficile trovare metodiaffidabili per articolare la conoscenza di sfondo e maniere generali per applicare tale conoscenza allacaratterizzazione dei significati. (Thomason 1991a, p. 2)

9Come esempio di integrazione fra circumscription e logiche intensionali Thomason cita (Thomason 1990), in cuiregole di tipo non monotòno vengono utilizzate per mantenere il coordinamento fra le credenze di sfondo checostituiscono la base comune di una conversazione.10Su questo punto si vedano ancora (Marconi 1989 e 1992b).

Page 145: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

6

Non si può individuare una distinzione netta, fa notare ancora Thomason, fra inferenze del tipo di quella precedente,relativa a John che attraversa la strada, e inferenze come la seguente:

Alice ha usato il fiammifero per accendere il fuoco.Quindi, Alice ha strofinato il fiammifero.

dove entrano in gioco generalizzazioni defeasible di senso comune che riguardano in generale la conoscenza del mondo(come ad esempio il fatto che, di solito, chi usa un fiammifero per accendere qualcosa lo ha prima strofinato), e chesarebbe dubbio se considerare parte della semantica lessicale.

E' interessante confrontare queste affermazioni con i passi sul problema del lessico nella semantica modellisticatratti da Thomason (1974), e riportati nel par. 2.1. Questo confronto dà la misura delle influenze dovute all'IA sulparadigma model teoretico11. Secondo le posizioni di Thomason (1974), in sostanza, nella misura in cui certeinformazioni rilevanti per la descrizione del significato lessicale erano riconoscibili come informazioni a caratterefattuale, allora esse non dovevano essere considerate rilevanti per la teoria semantica: "i problemi della teoria semanticadovrebbero essere distinti da quelli della lessicografia" in quanto "la lessicografia deve prendere in prestito concetti datutte le aree del sapere e della pratica". E ancora: "tale evoluzione [della teoria semantica] dovrebbe senza dubbiofermarsi assai prima di ottenere qualcosa che assomigli a un dizionario" in quanto "costruire un dizionario richiede unaconoscenza considerevole del mondo".

Questi assunti erano ampiamente condivisi nell'ambito del paradigma modellistico "classico" in semantica: nellamisura in cui gran parte del significato lessicale dipende da conoscenze fattuali, allora esso non è competenza dellasemantica, in quanto altrimenti una teoria semantica dovrebbe comprendere una summa enciclopedica di tutto il sapereumano. E' evidente però che una posizione "minimalista" di questo tipo non è praticabile da chi lavora in IA, che, percostruire sistemi che effettivamente funzionino, deve comunque fornire loro una rappresentazione abbastanza ricca delsignificato dei termini lessicali. Lo sviluppo di strumenti formali come le logiche non monotòne consente di estendere lasemantica filosofica in questa direzione, pur mantenendo una forte continuità dal punto di vista delle tecniche formaliutilizzate12.

Ciò pone però ulteriori problemi, a carattere eminentemente filosofico, rispetto alla visione modellistica classicadella semantica. Il significato dei termini del lessico non solo dipende in maniera determinante da informazioni di tipofattuale, ma è il bagaglio stesso di informazioni fattuali a disposizione dei singoli parlanti a risultare rilevante (Marconi1989, 1992b). Parlanti diversi associano ai termini del lessico insiemi diversi di conoscenze, e non è di norma possibileindividuare un nucleo di conoscenze comuni a tutti i parlanti con il quale identificare il significato del termine. Anche sesi ammette che, data una certa parola, esista un'intersezione fra le conoscenze relative al suo significato che ne hannotutti i parlanti di una lingua, di norma tale intersezione è troppo piccola per costituire il "significato" della parola. Ilsignificato lessicale dipende quindi in maniera determinante dal bagaglio cognitivo dei singoli soggetti: "da un certopunto di vista, non esiste la competenza semantica: ci sono competenze semantiche al plurale" (Marconi 1989, p. 78).Da questo punto di vista, Marconi individua una asimmetria fra semantica lessicale e semantica strutturale. Quest'ultimainfatti si basa su regole di tipo composizionale che si possono considerare con buona approssimazione condivise da tuttii parlanti competenti. Ma ciò non accade con la semantica lessicale. E' altresì evidente che questa concezione delsignificato lessicale non è compatibile con l'antipsicologismo fregeano tradizionalmente condiviso in ambito modelteoretico. Certamente, i significati lessicali così intesi non coincidono del tutto con le "immagini mentali" contro cuipolemizzava Frege, che sono contenuti di coscienza del tutto privati e incomunicabili13. Tuttavia, è evidente che isignificati lessicali così concepiti sono inconciliabili con la concezione fregeana di senso, inteso come entità logicacomune a tutti i parlanti, ed anzi dotata di una consistenza ontologica del tutto indipendente da ciò che avviene nellementi dei singoli soggetti.

Un ulteriore elemento che rende difficilmente compatibili gli strumenti offerti dall'IA logicista con gli assuntifregeani è costituito dall'indebolimento del principio di composizionalità del significato. Per come lo avevamo formulatonel par. 1.1, tale principio impone che il significato di un'espressione complessa sia funzione esclusivamente del 11Richmond Thomason è un autore che abbiamo incontrato diverse volte nel corso di questo lavoro, e che ancoraincontreremo nel seguito. Il suo percorso intellettuale è in un certo senso paradigmatico dell'evoluzione della semanticamodellistica posta in contatto con gli stimoli provenienti dall'IA di impostazione logica. Partito dalle posizioni"classiche" della teoria modellistica del significato, si è in seguito avvicinato alla ricerca sulla rappresentazione dellaconoscenza in IA, ponendosi al tempo stesso in maniera approfondita il problema dei fondamenti degli approccicognitivi e computazionali al problema del significato, e dei rapporti fra semantica filosofica ed IA.12 L'impossibilità di distinguere in maniera netta e definitiva fra informazione semantica e conoscenza fattuale apre lastrada al rischio di posizioni semantiche di tipo olistico, in base alle quali il significato di ciascuna espressione di undato linguaggio dipende dal significato di tutte le espressioni del linguaggio stesso. Qui non affronteremo questo aspettodel problema, e rimandiamo a Marconi (1992b) per una discussione.13Sulle differenze fra lo psicologismo contro cui polemizzava Frege e lo psicologismo dell'IA e delle scienze cognitivesono interessanti le osservazioni di Thomason (1979) che prenderemo in considerazione nel seguito (par. 12.4).

Page 146: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

7

significato dei suoi componenti e della sua struttura. In IA sono stati individuati tipi di ragionamento in cui, al contrario,è essenziale che il significato di un'espressione dipenda anche dal contesto costituito dalla teoria in cui esso compare.Ad esempio, a proposito del problema dell'eredità con eccezioni nelle reti semantiche, e della difficoltà di ricondurre taliaspetti ad un trattamento di tipo logico (cfr. par. 7.1), Thomason (1992) individua nell'assunzione classica dellacomposizionalità del significato un limite alla flessibilità della logica nel costruire modelli del ragionamento di sensocomune. Egli afferma:

La teoria dei modelli tarskiana [...] costituisce un approccio di grana relativamente grossolana, equesto è dovuto al requisito che le condizioni di verità di espressioni logiche complesse debbanodipendere in qualche modo in maniera uniforme dalle condizioni di verità delle loro parti. Questacaratteristica persiste anche qualora i modelli classici siano estesi in maniera da includere mondi possibili,domini di ordine superiore, valori di verità non classici, e simili. (Thomason 1992, p. 199).

In generale, il principio di composizionalità non vale nel caso delle logiche non monotòne. Ad esempio, in baseal principio di composizionalità, data una formula del tipo α ∧ β, un'interpretazione I = (ϕ, D) è un modello di α ∧ β see soltanto se I è un modello di α e al tempo stesso I è un modello di β. Quindi ogni modello di α ∧ β è anche un modellodi α. La stessa cosa non vale in logica non monotòna. Si supponga di operare nell'ambito della formula circumscription.Sia data una formula come:

(*) ∀x (¬ab(x) → P(x)),

e si supponga di voler circoscrivere il predicato ab. In questo caso, l'equivalente del fatto che I sia un modello di (*) èche I sia un modello preferito di (*) rispetto al criterio di preferenza sui modelli indotto dalla formula circumscription diab (nel senso della logica preferenziale di Shoham; si veda il paragrafo 6.3). Perché I sia un modello preferito di (*), Ideve essere un modello di (*) in senso tradizionale, e inoltre I deve essere minimale rispetto ad ab (cfr. par. 6.1). Il fattoche I sia minimale rispetto ad ab dipende in maniera cruciale dall'intera teoria in cui (*) compare. Se si considera unateoria composta esclusivamente da (*), allora I è minimale se e soltanto se ϕ[ab] = ∅ (e, di conseguenza, ϕ[P] = D). Seora consideriamo la congiunzione:

(**) ∀x (¬ab(x) → P(x)) ∧ ab(c),

risulta che i modelli preferiti di (**) sono i modelli di (**) in cui si ha che ϕ[ab] = {c} (dove c - in tondo - è l'oggetto deldominio su cui è interpretata la costante c), i quali però non sono, a loro volta, modelli preferiti di (*). Si potrebbe direche in una logica non monotòna non si può mai parlare di modello di una formula singola, ma solo di modello di unateoria nel suo complesso. Quindi, si può assegnare un valore semantico a una formula solo nel contesto di una teoria, e,in generale, non è possibile assegnare un valore semantico a una formula a partire dal valore semantico dei suoicomponenti atomici.

Quindi, sebbene vi sia una forte continuità fra le tecniche e gli strumenti utilizzati dall'IA logicista da un lato, e latradizione modellistica in semantica dall'altro, vi sono tuttavia numerosi punti di disaccordo fra la pratica dell'IA e leassunzioni di origine fregeana che sono alla base del paradigma modellistico (par. 1.1). Rispetto agli assunti originari diFrege, l'IA ha comportato una sorta di "liberalizzazione" del paradigma fregeano, che va soprattutto nella direzionedell'abbandono di una posizione "platonista" nei confronti della logica e delle entità semantiche, e pone al centro delleproprie indagini le capacità inferenziali di soggetti razionali finiti. Ad esempio, il problema dello psicologismo, inteso insenso lato, non si pone esclusivamente in relazione alla rappresentazione dei significati lessicali. In molti casi cambia ilmodo stesso di intendere la natura e lo scopo delle strutture semantico-modellistiche utilizzate. A proposito dellestrutture semantiche basate su situazioni incomplete o incoerenti, utilizzate nella logica di Levesque della credenzaimplicita ed esplicita (par. 10.1) e in altri ambiti di rappresentazione della conoscenza (par. 7.1), Patel-Schneiderafferma che le strutture semantiche vanno considerate come stati di conoscenza dell'intero sistema, e non modelli delmondo. Può accadere cioè che le strutture model teoretiche vengano viste non come una rappresentazione astratta distati "oggettivi" del mondo (reali o possibili), ma come stati del mondo in qualche senso "modellati" da un soggettocognitivo, o comunque rappresentati dal suo punto di vista. Più in generale, nell'IA logicista, anche se non vienerichiesta l'adeguatezza empirica da un punto di vista psicologico delle strutture e dei costrutti utilizzati, tuttavia la logicaviene utilizzata non come modello di razionalità astratto e "disincarnato", ma come strumento per rendere conto delleattività inferenziali di soggetti razionali individuali e finiti. Quindi la logica non è vista più (o non è vista più soltanto)come un canone normativo di razionalità assoluta, ma come strumento per costruire modelli di forme di ragionamentolimitate, in quanto sottoposte a vincoli di vario genere, quali ad esempio limiti nelle informazioni disponibili, o limiti ditipo computazionale (tempo di calcolo disponibile, dimensioni della memoria). Da un lato, ad esempio, le logiche nonmonotòne hanno a che fare con forme di ragionamento sottoposte a vincoli per quanto riguarda la possibilità di accederea tutte le informazioni rilevanti, e di conseguenza con la necessità di trarre inferenze sulla base di informazioniincomplete. Per quanto riguarda i vincoli imposti da limiti di tipo computazionale, vanno in questa direzione

Page 147: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

8

l'individuazione di sottoinsiemi trattabili computazionalmente dei calcoli logici (cfr. ad es. il par. 5.3 e il prossimoparagrafo), e, per molti versi, il problema stesso dell'onniscienza logica nel ragionamento epistemico.

Rispetto al problema dello psicologismo, e del rapporto fra IA logicista e settori della scienza cognitiva orientatipiù psicologicamente, è da notare che in molti casi l'IA logicista ha proceduto in modo "quasi empirico"14, nel senso chemolti dei problemi che sono stati affrontati e formalizzati in ambito logico erano stati posti originariamente negli ambitipiù "cognitivi" e più orientati psicologicamente della disciplina. Un esempio potrebbe essere quello dei default e dellarappresentazione di concetti mediante tratti prototipici, problema che è stato studiato originariamente da psicologi (cfr.par. 2.2), e che è stato introdotto in IA da un "anti-logico" come Minsky. D'altra parte, nel par. 7.2 abbiamo già messo inluce alcuni parallelismi fra le soluzioni al problema della rappresentazione dei concetti lessicali proposte in psicologiacognitiva e il lavoro svolto sullo stesso problema in IA simbolica e logicista. Sempre a questo proposito, si vedano piùoltre la discussione sulla trattabilità computazionale dei formalismi di rappresentazione della conoscenza, e le analogiesottolineate da Levesque (1986) fra basi di conoscenza vivide e modelli mentali nel senso di Johnson-Laird.

Si può ipotizzare che le relazioni che sussistono fra IA logicista e scienze cognitive più orientatepsicologicamente (o approcci all'IA meno attenti alla dimensione logico-formale) siano per certi versi analoghe allerelazioni che Agazzi (1986) individua fra logica matematica e logica filosofica. Secondo Agazzi, il rapporto che sussistefra logica matematica e logica filosofica presenta delle analogie con il rapporto fra fisica matematica e fisicasperimentale. Come la fisica sperimentale, la logica filosofica sviluppa spesso tematiche di ricerca in maniera informale,che spetta poi alla logica matematica formalizzare in vista di una loro completa comprensione. In molti casi la logicafilosofica individua problemi per affrontare i quali non sono disponibili tecniche formali appropriate. Individuare talitecniche è compito del logico matematico. E' in questo senso che la logica filosofica può essere ricondotta, se pure conle dovute cautele, a una disciplina sperimentale. Il suo compito è quello di affrontare nuovi campi di indagine, e se, nelfare questo, si trova spesso ad operare senza disporre degli strumenti formali adeguati, ciò è dovuto al fatto che talistrumenti spesso non sono ancora disponibili. Ma questo, ovviamente, nulla toglie al valore delle sue ricerche.Analogamente, superata la contrapposizione frontale fra "logicisti" e "anti-logici", l'IA simbolica di impostazione nonstrettamente logica, o di ispirazione più psicologica e cognitiva, può essere vista come una sorta di "IA sperimentale".Storicamente, i problemi posti dai settori dell'IA meno orientati verso gli aspetti formali hanno fornito, epresumibilmente continueranno a fornire, nuovi temi di ricerca e nuovi stimoli al lavoro dei logici (e non soltanto aquelli direttamente impegnati nel programma dell'IA logicista), sottoponendo al tempo stesso la ricerca logica a vincolidi adeguatezza (soprattutto di carattere computazionale) che i logici tradizionalmente avevano preso scarsamente inconsiderazione15. Thomason (1988) afferma che un problema generale nello sviluppo della logica è costituito dalla"difficoltà di sviluppare metodologie corrette per motivare le logiche. [...] non è facile articolare principi per controllaredelle ipotesi sul ragionamento" (p. 323). Il lavoro logico in IA, con la sua enfasi sulle motivazioni computazionali esulla costruzione di algoritmi, "promette non solo di suggerire teorie logiche nuove, ma mette a disposizione nuovimetodi per motivare e valutare le alternative teoriche" (p. 324). Gli sviluppi in questa direzione si prefigurano ricchi diricadute anche per altri settori di applicazione della logica, fra le quali appunto le teorie del significato del linguaggionaturale. Ancora Thomason (1991b) afferma ad esempio: "cercando di mettere in relazione le rappresentazioni aprocedure, il lavoro in IA impone vincoli sulle rappresentazioni di cui, io credo, c'è un forte bisogno nella semanticalinguistica" (Thomason 1991b, p. 456).

12. 3 Rappresentazioni finite e trattabilità computazionale

Dati gli scopi di tipo eminentemente computazionale della disciplina, è ovvio che la ricerca logica in IA si siaindirizzata prevalentemente verso l'individuazione di assiomatizzazioni finite dei sistemi di rappresentazione proposti.Per gli scopi dell'IA è infatti essenziale che una teoria della dimostrazione venga associata al trattamento modelteoretico dei formalismi studiati. Questo tipo di preoccupazione è invece estraneo alle teorie del significato di tipomodellistico classico (per le quali, come vedremo, è problematico fornire un'assiomatizzazione finita). Tuttavia, anchenell'ambito delle teorie filosofiche del significato, esigenze analoghe erano già emerse. L'esigenza che una teoriasemantica comportasse una rappresentazione finita dei significati era stata già espressa (pure se in un senso parzialmentediverso da quello richiesto dall'IA) da filosofi del linguaggio di tradizione analitica vicini - anche se esterni - allatradizione della semantica modellistica in senso stretto, come ad esempio Davidson (1965) e Dummett (1959, 1976). Per 14In un'accezione simile a quella usata da Putnam (1975a) rispetto alla filosofia della matematica. Putnam nega ilcarattere puramente a priori della conoscenza matematica, e afferma che "la conoscenza matematica assomiglia allaconoscenza empirica - cioè [...] il criterio di verità in matematica, proprio come in fisica, è il successo delle nostre ideenella pratica" (p. 61). Secondo Putnam l'introduzione di nuovi concetti e di nuovi assiomi in matematica è spessogiustificata sulla base del loro successo in relazione a discipline di tipo empirico.15Queste considerazioni possono essere estese, dall'ambito specifico dell'IA, al problema più generale dei rapporti fralogica e computer science. Molti degli sviluppi recenti della logica sono stati fortemente influenzati da considerazioni diordine informatico e computazionale. Basti pensare allo sviluppo della logica lineare di Girard (Girard 1987 e 1991;Abrusci 1992).

Page 148: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

9

Davidson, ad esempio, il requisito della finitezza è indispensabile per spiegare come una lingua possa essere appresa daun parlante finito.

L'IA tuttavia, in quanto interessata all'elaborazione di modelli computazionali, pone requisiti più vincolanti dellasemplice finitezza delle rappresentazioni. Affinché i modelli studiati possano essere effettivamente trasformati inprogrammi si devono individuare metodi di elaborazione di tipo effettivo, procedure decidibili che elaborano lerappresentazioni semantiche. Inoltre, affinché tali procedure abbiano un reale interesse (non soltanto dal punto di vistaapplicativo, ma anche in quanto modelli realistici delle prestazioni di soggetti finiti), tali procedure devono sottostare aulteriori vincoli di trattabilità computazionale. Un modello computazionale non solo deve dare le risposte adeguate in untempo finito, ma deve anche poterle dare in un lasso ragionevole di tempo.

Nell'ambito dell'IA di impostazione logicista è stato soprattutto Hector Levesque a porre il problema dellatrattabilità computazionale dei sistemi di rappresentazione della conoscenza16. Abbiamo già visto in precedenza (par.5.3) come Levesque e Brachman abbiano individuato un tradeoff fra potere espressivo e trattabilità computazionale neisistemi di rappresentazione della conoscenza: al crescere del primo la seconda inevitabilmente decresce. Abbiamo vistoinoltre che Levesque e la sua scuola hanno studiato la trattabilità della sussunzione nei sistemi terminologici, e abbiamosegnalato come molti dei sistemi ibridi sviluppati a partire da KRYPTON siano stati concepiti in vista di un ragionevolecompromesso fra espressività e buone proprietà computazionali. Levesque (1988) motiva il suo punto di vista circa lacentralità teoretica di questi problemi in IA, ed espone quale dovrebbe essere l'impatto della teoria della complessitàcomputazionale sull'IA e, in generale, sulle scienze cognitive. Il fatto di prendere in considerazione il problema dellacomplessità computazionale consentirebbe di giungere a una visione meno idealizzata della logica, in sintonia con gliscopi dell'IA. Secondo Levesque, la necessità di limitarsi a tipi di elaborazione che possano essere svolti entro limiti dirisorse accettabili non è soltanto una questione di efficienza, la cui rilevanza si manifesta esclusivamente sul pianoapplicativo. Un modello computazionale di un'attività cognitiva che non sia trattabile computazionalmente non può dircinulla a proposito di come quell'attività possa essere fisicamente realizzata. Le proprietà computazionali di un algoritmosono in un certo senso "assolute", e non dipendono da come l'algoritmo è stato implementato. In altri termini, sequalcosa non può essere computato in maniera efficiente da una macchina di Turing, allora non può essere computato inmaniera efficiente da alcun dispositivo di calcolo. Un modello cognitivo che non tenga conto dei vincoli computazionaliha quindi ben poco valore esplicativo. Di conseguenza, le considerazioni di complessità computazionale devono essereconsiderate vincolanti per qualsiasi modello, sia esso inteso come psicologicamente motivato o meno. Si potrebbeobiettare che tutti i formalismi interessanti dal punto di vista rappresentazionale risultano computazionalmenteintrattabili. Secondo Levesque le cose non stanno necessariamente in questo modo. Innanzi tutto, ad esempio, si devetenere conto di quali input devono essere considerati ammissibili per un dato modello. Non è detto che problemi cherisultano in generale intrattabili non possano essere ricondotti a problemi trattabili se ci si restringe ad un insieme piùlimitato di dati in ingresso. Si tratta di un aspetto che ha anche una forte plausibilità cognitiva. Ad esempio, in ambitolinguistico, gli esseri umani riescono facilmente a comprendere enunciati in cui sono presenti subordinate fino ad uncerto grado di incapsulamento; tuttavia, al di là di tale grado la capacità di comprensione viene meno. Inoltre, secondoLevesque, esistono formalismi trattabili computazionalmente che risultano interessanti dal punto di vista cognitivo e perla rappresentazione della conoscenza. Un esempio è costituito dal tipo di logica rilevante descritto nel par. 10.1 inrelazione al problema dell'onniscienza logica, che, dal punto di vista computazionale, risulta più attraente della logicaclassica17. La tesi di Levesque è che, in generale, le deviazioni dalla logica classica che vanno nella direzione di unamigliore trattabilità computazionale sono in stretto rapporto con le modifiche che dovrebbero essere apportate allalogica per renderla psicologicamente più realistica.

Un esempio che potrebbe andare in questa direzione è costituito dalle basi di conoscenza vivide (Levesque1986). Vediamo di che cosa si tratta. Intuitivamente, una base di conoscenza si dice incompleta se "ci dice che uno di un 16Qui e nel seguito si fa implicitamente riferimento alla teoria della complessità computazionale utilizzata abitualmentein informatica per valutare la trattabilità degli algoritmi. Per semplicità, tuttavia, non affronteremo alcun aspetto tecnico.Ci limitiamo a ricordare che un algoritmo si considera trattabile se il tempo di calcolo cresce al più polinomialmenterispetto alla lunghezza dell'input, mentre sono intrattabili gli algortimi per cui il tempo di calcolo cresceesponenzialmente rispetto alla lunghezza dell'input. Per i concetti base si rimanda comunque, ad esempio, a (Garey eJohnson 1979). Una trattazione della teoria della complessità in una prospettiva logica si trova in (Börger 1989).17Mentre infatti le procedure di decisione per la logica proposizionale classica hanno complessità esponenziale, lalogica proposizionale utilizzata da Levesque è decidibile in tempo polinomiale. Nell'ambito dell'IA, il problemadell'onniscienza logica è stato spesso indagato in relazione alla trattabilità computazionale delle procedure di decisioneper le logiche epistemiche (in questa prospettiva, si veda ad esempio Moses 1988). Da un punto di vista computazionale,l'assunzione di onniscienza logica è tanto più irrealistica, quanto più le procedure di decisione per la logica adottata sonodifficilmente trattabili computazionalmente (con il caso estremo in cui la logica non è decidibile, come per la logicaepistemica del primo ordine). Sulle proprietà computazionali delle logiche epistemiche proposizionali classiche sivedano (Ladner 1977) e (Halpern e Moses 1992). Vardi (1989) ha studiato le proprietà computazionali delle logiche deimodelli minimali. Un modello del ragionamento epistemico limitato sviluppato nella prospettiva della trattabilitàcomputazionale è quello recentemente proposto da Cadoli e Schaerf (1992), cui faremo cenno più oltre.

Page 149: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

10

certo numero di enunciati è vero, ma non ci dice quali" (Levesque 1986, p. 91). Ad esempio, una base di conoscenza èincompleta se da essa è possibile derivare una formula quantificata esistenzialmente del tipo ∃x α(x) senza che siapossibile derivare α(c) per qualche costante individuale c del linguaggio, oppure se è possibile derivare unadisgiunzione del tipo α ∨ β senza che sia derivabile α oppure β. Viceversa, in una base di conoscenza completa se, adesempio, è possibile derivare α ∨ β, allora o α oppure β devono essere derivabili. Le basi di conoscenza completepresentano migliori caratteristiche dal punto di vista computazionale. La conoscenza incompleta è infatti fonte diintrattabilità. Si consideri ancora la disgiunzione. Intuitivamente, se una formula del tipo α ∨ β deve essere utilizzata inun processo deduttivo, e non si sa se sia vera α oppure β, allora entrambi i casi devono essere presi in considerazioneseparatamente. E' evidente che, nel caso che formule di questo genere siano coinvolte in più passi deduttivi, sorge unproblema di esplosione combinatoria. Le basi di conoscenza vivide sono basi di conoscenza complete scritte in unaforma particolare, tali da rendere accessibili le informazioni in esse rappresentate in maniera ancora più diretta. Nellebasi di conoscenza vivide esiste innanzi tutto una corrispondenza biunivoca fra costanti del linguaggio e oggetti deldominio. Inoltre, per ogni predicato atomico a n posti del linguaggio, se la relazione da esso denotata sussiste nelmodello fra una n-pla di individui, allora ciò è rappresentato da una formula atomica corrispondente nella base diconoscenza. Quindi, una base di conoscenza vivida gode della particolare proprietà di essere isomorfa ad un suomodello. E' evidente che, dal punto di vista computazionale, le basi di conoscenza vivide sono particolarmente allettanti:fare inferenze in esse equivale ad "andare a vedere come stanno le cose" in un modello, o, in altri termini, a consultareuna tabella. E' altrettanto evidente però che il loro potere espressivo è estremamente limitato: di fatto, le basi diconoscenza vivide non sono altro che un insieme finito di formule atomiche. Secondo Levesque, tuttavia, la conoscenzavivida è estremamente diffusa in molti ambiti di tipo cognitivo. Egli sottolinea l'analogia fra una base di conoscenzavivida e un'immagine. In questo senso le basi di conoscenza vivide sarebbero in parte analoghe ai modelli mentali diJohnson-Laird (Levesque 1988). Inoltre, molta della conoscenza che proviene direttamente dalla percezione sarebbe ditipo vivido. E' possibile utilizzare ragionatori di tipo ibrido (nel senso visto nel par. 5.3), riconducendo la maggior partepossibile della conoscenza in forma vivida, e facendo ricorso a tecniche di ragionamento più complesse solo qualora siastrettamente necessario. Inoltre, anche qualora si disponga di informazione di altro tipo, è possibile utilizzare tecniche ditipo euristico per ricondursi a forme di conoscenza vivida. Una maniera consiste nel rinunciare a parte delleinformazioni originarie a favore della vividezza. Ad esempio, se si dispone dell'informazione (incompleta) che Giorgio ècognato di Mario oppure è suo cugino, si può asserire che Giorgio è parente di Mario. Oppure si può introdurre unnuovo predicato a due argomenti (atomico) cognato_o_cugino. O ancora, si possono utilizzare tecniche di ragionamentonon monotòno, come l'assunzione di mondo chiuso18, o regole di default. Ad esempio, sapendo che Tweety stanuotando oppure sta volando, e che Tweety è un uccello, poiché gli uccelli di solito volano si può asserire che Tweetysta volando.

In generale, l'obiettivo della trattabilità computazionale per i sistemi di rappresentazione della conoscenza puòessere perseguito mediante due diverse strategie19. Da un lato, è possibile indebolire il potere espressivo del linguaggiodi rappresentazione, in modo da disporre di procedure inferenziali complete e trattabili. Dall'altro, si può mantenere lapiena espressività del linguaggio e indebolire l'apparato deduttivo, ottenendo quindi la trattabilità computazionale ascapito della completezza. Abbiamo visto entrambi le soluzioni all'opera nel caso dei formalismi terminologici. In talunicasi si è tentato di individuare formalismi poco espressivi per cui il calcolo della sussunzione completa fosse trattabile.In altri si è mantenuta una espressività forte, rinunziando alla completezza degli algoritmi di sussunzione. Anche lalogica della credenza esplicita di Levesque può essere vista in questa seconda prospettiva. La logica del tautologicalentailment da lui impiegata infatti può essere vista come un indebolimento dell'apparato deduttivo della logicaproposizionale classica, in cui non vale la regola del modus ponens (e che quindi risulta incompleta rispetto allasemantica bivalente classica)20. Un ulteriore sviluppo di questa strategia è costituito dalle ricerche sul ragionamentoapprossimato. L'idea è di fare in modo che, in un processo inferenziale, si possano ottenere risposte via via "migliori"quanto maggiore è lo sforzo computazionale impiegato. Si vuole cioè che, fissati certi vincoli di risorse computazionali,il sistema sia in grado di fornire comunque risposte semanticamente fondate, le quali approssimino le prestazioni di unragionatore classicamente corretto e completo21.

18L'assunzione di mondo chiuso (closed world assumption) è una tecnica di ragionamento non monotòno che consistenell'assumere che gli oggetti esplicitamente rappresentati in una base di conoscenza siano tutti e soli gli oggetti deldominio (Reiter 1978; Minker 1982; cfr. anche il cap. 7 di Lukaszewicz 1990). Essa può essere ricondotta a una formaparticolare di circumscription. L'assunzione di mondo chiuso è molto utilizzata nell'ambito dei data base, ed èincorporata nel linguaggio di programmazione logica PROLOG. Essa è legata al concetto di negazione come fallimento(negation as failure): si assume che valga ¬α qualora fallisca il tentativo di dimostrare α.19A questo proposito, si veda ad esempio (Cadoli 1993).20Per tale modo di interpretare questo tipo di logiche si veda (Frisch 1987).21Cadoli e Schaerf (1991) ad esempio hanno sviluppato un modello in base a cui sia possibile trarre conseguenzeapprossimate da una base di conoscenza in logica proposizionale. Ciò viene ottenuto definendo due successioni direlazioni di conseguenza logica (le prime sempre corrette, le seconde sempre complete), che convergono verso la

Page 150: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

11

12.4 I paradossi della competenza semantica

Nel caso di una teoria del significato le richieste di finitezza e di trattabilità computazionale entrano tuttavia inconflitto con alcune difficoltà concernenti la possibilità stessa di una rappresentazioni finita dei significati. L'argomentoche riteniamo più importante contro la possibilità di ottenere una rappresentazione finita del significato dal punto divista cognitivo è esposto in un lavoro di Thomason (1979) contro il progetto di una semantica cognitiva e, in generale,contro lo psicologismo in semantica. Si tratta di un tema che meriterebbe di essere esaminato in dettaglio, anche se, perla sua complessità, in questa sede non avremo lo spazio per esaurirne tutti gli aspetti. Un motivo collaterale di interessedel lavoro di Thomason consiste nel fatto che esso consente anche di chiarire alcuni aspetti del rapporto fra le teoriesemantiche di impostazione cognitiva e i temi dell'antipsicologismo come erano stati formulati da Frege.

Thomason esamina l'antipsicologismo di Frege, prendendo in considerazione alcune delle motivazioni fregeanecontro una fondazione di tipo psicologico della matematica. Nei Grundlagen Frege (1884) mette in evidenza alcuneconseguenze inaccettabili del fatto di assumere che gli oggetti matematici siano definiti come entità di tipo mentale. Adesempio, afferma Frege, se una dimostrazione fosse un processo mentale, nella dimostrazione del teorema di Pitagora sidovrebbe tenere conto del contenuto di fosforo del cervello di chi la esegue. Inoltre, ciascuno ha idee differenti suinumeri. Quindi, se i numeri fossero rappresentazioni mentali, dovrebbero esserci numeri diversi per ciascun essereumano: ad esempio, si dovrebbe ammettere che esiste un numero due differente per ciascuno di noi. Da un altro punto divista, però, ci sarebbero troppo pochi numeri, in quanto ogni essere umano, nel corso della sua vita, può pensarne soloun numero finito. Abbiamo già accennato allo stretto legame in Frege fra l'antipsicologismo in semantica el'antipsicologismo rispetto al problema dei fondamenti della matematica. Queste considerazioni sono molto simili aquelle che Frege adopera ad esempio per motivare la natura extrapsicologica ed oggettiva dei sensi (cfr. par. 1.1).Tuttavia, afferma Thomason, questo tipo di argomentazioni si può considerare superato dalle posizioni della modernapsicologia cognitivista, e dalle teorie psicologiche di impostazione computazionale. Tali teorie si basano infatti sulladistinzione fra competenza ed esecuzione22. La competenza viene caratterizzata nei termini di stati computazionaliastratti, definiti funzionalmente. Si assume ad esempio che sia possibile caratterizzare la competenza in manieraindipendente dalle proprietà fisico-anatomiche del sistema nervoso, quali il contenuto di fosforo del cervello (questo èproprio quanto asseriscono le impostazioni di tipo funzionalista sulla natura degli stati mentali - cfr. par. 3.1). Ciòrisponde alla prima obiezione. Per quanto riguarda il fatto che esseri umani diversi hanno idee diverse sui numeri, talidifferenze possono essere limitate all'ambito dell'esecuzione, e non riguardare una teoria della competenza. Secaratterizziamo la competenza nei termini di una macchina astratta, ad esempio una macchina di Turing, allora, data larappresentazione di un numero su due realizzazioni fisiche diverse della stessa macchina, si può caratterizzare in modoesatto la loro equivalenza in termini funzionali. Rispetto al problema della finitezza, infine, una teoria della competenzaformulata nei termini di dispositivi di calcolo astratti e idealizzati (come appunto le macchine di Turing) consente diipotizzare, ad esempio, una memoria potenzialmente espandibile all'infinito, in maniera che possa essere generatoqualsiasi numero23.

Anche adottando uno "psicologismo della competenza", sorgono tuttavia, secondo Thomason, ulteriori problemiper una fondazione psicologica della semantica. Tali problemi costituiscono un ostacolo per la posizione degli obiettivicomuni fra semantica modellistica e semantica cognitiva, e impediscono di considerare le teorie modellistiche delsignificato (come ad esempio la teoria di Montague) alla stregua di modelli (di almeno una parte) della competenzalinguistica (come è stato parzialmente sostenuto ad esempio da Partee 1979b). Thomason (1979) definisce il suoobiettivo come quello di "sostituire gli argomenti di Frege contro lo psicologismo dell'esecuzione in logica e inmatematica con argomenti contro lo psicologismo della competenza in semantica" (Thomason 1979, p. 5). Un primoaspetto dell'argomentazione di Thomason può essere riassunto informalmente come segue. Le teorie semantiche di tipocognitivo assumono che il significato delle espressioni linguistiche debba essere ricondotto a rappresentazioni di tipomentale, e tali rappresentazioni mentali vanno intese come rappresentazioni simboliche di qualche tipo, che devonopoter essere elaborate computazionalmente. La relazione che sussiste fra un'espressione linguistica e il suo valore relazione di conseguenza logica proposizionale classica. Man mano che si procede lungo le due successioni, aumentanorispettivamente completezza e correttezza, e si ottengono quindi sempre migliori approssimazioni della relazione diconseguenza logica classica. A partire da questo modello, Cadoli e Schaerf (1992) hanno elaborato una logicaepistemica per ragionatori non onniscienti in cui alle due successioni di relazioni di conseguenza viste sopracorrispondono due famiglie di operatori epistemici modali. Tali operatori costituiscono approssimazioni via via piùprecise dell'operatore di conoscenza classico, e corrispondono a vincoli computazionali più o meno restrittivi sullecapacità inferenziali di un agente epistemico. La logica risultante, la cui semantica è data mediante una generalizzazionedelle strutture a mondi possibili di Kripke, costituisce uno sviluppo delle logiche basate su situazioni non classiche (cap.10) e sulla logica dell'awareness di Fagin e Halpern (par. 11.1).22Per tale distinzione si veda la nota al cap. 2.23Questo vale, ovviamente, per i numeri naturali, ma non funziona per i numeri reali. Ciò pone ulteriori problemi che sicollegano al problema di Benaceraff in filosofia della matematica (cfr. oltre).

Page 151: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

12

semantico (sia a livello intensionale che a livello estensionale) fa ovviamente parte del significato di quell'espressione.Tuttavia questo genere di relazioni semantiche non sono rappresentabili computazionalmente in quanto, in generale, nonsono ricorsive, e il supporre di poterle rappresentare conduce a una contraddizione. Prendiamo ad esempio la nozione diverità. Essa è innegabilmente rilevante per caratterizzare il significato linguistico. Poiché, per i sostenitori dellasemantica cognitiva, il significato deve essere rappresentato mentalmente in termini computazionali, allora la nozione diverità dovrebbe essere rappresentabile computazionalmente. Tuttavia, in generale, la nozione di verità non è ricorsiva, enon è quindi rappresentabile in termini computazionali. E' ben noto dal teorema di Tarski (Tarski 1936) che unlinguaggio logico ragionevolmente espressivo in cui si tenti di introdurre un predicato di verità per il linguaggio stessodiventa inconsistente.

Posta in questi termini, l'argomentazione di Thomason lascia spazio a molte perplessità, e sembra che non colganel segno, fraintendendo gli scopi stessi del paradigma cognitivo in semantica. L'ipotesi che sta alla base della semanticacognitiva, in base alla quale il parlante deve "conoscere" i significati delle espressioni linguistiche, non comporta che ilparlante debba incorporare una teoria semantica, ossia non comporta che il parlante debba conoscere la teoria delsignificato, nel senso di possedere una rappresentazione (simbolica) di come le espressioni della lingua si collegano aipropri significati extralinguistici (ed extramentali). Se, computazionalmente, possiamo considerare la competenza delparlante (o almeno una parte di essa) modellata nei termini di una teoria di qualche tipo (in senso proof-teoretico), allorai concetti di verità e di riferimento avranno a che fare con la metateoria semantica di quella. Questo ovviamente nonsignifica accettare la posizione secondo cui i concetti di verità e di riferimento, e i concetti semantici più in generale,non sono rilevanti per una teoria cognitiva del significato. Vuol dire che la teoria della verità non deve essererappresentata nel modello computazionale, ma piuttosto che al modello computazionale deve essere associata una teoriadella verità (intesa in senso lato, come una teoria che metta in relazione le rappresentazioni cognitive con entità esterneal modello stesso), e che le computazioni devono operare in accordo con essa. E' chiarificatore in questo senso ilcommento di Levesque e Brachman alla knowledge representation hypothesis di Brian Smith che abbiamo riportato nelpar. 3.2. Da questo punto di vista, l'argomento di Thomason sembra per certi versi paragonabile alle critiche di partecognitivista al paradigma modellistico che abbiamo presentato nel par. 2.2, in base alle quali l'implausibilità cognitivadella semantica modellistica veniva intesa come implausibilità delle strutture modellistiche in quanto costrutti cognitivi.In entrambi i casi sembra che ci si trovi di fronte a una confusione fra due dei sensi di "semantica" identificati da Woods(1975) (par. 4.4), cioè fra il concetto di semantica "dei linguisti", intesa come traduzione in un sistema dirappresentazione esplicito di qualche tipo, e il concetto di semantica "dei filosofi", intesa come costruzione di unacorrispondenza fra rappresentazioni ed entità extrasimboliche.

Anche qualora si accetti che un modello computazionale del linguaggio, nel suo complesso, debba rendere contoanche della competenza referenziale del parlante (nel senso del symbol grounding), e che quindi esso sia in grado, in uncerto senso, di "calcolare il riferimento" delle proprie rappresentazioni, anche in questo caso ciò non comporta chedebba esistere nella mente del parlante una rappresentazione simbolica della relazione fra le rappresentazioni cognitivee il loro riferimento, che il soggetto cognitivo cioè debba disporre nella "sua" teoria di qualcosa di analogo a unpredicato di verità, o a un equivalente sintattico della funzione interpretazione (anzi, questo, lungi dal costituire unasoluzione, costituirebbe soltanto un modo di rinviare il problema). Ed il fatto che un modello cognitivo sia in grado diassociare un riferimento nel mondo esterno alle proprie rappresentazioni non dovrebbe costituire alcun problemarispetto ai risultati limitativi quali il teorema di Tarski, non fosse altro perché i dispositivi computazionali demandati afissare il riferimento delle rappresentazioni non potrebbero essere altro, per loro stessa natura, che dispositivi di tipoparziale (ad esempio, nel senso che tali dispositivi sarebbero collegati soltanto ad alcuni dei simboli primitivi delsistema di rappresentazione interno - cioè a quelli che corrispondono a concetti di tipo "osservativo").

Vi è tuttavia un secondo aspetto dell'argomentazione di Thomason, che risulta molto più problematico, e che quici interessa in maniera diretta, in quanto si ricollega al problema della possibilità di ottenere un sistema dirappresentazioni interne sufficientemente espressivo da essere adeguato alla rappresentazione dei significati linguistici(o alle esigenze del ragionamento di senso comune), e che sia allo stesso tempo finitamente assiomatizzabile. Nel par.9.1 abbiamo visto che un risultato analogo al teorema di Tarski può essere esteso al trattamento al primo ordinemediante predicati delle modalità e di atteggiamenti proposizionali come la conoscenza. Montague (1963) ha dimostratoche una formalizzazione della conoscenza mediante predicati in un linguaggio del primo ordine, che comprendal'equivalente dell'apparato deduttivo del sistema modale T (assioma della conoscenza, assioma distributivo e regola dinecessitazione), e che comprenda inoltre gli assiomi dell'aritmetica di Robinson (e che quindi sia in grado diautoriferimento) conduce all'inconsistenza attraverso un meccanismo simile a quello del paradosso del mentitore nelteorema di Tarski. Sempre nel paragrafo 9.1, abbiamo visto che Thomason (1980) ha dimostrato che un risultato in parteanalogo vale anche per le formalizzazioni al primo ordine della credenza. Vi sono quindi paradossi epistemici simili perstruttura ai paradossi semantici. Inoltre, abbiamo constatato che le usuali assiomatizzazioni modali al primo ordine dellelogiche epistemiche (quelle cioè basate sull'uso operatori modali proposizionali anziché di predicati per esprimere iconcetti epistemici come credere e sapere) sono esenti da problemi di inconsistenza in quanto il loro potere espressivo èpiù limitato di quello delle formalizzazioni al primo ordine basate sull'uso di predicati epistemici. Infatti, nelleassiomatizzazioni al primo ordine di tipo modale non è possibile quantificare sugli oggetti degli atteggiamentiproposizionali. Il punto è che per poter quantificare al primo ordine sugli oggetti della credenza (e, in generale, di un

Page 152: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

13

atteggiamento proposizionale) si deve poter disporre di termini che denotano gli oggetti della credenza stessa, di "nomi"degli oggetti dell'atteggiamento proposizionale. Inoltre, perché possa essere garantita la possibilità di effettuare lenecessarie manipolazioni formali sulla struttura di tali termini, deve essere disponibile nel linguaggio un apparato dioperatori sintattici opportuni. Ciò dà origine alla possibilità di costruire formule autorefernziali, e quindi dà luogo aiparadossi. Si noti che non è necessario assumere che gli oggetti degli atteggiamenti proposizionali siano oggettisintattici, non è necessario assumere cioè che i termini cui si applicano ad esempio predicati come know o bel denotinoformule. Il paradosso insorgerebbe anche qualora si assumesse che tali termini denotano oggetti di tipo intensionale, adesempio proposizioni. E' sufficiente che tali termini abbiano una struttura composizionale analoga a quella delleformule. Quindi, l'insorgere del paradosso non è legato direttamente agli approcci di tipo sintattico o citazionale agliatteggiamenti proposizionali, nel senso utilizzato nel capitolo 9 (cfr. par. 9.1)24.

Il problema è che, per fornire una semantica delle espressioni del linguaggio naturale, e, in generale, per leesigenze della formalizzazione del ragionamento di senso comune, è necessario disporre di un potere espressivo tale daconsentire la quantificazione sugli oggetti degli atteggiamenti proposizionali25. Una maniera per ottenere ciò senzaincorrere nei paradossi consiste nell'utilizzare una logica modale (che esprima cioè i costrutti epistemici non comepredicati, ma come operatori proposizionali), il cui linguaggio comprenda un insieme di variabili (di un tipo sintatticodistinto da quello delle variabili individuali), i cui valori varino sull'insieme degli oggetti degli atteggiamentiproposizionali (ad esempio sull'insieme delle proposizioni). In questo modo non è necessario introdurre nel linguaggiotermini che denotino gli oggetti degli atteggiamenti proposizionali, e meccanismi che consentano l'autoriferimento.Questa è la soluzione adottata nelle logiche intensionali, come ad esempio nella teoria di Montague. Tuttavia, ilproblema consiste nel fatto che così facendo si esce dalla logica del primo ordine, e si passa ad una logica di ordinesuperiore, con le note difficoltà che ne derivano. In particolare, si esclude in questo modo la possibilità diun'assiomatizzazione completa finita della logica26.

Dunque l'esigenza di una rappresentabilità finita dei significati linguistici incontra difficoltà che, dal punto divista intuitivo, non erano facilmente prevedibili. Thomason (1979, 1986) interpreta tali difficoltà come un sintomo delladifficoltà di conciliare gli obiettivi della semantica filosofica e del programma modellistico da un lato, con gli scopidella semantica cognitiva e dell'intelligenza artificiale dall'altro. In particolare, secondo Thomason, è problematicoconciliare la tesi cognitivista dell'afferrabilità (graspability) dei significati da parte dei parlanti, e la concezione disignificato di tipo modellistico27. Sembra impossibile interpretare le teorie semantiche alla Montague come modellidella competenza di un parlante idealizzato (ma, ovviamente, finito). Non solo, ma il concetto stesso di competenzaidealizzata sembra problematico, in quanto sembra condurre a contraddizione. I risultati di Montague e di Thomason suiparadossi epistemici si basano sull'assunto che valga l'onniscienza logica: essi sono ottenuti a partire dall'ipotesi didisporre degli equivalenti, formulati al primo ordine, dell'assioma distributivo e della regola di necessitazione, che(come abbiamo visto nel par. 8.2) sono i principali responsabili dell'onniscienza logica. Quindi, abbandonandol'onniscienza logica, verrebbe meno anche la possibilità di derivare il paradosso. Ora, è certamente vero che i soggettiepistemici reali non sono logicamente onniscienti. Tuttavia, sembra difficile poter accettare che l'impossibilità di averel'onniscienza logica derivi dalla teoria semantica stessa. Sembra difficile cioè accettare che sia una questione di logica, enon una semplice questione fattuale, che non si possa assumere che esistano soggetti epistemici onniscienti. Lo stesso

24Sulle relazioni fra modelli sintattici degli atteggiamenti proposizionali e insorgere dei paradossi si veda Thomason(1977). Sarebbe possibile introdurre nel linguaggio termini che denotano proposizioni (e permettere quindi laquantificazione su di esse) evitando al tempo stesso l'insorgere di paradossi a patto di assumere che tali termini nonabbiano struttura, che siano tutti, in un certo senso, atomici, e a patto di non poter esprimere nel linguaggio a qualiformule le proposizioni denotate da tali termini sono associate. Ma, per ovvie ragioni, tale soluzione non può risultaresoddisfacente. Su questi punti si veda ad esempio (Asher e Kamp 1986).25Ad esempio per rappresentare il significato di un enunciato del tipo "C'è qualcosa di falso in quello che credeGiorgio". Si noti che in un enunciato come questo si ripropone il problema di rappresentare il predicato di veritàall'interno del linguaggio. Tuttavia, il motivo per cui qui il problema si pone non è lo stesso che abbiamo criticato inprecedenza. Qui si tratta del fatto che "vero" e "falso" sono parole della lingua di cui si intende fornire una semantica, equindi devono essere rappresentate come un atteggiamento proposizionale fra gli altri.26D'altro canto, Perlis (1988) dimostra che l'inconsistenza può insorgere anche in una logica modale basata su operatoriproposizionali qualora si introducano opportuni operatori modali che consentano di ottenere certe forme diautoriferimento. Sulle condizioni a cui possono insorgere paradossi epistemici anche nelle logiche modali si vedanoanche (Koons 1988, 1991) e (Grim 1993).27Thomason individua un'analogia fra questo problema e il problema di Benaceraff in filosofia della matematica(Benaceraff 1973). Il problema di Benaceraff può essere visto come il problema conciliare ontologia ed epistemologiadella matematica. Come è possibile una "competenza matematica" da parte di un soggetto matematico finito (anche seidealizzato), se gli enti matematici, in molti casi, eccedono i limiti della ricorsività? (Ad esempio, i numeri realigenerabili da una macchina di Turing non sono che un sottoinsieme proprio di tutti i numeri reali).

Page 153: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

14

dicasi per le capacità aritmetiche di cui dispone il parlante ideale. Non sembra ammissibile che dalla teoria semanticasegua che un parlante ideale deve sapere meno aritmetica di quella necessaria per derivare il paradosso.

Thomason (1979) sembra considerare i paradossi epistemici come una sorta di reductio ad absurdum delleipotesi alla base del programma della semantica cognitiva (e delle scienze cognitive in generale)28. Quello che è certo èche questi risultati sembrano mettere in serie difficoltà il programma logicista in IA (almeno se lo si interpreta inmaniera forte, intendendolo cioè come un programma di formalizzazione logica del ragionamento di senso comune inuna prospettiva computazionale, e non riducendolo all'elaborazione di una serie di tecniche a carattere informatico). E,in ogni caso, sembrerebbe messa in discussione la plausibilità della posizione degli obiettivi comuni fra semanticamodellistica e semantica cognitiva. Tuttavia, in anni recenti, sono stati sviluppati diversi tentativi per superare iproblemi posti dall'assiomatizzazione delle modalità e delle logiche epistemiche. Molti di essi si basano ad esempiosulla teoria della verità proposta da Kripke (1975). L'idea centrale di Kripke è quella di evitare l'insorgere dei paradossisemantici rinunciando al principio classico di bivalenza, in base al quale ad ogni enunciato deve essere assegnato uno edun solo valore di verità, il vero o il falso. In base alla teoria di Kripke, agli enunciati "problematici" come ad esempio levarie forme del paradosso del mentitore, o come il cosiddetto enunciato del truth teller (cioè un enunciato del tipo"questo enunciato è vero"), non viene assegnato alcun valore di verità. Questo evita l'insorgere delle inconsistenze. Apartire dai lavori di Kripke, e da altri lavori ad esso collegati, come ad esempio la teoria di Gupta (1982), sono statesviluppate diverse proposte per ottenere formalizzazioni al primo ordine degli atteggiamenti proposizionali chesuperassero i problemi sopra descritti. Un esempio è costituito dai lavori di Perlis (1985, 1988). La strategie utilizzatesono di diversi tipi: indebolire la logica utilizzata adottando qualche forma di logica non classica, limitare le forme diautoriferimento consentite, e così via29. Un'analisi approfondita di questi temi non è possibile in questa sede. Ingenerale, comunque, anche se nessuna soluzione definitiva è stata individuata, si tratta tuttavia di un ambito di ricercaricco e vitale, da cui potrà emergere qualche chiarificazione su questi temi cruciali dal punto di vista delle basi teorichedella linea logicista in IA e nelle scienze cognitive. Rispetto a questo problema, lo stesso Thomason (1986) sembramostrarsi meno drastico rispetto a quanto scriveva nel 1979. Egli afferma ad esempio:

Penso che la reazione corretta sia che la metafora del parlante ideale debba essere riconsiderataquando si assume che la semantica sia una parte della competenza del parlante ideale. Mi sembra che lerelazioni fra teorie del linguaggio e parlanti siano molto più problematiche di quanto la metaforasuggerisca. In ogni caso, credo che se le conseguenze di aderire all'obbiettivo dell'afferrabilità [delsignificato] verranno elaborate con attenzione, condurranno a forme forti di costruttivismo, o ad approcciparaconsistenti, o ad altri approcci che comportano una revisione dei fondamenti logici. Ogni valutazionedelle forme di cognitivismo forte dovrebbe tenere conto di queste conseguenze. [...] Possiamo aspettarci[...] che verranno sviluppate varie soluzioni tecniche, e che queste ci aiuteranno a chiarire le migliorialternative. (Thomason 1986, pp. 234-5).

12.5 Significato, competenza, comprensione

A prescindere dai problemi evidenziati nel paragrafo precedente, esistono conflitti e tensioni fra le varie lineedella ricerca logica in IA. In particolare, alcune ricerche sembrano ignorare le esigenze di finitezza dellerappresentazioni e di trattabilità computazionale che abbiamo individuato come una delle caratteristiche centrali dell'usodella logica in questa disciplina. Il caso più appariscente è probabilmente quello del ragionamento non monotòno. Nelparagrafo 6.1 abbiamo visto come la formalizzazione delle varie forme di circumscription richieda l'introduzione diassiomi del secondo ordine, con la conseguenza di escludere la possibilità di una assiomatizzazione completa construmenti finiti. La logica preferenziale di Shoham (par. 6.3) è stata sviluppata esclusivamente su base semantica,tralasciando gli aspetti di teoria della dimostrazione. Connesso alle difficoltà di assiomatizzazione del ragionamento nonmonotòno, vi è un problema messo originariamente in evidenza da David Israel (1980) in relazione alla default logic. E'noto dai risultati di Church che l'insieme dei teoremi di una teoria logica del primo ordine non è in generale decidibile.Tuttavia tale insieme è ricorsivamente enumerabile: si può definire un algoritmo che generi tutti i teoremi della teoriasemplicemente definendo un ordine opportuno con cui, a partire dagli assiomi, si applicano ricorsivamente le regole diinferenza ai teoremi che via via vengono ottenuti. Se si estende una teoria del primo ordine con regole di default, questacaratteristica va persa: in generale, l'insieme delle conseguenze non monotòne di una teoria di default non è neppurericorsivamente enumerabile. Il problema risiede nel fatto che ciò che fa sì che l'insieme dei teoremi di una teoria delprimo ordine sia semidecidibile dipende dal fatto che le regole di inferenza sono applicabili in modo effettivo. Alcontrario, le regole di default della default logic non godono di questa proprietà. Si consideri una teoria di default T checomprenda la seguente regola: 28 Anche se, in sede conclusiva, afferma che gli psicologi cognitivi non dovrebbero preoccuparsi più di tanto di questiproblemi a carattere filosofico e fondazionale, e proseguire nel loro programma di ricerca.29Oltre ai lavori di Perlis, su questi problemi si vedano anche (Asher e Kamp 1986) e (Asher 1988, 1990). Una rassegnasi trova in (Thomason 1986).

Page 154: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

15

α βγ :

Supponendo di disporre di α, per derivare γ bisogna stabilire se è consistente credere β, se cioè β, unito alla teoria T, dialuogo o meno a una contraddizione. Ma, in generale, la consistenza di una teoria del primo ordine non è decidibilemediante un algoritmo, e quindi, di conseguenza, la regola in questione non è applicabile in modo effettivo. Analogheconsiderazioni valgono per le logiche non monotòne di tipo modale, come la logica autoepistemica. Dal punto di vistadelle proprietà computazionali sembra quindi che le logiche non monotòne dell'IA siano meno attraenti delle usualiteorie logiche del primo ordine. E sembra che vi sia una tensione fra le tecniche utilizzate per modellare soggettiinferenziali limitati dal punto di vista dell'informazione disponibile (e che quindi devono trarre conseguenze rivedibilidisponendo di informazioni incomplete), e soggetti inferenziali limitati dal punto di vista delle risorse computazionali30.Più in generale, si ha talvolta l'impressione di uno scollamento fra gli obiettivi computazionali della disciplina e alcunedelle formalizzazioni elaborate.

Il punto è che i modelli proposti e le ricerche sviluppate nell'ambito dell'IA logicista si collocano spesso a livellidi analisi differenti. Dal nostro punto di vista, nella prospettiva cioè dei possibili apporti della ricerca logica in IA peruna teoria del significato, e delle relazioni che sussistono fra questi due ambiti, la questione può essere posta nei terminiseguenti. Il problema di una teoria del significato e delle sue relazioni con il parlante può essere posto a livelli diversi.Schematicamente, possono essere individuati i tre livelli seguenti31.

a) Al livello più astratto, una teoria del significato può essere concepita come una teoria delle relazioni fraespressioni del linguaggio e mondo (o meglio, fra espressioni del linguaggio e modelli formali della realtà),prescindendo completamente da come i significati possano essere compresi ed elaborati da coloro che utilizzano quellinguaggio. Dal punto di vista logico, questo livello di analisi corrisponde a un trattamento puramente semantico-modellistico di un sistema di rappresentazioni, che trascura gli aspetti legati alla teoria della dimostrazione. E' il punto divista classico della semantica model teoretica, di cui l'esempio più autorevole è costituito dalla teoria di Montague. Aquesto livello, l'oggetto principale di interesse è costituito dalle condizioni di verità degli enunciati e dai nessi diconseguenza logica che li concernono.

b) Il secondo livello è costituito da una teoria della competenza semantica, nel senso di una teoria dellarappresentazione dei significati che possa essere accessibile a un parlante finito (anche se idealizzato). In termini logici,una teoria della competenza intesa in questo senso si colloca a livello di teoria della dimostrazione: comporta cioèl'individuazione di assiomatizzazioni finite che siano in grado di rendere conto dei nessi sintattici che corrispondono ainessi semantici di conseguenza logica rilevanti per il punto a). Il fatto di porsi a livello di teoria della competenza noncomporta quindi che siano irrilevanti gli aspetti semantico-modellistici dei sistemi di rappresentazione utilizzati. Dinorma, comunque, una teoria della competenza comporta ulteriori vincoli sulle strutture modellistiche utilizzate. Necostituisce un esempio il problema dei paradossi epistemici trattato nel paragrafo precedente. Una teoria dellacomprensione non concerne tuttavia il problema della capacità di un parlante di decidere della verità di un enunciatodate certe premesse, o di individuare i nessi di conseguenza logica fra enunciati. L'indecidibilità del calcolo dei predicatidel primo ordine renderebbe impossibile una nozione di competenza così intesa. Una teoria della competenza ha a chefare con ciò che un parlante (idealizzato) conosce, mantenendo ferma però la distinzione fra ciò che il parlante sa e leproprietà che sono determinate da quello che il parlante sa. Ad esempio, chi conosca una assiomatizzazione del calcolodei predicati del primo ordine "conosce" in un certo senso la logica del primo ordine (in quanto ne possiede unarappresentazione finita). Ma vi sono proprietà che sono determinate da ciò che egli conosce (ad esempio l'estensionedell'insieme delle formula valide, oppure, date due formule qualunque, il fatto che una implichi logicamente l'altra omeno) che egli di fatto non può conoscere perché indecidibili (Partee 1982). In questo senso la nozione di competenza èindipendente dalla nozione di processo di giudizio o di comprensione32.

30Queste osservazioni valgono in generale. Vi sono tuttavia forme di ragionamento non monotòno che non dannoproblemi computazionali. Abbiamo visto ad esempio che il PROLOG incorpora una forma di closed world assumption.Sono inoltre in corso ricerche per ricondurre i formalismi non monotòni a sistemi computazionalmente più attraenti.Abbiamo già detto (par. 6.1) delle riformulazioni di varie forme di circumscription in logica del primo ordine. Suisistemi di deduzione automatica basati su logiche non monotòne si veda ad esempio il capitolo 7 di (Brewka 1991). Vi èchi, come Selman e Kautz (Selman e Kautz 1988; Kautz e Selman 1991), ha studiato dal punto di vista della trattabilitàcomputazionale forme limitate di formalismi non monotòni. Per una rassegna dei risultati di complessità computazionalerelativi ai sistemi di logica non monotòna si veda (Cadoli e Schaerf 1993).31Questa classificazione, soprattutto nella distinzione fra i punti b) e c), si basa su (Partee 1982).32Anche la nozione di semantica procedurale, secondo Barbara Partee, va oltre i limiti di una teoria della competenzasemantica, nella misura in cui verte sui processi utilizzati nella produzione di giudizi validi da parte dei parlanti.

Page 155: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

16

c) Il terzo livello, infine, concerne una teoria della comprensione (understanding), intesa come una teoria cheabbia per oggetto i giudizi di validità e il riconoscimento dei nessi di implicazione logica effettuati dal parlante, e cheabbia come scopo quello di modellare procedure effettive che possano rendere conto di tali giudizi.

Generalizzando questa classificazione dall'ambito della semantica del linguaggio naturale ai temi dellarappresentazione della conoscenza e del ragionamento, le ricerche svolte nell'ambito dell'IA logicista si possonocollocare, di volta in volta, a livelli differenti di tale gerarchia, e da ciò dipendono probabilmente i conflitti evidenziatiall'inizio del paragrafo. Ad esempio, le teorie circoscrittive nella loro formulazione originaria, o la preference logic diShoham si collocano in una prospettiva molto vicina a quella del punto a). Per quanto riguarda il punto b), si collocano aquesto livello quelle ricerche in cui si pone l'enfasi sulla possibilità di assiomatizzare in maniera finita i formalismiproposti. Un esempio è costituito dalle ricerche volte ad individuare forme di circumscription assiomatizzabili al primoordine. Si pongono su questa linea anche le ricerche menzionate nel paragrafo precedente, volte ad individuareformalizzazioni al primo ordine degli atteggiamenti proposizionali che superino i problemi individuati da Montague eThomason, come ad esempio i lavori di Perlis (1985, 1988). Sono assimilabili al punto c), ad esempio, le ricerche diLevesque e della sua scuola, che pongono l'enfasi sugli aspetti legati alle proprietà computazionali dei formalismi dirappresentazione, e che mirano ad individuare formalismi, o sottoinsiemi di formalismi, che siano trattabili dal punto divista computazionale. In questo senso, non sono probabilmente casuali le analogie individuate da Levesque fra basi diconoscenza vivide ed il concetto di modello mentale, nato nell'ambito della semantica procedurale. In questa prospettivasi potrebbe vedere forse anche gran parte del lavoro svolto nell'ambito della dimostrazione automatica di teoremi33. Unalinea di ricerca che concerne direttamente quella che abbiamo chiamato la teoria della comprensione, e che si poneesplicitamente in alternativa con le proposte di Levesque, è quella individuata da Jon Doyle, secondo il quale lostrumento idoneo a studiare e modellare le inferenze effettivamente eseguite da un soggetto va individuato nelle teoriedella razionalità economica e della scelta razionale34. Doyle e Patil (1991) criticano le posizioni di Levesque, tese aridurre il potere espressivo dei linguaggi di rappresentazione in cambio della trattabilità computazionale. Questoatteggiamento comporta in molti casi un impoverimento espressivo inaccettabile, tale da distruggere di fatto la generalitàdel sistema di rappresentazione. Doyle e Patil esemplificano le loro affermazioni sui linguaggi terminologici derivati daKL-ONE, mostrando come un gran numero di costrutti che risultano fondamentali nella descrizione di termini siano statiespunti da questi formalismi. La soluzione corretta, secondo Doyle, non risiede nel ridurre il potere espressivo deiformalismi di rappresentazione, ma di tenere conto degli scopi delle attività inferenziali di un soggetto razionale, equesto può essere ottenuto appunto mediante gli strumenti delle teorie della scelta razionale. In altri termini, per gliobiettivi di quella che abbiamo chiamato una teoria della comprensione gli strumenti logicisti non sarebbero di per sésufficienti: "In logica, ogni insieme consistente di credenze è buono quanto un altro, e l'unica guida che il logicismosembra offrire a un ragionatore è la regola se è corretto, fallo!" (Doyle 1990a, p. 1095). Gli strumenti logici andrebberointegrati con gli strumenti della razionalità economica. Lo scopo delle teorie della razionalità economica è quello diformalizzare i processi di decisione e di scelta fra diverse alternative. In questo caso, si tratta di formalizzare le scelte frapercorsi inferenziali diversi. In questo senso, le teorie della scelta razionale dovrebbero fornire un sostituto formale alletecniche euristiche di tipo informale usate in IA. In questa prospettiva, "le nozioni di razionalità logica ed economicasoddisfano esigenze complementari. La razionalità logica serve a descrivere le possibilità del ragionamento edell'azione, mentre la razionalità economica serve a prescrivere scelte fra di esse" (Doyle 1990a, p. 1096).

L'individuazione di questi livelli di analisi costituisce una sorta di "ricostruzione razionale" della ricercaattualmente svolta nell'IA di impostazione logica, nel senso che tali livelli appaiono spesso mescolati e sovrapposti nellapratica effettiva, e non sempre risulta facile (o lecito) distinguerli. Vi sono spesso tensioni fra i livelli, e non è facilecomprendere come le esigenze che vengono poste a livelli differenti possano convivere. Ne è un esempio il problemadegli atteggiamenti proposizionali e dai paradossi epistemici.

Tornando ai problemi posti dalla ricerca in teoria del significato, è evidente che ciascuno di questi livelli diindagine è pienamente legittimo, e risponde ad esigenze ed obiettivi in parte diversi. E' altrettanto evidente tuttavia che ilvantaggio che deriva da un approccio come quello suggerito dall'IA di impostazione logica risiede nel fatto di affrontaretutti questi livelli all'interno di una prospettiva teorica comune, di un paradigma unitario caratterizzato dalla centralitàdell'utilizzo degli strumenti della logica. In questo senso, non si avrebbe necessariamente a che fare con una posizionedegli scopi comuni: gli scopi potrebbero restare, in linea di principio, distinti (anche se, come vedremo, con dei punti dicontatto). Non si tratta però neppure di una posizione separatista (nel senso che i vari ambiti siano destinati a restareinconfrontabili, senza alcuna possibilità di comunicazione reciproca). Si tratta piuttosto di una prospettiva che postulaun quadro teorico generale comune, una comunanza di strumenti e di tecniche, e che quindi rende possibile l'utilizzoreciproco dei risultati.

E' evidente l'utilità di una comunicazione "dall'alto verso il basso" fra i livelli, in maniera tale cioè che ad ognilivello si possa tenere conto di ciò che è stato fatto ai livelli superiori, e usufruire dei risultati ottenuti. Ad esempio, unateoria della comprensione può essere sviluppata a partire dai modelli sviluppati a livello di teoria della competenza. Vi èinoltre almeno un caso un cui sembra indispensabile effettuare il cammino inverso, in cui cioè i livelli più alti sembrano 33Si veda ad esempio (Bundy 1983).34Sulle posizioni di Doyle a questo proposito si vedano ad esempio (Doyle 1983, 1988a, 1988b, 1990a, 1990b).

Page 156: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Cap. 12

17

dover tenere conto delle analisi sviluppate ai livelli inferiori. Si tratti degli enunciati di atteggiamento proposizionale edel problema dell'onniscienza logica. Anche una spiegazione del significato che si collochi al livello di astrazionemaggiore, che sia interessata cioè esclusivamente alle condizioni di verità degli enunciati, prescindendo da ogniriferimento alla competenza o ai processi di comprensione del parlante, deve coinvolgere anche i livelli più bassi dianalisi qualora si debba rendere conto, ad esempio, di enunciati di tipo epistemico. Come ha sottolineato Barbara Partee(1982) (cfr. par. 2.1), una teoria semantica che accetti l'assunzione dell'onniscienza logica è inadeguata anche cometeoria del linguaggio in quanto "parlato da Dio", perché obbliga ad assumere che tutti i soggetti di credenza del dominiosiano a loro volta ragionatori perfetti. Una teoria semantica che voglia rendere conto dei valori di verità e dei nessi diimplicazioni fra enunciati di atteggiamento proposizionale deve quindi incorporare, o far riferimento a, una teoria dellacomprensione relativa ai soggetti epistemici. Ad esempio, le condizioni di verità di un enunciato come "Tizio crede che α" devono tenere conto necessariamente della capacità di Tizio di rappresentarsi α e di giudicarlo vero. Inoltre, se adesempio α implica β, per sapere se da "Tizio crede che α" segue che "Tizio crede che β" si deve sapere se Tizio è ingrado di riconoscere la validità di α → β. Il fatto che, nell'IA di tradizione logica, i problemi che si collocano al livellodi teoria della comprensione vengano affrontati con strumenti "omogenei" a quelli dei livelli superiori (nel senso che sitratta di strumenti di tipo logico, o di estensioni di strumenti di tipo logico), può far ritenere che questo paradigma siaparticolarmente adatto ad affrontare il problema. Tutti i modelli logici della credenza che si basano su una distinzionefra conoscenza implicita e conoscenza esplicita (capp. 10 e 11) possono essere visti come tentativi di introdurre aspettidiversi di una teoria della comprensione nella semantica dei formalismi epistemici proposti. In generale, la distinzionefra conoscenza implicita e conoscenza esplicita potrebbe essere caratterizzata definendo la conoscenza esplicita comeconoscenza implicita più una teoria della comprensione. I tentativi compiuti sino ad ora sono per molti aspetti ancorarudimentali. Ci sembra tuttavia che una prospettiva in senso lato computazionale, come appunto quella dell'IA logicista,costituisca una via proficua per affrontare il problema.

Page 157: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Bibliografia1

Abrusci, V.M. (1992). Seminari di logica lineare. Fratelli Laterza, Bari.Agazzi, E. (1967). Alcune osservazioni sul problema dell'intelligenza artificiale. Rivista di filosofia neoscolastica,

59(1), 1-34.Agazzi, E. (1981). Intentionality and artificial intelligence. Epistemologia (numero speciale sul problema mente-corpo),

4, 195-228.Agazzi, E. (1986). Logica matematica e logica filosofica. Epistemologia, 9, 281-308.Anderson, A.R. e Belnap, N.D. (1962). Tautological entailment. Philosophical Studies, 13, 9-24.Anderson, J.R. (1976). Language, Memory and Thought. Erlbaum, Illsdale, NJ.Anderson, J.R. e Bower, G.H. (1973). Human Associative Memory. Holt, New York.Armstrong, J.J.C. (1981). The Nature of Mind and Other Essays. Cornell University Press, Ithaca, New York.Artificial Intelligence (1980). Numero speciale sulla logica non monotòna, 13, 1-172.Asher, N.M. (1988). Reasoning about belief and knowledge with self-reference and time. Proc. TARK-88, 61-81.Asher, N.M. (1990). Intentional paradoxes and an inductive theory of propositional quantification. Proc. TARK-90, 11-

28.Asher, N.M. e Kamp, J.A. (1986). The knower paradox and representation theories of attitudes. Proc. TARK-86, 131-

147.Attardi, G. e Simi, M. (1981). Consistency and completeness of OMEGA, a logic for knowledge representation. Proc.

7th IJCAI, Vancouver, Canada, 504-510Attardi, G., Corradini, A., Diomedi, S. e Simi, M. (1987). Taxomomic reasoning. in B. Du Boulay, D. Hogg e L. Steels

(a cura di), Advances in Artificial Intelligence - II, Elsevier Science Publisher, Amsterdam, 277-286Bara, B. (1990). Scienza cognitiva. Bollati Boringhieri, Torino.Barwise, J. e Perry, J. (1983). Situations and Attitudes. MIT Press, Cambridge, MA.Bäuerle, M.J. e Cresswell, M.J. (1988). Porpositional attitudes. In D. Gabbay e F. Guenthner (a cura di), Handbook of

Philosophical Logic, vol. IV, Reidel, Dordrecht e Boston.Belnap N.D. (1975). How a computer should think. In Contemporary Aspects of Philosophy. Proceedings of the Oxford

International Symposium, Oxford, UK, 30-56.Belnap N.D. (1977). A useful four valued logic. In G. Epstein e J.M. Dunn (a cura di), Modern Uses of Multiple-Valued

Logics, Reidel, Boston, MA, 8-37.Benaceraff, P. (1973). Mathematical truth. Journal of Philosophy, 70, 661-679.Besnard, P., Moinard, Y., Mercer, R.E. (1989). The importance of open and recursive circumscription. Artificial

Intelligence, 40, 251-62.Bigelow, J.C. (1978). Believing in semantics. Linguistics and Philosophy, 2, 101-144.Block, N. (a cura di) (1980). Readings in Philosophy of Psychology, vol. 1. Harvard University Press, Cambridge,

Mass.Bobrow, D. e Winograd, T. (1977). An overview of KRL, a knowledge representation language. Cognitive Science, 1,

3-46. Anche in Brachman e Levesque (1985), 264-85.Bonomi, A. (a cura di) (1973). La struttura logica del linguaggio. Bompiani, Milano.Bonomi, A. (1983). Linguistica e Logica. In C. Segre (a cura di), Intorno alla linguistica, Feltrinelli, Milano. Anche in

A. Bonomi, Le immagini dei nomi, Garzanti, Milano, 1987.Boolos, G.S. e Jeffrey, R.C. (1974). Computability and Logic. Cambridge University Press, Cambridge, UK.Börger, E. (1989). Computability, Complexity, Logic. North Holland, Amsterdam.Bottani, A. e Penco, C. (a cura di) (1991). Significato e teorie del linguaggio. Franco Angeli, Milano.Brachman, R. (1977). What's in a concept: structural foundations for semantic networks. International Journal of Man-

Machine Studies, 9, 127-152Brachman, R. (1979). On the epistemological status of semantic networks. In N.V. Findler (a cura di), Associative

Networks: Representation and Use of Knowledge by Computers, Academic Press, New York, 3-50. Anche inBrachman e Levesque (1985).

Brachman, R. (1983). What IS-A is and isn't: an analysis of taxonomic links in semantic networks. IEEE Computer,16(10), 30-36.

Brachman, R. (1985). I lied about the trees. The AI Magazine, 3(6), 80-95Brachman, R. e Levesque, H. (1984). The tractability of subsumption in frame-based description languages. Atti del

Convegno AAAI-84, Austin, TX, 34-37Brachman, R. e Levesque, H. (a cura di) (1985). Readings in Knowledge Representation. Morgan Kaufman, Los Altos

(CA)

1Nella presente bibliografia ricorrono alcune sigle che è opportuno spiegare. IJCAI è l'International Joint Conferenceon Artificial Intelligence; TARK è il congresso Theoretical Aspects of Reasoning about Knowledge; AAAI è l'AmericanAssociation for Artificial Intelligence.

Page 158: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

2

Brachman, R. e Schmolze, J. (1985). An overview of the KL-ONE knowledge representation system. Cognitive Science,9, 171-216

Brachman, R., Fikes, R. e Levesque, H. (1983). KRYPTON: a functional approach to knowledge representation. FLAIRTechnical Report 16. Anche in Brachman e Levesque (1985).

Brachman, R., Pigman Gilbert, V. e Levesque, H. (1985). An essential hybrid reasoning system: knowledge and symbollevel accounts of KRYPTON. Proc. 9th IJCAI, 532-539, Los Angeles

Brewka, G. (1987). The logic of inheritance in frame systems. Proc. 10th IJCAI, 483-488, Morgan Kaufmann, LosAltos, CA.

Brewka, G. (1991). Nonmonotonic Reasoning: Logical Foundations of Commonsense. Cambridge University Press,Cambridge, UK.

Brooks, R. (1991). Intelligence without representation. In Kirsh (1991).Bundy, A. (1983). The Computer Modelling of Mathematical Reasoning. Academic Press, Boston. Trad. it.:

L'automazione del ragionamento matematico, Muzzio Editore, Padova, 1986.Cadoli, M. (1993). Due metodi per il ragionamento trattabile in intelligenza artificiale: restrizione del linguaggio e

approssimazione delle teorie. AI*IA Notizie, 6(3), 16-41.Cadoli, M. e Schaerf, M. (1991). Approximate entailment. In E. Ardizzone, S. Gaglio, F. Sorbello (a cura di), Trends in

Artificial Intelligence, Springer, Berlin.Cadoli, M. e Schaerf, M. (1992). Approximate reasoning and non-omniscient agents. Proc. TARK-92, 169-183.Cadoli, M. e Schaerf, M. (1993). A survey of complexity results for non-monotonic logics. Apparirà sul Journal of

Logic Programming.Carbonell, J.R. (1970). AI in CAI: an artificial intelligence approach to computer-aided instruction. IEEE Transactions

on Man-Machine Systems, 11(4). 190-202.Carnap, R. (1947). Meaning and Necessity. University of Chicago Press, Chicago. Trad. it. Significato e necessità, La

Nuova Italia, Firenze, 1976Carnap, R. (1952). Meaning postulates. Philosophical Studies, 3, 65-73. Trad. it. in appendice alla trad. it. di Carnap

(1947) e in Bonomi (1973).Casalegno, P. (1992). Il paradigma di Frege. In Santambrogio (1992).Castelnovo, W. (1986). Attribuire credenze. Epistemologia, 9, 343-358.Ceccato, S. (1961). Linguistic Analysis and Programming for Mechanical Translation. Gordon & Breach, New York.Cercone, N. e McCalla, G. (a cura di) (1987), The Knowledge Frontier. Essays in Representation of Knowledge,

Springer, Berlino.Chellas, B.F. (1980). Modal Logic. An Introduction. Cambridge University Press, Cambridge.Cherniak, C. (1986). Minimal Rationality. MIT Press, Cambridge, Mass.Chierchia, G. (1992). Logica e Linguistica. Il contributo di Montague. In Santambrogio (1992).Chomsky, N. (1965). Aspects of the Theory of Syntax. MIT Press, Cambridge, Mass. Trad. it. in N. Chomsky, La

grammatica generativa trasformazionale. Saggi linguistici, II, Boringhieri, Torino, 1970.Church, A. (1936). An unsolvable problem of elementary number theory. American Journal of Mathematics, 58, 345-

63.Church, A. (1950). On Carnap's analisys of statements of assertion and belief. Analisys, 10, 97-99. Anche in Linsky

(1971).Churchland, P. (1986). Neurophilosophy. MIT Press, Cambridge, Mass.Collins, A. e Quillian, M.R. (1970). Facilitating retrieval from semantic memory. In A.F. Sanders (a cura di), Acta

Psychologica 33. Attention and Performance III, North Holland, Amsterdam.Collins, A. e Smith, E.E. (a cura di) (1988). Readings in Cognitive Science. Morgan Kaufmann, San Mateo, CA.Cresswell, M.J. (1975). Hyperintensional logic. Studia Logica, 34, 25-38.Cresswell, M.J. (1978). Semantic competence. In F. Guenthner e M. Guenthner-Reuter (a cura di), Meaning and

Translation, Duckworth, London. Anche in Cresswell (1988).Cresswell, M.J. (1980). Quotational theories of propositional attitudes. Journal of Philosophical Logic, 9, 17-40. Anche

in Cresswell (1988).Cresswell, M.J. (1982). The autonomy of semantics. In Peters e Saarinen (1982).Cresswell, M.J. (1985). Structured Meanings. MIT Press, Cambridge, Mass.Cresswell, M.J. (1988). Semantical Essays. Possible Worlds and Their Rivals. Kluwer, Dordrecht e Boston.Davidson, D. (1965). Theories of meaning and learnable languages. In Y. Bar-Hillel (a cura di), Proceedings of the

1964 Congress for Logic, Methodology and Philosophy of Science, North Holland, Amsterdam.Davis, M. (1958). Computability and Unsolvability. McGraw-Hill, New York. Trad. it.: Computabilità e insolubilità,

Ed. Abete.de Kleer, J., Doyle, J., Steele, G. e Sussman, G. (1977). AMORD: explicit control of reasoning. Proc. Symposium on

Artificial Intelligence and Programming Languages, SIGPLAN Notices, 12(8), e Sigart Newsletter, 64, 116-125.Anche in Brachman e Levesque (1985).

Deliyanni, A. e Kowalski, R. (1979). Logic and semantic networks. Communications of the ACM, 22(3), 184-192

Page 159: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

3

des Rivieres, J. e Levesque, H. (1986). The consistency of syntactical treatments of knowledge. Proc. TARK-86,Monterey, CA, 115-30.

Doherty, P. (1989). A correspondence between inheritance properties and a logic of preferential entailment. In Z. Ras etal. (a cura di), Proc. of the 4th Int. Symposium on Methodologies for Intelligent Systems, 395-402, NorthHolland, Amsterdam.

Dowty, D. (1979). Word Meaning and Montague Grammar. Reidel, Dordrecht e Boston.Dowty, D., Wall, R. e Peters, S. (1981). Introduction to Montague Semantics. Reidel, Dordrecht e Boston.Doyle, J. (1983). Some theories of reasoned assumptions: an essay in rational psychology. Technical Report 83-125,

Department of Computer Science, Carnagie Mellon University, Pittsburgh, PA.Doyle, J. (1988a). Knowledge, representation and rational self-government. Proc. TARK-88, 345-354.Doyle, J. (1988b). Artificial intelligence and rational self-government. Technical Report CS-88-124, Department of

Computer Science, Carnagie Mellon University, Pittsburgh, PA.Doyle, J. (1990a). Rationality and its roles in reasoning (extended abstract). Atti del Convegno AAAI-90, 1093-1100.Doyle, J. (1990b). Rationality and its roles in reasoning. Technical Report.Doyle, J. e Patil, R.S. (1991). Two theses of knowledge representation: language restrictions, taxonomic classification,

and the utility of representation services. Artificial Intelligence, 48, 261-297.Dummett, M. (1959). Truth. Proc. of the Aristotelian Society, 59, 141-162. Anche in M. Dummett Truth and other

Enigmas, Duckworth, London, 1978, trad. it.: La verità ed altri enigmi, a cura di M. Santambrogio, Il Saggiatore,Milano, 1986.

Dummett, M. (1976). What is a theory of meaning (II). In G. Evans e G. McDowell (a cura di), Truth and Meaning,Clarendon Press, Oxford.

Dunn, J.M. (1986). Relevance logic and entailment. In D. Gabbay e F. Guenthner, (a cura di), Handbook ofPhilosophical Logic. Vol. III. Alternatives to Classical Logic. Reidel, Dordrecht e Boston.

Eberle, R.A. (1974). A logic of believing, knowing and inferring. Synthese, 26, 356-82.Eco, U., Santambrogio, M. e Violi, P. (a cura di) (1986). Meanings and Mental Representations. Versus, 44/45, maggio-

dicembre 1986.Etherington, D. (1987). Relating default logic and circumscription. Proc. 10th IJCAI, Milano, 489-494.Etherington, D. (1988). Reasoning with Incomplete Information. Pitman, London, UK.Etherington, D. e Reiter, R. (1983). On inheritance hierarchies with exceptions. Atti del Convegno AAAI-83, 104-108.

Anche in Brachman e Levesque (1985). Anche in Ginsberg (1987).Etherington, D., Mercer, R., Reiter, R. (1985). On the adequacy of predicate circumscription for closed-world reasoning.

Computational Intelligence, 1, 11-15. Anche in Ginsberg (1987).Fagin, R. e Halpern, J.Y. (1985). Belief, awareness and limited reasoning: preliminary report. Proc. 9th IJCAI, Los

Angeles, CA, 491-501.Fagin, R. e Halpern, J.Y. (1988). Belief, awareness and limited reasoning. Artificial Intelligence, 34, 39-76.Fagin, R., Halpern, J.Y. e Vardi, M. (1990). A nonstandard approach to the logical omniscience problem. Proc. TARK-

90, 41-55.Fagin, R., Halpern, J.Y. e Vardi, M. (1991). A model-theoretic analysis of knowledge. Journal of the ACM, 38(2), 382-

428.Fagin, R., Halpern, J.Y., Moses, Y. e Vardi, M.Y. (1993). Reasoning about Knowledge. MIT Press, Cambridge, Mass..Fahlman, S. (1979). NETL: a System for Representing and Using Real World Knowledge. MIT Press, Cambridge, Mass.Field, H. (1972). Tarski's theory of truth. The Journal of Philosophy, 69(13), 347-375.Fillmore, C. (1968). The case for case. In E. Bach e R. Harms (a cura di), Universals in Linguistic Theory, Holt, New

York.Fodor, J. (1975). The language of thought. The Harvester Press, Hassocks, UK.Fodor, J. (1978). Propositional attitudes. The Monist, 61, 501-523.Fodor, J. (1980a). Methodological solipsism as a research strategy in psychology. Behavioral and Brain Sciences, 3, 63-

73. Anche in Haugeland (1981).Fodor, J. (1980b). Mente. In Enciclopedia Einaudi, Einaudi, Torino.Frege, G. (1884). Die Grundlagen der Arithmetik. Köbner, Breslavia. Trad. it. in G. Frege, Logica e artitmetica, a cura

di C. Mangione, Boringhieri, Torino, 1977.Frege, G. (1891). Funktion und Begriff. Pohle, Jena. Trad. it. parziale in Bonomi (1973).Frege, G. (1892). Über Sinn und Bedeutung. Zeitschrift für Philosophie und philosophische Kritik, 100, 25-50. Trad. it.

parziale in Frege (1965) e trad. it. integrale in Bonomi (1973).Frege, G. (1918). Der Gedanke. Eine logische Untersuchung. Beiträge zur Philosophie des deutschen Idealismus, 1, 58-

77. Trad. it. in Frege (1988).Frege, G. (1923). Logische Untersuchungen. Dritter Teil: Gedankengefüge. Beiträge zur Philosophie des deutschen

Idealismus, 3, 36-51. Trad. it. in Frege (1988).Frege, G. (1965). Logica e aritmetica. a cura di C. Mangione. Boringhieri, Torino.Frege, G. (1969). Nachgelassene Schriften. Meiner, Hamburg. Trad. it. Scritti Postumi, Bibliopolis, Napoli, 1986.

Page 160: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

4

Frege, G. (1976). Wissenschaftlicher Briefwechsel. Meiner, Hamburg. Trad. it. Alle origini della nuova logica,Boringhieri, Torino, 1983.

Frege, G. (1988). Ricerche logiche. A cura di M. Di Francesco. Guerini, Milano.Frixione, M., Gaglio, S. e Spinelli, G. (1989). Symbols and subsimbols for representing knowledge: a catalogue

raisonné. Proc. 11th IJCAI, Detroit, USA, 3-7.Frixione, M. e Spinelli, G. (1992). Connectionism and functionalism. The importance of being a subsymbolist. Journal

of Experimental and Theoretical Artificial Intelligence, 1(1992), 3-17.Frisch, A.M. (1987). Inference without chaining. Proc. 10th IJCAI, Milano, 515-519.Gabbay, D. e Guenthner, F. (a cura di) (1984). Handbook of Philosophical Logic. vol. II. Extension of Classical Logic.

Reidel, Dordrecht e Boston.Galvan, S. (1985). Introduzione alle logiche filosofiche I: Estensioni della logica proposizionale classica. I.S.U. - Univ.

Cattolica, Milano.Gardner, H. (1985). The mind's new science. Basic Books, New York. Trad. it.: La nuova scienza della mente,

Feltrinelli, Milano, 1988.Garey, M. e Johnson, D. (1979). Computers and Intractability: A Guide to the Theory of NP-Completeness. Freeman,

San Francisco, CA.Geanakoplos, J. (1992). Common knowledge. Proc. TARK-92, 254-312.Gelernter, P.C. (1963). Realization of a geometry theorem-proving machine. In Feigenbaum e Feldman (a cura di),

Computers and Thought, McGraw-Hill, 134-152.Gelfond, M. e Przymusinska, H. (1989). Inheritance reasoning in autoepistemic logic. In Z. Ras et al. (a cura di), Proc.

of the 4th Int. Symposium on Methodologies for Intelligent Systems, 419-429, North Holland, Amsterdam.Genesereth, M.R. e Nilsson N.J. (1987). Logical Foundations of Artificial Intelligence. Morgan Kaufmann, Los Altos,

CA.Gettier, P. (1963). Is justified true belief knowledge? Analysis, 23, 167-8. Trad. it. in A. Bottani e C. Penco (1991).Gilmore, P.C. (1970). An examination of the geometry theorem-proving machine. Artificial Intelligence, 1, 171-187.Ginsberg, M. (a cura di) (1987). Readings in Non-Monotonic Reasoning. Morgan Kaufmann, Los Altos, CA.Girard, J.Y. (1987). Linear logic. Theoretical Computer Science, 50, 1-102.Girard, J.Y. (1991). La logica lineare. Le Scienze - Quaderni, 60, 82-90.Giunchiglia, F. (1993). Contextual reasoning. Epistemologia, fascicolo speciale su I linguaggi e le macchine, 16, 345-

364.Giunchiglia, F. e Serafini, L. (1994). Multilanguage hierarchical logics (or: how we can do without modal logics).

Apparirà su Artificial Intelligence.Giunchiglia, F., Serafini, L., Giunchiglia, E. e Frixione, M. (1993). Non-omniscient belief as context-based reasoning.

Proc. 11th IJCAI, Chambery, France, 548-554.Greco, A. (1988). Introduzione alla simulazione. Franco Angeli, Milano.Gregoire, E. (1989). Skeptical theories of inheritance and nonmonotonic logics. In Z. Ras et al. (a cura di),

Methodologies for Intelligent Systems, Proc. of the 4th Int. Symposium on Methodologies for Intelligent Systems,430-438, North Holland, Amsterdam.

Grim, P. (1993). Operators in the paradox of the knower. Synthese, 94, 409-428.Grosof, B. (1984). Default reasoning as circumscription. Proc. AAAI Workshop on Non-Monotonic Reasoning, New

Paltz, NY, 115-124.Gupta, A. (1982). Truth and paradox. Journal of Philosophical Logic, 11, 1-60.Halpern, J.Y. (a cura di) (1986a). Theoretical Aspects of Reasoning about Knowledge. Atti del terzo convegno. Morgan

Kaufmann, Los Altos, CA.Halpern, J.Y. (1986b). Reasoning about knowledge: an overview. Proc. TARK-86, Monterey, CA, 1-17.Halpern, J.Y. (1992). Reasoning about knowledge: a survey circa 1991. Monoscritto inedito.Halpern, J.Y. e Moses, Y.O. (1984a). Towards a theory of knowledge and ignorance. Proc. AAAI Workshop on Non-

Monotonic Reasoning, New Paltz, NY, 125-43. Anche in K. Apt (a cura di), Logics and Models of ConcurrentSystems. Springer, Berlin, 1985.

Halpern, J.Y. e Moses, Y.O. (1984b). Knowledge and common knowledge in a Distributed environment. Proc. 3rdACM Conf. on Principles of Distributed Computing, 50-61.

Halpern, J.Y. e Moses, Y.O. (1985). A guide to modal logics of knowledge and belief: preliminary draft. Proc. 9thIJCAI, Los Angeles, CA, 480-90.

Halpern, J.Y. e Moses, Y.O. (1992). A guide to completeness and complexity for modal logics of knowledge and belief.Artificial Intelligence, 54, 319-379.

Hamilton, S.J. e Delgrande, J.P. (1989). An investigation of modal structures as an alternative semantic basis forepistemic logics. Computational Intelligence, 5, 82-96.

Hanks, S. e McDermott, D. (1987). Non monotonic logic and temporal projection. Artificial Intelligence, 33, 379-412.Harman, G. (1987). (Nonsolipsistic) conceptual role semantics. In E. Le Pore (a cura di), New Directions in Semantics.

Academic Press, New York.

Page 161: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

5

Harmann, G. (1986). Change in View: Principles of Reasoning. MIT Press, Cambridge, Mass.Harnad, S. (1989). Minds, Machines and Searle. Journal of Experimental and Theoretical Artificial Intelligence, 1, 5-

25.Harnad, S. (1990). The symbol grounding problem. Physica D, 42(1/3).Haugeland, J. (a cura di) (1981). Mind Design. MIT Press, Cambridge, Mass. Trad. it.: Progettare la mente, Il Mulino,

Bologna, 1989.Haugeland, J. (1985). Artificial Intelligence. The Very Idea. MIT Press, Cambridge, Mass. Trad. it.: Intelligenza

artificiale. Il significato di un'idea, Bollati Boringhieri, Torino, 1988.Haugh, B. (1988). Tractable theories of multiple defeasible inheritance in ordinary non-monotonic logics. Atti del

Convegno AAAI-88, 421-426, Morgan Kaufmann, San Mateo, CA.Hayes, P. (1974). Some problems and non-problems in representation theory. Proc. AISB Summer Conference, Univ. of

Sussex, 63-79. Anche in Brachman e Levesque (1985).Hayes, P. (1977). In defence of logic. Proc. 5th IJCAI, Cambridge, (Mass.), 559-565.Hayes, P.J. (1979). The logic of frames. In D. Metzing (a cura di), Frame Conceptions and Text Understanding, de

Gruyter & Co., Berlino. Anche in Webber e Nilsson (1981) e in Brachman e Levesque (1985).Hempel, C. (1952), Fundamentals of Concept Formation in Empirical Science, The University of Chicago Press,

Chicago, Ill., trad. It. La formazione dei concetti e delle teorie nella scienza empirica, Feltrinelli, Milano, 1961.Hempel, C. (1980). The logical analysis of psychology. In Block (1980).Hermes, H. (1961). Aufzälbarkeit, Entscheidbarkeit, Berechenbarkeit. Springer, Berlin. Trad. it.: Numerabilità,

decidibilità, computabilità, Boringhieri, Torino, 1973.Hintikka, J. (1962). Knowledge and Belief. Cornell University Press, Ithaca, NY.Hintikka, J. (1969). Semantics for propositional attitudes. In J.W. Davis et al. (a cura di), Philosophical Logic, Reidel,

Dordrecht. Anche in Linsky (1971).Hugues, G.E. e Cresswell, M.J. (1968). An Introduction to Modal Logic, Methuen & Co., London. Trad. it. Introduzione

alla logica modale, Il Saggiatore, Milano, 1973.Imielinsky, T. (1987). Results on translating defaults to circumscription. Artificial Intelligence, 32, 131-46.Israel, D. (1980). What's wrong with non-monotonic logic. Atti del Convegno AAAI-80, Stanford, CA, 99-101. Anche in

Ginsberg (1987).Israel, D. (1983). Interpreting network formalisms. Computers & Mathematics with Applications, 1, 1-13.Israel, D. e Brachman, R. (1981). Distinctions and confusions: a catalogue raisonné. Proc. 7th IJCAI, Vancouver,

Canada.Jackendoff, R. (1986). Conceptual semantics. In U. Eco et al. (1986).Johnson-Laird, P.N. (1982). Formal semantics and the psychology of meaning. In Peters e Saarinen (1982).Johnson-Laird, P.N. (1983), Mental Models: towards a Cognitive Science of Language, Inference, and Consciousness.

Cambridge University Press, Cambridge, 1983. Trad.it.: Modelli mentali, Il Mulino, Bologna, 1988.Johnson-Laird, P.N. (1988). The Computer and the Mind. An Introduction to Cognitive Science. William Collins Sons

& Co. Ltd., London. Trad. it.: La mente e il computer. Introduzione alla scienza cognitiva, Il Mulino, Bologna,1990.

Johnson-Laird, P.N., Chaffin, R. e Herrmann, D.J. (1984). Only connections: a critique of semantic networks.Psychological Bulletin, 96(2), 292-315.

Katz, J.J. (1972). Semantic Theory. Harper and Row, New York.Katz, J.J. e Fodor, J.A. (1964). The structure of semantic theory. In J.A. Fodor e J.J. Katz (a cura di), The Structure of

Language. Readings in the Philosophy of Language, Prentice Hall.Kautz, H.A. e Selman, B. (1991). Hard problems for simple default logics. Artificial Intelligence, 49, 243-279.Kirsh, D. (a cura di) (1991). Foundation of Artificial Intelligence. Volume speciale di Artificial Intelligence, 47(1-3).Kleene, S.C. (1952). Introduction to Metamathematics. North Holland, Amsterdam.Kolata, G. (1982). How can computers get common sense? Science, 217, 1237-1238.Konolige, K. (1984). A deduction model of belief and its logics. SRI Technical Note, 326.Konolige, K. (1985a). Belief and incompleteness. In J.R. Hobbs e R.C. Moore (a cura di), Formal Theories of the

Common Sense World, Ablex.Konolige, K. (1985b). A computational theory of belief introspection. Proc. 9th IJCAI, Los Angeles, CA, 502-8.Konolige, K. (1986a). A Deduction Model of Belief. Morgan Kaufmann, Los Altos, CA.Konolige, K. (1986b). What awareness isn't: a sentential view of implicit and explicit belief. Proc. TARK-86, Morgan

Kaufmann, Los Altos, CA, 241-50.Konolige, K. (1988). On the relation between default and autoepistemic logic. Artificial Intelligence, 35, 343-82. Anche

in Ginsberg (1987).Konolige, K. (1989). On the relation between autoepistemic logic and circumscription. Proc. 11th IJCAI, Detroit, 1213-

1218.Koons, R.C. (1988). Doxastic paradoxes without self-reference. Proc. TARK-88, 29-41.Koons, R.C. (1991). Paradoxes of Belief and Strategic Rationality. Cambridge University Press, Cambridge, UK.

Page 162: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

6

Kripke, S. (1963). Semantical considerations on modal logic. Acta Philosophica Fennica, 16, 83-89. Anche in Linsky(1971).

Kripke, S. (1972). Naming and necessity. In D. Davidson e G. Harman (eds.), Semantics of Natural Language, Reidel,Dordrecht e Boston. Trad. it. Nome e necessità, Torino, Boringhieri, 1982.

Kripke, S. (1975). Outline of a new theory of truth. Journal of Philosophy, 72, 690-715.Krishnaprasad, T., Kifer, M. e Warren, D. (1989). On the circumscriptive semantics of inheritance networks. In Z. Ras

et al. (a cura di), Proc. of the 4th Int. Symposium on Methodologies for Intelligent Systems, 448-456, NorthHolland, Amsterdam.

Ladner, R.E. (1977). The computational complexity of provability in systems of modal propositional logic. SIAM J.Comput., 6(3), 467-480.

Lakemeyer, G. (1986). Steps towards a first-order logic of explicit and implicit belief. Proc. TARK-86, 325-340.Lakemeyer, G. (1987). Tractable meta-reasoning in propositional logics of belief. Proc. 10th IJCAI, Milano, 402-408.Lakemeyer, G. (1990). Decidable reasoning in first-order knowledge bases with perfect introspection. Atti del Convegno

AAAI-90, Boston, MA.Lakemeyer, G. (1991a). On the relation between explicit and implicit belief. Proc. of the Secon Conference on

Principles of Knowledge Representation and Reasoning, Morgan Kaufmann, San Mateo, CA, 368-375.Lakemeyer, G. (1991b). A model of decidable introspective reasoning with quantifying-in. Proc. 12th IJCAI, Sidney.Lakemeyer, G. e Levesque, H. (1988). A tractable knowledge representation service with full introspection. Proc.

TARK-88, Monterey, CA, 145-159.Lakoff, G. (1972). Hedges: a study in meaning criteria and the logic of fuzzy concepts. In Papers from the Eight

Regional Meeting of the Chicago Linguistic Society, Chicago Linguistic Society, Chicago, 183-228.Lehmann, F. (1992). Semantic Networks. Computers and Mathematics with Applications, 23(2-5). Anche in Lehmann

(1993).Lehmann, F. (a cura di) (1994). Semantic Networks in Artificial Intelligence. Pergamon Press. Annunciato. Anche come

volumi speciali di Computers and Mathematics with Applications, 1992, 23 (2-5 e 6-9).Lenzen, W. (1978). Recent work in epistemic logic. Acta Philosophica Fennica, 30, 1-219.Levesque, H.J. (1984a). A logic of implicit and explicit belief. Atti del Convegno AAAI-84, Austin, TX, 198-202.Levesque, H.J. (1984b). A logic of implicit and explicit belief. Fairchild Technical Report #653, FLAIR Technical

Report #32.Levesque, H.J. (1984c). Foundations of a functional approach to knowledge representation. Artificial Intelligence,

23(2), 155-212.Levesque, H.J. (1986). Making believers out of computers. Artificial Intelligence, 30(1), 81-108.Levesque, H.J. (1988). Logic and the complexity of reasoning. Journal of Philosophical Logic, 17(4), 355-389.Levesque, H.J. (1990). All I know: a study on autepistemic logic. Artificial Intelligence, 42, 263-309.Levesque, H.J. e Brachman, R. (1985). A fundamental tradeoff in knowledge representation and reasoning. In Brachman

e Levesque (1985), 41-70.Lewis, D. (1969). Convention, a Philosophical Study. Harvard University Press, Cambridge, Mass. Trad. it.: La

convenzione. Studio filosofico, Bompiani, Milano, 1974.Lewis, D. (1972). General semantics. In D. Davidson e G. Harman, (a cura di), Semantics of Natural Language, Reidel,

Dordrecht e Boston.Lewis, D. (1982). A logic for equivocators. Noûs, 16, 431-441.Lifschitz, V. (1985). Computing circumscription. Proc. 9th IJCAI, Los Angeles, CA, 121-127. Anche in Ginsberg

(1987).Lifschitz, V. (1986). On the satisfiability of circumscription. Artificial Intelligence, 28, 12-27.Lifschitz, V. (1987). Pointwise circumscription. In Ginsberg (1987).Lin, F. e Shoham, Y. (1990). Epistemic semantics for fixed-points non-monotonic logics. Proc. TARK-90, Morgan

Kaufmann, San Mateo, CA, 111-20.Lin, F. e Shoham, Y. (1992). A logic of knowledge and justified assumptions. Artificial Intelligence, 57, 271-289.Linsky, L. (a cura di) (1971). Reference and Modality. Oxford University Press, Oxford, UK. Trad. it.: Riferimento e

modalità, Bompiani, Milano, 1974.Lipkis, T. (1982). A KL-ONE classifier. Proc. of the 1981 KL-ONE workshop, BBN, 128-145Lolli, G. (1988). La macchina e le dimostrazioni, Il Mulino, Bologna.Lolli, G. (1991). Logica e intelligenza artificiale. Sistemi intelligenti, 3(1), 7-36.Luccio, F. (1972). Strutture, linguaggi, sintassi. Boringhieri, Torino.Lukaszewicz, W. (1990). Non-Monotonic Reasoning. Ellis Horwood, Chicester, UK.Lytinen, S.L. (1992). Conceptual dependency and its descendants. Computers and Mathematics with Applications 23(5).

Anche in Lehmann (1993).Mac Gregor, R. (1990). Loom Users Manual. Technical Report Working Paper ISI/WP-22, USC/Information Science

Institute.

Page 163: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

7

Mac Gregor, R. (1991). The evolving technology of classification-based knowledge representation systems. In Sowa(1991).

Mac Randall, D. (1988). Semantic Networks. In Ringland e Duce (1988).Maida, A.S. (1985). Selecting a humanly understandable knowledge representation for reasoning about knowledge.

International Journal of Man-Machine Studies, 22, 151-161.Maida, A.S. e Shapiro, S.C. (1982). Intensional concepts in propositional semantic networks. Cognitive Science, 6, 291-

330. Anche in Brachman e Levesque (1985).Marconi, D. (1989). Rappresentare il significato lessicale. In R. Viale (a cura di), Mente umana e mente artificiale,

Feltrinelli, Milano.Marconi, D. (1992a). Semantica cognitiva. In Santambrogio (1992).Marconi, D. (1992b). Lexical Competence. Testo delle lezioni tenute a Bolzano, luglio 1992.Masterman, M. (1962). Semantic message detection for machine translation, using an interlingua. Atti della 1961

International Conference on Machine Translation of Languages and Applied Language Analysis, Her Majesty'sStationery Office, London.

McArthur, G.L. (1988). Reasoning about knowledge and belief: a survey. Computational Intelligence, 4, 223-243.McCarthy, J. (1977). Epistemological problems of artificial intelligence. Proc. 5th IJCAI, Cambridge, MA, 1038-1044.

Anche in Webber e Nilsson (1981), in Brachman e Levesque (1985), 24-30, e in Ginsberg (1987).McCarthy, J. (1979). First-order theories of individual concepts and propositions. In J.E. Hayes, D. Michie e L.I.

Mikulich (a cura di), Machine Intelligence, 9, 120-47, Halsted Press, New York, NY. Anche in Brachman eLevesque (1985).

McCarthy, J. (1980). Circumscription - a form of nonmonotonic reasoning. Artificial Intelligence, 13, 27-39. Anche inWebber e Nilsson (1981) e in Ginsberg (1987).

McCarthy, J. (1984). Applications of circumscription to formalizing common sense knowledge. Proc. AAAI Workshopon Non-Monotonic Reasoning, New Paltz, NY, 295-324. Anche in Artificial Intelligence, 1986, 28, 89-116.Anche in Ginsberg (1987).

McCarthy, J. e Hayes, P. (1969). Some philosophical problems from the standpoint of artificial intelligence. In B.Meltzer e D. Michie (a cura di), Machine Intelligence 4, Edinburgh University Press, Edinburgh. Anche Webbere Nilsson (1981) e in Ginsberg (1987).

McCorduck, P. (1979). Machines who Think. Freeman & Co., New York. Trad. it.: Storia dell'intelligenza artificiale,Franco Muzzio ed., Padova, 1987.

McDermott, D. (1978). Tarskian semantics, or no notation without denotation! Cognitive Science, 2, 277-282.McDermott, D. (1982). Non-monotonic logic II. Journal of the ACM, 29, 33-57.McDermott, D. (1987). A critique of pure reason. Computational Intelligence, 3, 155-160. Trad. it.: Sistemi Intelligenti,

3(1), 113-139.McDermott, D. e Doyle, J. (1980). Non-monotonic logic I. Artificial Intelligence, 13, 41-72. Anche in Ginsberg (1987).Medin, D.L. e Smith, E.E. (1984). Concepts and concept formation. Ann. Rev. Psicol., 35, 113-138.Miller, G.A. e Jonhson-Laird, P. (1976). Language and Perception. Cambridge University Press, Cambridge.Minker, J. (1982). On indefinite data bases and the closed world assumption. Proc. 6th Conference on Automated

Deduction. Lecture Notes in Computer Science, 138, Springer, Berlin, 292-398. Anche in Ginsberg (1987).Minsky (1967). Computation. Finite and Infinite Machines. Prentice-Hall, Englewood Cliffs.Minsky, M. (1975). A framework for representing knowledge. In P. Winston (a cura di), The Psychology of Computer

Vision, McGraw Hill, New York. Versioni parziali in Brachman e Levesque (1985) e in Haugeland (1981).Minsky, M. (1982). Why people think computers can't. AI Magazine, 3(4), 3-15.Minsky, M. (1986). The Society of Mind. Simon and Schuster, New York. Trad. it.: La società delle menti, Adelphi,

Milano, 1989.Montague, R. (1963). Syntactical treatments of modality, with corollaries on reflexion principles and finite

axiomatizability. In Montague (1974), 286-302.Montague, R. (1968). Pragmatics. In Montague (1974), 95-118.Montague, R. (1970). Universal grammar. In Montague (1974), 222-246.Montague, R. (1973). The proper treatment of quantification in ordinary English. In J. Hintikka, N. Moravcsik e P.

Suppes (a cura di), Approaches to Natural Language, Reidel, Dordrecht e Boston. Anche in Montague (1974).Montague, R. (1974). Formal Philosophy. Yale University Press, New Haven e Londra.Moore, R. (1982). The role of logic in knowledge representation and commonsense reasoning. Atti del Convegno AAAI-

82, 428-33. Anche in Brachman e Levesque (1985), 336-41.Moore, R.C. (1983). Semantical considerations on nonmonotonic logic. Proc. 8th IJCAI, Karlsruhe, Germania

Occidentale, 272-9.Moore, R.C. (1985). Semantical considerations on nonmonotonic logic. Artificial Intelligence, 25, 75-94. Anche in

Ginsberg (1987).Moore, R.C. e Hendrix, G.G. (1979). Computational models of belief and the semantics of belief sentences. Technical

Note 187, SRI International, Menlo Park, CA.

Page 164: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

8

Moore, R.C. e Hendrix, G.G. (1982). Computational models of belief and the semantics of belief sentences. In S. Peterse E. Saarinen (a cura di) (1982), 107-127.

Moser, M.G. (1983). An overview of NIKL, the new implementation of KL-ONE. BBN Report n. 5421, 7-26Moses, Y.O. (1988). Resource-bounded knowledge. Proc. TARK-88, 261-275.Moses, Y.O. (a cura di) (1992). Theoretical Aspects of Reasoning about Knowledge. Atti del quarto convegno. Morgan

Kaufmann, Los Altos, CA.Napoli, E. (1992). Riferimento diretto. In Santambrogio (1992).Nebel, B. (1988). Computational complexity of terminological reasoning in BACK. Artificial Intelligence, 34, 371-383Nebel, B. (1990a). Reasoning and Revision In Hybrid Representation Systems. Springer, Berlino.Nebel, B. (1990b). Terminological reasoning is inherently intractable. Artificial Intelligence, 43(2).Newell, A. (1980). Physical symbol systems. Cognitive Science, 4, 135-184.Newell, A. (1981). The knowledge level. AI Magazine, 2(2), 1-20.Newell, A. e Simon, H.A. (1976). Computer science as empirical inquiry: symbols and search. Communications of the

ACM, 19(3), 113-126. Anche in Haugeland (1981).Nilsson, N.J. (1971). Problem-Solving Methods in Artificial Intelligence. McGraw-Hill, New York. Trad. it.: Metodi per

la risoluzione di problemi nella intelligenza artificiale, Angeli, Milano, 1976.Nilsson, N.J. (1980). Principles of Artificial Intelligence. Morgan Kuafmann, Los Altos, CA.Norman, D. (a cura di) (1981). Perspectives on Cognitive Science. Ablex, Norwood, New Jersey.Oden, G.C. (1977). Fuzziness in semantic memory: Choosing examples of subjective categories. Memory and

Cognition, 5, 198-204.Osherson, D.N.e Smith E.E. (1981). On the adequacy of prototype theory as a theory of concepts. Cognition, 9, 59-72.Parikh, R. (a cura di) (1990a). Theoretical Aspects of Reasoning about Knowledge. Atti del terzo convegno. Morgan

Kaufmann, Los Altos, CA.Parikh, R. (1990b). Recent issues in reasoning about knowledge. Proc. TARK-90, 3-10.Partee, B. (1979a). Montague grammar, mental representation and reality. In S. Oehman e S. Kanger (a cura di),

Philosophy and Grammar, Reidel, Dordrecht e Boston.Partee, B. (1979b). Semantics - mathematics or psychology? In R. Bäuerle, U. Egli e A. von Stechow (a cura di),

Semantics from Different Points of View, Springer, Berlin.Partee, B. (1982). Belief sentences and the limits of semantics. In Peters e Saarinen (1982). Trad. it. in Bottani e Penco

(1991).Patel-Schneider, P.F. (1984). Small can be beautiful in knowledge representation. Proc. IEEE Workshop on Principles

of Knowledge-Based Systems, 559-565.Patel-Schneider, P.F. (1987). Decidable, logic-based knowledge representation. AI Technical Report n. 56,

Schlumberger Palo Alto Research.Patel-Schneider, P.F. (1989a). A four-valued semantics for terminological logics. Artificial Intelligence, 38(3), 319-351.Patel-Schneider, P.F. (1989b). Undecidability of subsumption in NIKL. Artificial Intelligence, 39, 263-272Patel-Schneider, P.F. (1990). A decidable first order logic for knowledge representation. Journal of Automated

Reasoning, 6(4), 361-388.Penco, C. (1994). Vie della scrittura. Frege e la svolta linguistica in filosofia. Franco Angeli, Milano.Perlis, D. (1985). Languages with self reference I: Foundations. Artificial Intelligence, 25, 301-322.Perlis, D. (1988). Languages with self reference II: Knowledge, belief and modality. Artificial Intelligence, 34, 179-212.Pertrolini, E. (1971). Teatro. Garzanti, Milano.Peters, S. e Saarinen, E. (a cura di) (1982). Processes, Beliefs and Questions. Reidel, Dordrecht e Boston.Post, E. (1936). Finite combinatory processes - formulation 1. Journal of Symbolic Logic, 1, 103-5.Putnam, H. (1970). Is semantics possible? In Putnam (1975).Putnam, H. (1975). Mind, Language and Reality. Cambridge University Press, Cambridge. Trad. it.: Mente, linguaggio

e realtà, Adelphi, Milano, 1987.Putnam, H. (1975a). Mathematics, Matter and Method. Cambridge University Press, Cambridge.Putnam, H. (1978). Reference and understanding. In H. Putnam, Meaning and the Moral Sciences, Routledge & Paul,

Londra.Putnam, H. (1981). Reason, Truth and History. Cambridge University Press, Cambridge. Trad. it: Ragione, verità e

storia, Il Saggiatore, Milano, 1985.Pylyshyn, Z. (1984). Computation and Cognition. MIT Press, Cambridge, Mass.Quillian, M.R. (1967). Word concepts: a theory and simulation of some basic semantic capabilities. Behavioral Science,

12, 410-430. Anche in Brachman e Levesque (1985).Quillian, M.R. (1968). Semantic memory. In M. Minsky (a cura di), Semantic Information Processing, MIT Press,

Cambridge, Mass. Anche in Collins e Smith (1988).Quillian, M.R. (1969). The teachable language comprehender: a simulation program and theory of language.

Communications of the ACM, 12(8), 459-476.

Page 165: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

9

Reinfrank, M., De Kleer, J., Ginsberg, M.L., Sandewall, E. (a cura di) (1988). Non-Monotonic Reasoning. Proceedingsof the 2nd International Workshop. Springer, Berlin.

Reiter, R. (1978). On closed-world databases. In M. Gallaire e J. Minker (a cura di), Logic and Databases, PlenumPress, New York. Anche in Webber e Nilsson (1981) e in Ginsberg (1987).

Reiter, R. (1980). A logic for default reasoning. Artificial Intelligence, 13, 81-132. Anche in Ginsberg (1987).Reiter, R. e Criscuolo, G. (1980). Some representational issues in default reasoning. Tech. Report 80-87, Dept. of

Computer Science, The University of British Columbia.Reiter, R. e Criscuolo, G. (1983). Some representational issues in default reasoning. Computer & Mathematics with

Applications, 1, 15-27.Rescher, N. e Brandom, R. (1980). The Logic of Inconsistency. Basil Blackwell, London.Richens, R.H. (1956). Preprogramming for mechanical translation. Mechanical Translation, 3(1).Ringland, G.A. e Duce, D.A. (a cura di) (1988). Approaches to Knowldge Representation: an Introduction. John Wiley

& Sons, New York.Rogers, H. (1967). Theory of Recursive Functions and Effective Computability. McGraw-Hill, New York.Rosch, E. (1975). Cognitive representation of semantic categories. Journal of Experimental Psychology: General, 104,

192-233.Roth, E.M. e Mervis C.B. (1983). Fuzzy set theory and class inclusion relations in semantic categories. Journal of

Verbal Learning and Verbal Behavior, 22, 509-525.Routley, R. e Meyer, R.K. (1973). The semantics of entailment. In H. Leblanc (a cura di), Truth, Syntax, and Semantics,

North-Holland, Amsterdam.Routley, R. e Routley, V. (1972). Semantics of first degree entailment. Noûs, 6, 335-359.Rumelhart, D.E., Linsday, P.H. e Norman, D.A. (1972). A process model for long-term memory. In In E. Tulving e W.

Donaldson (a cura di), Organization and Memory, Academic Press, New York.Russell, B. (1921). The Analysis of Mind. Oxford University Press. London.Russell, B. (1940). An Enquiry into Meaning and Truth. George Allen and Unwin, London.Ryle, G. (1949). The Concept of Mind. Hutchinson's University Library, London. Trad. it.: Lo spirito come

comportamento, Einaudi, Torino, 1955.Santambrogio, M. (a cura di) (1992). Introduzione alla filosofia analitica del linguaggio. Laterza, Bari.Santambrogio, M. e Violi, P. (1986). Introduction. In Eco et al. (1986).Schank, R.C. (1972). Conceptual dependency: a theory of natural language understanding. Cognitive Psychology, 3,

552-631.Schank, R.C. (1975). Conceptual Information Processing. North Holland, Amsterdam.Schank, R.C. e Rieger III, C.J. (1974). Inference and the computer understanding of the natural language. Artificial

Intelligence, 5(4), 373-412. Anche in Brachman e Levesque (1985), 119-139.Schmidt-Schauss, M. (1989). Subsumption in KL-ONE is undecidable. Proc. 1st International Conference on

Principles of Knowledge Representation and Reasoning, Morgan Kaufmann, San Mateo, CA, 421-431.Schmolze, J. (1989). Terminological knowledge representation systems supporting n-ary terms. Proc. 1st International

Conference on Principles of Knowledge Representation and Reasoning, 432-443.Schmolze, J. e Israel, D. (1983). KL-ONE: semantics and classification. BBN report n. 5421, 27-39Schmolze, J. e Lipkis, T. (1983). Classification in the KL-ONE knowledge representation system. Proc. 8th IJCAI,

Karlsruhe, 330-332Schwartz, S.P. (a cura di) (1977). Naming, Necessity and Natural Kinds. Cornell University Press, Ithaca e Londra.Scott, D. (1970). Advice on modal logic. In K. Lambert (a cura di), Philosophical Problems in Logic, Reidel, Boston,

MA, 143-173.Searle, J. (1980). Minds, Brains and Programs. Behavioral and Brain Sciences, 3, 417-457. Anche in Haugeland (1981)

e in Collins e Smith (1988). Trad. it.: Menti, cervelli e programmi, Clup-Clued, Milano, 1984.Selman, B. e Kautz, H. (1988). The complexity of model preference default theories. In Reinfrank et al. (1988).Selz, O. (1913). Über die Gesetze des geordneten Denkverlaus, Spemann, Stuttgart.Selz, O. (1922). Zur Psychologie des produktiven Denkens und des Irrtums. Friederich Cohen, Bonn.Shoham, Y. (1987). Non-monotonic logics, meaning and utility. Proc. 10th IJCAI, Milano, 388-93.Shoham, Y. (1988). Reasoning about Change. MIT Press, Boston, MA.Simmons, R.F. e Bruce, B.C. (1971). Some relations between predicate calculus and semantic net representations of

discourse. Proc. 2nd IJCAI, 524-529.Simmons, R.F. e Slocum, J. (1972). Generating English discourse from semantic networks. Communications of the

ACM, 15(10), 891-905.Simmons, R.F., Burger, J.F. e Schwarcz R.M. (1968). A computational model of verbal understanding. AFIPS

Conference Proceedings, 33, 441-456.Sistemi Intelligenti (1991). Numero monografico su Logica e Intelligenza Artificiale, 3(1).Skinner, B.F. (1953). Science and Human Behavior. Macmillan, New York. Estratti in Block (1980).Smart, J. (1959). Sensations and brain processes. Philosophical Review, 68, 141-56.

Page 166: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

10

Smith, B. (1982). Prologue to 'Reflection and Semantics in a Procedural Language'. In Brachman e Levesque (1985),31-40.

Smith, E.E. e Medin, D.L. (1981). Categories and Concepts. Harvard Univ. Press, Cambridge, Mass.Smolensky, P. (1988). On the proper treatment of connectionism. Behavioral and Brain Sciences, 11, 1-74. Trad. it.: Il

Connessionismo fra simboli e neuroni (a cura di M. Frixione), Marietti, Genova, 1992.Smullyan, R.M. (1968). First-Order Logic. Springer, New York.Somenzi, V. e Cordeschi, R. (a cura di) (1986). La filosofia degli automi. Boringhieri, Torino.Sowa, J. (a cura di) (1991). Principles of Semantic Networks. Exploration in the Representation of Knowledge. Morgan

Kaufmann, San Mateo, CA.Stalnaker, R.C. (1984). Inquiry. MIT Press, Boston, MA.Stalnaker, R.C. (1991). The problem of logical omniscience. Synthese, 89(3), 425-440.Tabossi, P. (1985). La rappresentazione mantale dei concetti. Giornale Italiano di Psicologia, XII(1), 45-70.Tabossi, P. (1988). Intelligenza naturale e intelligenza artificiale. Il Mulino, Bologna.Tarski, A. (1936). Der Wahrheitsbegriff in den formalisierten Sprachen. Studia Philosophica, 1, 261-405. Trad. ingl. in

Tarski (1956); trad. it. in F. Rivetti-Barbò (a cura di), L'antinomia del mentitore nel pensiero contemporaneo, daPeirce a Tarski, Vita e Pensiero, Milano, 1961.

Tarski, A. (1956). Logic, Semantics, Metamathematics. Oxford University Press, Oxford.Thomason, R. (1974). Introduzione a Montague (1974).Thomason, R. (1977). Indirect discourse is not quotational. The Monist, 60, 340-354.Thomason, R. (1979). Some limitations to the psychological orientation in semantic theory. Manoscritto inedito.Thomason, R.H. (1980). A note on syntactical treatments of modality. Synthese, 44, 391-5.Thomason, R. (1986). Pardoxes and semantic representation. Proc. TARK-86, 225-239.Thomason, R. (1988). Philosophical logic and artificial intelligence. Journal of Philosophical Logic, 17(4), 321-327.Thomason, R. (1990). Propagating epistemic coordination through mutual defaults. Proc. TARK-90, 29-39.Thomason, R. (1991a). Knowledge representation and knowlegde of words. Proc. of Workshop on Lexical Semantics

and Knowledge Representation, University of California, Berkley, 1-8Thomason, R. (1991b). Logicism, AI, and common sense: John McCarthy's program in philosophical perspective. In V.

Lifschitz (a cura di), Artificial Intelligence and Mathematical Theory of Computation, Academic Press, Boston.Thomason, R. (1992). NETL and the subsequent path-based inheritance theories. Computers and Mathematics with

Applications, 23(5), 205-221. Anche in Lehmann (1993).Thomason, R. e Horty, J. (1988). Logics for inheritance theory. In Reinfrank et al. (1988).Thomason, R., Horty, J. e Touretzky, D. (1986). A calculus for inheritance in monotonic semantic nets. Tech. Report #

CMU-CS-86-138, Department of Computer Science, Carnagie Mellon University.Thomason, R., Horty, J. e Touretzky, D. (1987). A calculus for inheritance in monotonic semantic nets. In R. Zas e R.

Zemankova (a cura di), Methodologies for Intelligent Systems, North Holland, Amsterdam, 280-7.Touretzky, D.S. (1986). The Mathematics of Inheritance Systems, Pitman, Londra.Turing, A. (1936-37). On computable numbers, with an application to the Entscheidungsproblem. Proceedings of the

London Mathematical Society, serie 2, 42, 230-365, 43, 544-46. Anche in M. Davis (a cura di), The undecidable,Raven Press, New York, 1965.

Turing, A. (1950). Computing machinery and intelligence. Mind, 59, 433-60. Anche in Collins e Smith (1988). Trad. it.in Somenzi e Cordeschi (1986).

van Benthem, J. (1983). The Logic of Time. Reidel, Dordrecht e Boston.Vardi, M. (1985). A model-theoretic analysis of monotonic knowledge. In Proc. 9th IJCAI, Los Angeles, CA, 509-512.Vardi, M. (1986). On epistemic logic and logical omniscience. In Proc. TARK-1986, Monterey, CA, 293-305.Vardi, M. (a cura di) (1988). Theoretical Aspects of Reasoning about Knowledge. Atti del secondo convegno. Morgan

Kaufmann, Los Altos, CA.Vardi, M. (1989). On the complexity of epistemic reasoning. Proc. 4th IEEE Symposium on Logic in Computer Science,

New York, 243-252.Vilain, M. (1985). The restricted language architecture of a hybrid representation system. Proc. 9th IJCAI, 547-551Vilain, M. e McAllester, D. (1983). Assertions in NIKL. BBN Report n. 5421, 45-80Wason, P.C. e Johnson-Laird, P.N. (1972). The Psychology of Reasoning, Harvard University Press, Cambridge, Mass.

Trad. it.: Psicologia del ragionamento, Martello-Giunti, 1977.Webber, B.L. e Nilsson, N.J. (a cura di) (1981). Readings in Artificial Intelligence. Morgan Kaufmann, Los Altos, CA.Wilks, Y. e Fass, D. (1992). The preference semantics family. Computers and Mathematics with Applications 23(5),

205-221. Anche in Lehmann (1993).Winograd, T. (1973). A procedural model of language understanding. In R.C. Schank e K. Colby (a cura di), Computers

Models of Thought and Language, Freeman & Co., San Francisco.Winograd, T. (1975). Frame representation and the declarative/procedural controversy. In D.G. Bobrow e A.M. Collins,

Representation and Understanding: Studies in Cognitive Science, Academic Press, New York. Anche inBrachman e Levesque (1985).

Page 167: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

Frixione Bibliografia

11

Winston, P.H. (1970). Learning structural descriptions from examples. Project MAC TR-76, MIT, Cambridge, Mass.Winston, P.H. (1975). Learning structural descriptions from examples. In P.H. Winston (a cura di), Psychology of

Computer Vision, McGraw-Hill, New York. Anche in Brachman e Levesque (1985).Wittgenstein, L. (1956). Philosophische Untersuchungen. Blackwell, Oxford. Trad. it.: Ricerche filosofiche, Einaudi,

Torino, 1968.Wittgenstein, L. (1958). The Blue and Brown Books. Blackwell, Oxford. Trad. it.: Libro blu e libro marrone, Einaudi,

Torino, 1983.Woods, W. (1975). What's in a link: foundations for semantic networks. In D. Bobrow e A. Collins (a cura di),

Representation and Understanding, Academic Press, New York. Anche in Brachman e Levesque (1985) e inCollins e Smith (1988).

Woods, W. (1980). Procedural semantics as a theory of meaning. In A.K. Ioshi, B.L. Webber e I.A. Sag (a cura di),Elements of Discourse Understanding, Cambridge University Press, Cambridge.

Woods, W. (1983). What is important about knowledge representation? IEEE Computer, 16(10), 22-27.Woods, W. e Schmolze, J. (1992). The KL-ONE family. Computers and Mathematics with Applications 23(5), 133-

178. Anche in Lehmann (1993).Zadeh, L.A. (1971). Quantitative fuzzy semantics. Information Sciences, 3, 159-176.Zadeh, L.A. (1975). Fuzzy logic and aproximate reasoning. Synthese, 38, 407-428.Zanaboni, A.M. (1992). Reasoning about knowledge. Notes of Rohit Parikh's lecture. AILA Preprint, 12.

Page 168: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

1

Contesti di credenza e onniscienza logica

Marcello Frixione

Frege in “Senso e significato” mise in luce come il principio di sostituibilità salva veritate fallisca neldiscorso indiretto: se nell’enunciato (vero) “Galileo dice che la terra gira” sostituisco “la terra gira” con unaltro enunciato avente lo stesso riferimento (ossia, lo stesso valore di verità), non è detto che l’enunciato cheottengo sia ancora vero. Ad esempio, “l’acqua ha composizione chimica H2O” ha lo stesso riferimento di “laterra gira” (sono entrambi veri). Ma “Galileo dice che l’acqua ha composizione chimica H2O” èpresumibilmente falso. La soluzione proposta da Frege consiste nell’assumere che, nel discorso indiretto, “leparole non hanno il loro significato [Bedeutung] ordinario, ma stanno per quello che solitamente è il lorosenso. Per brevità diremo che nel discorso indiretto le parole vengono usate indirettamente, ovvero hanno unsignificato indiretto” (Frege 1892, p. 35 della trad. it.). Ossia, le espressioni linguistiche nel discorso indirettonon denotano quello che è il loro usuale riferimento, bensì il loro senso. La ragione, da un certo punto divista, è intuitiva: in un enunciato come “la terra gira” ci si riferisce alla terra e, asserendolo, ci si impegnasulla sua verità; in un enunciato come “Galileo dice che la terra gira” non ci si riferisce alla terra, bensì a ciòche ha detto Galileo, al pensiero che egli ha espresso. Perciò nel secondo enunciato l’espressione “la terragira” non si riferisce al suo riferimento usuale, ma al suo senso.

Considerazioni di questo tipo non valgono solo per il discorso indiretto in senso stretto. Il principio disostituibilità salva veritate fallisce anche per altri tipi di contesti indiretti, quali ad esempio i contestiepistemici (quelli generati da verbi come sapere o credere)1, i contesti modali aletici (quelli generati daespressioni come è possibile che o è necessario che), i contesti deontici (quelli generati da espressioni comeè obbligatorio o è lecito), i controfattuali, i contesti temporali, e così via.

La soluzione di Frege fu criticata da Carnap (1947), in quanto comporterebbe una proliferazione dientità semantiche diverse (nei contesti indiretti le espressioni linguistiche dovrebbero avere un sensoindiretto, e così via). La soluzione proposta da Carnap tuttavia è in un certo senso parente di quella fregeana:egli propone di modificare il principio di sostituibilità salva veritate, per così dire contestualizzandolo: in uncontesto indiretto sono sostituibili salva veritate quelle espressioni che hanno non lo stesso riferimento, bensìla stessa intensione (assumo qui per semplicità che la nozione carnapiana di intensione possa essereconsiderata una ricostruzione razionale della nozione fregeana di senso).

La proposta di Carnap è stata alla base dell’estensione della semantica modellistica al trattamento dellelogiche modali, che, a partire dalla semantica per la logica modale sviluppata in Meaning and Necessity, haportato allo sviluppo della semantica intensionale kripkeana dei mondi possibili e alla sua generalizzazionenella logica intensionale di Montague.

Anche la semantica kripkeana dei mondi possibili tuttavia fallisce nel caso dei contesti di credenza, incui in generale espressioni di uguale intensione non risultano sostituibili salva veritate. A ciò è legato ilproblema dell’onniscienza logica, ossia il problema di individuare modelli logici del ragionamentoepistemico in cui le credenze dei soggetti non siano chiuse rispetto alla relazione di conseguenza logica. Inquesto capitolo verranno presentate alcune proposte per sviluppare modelli del ragionamento epistemico chesuperino tali difficoltà. Le analisi alla base di tali proposte mettono in luce come la mancanza di onniscienzalogica e il fallimento della sostituibilità salva veritate di espressioni equiintensionali nei contesti epistemicisiano fenomeni complessi, che devono essere ricondotti a cause diverse.

1 Talvolta il termine contesti epistemici viene riservato ai soli contesti di conoscenza, mentre per i contesti di credenzasi parla di contesti doxastici. Qui tuttavia indicherò come contesti epistemici sia gli uni che gli altri.

Page 169: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

2

1. Contesti indiretti, mondi possibili e logiche della credenza2

L’idea che sta alla base della semantica dei mondi possibili per le logiche modali così come èstata sviluppata da Saul Kripke3 consiste nel prendere in considerazione, per la valutazione deglienunciati in cui compaiono operatori modali, stati di cose diversi dal mondo reale. Tali stati di cosevengono detti appunto mondi possibili (nel seguito userò talvolta più semplicemente l’espressionemondi). Nel caso delle logiche modali aletiche, un mondo possibile può essere concepito come unasituazione controfattuale, ossia come uno stato di cose alternativo rispetto al mondo reale(ovviamente anche il mondo reale è un mondo possibile). Gli enunciati necessariamente veri sonoquegli enunciati che, oltre a essere veri nel mondo reale, sono veri anche in tutti i mondi possibiliche si possono concepire nel mondo reale.

Nella semantica di Kripke questa idea è formalizzata per mezzo di strumenti insiemistici. Imondi possibili sono elementi w di un insieme W di mondi. Poiché ciascun w ∈ W corrisponde a unpossibile stato di cose, ogni w comporta l’assegnazione di un valore di verità (vero o falso) aciascuno degli enunciati atomici del linguaggio. (Dato che nel seguito ci occuperemoesclusivamente di logica proposizionale, possiamo identificare gli enunciati atomici con lettereenunciative p, q, …). Un aspetto importante è che i mondi possibili corrispondono a stati completi ecoerenti dell’universo. Vale a dire, ciascun mondo assegna uno e un solo valore di verità a ognilettera enunciativa del linguaggio. Non può accadere cioè che in un mondo a una lettera enunciativanon sia assegnato alcun valore di verità, così come non può accadere che un mondo sia incoerente,ossia che assegni alla stessa lettera enunciativa valori di verità diversi.

Nella semantica dei mondi possibili un enunciato del tipo “è necessario che α”4 (in simboli,Lα) è vero rispetto a un mondo w se e solo se α è vera in tutti i mondi possibili che sono accessibilida w, cioè, intuitivamente, in tutti quei mondi possibili che possono essere concepiti nel mondo w.

Quali siano i mondi possibili che possono essere concepiti a partire da un mondo w vieneformalizzato introducendo una relazione R di accessibilità tra mondi. R è appunto una relazione tramondi, vale a dire è un sottoinsieme del prodotto cartesiano W × W, dove W è l’insieme di tutti imondi possibili. Dato un mondo w, sono accessibili da w tutti quei mondi w’ tali che R(w, w’).Quindi, una formula Lα è vera nel mondo w se e solo se α è vera in tutti i w’ tali che R(w, w’).

Ponendo restrizioni diverse sulla relazione di accessibilità (imponendo ad esempio che essasia transitiva, oppure riflessiva, euclidea, eccetera) si ottengono logiche modali differenti, in cuirisultano valide formule modali diverse5. La logica modale più debole basata sulla semantica diKripke è quella in cui si assume che R possa essere una relazione qualunque. Tale logica viene dettaK. In essa risultano valide tutte le formule del tipo:

(AD) Lα ∧ L(α → β) → Lβ

La formula (AD) (di solito usata come assioma per K) viene detta abitualmente assiomadistributivo. Essa risulta valida perché, dato un qualsiasi mondo w, vale quanto segue:

2 In questo capitolo mi occuperò soltanto di un aspetto specifico relativo ai contesti di credenza, ossia il problemadell’onniscienza logica, legato a sua volta alla sostituibilità salva veritate di enunciati nei contesti epistemici. Lo studiodei contesti di credenza coinvolge moltissimi altri aspetti, quali ad esempio il ragionamento sulla conoscenza,l’interazione tra agenti, i rapporti con la teoria dei giochi, i rapporti tra ragionamento epistemico e inferenze nonmonotòne. In (Fagin et al. 1995) e (Levesque e Lakemeyer 2001) sono trattati vari di questi temi. Un punto diriferimento sui diversi aspetti della ricerca sui contesti di credenza sono i convegni TARK – Theoretical Aspects ofRationality and Knowledge (http://www.tark.org/); (Gilboa 1998) e (van Benthem 2001) sono gli atti delle ultime dueedizioni.3 (Kripke 1963); sulla semantica di Kripke per le logiche modali cfr. ad es. Chellas (1980) e Hugues e Cresswell (1996).4 Seguirò la convenzione di indicare con lettere greche minuscole (α, β, …) formule generiche, mentre indicherò conlettere latine minuscole (p, q, …) specifiche lettere enunciative.5 Si vedano ad esempio Chellas (1980) e Hugues e Cresswell (1996).

Page 170: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

3

(a) se Lα è vera in w, allora α è vera in tutti i mondi w’ accessibili da w;(b) se L(α → β) è vera in w, allora in tutti i mondi w’ accessibili da w è vera α → β; cioè, in

tutti i mondi w’ accessibili da w, α è falsa oppure β è vera.

Da (a) e da (b) segue che, se in w sono vere Lα e L(α → β), allora β è vera in tutti i mondi w’accessibili da w, per cui Lβ è vera in w.

In K si ha inoltre che, se α è una formula valida, risulta valida anche Lα. Questo perché, se αè valida, allora α è vera in tutti i mondi di W. Quindi, dato qualunque mondo w, si avrà che α è verain tutti i mondi possibili accessibili da w. Su questo si basa la regola di necessitazione:

α______

Ossia, se è possibile derivare α utilizzando esclusivamente assiomi logici, allora è possibilederivare Lα.

Poiché K è la logica più debole basata sulla semantica di Kripke, ne segue che assiomadistributivo e regola di necessitazione valgono in tutte le logiche modali basate su questo tipo disemantica6.

Sia {v, f} l’insieme dei valori di verità vero e falso. Possiamo definire l’intensione di unaformula α come una funzione di tipo W → {v, f}, ossia una funzione che associa a ciascun mondopossibile in W un valore di verità. In particolare, l’intensione di α sarebbe una funzione che, perciascun mondo wi preso come argomento, produce come valore v se α è vero in wi, e produce f se αè falsa in wi. In modo del tutto analogo, si può identificare l’intensione di α con l’insieme dei mondiwi in cui α è vera; dato un enunciato α, indicherò con Int(α) tale insieme.

In base a questa definizione, si può constatare che due enunciati sono sostituibili salvaveritate in un contesto modale aletico se hanno la stessa intensione, rispettando così l’intuizionecarnapiana. La definizione di intensione di un enunciato come funzione da mondi possibili a valoridi verità può essere generalizzata ad altre categorie sintattiche. Ad esempio, l’intensione di untermine individuale può essere vista come un funzione da mondi possibili a individui del dominio,l’intensione di un simbolo predicativo ad un argomento come una funzione da mondi possibili asottoinsiemi del dominio, e così via. In generale, l’intensione di un’espressione può essere vistacome una funzione da mondi possibili a estensioni del tipo appropriato7.

In un contesto modale risultano così sostituibili salva veritate tutte le espressioni dotate dellastessa intensione. Infatti se due espressioni linguistiche e ed e’ hanno la stessa intensione, allora ilriferimento di e è lo stesso del riferimento di e’ in tutti i mondi possibili. Di conseguenza, se laformula α’ è ottenuta da una formula α sostituendovi tutte le occorrenze di e con e’, allora α’ èvera in tutti i mondi in cui è vera α. In particolare, per ogni mondo w, se α’ è vera in tutti i mondiw’ accessibili da w, anche α’ è vera in tali mondi.

La semantica di Kripke ha dato buoni risultati, oltre che per le logiche modali aletiche, ancheper la formalizzazione logica di altri contesti indiretti, quali ad esempio i contesti temporali edeontici. Difficoltà sorgono invece nel caso dei contesti epistemici. Il tentativo di impiegare la 6 Si noti che in K può succedere che una formula come L(α ∧ ¬ α) sia vera in qualche mondo w. Ciò accade quando daw non è accessibile alcun mondo possibile (questo è infatti l’unico caso in cui α ∧ ¬ α può essere vera in tutti i mondiaccessibili da w). Se tuttavia in w è vera L(α ∧ ¬ α), allora in w è vera Lβ per qualunque formula β del linguaggio. Perevitare ciò basta imporre che da ogni mondo w sia accessibile almeno un mondo possibile. Sul piano sintattico, questoequivale ad aggiungere come assioma ¬ L(α ∧ ¬ α). Tale assioma viene detto usualmente assioma P, e la logica che siottiene a partire da K imponendo che da ciascun mondo possibile sia sempre accessibile almeno un mondo viene dettasistema KP.7 Questa generalizzazione della nozione di intensione si ha con i lavori di Richard Montague (1974).

Page 171: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

4

semantica kripkeana dei mondi possibili per la formalizzazione dei contesti epistemici si deve aJakko Hintikka (1962, 1971)8. Nel caso delle logiche epistemiche, la semantica a mondi possibili sibasa sull’idea intuitiva che, in ogni mondo possibile, ad un soggetto epistemico sia associato(tramite la relazione R di accessibilità) l’insieme di mondi che corrispondono a tutte le situazionicompatibili con le sue credenze (o conoscenze). Ad esempio, un soggetto epistemico può credereche la capitale d'Italia sia Roma e la capitale degli Stati Uniti sia New York; in tal caso in tutti imondi possibili compatibili con le sue credenze saranno veri gli enunciati "la capitale d'Italia èRoma" e "la capitale degli Stati Uniti è New York". Se lo stesso soggetto non ha alcuna opinioneriguardo alla capitale della Svizzera, in alcuni dei mondi compatibili con le sue credenze sarà verol'enunciato "la capitale della Svizzera è Zurigo", in altri "la capitale della Svizzera è Ginevra", ecosì via. In simboli, esprimiamo “è creduto che …” con l’operatore proposizionale B. Affinché siavero che è creduto un enunciato α, cioè sia vero Bα, occorre che α sia vero in tutti i mondi che ilsoggetto epistemico considera possibili. In questi termini, la logica K può essere interpretata comeuna logica epistemica: si tratta della più debole logica della credenza che può essere catturata con lasemantica di Kripke.

Per quanto riguarda la logica della conoscenza, esprimiamo “è conosciuto che …” conl’operatore proposizionale K. Tornando all'esempio precedente, un soggetto epistemico può credereche "la capitale degli Stati Uniti è New York", ma non può sapere che "la capitale degli Stati Uniti èNew York", in quanto tale enunciato è falso nel mondo reale. Vale a dire, affinché si sappia che α,α deve essere vero nel mondo reale. Dunque, in termini di mondi possibili, affinché in un mondo wsia vero che è conosciuto un enunciato α (ossia, sia vero Kα,), α deve essere vero, oltre che in tutti imondi compatibili con le credenze dal soggetto epistemico, anche nel mondo reale. Ciò si puòottenere imponendo che ogni mondo w sia accessibile da sé stesso, ossia, imponendo che larelazione di accessibilità tra mondi R sia riflessiva: per ogni w, si deve avere R(w, w). La logica chesi ottiene da K imponendo il vincolo che la relazione di accessibilità sia riflessiva viene detta T.Un’assiomatizzazione corretta e completa di T si ottiene aggiungendo all’apparato deduttivo di K(formulato nei termini dell’operatore di conoscenza K) l’assioma Kα → α9. Nel seguito di questocapitolo ci occuperemo comunque esclusivamente di logiche della credenza.

La semantica dei mondi possibili presenta severi limiti nel trattamento delle logicheepistemiche. Il problema consiste nel fatto che, in generale, nei contesti epistemici non sonosostituibili salva veritate espressioni con la stessa intensione (per questa ragione Cresswell (1975)parla di contesti iperintensionali). Ad esempio, possiamo assumere che i nomi propri “Linneo” e“Carl von Linné” abbiano la stessa intensione. Tuttavia dalla verità di “Roberto crede che Linneoabbia scritto il Sistema naturae” non segue la verità di “Roberto crede che Carl von Linné abbiascritto il Sistema naturae” per la semplice ragione che Roberto potrebbe non sapere che Linneo eCarl von Linné sono la stessa persona. O ancora, se assumiamo che le verità aritmetiche sianonecessarie, allora tutti gli enunciati aritmetici veri hanno la stessa intensione. Ma, se α e β sono dueenunciati aritmetici veri, da “Rina sa che α” non segue in generale “Rina sa che β” (α potrebbeessere “2 + 2 = 4”, mentre β potrebbe essere un complicato teorema di teoria dei numeri). Inparticolare, tutte le verità logiche hanno la stessa intensione, in quanto sono vere in tutti i mondipossibili. Pertanto se un soggetto epistemico crede, ad esempio, una qualunque tautologiaproposizionale, ne segue che egli deve credere ogni tautologia. In altri termini in una logicaepistemica basata sulla semantica di Kripke vale la regola di necessitazione formulata per glioperatori epistemici. Analogamente, per le ragioni viste più sopra, l’insieme delle credenze diqualunque soggetto epistemico risulta chiuso rispetto alla relazione di conseguenza logica: unsoggetto epistemico è tenuto a credere tutte le conseguenze logiche delle sue credenze. In unasemantica kripkeana per la logica epistemica vale infatti la versione epistemica dell’assioma

8 La formulazione in termini di mondi possibili si trova in (Hintikka 1971); in (Hintikka 1962) la semantica per lalogica epistemica è formulata in maniera sostanzialmente equivalente per mezzo di strutture semantiche dette model set.9 Si noti che in T diventa superfluo introdurre l’assioma P.

Page 172: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

5

distributivo (AD). In altri termini, nella semantica di Kripke per la logica epistemica i soggetti dicredenza sono logicamente onniscienti. Tale assunzione di onniscienza logica è un’idealizzazionedecisamente poco realistica delle capacità inferenziali dei soggetti epistemici reali.

Sono state sviluppate diverse proposte per superare queste difficoltà. Partendo dallaconstatazione che le intensioni forniscono un’analisi troppo grossolana per rendere conto delleprestazioni inferenziali dei soggetti epistemici, in ambito filosofico la soluzione è stata spessocercata nell’individuazione di un livello di analisi semantica di grana più fine, allo scopo di definireuna classe di entità semantiche che garantissero la sostituibilità salva veritate nell’ambito deicontesti epistemici. A partire dalle idee di Carnap sulla distinzione tra intensione e strutturaintensionale (Carnap 1947, §§14-15), i tentativi di elaborare un trattamento logico più soddisfacentedei contesti epistemici hanno seguito vie differenti. In anni recenti probabilmente gli sviluppi piùestesi e sistematici si sono avuti in ambito computazionale, nel contesto della rappresentazione dellaconoscenza di impostazione logica in intelligenza artificiale. Nei prossimi paragrafi presenterò leprincipali di tali proposte10.

2. Modelli minimali e ragionamento epistemico

La semantica dei cosiddetti modelli minimali (o neighborood models, o modelli di Scott-Montague)11 consente di indebolire l'assunzione di onniscienza logica rimanendo nell’ambito dellasemantica dei mondi possibili. L’idea, in breve, è la seguente. Abbiamo visto che nella semantica amondi possibili l’intensione di un enunciato α coincide con il sottoinsieme Int(α) di W costituito daimondi in cui α è vero. In un modello minimale una funzione N associa a ciascun mondo possibile wun insieme N(w) di intensioni (ossia, di sottoinsiemi di W). In ciascun mondo w il soggettoepistemico crede tutti e soli gli enunciati la cui intensione è in N(w). Pertanto, una formula del tipoBα è vera in un mondo w se e soltanto se Int(α) ∈ N(w). L’insieme delle intensioni associate a unmondo w può essere del tutto arbitrario: nessuna ipotesi viene formulata sulle proprietà dellafunzione N.

Di conseguenza, la logica definita dalla classe dei modelli minimali non è chiusa rispetto allaconseguenza logica: se in un mondo w è creduto α, e se β è conseguenza logica di α, non è dettoche sia creduto β, in quanto può darsi il caso che Int(α) ∈ N(w) ma Int(β) ∉ N(w). Dato però chedue enunciati α e β logicamente equivalenti hanno stessa intensione, se in un mondo è creduto uno,allora è creduto anche l'altro12.

Se non si pongono condizioni sulla funzione N si ha una logica in cui le capacità inferenzialidei soggetti epistemici sono praticamente nulle. Indicheremo con E questa logica. Per ottenere unaassiomatizzazione corretta e completa di E basta aggiungere all’apparato deduttivo della logica

10 Per una rassegna dei vari modelli sviluppati in ambito filosofico si veda (Bäuerle e Cresswell 1988), una trattazionepiù recente che tiene conto anche dei modelli di orientamento computazionale descritti nel seguito di questo capitolo è(Meyer 2001); per i modelli descritti nei §§ 2-5 cfr. anche (Frixione 1994).11 (Montague 1968), (Scott 1970); cfr. (Chellas 1980) per i dettagli tecnici; per un impiego dei modelli minimali nelragionamento di tipo epistemico vedi anche (Vardi 1986), e, più avanti, il § 5.3.12 Dato che l’intensione di una qualsiasi tautologia coincide con l’insieme W di tutti i mondi possibili, se W ∉ N(w),allora in w il soggetto epistemico non crede alcuna tautologia. Se però in un mondo si crede una tautologia, allora sicredono tutte le tautologie. Non vale tuttavia la regola di necessitazione. Possono anche essere credute dellecontraddizioni: dato che l'intensione di una contraddizione è l’insieme vuoto, se ∅ ∈ N(w), allora in w sono credutetutte le contraddizioni. Inoltre, possono essere creduti due enunciati che si contraddicono tra loro senza che sia credutauna contraddizione: affinché in un mondo w siano vere Bα e B¬α senza che al tempo stesso sia vero B(α ∧ ¬α) bastache Int(α) ∈ N(w) e Int(¬α) ∈ N(w) ma che al tempo stesso ∅ ∉ N(w) (si noti che Int(¬α) è il complemento di Int(α)rispetto a W). Analogamente non vale la chiusura delle credenze rispetto al condizionale, in quanto non è valida laformula Bα∧ B(α→β) → Bβ. Può capitare infatti che Int(α) ∈ N(w), Int(α→β) ∈ N(w), ma che allo stesso tempo Int(β)∉ N(w). Per ragioni analoghe, non sono valide B(α ∧ β) → Bα ∧ Bβ e Bα ∧ Bβ → B(α ∧ β). Infine, è possibile che inun mondo w non sia creduto alcun enunciato; basta che N(w) = ∅ (ovviamente, N(w) = ∅ è ben diverso da ∅ ∈ N(w)).

Page 173: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

6

proposizionale classica una regola in base a cui, se α ↔ β è un teorema della logica, allora se nepuò derivare Bα ↔ Bβ. In altri termini, nella logica E l’unico vincolo sulle credenze di un soggettoepistemico consiste nel fatto che, se il soggetto crede un enunciato, allora è tenuto a credere tutti glienunciati ad esso logicamente equivalenti.

Logiche diverse, che vincolano maggiormente il comportamento dell’operatore di credenza B,possono essere ottenute restringendo il comportamento della funzione N. Chiamiamo ad esempioEM la logica che si ottiene a partire da E imponendo che valga la proprietà di chiusura rispetto aisoprainsiemi, ossia che, per ogni mondo w e per tutti gli insiemi di mondi X e Y, se X ⊂ Y e se X ∈N(w), allora Y ∈ N(w). (Oppure, in maniera equivalente, che, se X ∩ Y ∈ N(w), allora X ∈ N(w) e Y∈ N(w)). Si vede facilmente che in EM risulta valido:

(AM) B(α ∧ β) → Bα ∧ Bβ

Un’assiomatizzazione corretta e completa di EM si può ottenere aggiungendo (AM) agliassiomi di E.

Analogamente, la proprietà di chiusura rispetto all’intersezione, in base alla quale per ognimondo w e per ogni X, Y ⊂ W, se X ∈ N(w) e Y ∈ N(w), allora X ∩ Y ∈ N(w), equivale all’assioma:

(AC) Bα ∧ Bβ → B(α ∧ β)

Chiameremo EC la logica dei modelli minimali in cui vale la chiusura rispettoall’intersezione.

La proprietà di esistenza dell’unità, in base a cui, per ogni mondo possibile w, W ∈ N(w),equivale alla validità dell’assioma:

(AN) B (α ∨ ¬ α)

Chiameremo EN la logica dei modelli minimali in cui vale la proprietà di esistenza dell’unità.Chiameremo infine EMCN la logica dei modelli minimali chiusi rispetto ai soprainsiemi,

rispetto all’intersezione e dotati di unità. Una assiomatizzazione corretta e completa per EMNC siottiene aggiungendo all’apparato deduttivo di E gli schemi di assiomi (AM), (AC) e (AN). Si puòdimostrare che EMCN è equivalente alla logica K del paragrafo precedente. Quindi la semanticadei modelli di credenza costituisce una generalizzazione di quella dei modelli di Kripke.

Alcune logiche dei modelli minimali hanno proprietà interessanti dal punto di vistaepistemico (si veda ad esempio il sistema descritto nel §5.3). Tuttavia, il fatto che enunciatilogicamente equivalenti non siano distinguibili dal punto di vista del ragionamento epistemico èancora una idealizzazione troppo forte per poter concludere che, con i modelli di credenza, si siafatto un significativo passo avanti nella soluzione del problema dell’onniscienza logica. Ciò dipendedal fatto che, in base alla semantica dei modelli minimali, nei contesti epistemici non si puòdistinguere tra enunciati con la stessa intensione.

3. Modelli sintattici delle credenze: il sistema di Konolige

Per superare le difficoltà che la semantica a mondi possibili presenta nei confronti deltrattamento logico degli operatori epistemici, un filone di ricerche si è orientato a identificare glioggetti di credenza con entità di tipo sintattico13. In questi modelli le credenze di un soggetto

13 Si noti che talvolta si usa l’espressione syntactic approach per indicare i modelli del ragionamento epistemico di tipocitazionale (quotational), nei quali cioè la credenza viene espressa per mezzo di predicati che assumono comeargomenti nomi di oggetti di credenza, anziché (come qui) tramite operatori proposizionali del tipo di B, che si

Page 174: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

7

epistemico sono fatte coincidere con un insieme di enunciati, o del linguaggio naturale, oppure diqualche forma di codice mentale interno, di “linguaggio del pensiero”. In particolare, varie propostesviluppate nell’ambito delle scienze cognitive e dell’intelligenza artificiale14 adottano la secondaalternativa. Senza entrare in particolari tecnici, in questo paragrafo descriverò schematicamente glielementi essenziali del modello proposto da Kurt Konolige (1986) mantenendo una terminologia ilpiù possibile conforme a quella del resto del capitolo.

La logica di Konolige modella situazioni in cui sono presenti più soggetti epistemici diversi.Ad ogni soggetto epistemico x viene associata una struttura di deduzione d(x) costituita da uninsieme b(x) di enunciati di un certo linguaggio logico (che può variare da soggetto a soggetto) e daun apparato deduttivo r(x) costituito da assiomi e regole di inferenza. L’insieme delle credenzeC(d(x)) del soggetto epistemico x è l’insieme degli enunciati derivabili dall’insieme b(x) mediantel'apparato deduttivo r(x). Sull’apparato deduttivo, che anch’esso può variare da soggetto a soggetto,non viene fatta alcuna ipotesi di completezza rispetto alla semantica della parte non epistemica dellinguaggio; anzi, le regole di derivazione possono essere formulate in modo da tenere conto dieventuali incompetenze del soggetto o di un impiego limitato di risorse. Konolige richiedecomunque che le regole siano corrette, siano effettive e stabili (nel senso che il numero delle loropremesse non può variare). Per rendere conto dell’iterazione degli operatori epistemici vengonointrodotti i punti di vista, ossia sequenze finite di soggetti epistemici. Ad esempio, se x e y sono duesoggetti epistemici, (x, y) è il punto di vista di x sulle credenze di y e d(x, y) è la struttura dideduzione ad esso associata, che è costituita dall’insieme di enunciati b(x, y) e dall’apparatodeduttivo r(x, y). L’insieme C(d(x, y)) rappresenta le credenze che x attribuisce a y (e che, ingenerale, saranno diverse da C(d(y))). Questo procedimento può essere iterato per tenere conto disequenze di operatori epistemici incapsulati di lunghezza arbitraria. Così, ad esempio, d(x, y, z) è lastruttura di deduzione che rappresenta ciò che x crede che y creda a proposito delle credenze di z. Ed(x, x) rappresenta le credenze di x a proposito delle sue stesse credenze.

Quindi, nel sistema di Konolige, a ciascun punto di vista v (cioè, a ciascuna sequenza finitadi soggetti epistemici) è associata una struttura di deduzione d(v), costituita dalla coppia (b(v), r(v)).Supponendo, per semplicità, che il linguaggio di tutte le strutture di deduzione sia lo stesso, illinguaggio del sistema sarà costituito, oltre che dagli usuali connettivi proposizionali15, da noperatori proposizionali di credenza Bi, uno per ciascun soggetto epistemico i.

Sul piano sintattico, una assiomatizzazione del modello di Konolige si ottiene aggiungendoall’apparato deduttivo della logica proposizionale classica un apparato deduttivo d(v) per ciascunpunto di vista e una regola, detta di collegamento procedurale, in base alla quale:

se da α1, α2, ..., αk si può dedurre β sulla base delle regole di d(i),allora da Bi α1, Bi α2,..., Bi αk si può dedurre Bi β.

Per trattare gli operatori di credenza iterati, gli apparati deduttivi per i vari punti di vista d(v)dovranno a loro volta contenere delle regole di collegamento del tipo:

se da α1, α2, ..., αk si può dedurre β sulla base delle regole di d(v, i)16,allora in d(v) da Bi α1, Bi α2,..., Bi αk si può dedurre Bi β.

applicano a formule (cfr. ad es. Thomason 1980; des Rivieres e Levesque 1986). I linguaggi di tipo citazionale hannoun potere espressivo maggiore di quelli basati su operatori proposizionali, e a certe condizioni possono dar luogo adinconsistenze. Il senso in cui si parla di modelli sintattici in questo paragrafo è diverso; i problemi legati ai modellicitazionali non vengono trattati, e sono in larga parte indipendenti dai temi di questo capitolo.14 Cfr. ad es. (Moore e Hendrix 1982).15 Si tenga presente che all’interno delle strutture di deduzione non è detto che in generale valga l’interdefinibilità deiconnettivi, per cui tutti i connettivi verofunzionali che si intendono impiegare devono essere inseriti nel linguaggio.16 Si noti che, se v è un punto di vista, allora, per ogni soggetto i, anche v, i è un punto di vista.

Page 175: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

8

La semantica del sistema riflette banalmente tale assiomatizzazione. La semantica della partenon modale del linguaggio è una usuale semantica classica per la logica proposizionale. Per quantoriguarda le formule modali, una formula del tipo Biα è vera se e soltanto se α appartiene all’insiemeC(d(i)) delle credenze del soggetto i-esimo, ossia se α è deducibile a partire dagli enunciati di b(i)mediante le regole di r(i) (queste ultime comprenderanno, in generale, anche le regole dicollegamento disponibili ai vari soggetti i, e ciò garantisce il trattamento degli operatori epistemiciiterati mediante il richiamo ai vari punti di vista).

Per gli approfondimenti tecnici rinvio a (Konolige 1986). Si noti soltanto che si puòdimostrare che, se gli apparati deduttivi associati a tutti i punti di vista sono completi dal punto divista proposizionale, e sono inoltre dotati di regole di collegamento per ogni punto di vista, allora lalogica delle strutture di deduzione è equivalente al sistema Kn, vale a dire, al sistema K esteso a nsoggetti epistemici.

Nei modelli sintattici di questo tipo il problema dell’onniscienza logica viene “risolto”adottando sistemi deboli di regole di inferenza. Il prezzo è però molto alto. Per un verso, lasemantica a mondi possibili è di grana troppo grossolana per modellare gli atteggiamentiproposizionali in quanto enunciati logicamente equivalenti risultano indistinguibili a prescinderedalla loro complessità sintattica. Per l’altro verso, i modelli sintattici hanno una grana troppo fine inquanto praticamente tutti gli enunciati risultano semanticamente distinti. Ad esempio, si può crederep ∨ q senza al contempo credere q ∨ p (in quanto “p ∨ q ” e “q ∨ p ” sono enunciati sintatticamentedistinti). Si può ovviare a questo inconveniente imponendo che ogni apparato deduttivo r(v)contenga una regola per cui da p ∨ q si può derivare q ∨ p. Tuttavia si tratta evidentemente di unasoluzione ad hoc, del tutto immotivata dal punto di vista semantico. Si potrebbe infatti continuarecon regole del tipo: da ¬¬p si può derivare p; da p e q si può derivare p ∧ q; in ogni b(v) devonofigurare tautologie ovvie come p → p. Ma quali tautologie sono ovvie? E, in generale, quandobisogna fermarsi nell’estendere l’espressività dei vari r(v)? Il modello non offre alcuna indicazionesulle scelte da effettuare per non smarrire, da un lato, ogni sistematicità nelle prestazioni inferenzialidegli agenti epistemici, e per non ricadere, dall’altro, in uno dei sistemi dei paragrafi precedenti, Ilproblema principale risiede nel fatto che la “semantica” di Konolige è tale solo in un senso moltodebole: il significato del sottoinsieme più problematico del linguaggio (ossia, le formule checompaiono nell’ambito degli operatori di credenza) viene definito semplicemente interpretando lestrutture del linguaggio su loro stesse.

4. La logica della credenza esplicita e implicita di Levesque

Un diverso modo di affrontare la questione è stato proposto da Hector Levesque17, e si basa suuna generalizzazione della semantica a mondi possibili che cerca di evitarne le conseguenzeindesiderate. Il problema con la semantica di Kripke sorge in quanto i mondi possibili sono coerenti(a ciascun enunciato associano al più un valore di verità) e completi (a ciascun enunciato associanoalmeno un valore di verità). La proposta di Levesque consiste essenzialmente nel sostituire i mondipossibili con altre entità semantiche, dette situazioni18, che possono essere incoerenti (alcunienunciati possono ricevere entrambi i valori di verità) o incomplete (alcuni enunciati possono nonricevere alcun valore di verità). Questo consente di elaborare modelli di ragionamento epistemico incui le credenze non siano chiuse rispetto alla conseguenza logica.

17 Si veda (Levesque 1984) e il cap. 12 di (Levesque e Lakemeyer 2001).18 Il termine situazione è stato ispirato a Levesque dalla terminologia della situation semantics (Barwise e Perry 1983).Anche le situazioni di Barwise e Perry, a differenza dei mondi della semantica modellistica, sono incomplete. Barwise(1981) le introduce per render conto degli enunciati percettivi, che presentano problemi analoghi agli enunciatiepistemici.

Page 176: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

9

Intuitivamente, l’uso di situazioni incomplete dovrebbe modellare la parte di realtà rilevanteper le credenze di un soggetto epistemico, lasciando indeterminato tutto il resto. “Si consideri – diceLevesque – la situazione in cui io siedo al mio terminale al lavoro. Potremmo dire che questasituazione giustifica il fatto che io sono al lavoro, che qualcuno è al mio terminale, che c’è un librooppure un terminale sulla mia scrivania, e così via. D’altro canto, essa non motiva l’opinione chemia moglie è a casa, che non è fuori a fare acquisti, e neppure l’opinione che essa è oppure non è acasa. Benché quest’ultimo fatto sia certamente vero, che io sieda al mio terminale non ha nulla ache fare con tutto ciò” (Levesque, 1984, p. 199). L’uso di situazioni incoerenti viene motivato sullabase del fatto che un soggetto epistemico può avere concezioni o informazioni sbagliate che loportano a credere possibili stati di cose che di fatto non lo sono.

Più in dettaglio, Levesque prende in considerazione due tipi di credenza, la credenzaimplicita, che ha a che fare con tutto ciò che è implicito nelle credenze di un soggetto (“comesarebbe il mondo se ciò che il soggetto crede fosse vero”) e che quindi è chiusa rispetto allaconseguenza logica, e la credenza esplicita, ossia tutto ciò che di fatto il soggetto ritiene vero. Nellinguaggio vengono quindi introdotti due operatori epistemici, uno per la credenza implicita e unoper la credenza esplicita, che indicheremo rispettivamente con B e E. Nella sua versione originaria,la logica di Levesque non prevede iterazioni degli operatori epistemici19.

Indichiamo con S l’insieme delle situazioni. Nella semantica per la logica della credenzaimplicita ed esplicita di Levesque, in ciascuna situazione s di S, a ogni lettera enunciativa p èassociato un sottoinsieme di {v, f}. Cioè, a differenza di quanto accade nei modelli di Kripke (in cuisi danno due soli casi: dato un mondo w, a p viene associato il valore v oppure il valore f), ora i casisono quattro: oltre ai due precedenti può accadere che a p in s sia associato l’insieme vuoto ∅ (ossiap non è né vera né falsa nella situazione s) e che a p in s sia associato l’insieme {v, f} (ossia p è siavera che falsa nella situazione s).

Si dice poi che una situazione s è un mondo se e solo se in s ogni lettera enunciativa riceveuno ed uno solo dei valori di verità (ossia sono mondi le situazioni coerenti e complete). Un ruoloimportante è svolto dall’insieme W(s) dei mondi compatibili con una data situazione s, definitocome l'insieme dei mondi w contenuti in S tali che, se p è vera in s, allora p è vera in w, e se p èfalsa in s, allora p è falsa in w. In altri termini, i mondi compatibili con s sono quelli che concordanocon s sulle lettere alle quali in s è attribuito un solo valore di verità (ossia i mondi di S checompletano la situazione s). Si ha immediatamente che se una situazione s è incoerente (ossia, perqualche p, a p è associato l’insieme {v, f}), allora W(s) = ∅ (nessun mondo è compatibile con s). SeS' è un insieme di situazioni (ossia, S' ⊆ S), allora si pone W(S') uguale all’unione dei W(s) tali che s∈ S'. Quindi, ad esempio, W(S) è l'insieme dei mondi contenuti in S.

Nella semantica della logica di Levesque al soggetto di credenza è associato un insieme C disituazioni: C è il sottoinsieme di S che comprende le situazioni che sono compatibili con le credenzedel soggetto epistemico (o, in altri termini, l’insieme delle situazioni che sono ritenute possibili dalsoggetto epistemico)20. Di conseguenza, in base alle definizioni precedenti, W(C) è l'insieme deimondi compatibili con le situazioni ritenute possibili dal soggetto epistemico.

Data una situazione s, non accade (come accadrebbe invece rispetto a un mondo w) che unaformula α è vera in s se e soltanto se α non è falsa in s: può capitare che α sia al contempo vera efalsa in s, o che non sia né vera né falsa. Per caratterizzare il valore di verità di una formula in unasituazione bisogna quindi trattare separatamente il caso in cui la situazione rende vera la formula equello in cui la rende falsa. Si avrà quindi, ad esempio, che:

• α è vera in una situazione s se e solo se ¬ α è falsa in s 19 Come vedremo più oltre, sono state in seguito sviluppate versioni di questa logica che ammettono l’iterazione deglioperatori di credenza.20 Rispetto alla semantica di Kripke, di cui questa costituisce un’evidente generalizzazione, l’insieme C svolge un ruoloanalogo a quello della relazione R di accessibilità. Non è necessario impiegare una relazione di accessibilità perché nonsono ammesse iterazioni degli operatori epistemici.

Page 177: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

10

• α è falsa in s se e solo se ¬ α è vera in s

• α ∧ β è vera in s se e solo se α e β sono entrambe vere in s• α ∧ β è falsa in s se e solo se almeno una tra α e β è falsa in s

• α → β è vera in s se e solo α è falsa oppure β è vera in s• α → β è falsa in s se e solo α è vera e β è falsa in s

e così via. Nella logica classica (come nel caso in cui tutte le situazioni s sono mondi corretti ecompleti) la seconda clausola di ognuna di queste coppie diventa ridondante. Non è così invece, perle ragioni esposte sopra, nel caso generale della logica di Levesque.

La parte non modale del linguaggio viene valutata in modo classico; vale a dire, si assume cheil mondo reale sia appunto un mondo, sia cioè corretto e completo. Le situazioni svolgono un ruolosolo nella valutazione delle formule che compaiono nell’ambito degli operatori di credenza. Essesono usate soltanto per modellare gli stati cognitivi dell’agente epistemico. In particolare, si avràche una formula di tipo Eα (dove E è l’operatore di credenza esplicita) è vera se e solo se α è verain tutte le situazioni s che appartengono a C21. Per quanto riguarda l’operatore di credenza implicita,una formula del tipo Bα è vera se e soltanto se α è vera in tutte le situazioni s tali che s ∈ W(C),cioè in tutti i mondi compatibili con le situazioni ritenute possibili dal soggetto epistemico. Poichéle formule costruite per mezzo dell’operatore B vengono valutate esclusivamente rispetto a mondipossibili (quindi corretti e completi), B si comporta come un operatore modale classico. Si dimostrafacilmente infatti che la logica così definita, rispetto all'operatore B coincide con il sottoinsieme diK che non comprende modalità iterate.

Più interessante è il comportamento dell'operatore di credenza esplicita E. Si può verificare adesempio che può essere soddisfatto un insieme di formule del tipo: {Eα, E(α → β), ¬Eβ}.Supponiamo infatti che ogni situazione s di C renda vere α e α → β. Supponiamo tuttavia che vi siain C almeno una situazione s’ che rende α sia vera che falsa, e che rende falsa β. Anche s’ rendevere α e α → β (quest’ultima perché α è falsa). Di conseguenza, in base alle definizioni precedenti,risultano vere Eα e E(α → β) e falsa Eβ (e quindi vera ¬Eβ). Il soggetto cognitivo può quindicredere esplicitamente α e α → β senza al tempo stesso credere esplicitamente β. In altri termini,l’insieme delle credenze esplicite del soggetto epistemico non è chiuso rispetto al modus ponens.

In modo analogo si può constatare che non tutti gli enunciati (classicamente) validi devonoessere creduti esplicitamente. Ad esempio è soddisfacibile l'enunciato ¬ E(α ∨ ¬α): basta che vi siauna situazione s in C che non assegna a α alcun valore di verità. Così, se α è vero per ogni s in C,ma vi è una s' in C per cui β non ha alcun valore di verità in s’, allora è vero Eα, ma non è vero E(α∧ (β ∨ ¬β)). Può quindi accadere che non vengano creduti esplicitamente tutti gli enunciatilogicamente equivalenti a un enunciato creduto esplicitamente. Analogamente, si può credereesplicitamente una contraddizione senza che sia creduto esplicitamente qualsiasi enunciato.

Per quanto concerne le relazioni fra conoscenza esplicita e implicita, tutto ciò che è credutoesplicitamente è anche creduto implicitamente: è valida cioè la formula Eα → Bα22.

21 Ed Eα è falsa se e soltanto se Eα non è vera – si ricordi infatti che non sono ammesse modalità iterate, quindinessuna formula modale può comparire nell’ambito di un altro operatore modale, e non è pertanto necessario valutare leformule modali rispetto a situazioni che non siano mondi.22 Questo è evidente se si considera che, per ogni situazione s, se s è coerente, allora tutti i mondi in W(s) conservano ivalori di verità determinati da s; se invece s è incoerente, allora W(s) = ∅. Quindi, tutti gli enunciati che sono veri intutte le situazioni di C sono veri anche in tutti i mondi di W(C)). Inoltre, se un soggetto epistemico crede esplicitamenteuna contraddizione, allora crede implicitamente ogni enunciato: è valido cioè E(α ∧ ¬ α) →Bβ: se è vero E(α ∧ ¬ α),allora ogni s in C è incoerente, e quindi W(C) = ∅, per cui ogni enunciato è banalmente vero in tutti gli elementi diW(C).

Page 178: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

11

La logica di Levesque non prevede l’iterazione degli operatori epistemici. Uno sviluppo inquesto senso è stato proposto da Gerhard Lakemeyer23. Nella logica sviluppata da Lakemeyer visono due operatori epistemici, uno per la credenza esplicita (E) e uno per la credenza implicita (B),che possono essere iterati. Tuttavia si suppone che le credenze implicite di un soggetto non abbianoa che fare con i suoi stati cognitivi, per cui non si ammette che si possano avere credenze espliciterelativamente alle credenze implicite. Ossia, in termini sintattici, non vi possono essere occorrenzedell’operatore B nell’ambito dell’operatore E.

Nella semantica di Levesque il credere un enunciato è scorrelato dal credere la sua negazione,come se il soggetto epistemico usasse fonti di evidenza diverse per confermare o smentire glioggetti della sua credenza (esplicita). Pertanto, per estendere il modello al trattamento di operatoriepistemici iterati, Lakemeyer introduce due relazioni distinte R' e R" di accessibilità fra situazioni.In una certa situazione s è vero che è creduto esplicitamente un enunciato α (cioè, è vero Eα) se esolo se α è vero in tutte le situazioni accessibili da s rispetto alla relazione R', mentre è falso che ècreduto esplicitamente un enunciato α (e dunque è vero ¬ Eα) se è solo se è falso in qualchesituazione accessibile da s rispetto alla relazione R".

Come nella logica di Levesque, una situazione è un mondo w se e solo se è corretta ecompleta, vale a dire se ad ogni lettera proposizionale p viene assegnato in w uno ed un solo valoredi verità. Inoltre deve valere che, rispetto a ciascun mondo w, R' e R" devono coincidere (ossia, sideve avere che, per ogni s, R'(w,s) se e solo se R"(w,s)). Per quanto riguarda la credenza implicita,in una data situazione s è creduto che α (cioè, è vero Bα) se e solo se α è vero in tutti i mondiaccessibili da s (ed è falso che è creduto implicitamente α se e solo se non è vero che è credutoimplicitamente α).

Anche in questa logica le credenze esplicite non sono chiuse rispetto all’implicazione, glienunciati validi non devono essere creduti esplicitamente, un enunciato logicamente equivalente auno creduto esplicitamente può non essere creduto esplicitamente e si possono credereesplicitamente delle contraddizioni senza che sia creduto esplicitamente ogni enunciato. L’operatoreB di credenza implicita si comporta anche qui come un operatore modale classico24.

La logica che vale all’interno dei contesti di credenza esplicita nel sistema di Levesque (e neisistemi che ne derivano) ha forti legami con una logica della rilevanza, e precisamente con la logicadel tautological entailment di Anderson e Belnap25, alla quale Levesque si è ispirato. Diconseguenza, i soggetti epistemici nella logica di Levesque non sono logicamente onniscientirispetto alla logica classica, ma lo sono rispetto a un tipo di logica non classica (rispetto appuntoalla logica del tautological entailment).

La logica del tautological entailment (e quindi, di conseguenza, la logica che vale all’internodei contesti di credenza esplicita) ha però un’interessante caratteristica. E’ ben noto che nella logicaproposizionale classica il problema di decidere se una certa formula segue logicamente da uninsieme dato di formule non è trattabile computazionalmente (equivale infatti al problema didecidere se una formula proposizionale α è una tautologia, il che verosimilmente richiede, nelpeggiore dei casi, un numero di passi di calcolo che cresce esponenzialmente rispetto al numero dilettere enunciative diverse che compaiono in α). Nella logica del tautological entailment ilproblema di decidere la relazione di conseguenza logica ha caratteristiche computazionali

23 Lakemayer (1987). Lakemeyer (1994) estende questo tipo di logica anche al caso predicativo. Si veda anche il cap.12 di (Levesque e Lakemeyer 2001).24 Per la precisione, Lakemeyer (1987) richiede che, per tutti i mondi w e w' e per tutte le situazioni s, valga quantosegue: (a) se R'(w,w') e R'(w',s), allora R'(w,s) e (b) se R'(w,w') e R'(w,s), allora R'(w',s). La condizione (a) corrispondealla transitività e la condizione (b) all’euclidicità della relazione di accessibilità tra mondi nei modelli di Kripke: datoche R' e R" coincidono rispetto ai mondi, ciò comporta che l'operatore B di credenza implicita si comporti come nelsistema modale C5.25 (Anderson e Belnap 1962), (Belnap 1975, 1977).

Page 179: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

12

migliori26. Dunque, sebbene la logica della credenza esplicita di Levesque costituisca comunqueuna idealizzazione delle capacità inferenziali dei soggetti epistemici reali (come si è detto, i soggettiepistemici sono logicamente onniscienti rispetto alla logica del tautological entailment), dal puntodi vista computazionale ciò costituisce una idealizzazione più realistica rispetto alle logicheepistemiche tradizionali27.

Uno sviluppo interessante di questo tipo di logiche che va in questa direzione è stato propostoda Marco Cadoli e Marco Schaerf (Schaerf e Cadoli 1995) che, a partire da una semantica del tipodi quella utilizzata da Levesque, hanno sviluppato un modello di inferenza approssimata per basi diconoscenza formulate nel linguaggio della logica proposizionale. Il modello si basa su duesuccessioni di relazioni di conseguenza logica, le prime sempre corrette, le seconde semprecomplete, che convergono verso la relazione di conseguenza logica proposizionale classica. Manmano che si procede lungo le due successioni, aumentano rispettivamente completezza ecorrettezza, e si ottengono quindi approssimazioni sempre migliori della relazione di conseguenzalogica classica. Quanto migliore è l’approssimazione ottenuta, tanto maggiore è lo “sforzocomputazionale” richiesto. Basandosi su questo stesso modello, Cadoli e Schaerf (1992) hannoelaborato una logica epistemica per ragionatori non onniscienti nella quale alle due successioni direlazioni di conseguenza logica sopra menzionate corrispondono due famiglie di operatoriepistemici. Tali operatori costituiscono approssimazioni via via più precise dell’operatore dicredenza classico, e corrispondono a vincoli computazionali più o meno restrittivi sulle capacitàinferenziali del soggetto di credenza.

Concludendo, si può osservare che il problema dell’onniscienza logica comprende almeno trediverse questioni:1) chiusura rispetto all’implicazione: se sono creduti α e α → β, allora è creduto β;2) chiusura rispetto alla conseguenza logica: se è creduto α, e α → β è valido, allora è creduto β;3) chiusura rispetto alle tautologie: sono credute tutte le tautologie.

Nelle logiche esaminate in questo paragrafo la credenza esplicita non ha nessuna di questeproprietà. Tuttavia, ad un esame più attento, le ragioni a sostegno di ciò non sembrano coincidereesattamente con le nostre intuizioni concernenti il problema dell’onniscienza logica. Ad esempio,come si è visto nel caso della soddisfacibilità dell’insieme di formule {Eα, E(α → β), ¬Eβ}, lamancanza di chiusura rispetto all’implicazione è strettamente connessa con la possibilità disituazioni incoerenti. Ciò è evidente dal fatto che è valida la formula:

Eα ∧ E(α → β) → E(β ∨ (α ∧ ¬ α))

dalla quale risulta che, se un soggetto crede α e α → β senza credere al contempo β è perchéammette che la sua credenza di α sia in qualche modo inaffidabile. Dal punto di vista intuitivo nonsembra questa l’unica ragione per cui le credenze dei soggetti epistemici reali non sono chiuserispetto all’implicazione. Il fatto che gli enunciati validi non siano creduti esplicitamente derivadall’incompletezza delle situazioni, ossia dalla mancanza di quella che Fagin e Halpern chiamano laconsapevolezza (§5.1). La mancata chiusura rispetto alla conseguenza logica dipende da entrambele circostanze: se un soggetto epistemico crede α, e se α → β è una formula valida, affinché eglinon creda β occorre che non sia consapevole di α → β, oppure che ritenga possibile una situazionein cui α è sia vero che falso. 26 Più precisamente, nella logica proposizionale classica stabilire se una formula α segue da un insieme di formule Γ èun problema co-NP completo; nella logica della credenza esplicita di Levesque stabilire se una credenza α segue da uninsieme di credenze Γ richiede un tempo di calcolo che cresce linearmente rispetto alla lunghezza di α e di Γ (misuratanei termini del numero di lettere proposizionali distinte che vi compaiono) a condizione però che α e Γ siano in formanormale congiuntiva. (Se α e Γ sono formule proposizionali qualunque, allora il problema è co-NP completo anchenella logica della credenza esplicita). Si veda Levesque (1984).27 Su complessità computazionale e idealizzazione delle capacità dei soggetti cognitivi si veda ad esempio (Frixione2001). Su ragionamento e complessità computazionale in intelligenza artificiale si veda (Levesque 1988).

Page 180: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

13

5. Fagin e Halpern: tre logiche per il ragionamento epistemico limitato

Ronald Fagin e Joseph Halpern, in un articolo apparso su Artificial Intelligence28, sottolineanocome la mancanza di onniscienza logica nei soggetti epistemici reali sia un fenomeno complesso,dovuto al concorso di cause diverse. Le proposte fin qui esaminate risulterebbero inadeguate poichési focalizzano solo alcune di queste cause. In questa prospettiva, Fagin e Halpern hanno proposto tresistemi logici differenti per affrontare aspetti diversi del problema. Vediamo in sintesi ciascuno diessi.

5.1 Una logica della consapevolezza

Il primo sistema, la logica della consapevolezza, è una variante della logica della credenzaimplicita ed esplicita di Levesque che consente l’iterazione di operatori epistemici e che prende inconsiderazione più soggetti di credenza diversi. In essa si evita di ammettere situazioni incoerenti oincomplete, introducendo esplicitamente nella semantica una funzione di consapevolezza(awareness) per ciascun soggetto epistemico. Tale funzione ha lo scopo di rendere esplicito nellasemantica il fatto che un soggetto epistemico può non essere consapevole del significato di alcunedelle lettere proposizionali del linguaggio (questo potrebbe accadere ad esempio perché tali lettereformalizzano enunciati in cui compaiono concetti che il soggetto non conosce). In sintesi, si parteda una semantica di Kripke con n relazioni di accessibilità Ri (una per ciascun soggetto epistemicoi), e la si estende con n funzioni di consapevolezza Ai che associano a ciascun mondo w un insiemeAi(w) di lettere enunciative. L’insieme Ai(w) è l’insieme delle lettere enunciative di cui l’i-esimosoggetto epistemico è consapevole nel mondo w. Le funzioni Ai hanno lo scopo di “ritagliare” dellesituazioni parziali all’interno dei mondi possibili; intuitivamente, tali situazioni parzialicorrispondono al punto di vista dei diversi soggetti. Senza entrare nei dettagli tecnici, le funzioni diconsapevolezza entrano in gioco quando si tratta di valutare gli enunciati retti dagli operatori Ei dicredenza esplicita (esiste un operatore Ei per ciascun soggetto epistemico i): affinché in un mondow sia vero Eiα bisogna che in tutti i mondi w' accessibili da w (quelli per cui Ri(w, w')) sia vera α eche il soggetto sia consapevole di tutte le lettere enunciative che compaiono in α (ossia, che talilettere devono far parte di Ai(w)). Le situazioni “ritagliate” dalle funzioni Ai sono incomplete.Quindi, come nella logica di Levesque, non è detto che se in una situazione non è vera una dataformula, allora sia vera la sua negazione, e viceversa29.

La credenza implicita è espressa per mezzo di n operatori epistemici Bi (uno per ciascunsoggetto epistemico i). Nella valutazione delle formule di tipo Biα le funzioni Ai non entrano ingioco. Rispetto alla credenza implicita la semantica per la logica della consapevolezza si comportadunque come la semantica a mondi possibili classica.

Come nella logica di Levesque, la credenza esplicita implica quella implicita, non tutti glienunciati validi devono essere creduti esplicitamente e la credenza esplicita non è chiusa rispettoalla conseguenza logica. Tuttavia, il fatto di non utilizzare situazioni incoerenti comporta che lacredenza esplicita sia chiusa rispetto all’implicazione e che non si possano credere esplicitamentedelle contraddizioni.

28 (Fagin e Halpern 1988); si veda anche il cap. 9 di (Fagin, Halpern, Moses e Vardi 1995).29 Questo, dal punto di vista tecnico, comporta che per definire la semantica si debba considerare separatamente il casoin cui una situazione supporta la verità di un formula e quello in cui una situazione supporta la sua falsità, come nel casodelle logiche descritte nel paragrafo precedente.

Page 181: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

14

5.2 Una logica della consapevolezza generalizzata.

Nella logica della consapevolezza generalizzata, il secondo dei sistemi proposti da Fagin eHalpern, i valori delle funzioni di consapevolezza possono essere insiemi di enunciati qualunque:non solo di lettere enunciative, ma anche enunciati complessi. L’idea è quella di incorporare in unasemantica di tipo modellistico tradizionale una trattazione sintattica della credenza adeguata a varieforme di ragionamento epistemico limitato (in sintonia con le proposte illustrate nel § 3). Anche inquesto caso vengono presi in considerazione più soggetti di credenza diversi. Per ciascun soggettoepistemico i, esiste un operatore Ei per la credenza esplicita e un operatore Bi per la credenzaimplicita. Come nella logica della consapevolezza vista sopra, si parte da una semantica di Kripkecon n relazioni di accessibilità Ri e la si estende con n funzioni di consapevolezza Ai che associano aciascun mondo w un insieme Ai(w) di formule, di cui l’i-esimo soggetto epistemico è consapevolenel mondo w. Affinché in un mondo w sia vero Eiα bisogna che in tutti i mondi w' accessibili da w(quelli per cui Ri(w, w')) sia vera α e che il soggetto sia consapevole di α (ossia, α deve far parte diAi(w)). Per quanto riguarda la credenza implicita, una formula del tipo Biα è vera nel mondo w se esoltanto se α è vera in tutti i mondi w' accessibili da w. Quindi, come nella logica precedente, i Bi sicomportano come operatori modali classici.

In generale, la credenza esplicita non è chiusa rispetto alla implicazione, alla conseguenzalogica e alle tautologie. E' valida però l’equivalenza Eiα ↔ Aiα ∧ Biα (dove Ai è un operatore diconsapevolezza introdotto nel linguaggio in modo analogo a quanto fatto nella logica precedente).Per assiomatizzare la logica della consapevolezza generalizzata basta aggiungere questo assiomaall'apparato deduttivo per la parte proposizionale e a quello per la credenza implicita, che coincidecon l'apparato deduttivo di una logica modale classica30.

Si possono imporre delle restrizioni sulle funzioni di consapevolezza in modo da formalizzaretipi specifici di ragionamento epistemico limitato. Si può, ad esempio, rendere irrilevante l'ordinedei congiunti ponendo:

α ∧ β ∈ Ai(w) se e solo se β ∧ α ∈ Ai(w)

Oppure si può rendere la consapevolezza chiusa rispetto ai sottoenunciati:

se α ∈ Ai(w) e β è un sottoenunciato di α, allora β ∈ Ai(w)

(in tal caso le credenze esplicite risultano chiuse rispetto all’implicazione).O ancora, si può restringere la consapevolezza ad alcune lettere enunciative, oppure si può

rendere un soggetto inconsapevole delle credenze di un altro soggetto, oppure consapevole delleproprie consapevolezze. Ancora, in Ai (w) possono comparire gli enunciati che il soggetto puòdedurre in un certo lasso di tempo, oppure di complessità sintattica fino ad un certo grado, e cosìvia. Quindi la logica della consapevolezza generalizzata consente di imporre vincoli sull’insiemedelle credenze analoghi a quelli della logica di Konolige (§ 3); in essa tuttavia la componentemodellistica della semantica svolge un ruolo meno marginale per la parte modale del linguaggio,ossia nella caratterizzazione degli oggetti credenza.

5.3 Una logica del ragionamento locale. 30 Ad esempio, se si assume, con Fagin e Halpern, che le relazioni di accessibilità siano seriali, transitive ed euclidee,allora la credenza implicita è assiomatizzata dagli assiomi del sistema modale C5n - ossia C5 ad n soggetti epistemici.

Page 182: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

15

Il terzo e ultimo sistema proposto da Fagin e Halpern (1988) è una logica del ragionamentolocale. Essa consente che i soggetti epistemici abbiano credenze contraddittorie senza tuttaviautilizzare situazioni incoerenti nella semantica. Tra le cause della mancanza di onniscienza logica viè il fatto che i soggetti epistemici non riescono a focalizzare la loro attenzione su tutte leinformazioni in loro possesso. L’idea quindi è quella di sviluppare un modello formale in cui lecredenze di ciascun agente sono organizzate in quadri mentali separati che non comunicano tra loro.In ogni mondo si assegna a ciascun soggetto epistemico (anziché un unico insieme di mondialternativi come nelle tradizionali semantiche a mondi possibili) una famiglia di insiemi non vuotidi mondi, ciascuno dei quali, intuitivamente, corrisponde a un possibile quadro mentale delsoggetto31. In altri termini, per ogni mondo w e per ogni soggetto epistemico i, Ci(w) è una famigliadi insiemi non vuoti di mondi. Ossia Ci(w) = {T1,...,Tk}, dove ogni Tj è un insieme di mondi, ecorrisponde a uno dei quadri mentali del soggetto i nel mondo w. Una formula del tipo Eiα è vera inun mondo w se e solo se esiste un Tj ∈ Ci (w) tale che α è vera per ogni w' ∈ Tj. Cioè, il soggetto icrede esplicitamente α se e soltanto se α è vera in tutti i mondi di almeno uno dei quadri mentaliche gli sono associati nel mondo w. Per quanto riguarda la credenza implicita, una formula Biα èvera in w se e solo se α è vera in tutti i mondi w' tali che w' ∈ I

)(wCT i

T∈

. Quindi, il soggetto epistemico

i crede implicitamente α nel mondo w se e solo se α è vero in tutti i mondi che stannonell'intersezione di tutti i quadri mentali associati a i nel mondo w (e quindi, evidentemente, èvalido Eiα → Biα). In questa semantica la credenza esplicita non è chiusa rispetto all’implicazione:possono essere creduti esplicitamente α e α → β senza che sia creduto β; ciò accade se α e α →β sono creduti in quadri mentali diversi (è come se il soggetto epistemico non fosse in grado di“mettere assieme” quanto si verifica nei diversi quadri mentali). La credenza esplicita, tuttavia, èchiusa rispetto alle tautologie e alla conseguenza logica (in quanto i mondi sono coerenti ecompleti): i soggetti epistemici sono ragionatori ideali all’interno di ciascun quadro mentale. Così,ad esempio, possono essere creduti contemporaneamente due enunciati tra loro in contraddizionecome α e ¬α, ma solo in quadri diversi, e una contraddizione non può essere creduta all’internodello stesso quadro mentale senza che venga creduto esplicitamente qualsiasi enunciato.

E’ interessante notare che, per quanto riguarda la credenza esplicita, la logica descritta inquesto paragrafo equivale a una logica dei modelli minimali (§ 2): gli operatori Ei di credenzaesplicita della logica del ragionamento locale si comportano come l’operatore B della logica deimodelli minimali che estende E con gli assiomi (AM) e (AN) e con l’assioma ¬B (α ∧ ¬ α)32.

6. Conclusioni

La rassegna dei paragrafi precedenti rivela quanto siano eterogenee le soluzioni al problemadell’onniscienza logica che sono state proposte in vari ambiti (filosofia, semantica modellistica,intelligenza artificiale). E’ interessante notare come proposte che originariamente erano stateinterpretate come alternative per la soluzione del problema dell’onniscienza logica si sono rivelatecome vie per affrontare alcune delle varie sfaccettature di un fenomeno complesso, le cui causesono differenziate e di diversa natura. Tra le cause della mancanza di onniscienza logica possiamoannoverare le seguenti33.

31 Proposte che vanno in questa direzione sono state avanzate, in maniera più o meno formalizzata, da Rescher eBrandom (1980), Lewis (1982) e Stalnaker (1984).32 Cfr. (Vardi 1986). Questa logica risulta equivalente anche al sistema proposto in (Rescher e Brandom 1980).33 Cfr. Fagin e Halpern 1988.

Page 183: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

16

• Mancanza di consapevolezza. Può accadere che un soggetto non abbia opinioni circa la verità ola falsità di un enunciato che segue logicamente dall’insieme delle sue credenze per la sempliceragione che nella formulazione di quell’enunciato compaiono termini che non conosce, di modoche egli non è consapevole della verità o falsità dell’enunciato stesso.

• Risorse limitate. Un soggetto razionale può ignorare certe verità logiche, o non conoscerealcune delle conseguenze logiche delle sue credenze perché non dispone del tempo o dellerisorse di memoria per dedurle. Oppure perché sono formulate in maniera troppo complessaperché possa comprenderle.

• Ignoranza di regole di derivazione. Spesso i ragionatori reali non conoscono o non sannoapplicare alcune regole di ragionamento. Ad esempio, alcune ricerche in psicologia cognitivahanno messo in luce le difficoltà di molti soggetti nell’utilizzare la regola di contrapposizione.

• Molteplicità dei contesti mentali. Nel ragionamento i soggetti non utilizzanocontemporaneamente tutte le informazioni di cui dispongono. Sembra che gli esseri umaniabbiano difficoltà nell’utilizzare contemporaneamente informazioni che provengono da ambitidiversi. Sembra ragionevole pensare la memoria umana come strutturata in contesti diversi, indiversi “quadri mentali”, che difficilmente comunicano fra loro.

Ciascuna delle logiche dei paragrafi precedenti può essere vista come un tentativo diaffrontare qualcuno di questi aspetti. In questa prospettiva, soluzioni diverse possono esserevariamente combinate tra loro. Poiché ad esempio ragionamento locale e consapevolezza possonoessere considerate due diverse cause della mancanza di onniscienza logica si possono definire dellelogiche ibride che combinino nella loro semantica il meccanismo dei quadri mentali con quellodelle funzioni di consapevolezza.

Tale natura complessa ed eterogenea del fenomeno è probabilmente l’aspetto più interessanteemerso dalle ricerche qui descritte. Da ciò segue l’implausibilità di un meccanismo semanticouniforme che consenta di rendere conto del ragionamento epistemico, di un livello specifico dientità semantiche che possa garantire la sostituibilità salva veritate nei contesti epistemici (e,presumibilmente, negli altri contesti di atteggiamento proposizionale). Vista in questi termini, lamancanza di onniscienza logica si configura sempre meno come un problema semantico, e sicollega piuttosto al problema più generale dei limiti nelle capacità inferenziali dei soggetti cognitivi.

Riferimenti bibliografici

Anderson A.R. e Belnap N.D. (1962). “Tautological entailment”, Philosophical Studies, 13, pp. 9-24.

Barwise, J. (1981). “Scenes and other situations”, The Journal of Philosophy, 78, pp. 369-397. Tr.it. in A. Bottani, C. Penco (a cura di), Significato e teorie del linguaggio, Franco Angeli,Milano, 1991.

Barwise, J. e Perry, J. (1983). Situations and Attitudes, MIT Press, Boston (MA).

Bäuerle M. J., Cresswell M.J. (1988). “Propositional attitudes”, in D. Gabbay, F. Guenthner (a curadi), Handbook of Philosophical Logic, Volume IV: Topics in the Philosophy of Language,Reidel, Dordrecht-Boston, pp. 491-512

Belnap, N.D. (1975). “How a computer should think”, in Contemporary Aspects of Philosophy.Proceedings of the Oxford International Symposium, Oxford, UK, pp. 30-56.

Belnap, N.D. (1977). “A useful four valued logic”, in G. Epstein e G.M. Dunn (a cura di), ModernUses of Multiple-Valued Logics, Reidel, Boston (MA), pp. 8-37.

Page 184: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

17

van Benthem, J. (2001) (a cura di). Theoretical Aspects of Rationality and Knowledge. Proc. of the8th TARK Conference, Morgan Kaufmann Pub.

Cadoli M. e Schaerf M. (1992). “Approximate reasoning and non-omniscient agents”, Proc. TARK-92, pp. 169-183.

Carnap R. (1947). Meaning and Necessity, University of Chicago Press, Chicago.

Chellas B. F. (1980), Modal Logic. An Introduction, Cambridge University Press, Cambridge.

Cresswell M.J. (1975). “Hyperintensional logic”, Studia Logica, 34, pp. 25-38.

des Rivieres, J. e Levesque, H. (1986). “The consistency of syntactical treatments of knowledge”,Proc. TARK-86, Monterey (CA), pp. 115-130.

Fagin R., Halpern J. Y. (1988). "Belief, awareness and limited reasoning", Artificial Intelligence 34(1988), pp. 39-76.

Fagin R., Halpern J.Y., Moses, Y., Vardi M. (1995). Reasoning About Knowledge, MIT Press,Boston (MA).

Frege G. (1892). “Über Sinn und Bedeutung”, Zeitschrift für Philosophie un philosophische Kritik,100, pp. 25-50. Tr. it. in G. Frege, Senso, funzione e concetto. Scritti filosofici, a cura di C.Penco ed Eva Picardi, Laterza, Bari, 2001.

Frixione M. (1994). Logica, significato e intelligenza artificiale, Franco Angeli, Milano.

Frixione M. (2001). “Tractable competence”, Minds and Machines, Vol.11, No. 3, pp. 379-397.

Gilboa, I. (1998) (a cura di). Theoretical Aspects of Rationality and Knowledge. Proc. of the 7th

TARK Conference, Morgan Kaufmann Pub.

Hintikka J. (1962). Knowledge and Belief. An Introduction to the Logic of the Two Notions, CornellUniversity Press, Ithaca-New York, 1962.

Hintikka J. (1971). “Semantics for propositional attitudes”, in (Linsky 1971), pp.185-213.

Hugues G.E., Cresswell M.J. (1996). A New Introduction to Modal Logic, Routledge, London NewYork.

Konolige K. (1986). A Deduction Model of Belief, Morgan Kaufmann, Los Altos CA, 1986.

Kripke S. (1963). “Semantical considerations on modal logic”, Acta Philosophica Fennica, 16, 83-89; anche in (Linsky 1971).

Lakemeyer G. (1987). “Tractable meta-reasoning in propositional logics of belief”, in Proceedingsof the tenth International Joint Conference on Artificial Intelligence, Milano, 1987, pp. 402-408.

Lakemeyer G. (1994). “Limited Reasoning in first-order knowledge bases”, Artificial Intelligence,71, pp. 1-42.

Levesque H.J. (1984). “A logic of implicit and explicit belief”, in Procceedings of the NationalConference on Artificial Intelligence, Austin (Texas), 1984, pp. 198-202.

Levesque H.J. (1988). “Logic and the complexity of reasoning”, Journal of Philosophical Logic,17, pp. 355-389.

Levesque H.J. e Lakemeyer G. (2001). The Logic of Knowledge Bases, MIT Press, Boston (MA).

Lewis D. (1982). “A logic for equivocators”, Noûs, 16, pp. 431-441.

Linsky L. (a cura di) (1971). Reference and Modality, Oxford University Press, Oxford; trad. it.,Riferimento e modalità, Bompiani, Milano, 1974.

Page 185: Marcello Frixione - Logica, Significato e Intelligenza Artificiale

18

Meyer J.-J. Ch. (2001). “Epistemic logic”, in L. Goble (a cura di), The Blackwell Guide toPhilosophical Logic, Blackwell, Oxford (UK).

Montague R. (1968). “Pragmatics”, in (Montague 1974), pp. 95-118.

Montague R. (1974). Formal Philosophy, a cura di R. Thomason, Yale University Press, Londra.

Moore R.C. e Hendrix G.G. (1982). “Computational models of belief and the semantics of beliefsentences”, in S. Peters e E. Saarinen (a cura di), Processes, Beliefs and Questions, Reidel,Dordrecht e Boston, pp. 107-127.

Rescher N. e Brandom R. (1980). The Logic of Inconsistency, Basil Blackwell, London.

Schaerf M. e Cadoli M. (1995). “Tractable reasoning via approximation”, Artificial Intelligence, 74(2), pp. 249-310.

Scott D. (1970). “Advice on modal logic”, in K. Lambert (a cura di), Philosophical Problems inLogic, Reidel, Boston (MA), pp. 143-173.

Stalnaker, R.C. (1984). Inquiry, MIT Press, Boston (MA).

Thomason, R. (1980). “A note on syntactical treatments of modality”, Synthese, 44, pp. 391-5.

Vardi M. (1986). “On epistemic logic and logical omniscience”, Proceedings of the Conference onTheoretical Aspects of Reasoning about Knowledge, Monterey CA, Morgan Kaufmann, LosAltos (CA), pp. 293-305.