messaggi e comunicazione

download messaggi e comunicazione

of 329

Transcript of messaggi e comunicazione

  • 8/6/2019 messaggi e comunicazione

    1/328

    1

    Oscar Bettelli

    MESSAGGI E COMUNICAZIONE

    Trasformazione delle simiglianzein programmazione logica

  • 8/6/2019 messaggi e comunicazione

    2/328

    2

    Introduzione pag. 4

    1. Rappresentazione della conoscenza1.1 Messaggi e comunicazione. 61.2 Rappresentazione simbolica... 15

    2. Il concetto di simiglianza2.1 Induzione di una metrica su insiemi... 182.2 Definizione di una metrica associativa... 202.3 Il processo di inferenza... 362.4 Il trattamento dell'incertezza... 43

    3. Il processo di astrazione3.1 Principali meccanismi di astrazione 583.2 Il processo di categorizzazione... 633.3 Algoritmi genetici... 74

    4. I criteri di classificazione4.1 Sistemi di classificazione 864.2 Teoria matematica della classificazione. 92

    5. Logica matematica5.1 La logica proposizionale. 97

    5.1.1 Semantiche della logica proposizionale. 995.1.2 Teorie proposizionali.. 1045.1.3 Logica proposizionale come sistema deduttivo.. 1075.2 Logica classica del primo ordine 1125.2.1 Linguaggi della logica del primo ordine. 1125.2.2 Semantica della logica del primo ordine. 1165.2.3 Teorie del primo ordine.. 1245.2.4 Logica del primo ordine come sistema deduttivo.. 1275.3 Logica del primo ordine multi-ordinata. 1305.4 Il metodo di risoluzione. 1355.4.1 La forma in clausole.. 1365.4.2 Le regole di risoluzione. 140

    5.4.3 Soluzione lineare... 1495.5 Logica classica del secondo ordine... 1525.5.1 Linguaggi logici del secondo ordine. 1525.5.2 Semantica della logica del secondo ordine... 1555.5.3 Teorie del secondo ordine. 1595.5.4 Logica del secondo ordine come sistema deduttivo. 160

  • 8/6/2019 messaggi e comunicazione

    3/328

    3

    5.5.5 Espressioni con predicati e funzioni.pag. 1615.6 Logica modale.. 1675.6.1 Logica proposizionale modale. 1675.6.2 Logica modale del primo ordine.. 172

    6. Programmazione logica6.1 Ragionamento non monotonico. 1766.2 Clausole di Horn. 1816.3 Metodo di risoluzione SLD 1826.4 Semantica di un linguaggio di programmazione 1846.5 Base di conoscenza basata sulla logica dei predicati.. 1856.6 Un filtro prolog... 187

    7. Trasformazione delle simiglianze7.1 Descrizione di oggetti come insieme di attributi 1977.1.1 La funzione di appartenenza ad insiemi sfumati. 1977.1.2 Rappresentazione tramite propriet. 1997.1.3 Implicazione semantica... 2017.1.4 Definizione di un'algebra sulle propriet. 2087.2 Ruolo delle irrilevanze nella formazione di concetti... 2097.3 Simiglianze nel caso di corrispondenza biunivoca.. 2137.3.1 Corrispondenze, trasformazioni, simiglianze.. 2137.3.2 Costruzione di una metrica sull'insieme dei naturali... 222

    7.4 Sistemi di deduzione basati su regole. 2277.5 Logiche a pi di due valori. 2327.5.1 Logica modale non monotonica intuizionista. 2327.5.2 Logica modale non monotonica a tre valori... 2407.5.3 Logica modale non monotonica a quattro valori. 2477.6 Rappresentazione in uno spazio vettoriale binario. 2537.7 Sistemi ipotetici in comunicazione reciproca. 2607.8 Trasformazioni T da |P(X) a |P(X). 2647.9 Rappresentazioni di regole tramite corrispondenze... 2767.10 Sistemi di regole ricavabili da corrispondenze.. 2787.11 Leggi di riduzione dei sistemi di regole. 2817.12 Equivalenza di sistemi di regole. 283

    7.13 Definizione di trasformazioni particolari... 2867.14 Misura dell'affidabilit delle deduzioni. 2927.15 Interpretazione statistica dell'affidabilit... 2977.16 Generalizzazione operazioni OR AND XOR .. 3077.17 Implicazione semantica di raggruppamento. 3167.18 Conclusioni... 325

  • 8/6/2019 messaggi e comunicazione

    4/328

    4

    Introduzione

    La comunicazione, i messaggi, la capacit di comunicare scambiandomessaggi sono aspetti fondamentali della natura umana e forse della vitastessa.Intorno alla met di questo secolo l'ingegneria dei sistemi di comunicazioneha subito un notevole impulso; se la prima met del novecento ha assistitoallo sviluppo dei sistemi analogici, la seconda met ha assistito allo sviluppodei sistemi di comunicazione numerici o digitali.Una delle ragioni risiede nel fatto che le apparecchiature in grado dielaborare i segnali numerici sono in genere pi semplici di quelle cheelaborano dati analogici, in particolare si visto che le informazioni poste inuna forma discreta sono pi facilmente trasmesse, con grande affidabilitanche in un canale disturbato.Nella teoria dell'informazione possibile identificare eventi fisici di cui essafornisce un modello; come ogni modello anche la teoria dell'informazione riduttiva, trascura certi eventi e di certi altri ignora alcuni aspetti.Nella teoria dell'informazione i messaggi sono pi importanti del lorosupporto materiale, la forma pi importante della materia; accanto al mondodella fisica, dove imperano le forze e le quantit di moto, e dove le azioni e lereazioni sono rette da equazioni specifiche, esiste un mondo in cui l'energia,magari piccolissima, associata ad un messaggio pu scatenarne unagrandissima. Nel mondo dell'informazione ci che conta non sono gli oggetti

    ma le differenze tra gli oggetti, e l'informazione risiede nelle differenze chegenerano altre differenze e che si propagano lungo un canale di comunicazionedalla sorgente all'utilizzatore.Comunque quando si parla di differenze queste debbono essere riferite ad unosservatore che sia in grado di percepirle e quindi, eventualmente diriprodurle: questo carattere relativo dell'informazione cos fondamentale chespesso sottaciuto.In realt non ha neppur senso parlare di sorgente d'informazione se non sispecifica anche quale sia l'utente di questa sorgente: una sorgente apparediversa a utenti diversi, perci si dovrebbe sempre far riferimento a coppiesorgente-utente. importante osservare che la produzione d'informazione da parte di una

    sorgente pu essere un atto spontaneo oppure provocato. In particolare l'interesse dell'utente che sollecita la sorgente a fornire messaggi checorrispondono ad informazione utile in vista dei fini dell'utente stesso.Riassumendo, l'utente sar in grado di impiegare l'informazione solo se potr:1) rilevare l'informazione pertinente ai propri fini;

  • 8/6/2019 messaggi e comunicazione

    5/328

    5

    2) ricondurre tale informazione ad una propria esperienza precedente checonsenta la comprensione del significato dei messaggi ricevuti.

    importante sottolineare che il processo di comunicazione fra una sorgenteed un utente multiforme e si svolge su diversi livelli:

    A) livello del rilevamento delle differenze che costituiscono l'informazione;

    B) livello della comprensione del significato delle differenze rilevate;

    C) livello dell'impiego delle differenze rilevate e comprese.

    Questi tre livelli non sempre sono separabili con precisione e, se lo sono, nonsempre si possono ordinare gerarchicamente; occorre ricordare che la teoria diShannon si situa nettamente al livello A), livello sintattico o tecnico, mentrenon tocca n il livello B), livello semantico, n quello C), livello pragmatico.Nel presente lavoro si propone un approccio sinergico a tutti e tre questilivelli A), B) e C) integrando il livello sintattico con il livello semantico e illivello pragmatico, utilizzando le tecniche della programmazione logica.Ovviamente, il risultato presenta un marcato riduzionismo e notevolisemplificazioni concettuali, d'altra parte l'idea di due sistemi a stati finiti incomunicazione reciproca governati da un motore inferenziale che utilizzaregole, produce inferenze e trasmette messaggi tramite un canale dicomunicazione, si presenta come un affascinante modello per lo studio deiprocessi fondamentali alla base della comprensione e trasmissione diinformazione tra sistemi in comunicazione reciproca.

  • 8/6/2019 messaggi e comunicazione

    6/328

    6

    1. La rappresentazione della conoscenza

    1.1 Messaggi e comunicazione

    La capacit di comunicare una caratteristica notevole dei sistemiintelligenti.Acquisizione, immagazzinamento, recupero, ed infine usodell'informazione sono processi di estrema importanza, che si verificano confacilit nel corso dell'esperienza umana.

    La diffusione nella nostra realt sociale di continui scambi di messaggi cirende familiari alcuni concetti che necessitano, per una loro realecomprensione, di una pausa di riflessione.Tramite la comunicazione e l'elaborazione di strutture di messaggi sicompiono atti che vengono riconosciuti come manifestazione diintelligenza.L'uomo ha costruito diverse macchine in grado di manipolare messaggi tracui, la pi recente, l'elaboratore elettronico. Claude E. Shannon pubblic, nel1948, una memoria dal titolo: "A mathematical theory of communication".Il nome di Shannon legato alla ricerca di una codificazione dei messaggi,scelti da un insieme noto, che permettesse di trasmetterli con precisione euniformit in presenza di rumore. Il problema di una codificazione efficiente e

    le sue conseguenze costituiscono il centro della teoria dell'informazione.In effetti, ogni comunicazione comporta una qualche specie di codificazione.In teoria qualsiasi messaggio pu essere codificato nel sistema binario edessere trasmesso elettricamente come una sequenza di impulsi o di assenza diimpulsi. Si dimostrato che campionando periodicamente un segnalecontinuo, come per esempio un'onda sonora, e rappresentando le ampiezze diogni campione con valori ad esse pi approssimati di un insieme discreto divalori, si pu rappresentare e codificare perfino tale onda continua come unasequenza di cifre binarie con una precisione grande a piacere.Gli elaboratori elettronici funzionano utilizzando la rappresentazionebinaria di numeri e cifre, i numeri e le cifre poi vengono utilizzati permanipolare i messaggi.

    Come si rappresentano numeri e cifre in un linguaggio binario?La codifica pi utilizzata la codifica ASCII.Nella codifica ASCII si considerano otto bit a formare un carattere:

    carattere 8 bit

  • 8/6/2019 messaggi e comunicazione

    7/328

    7

    0 = 001100001 = 001100012 = 001100103 = 00110011

    ...A = 01000001B = 01000010C = 01000011D = 01000100

    ...

    Prendiamo due persone che, da due stanze separate, si scambino dei messaggiconversando. Ogni messaggio viene codificato in parole appartenenti a frasi diuna determinata lingua, viene trasformato in onde sonore che attraversano lestanze e la parete, viene raccolto dall'orecchio e trasformato in impulsielettrochimici, riconosciuto come essere un messaggio e non rumore,suddiviso in frasi e parole e finalmente viene interpretato comesignificativo da parte dell'ascoltatore.Utilizzando delle tecnologie telematiche la comunicazione potrebbeavvenire anche nel seguente modo: Il soggetto A scrive un messaggiocodificandolo in parole e frasi di una certa lingua, il sistema lo codifica in unaforma binaria e lo trasmette a notevole distanza, un sistema riceventeritrasforma il messaggio in frasi e parole che possono essere lette dalsoggetto B che riceve il messaggio per lui significativo. Supponiamoche un soggetto C intercetti il segnale trasmesso lungo la linea nelmomento in cui esso si presenta come una successione di impulsi.Se il messaggio trasmesso fosse : "Le mele sono mature", il soggetto Crivelerebbe la seguente successione di impulsi:

    "01001100010001010010000001001101010001010100110001000101001000000101001101001111100111001001111001000000100110010100000101010100010101010101001001000101"

    che si presenta come una successione di impulsi all'apparenza governata dal

    caso in cui compare una maggior frequenza di zeri rispetto agli uni (93 zeri su152 contro 59). Se ricevessimo dallo spazio una successione di impulsi deltipo di quella sopra descritta probabilmente la attribuiremmo al puro caso eben difficilmente ad intelligenze che desiderano mettersi in contatto con lanostra cultura inviando messaggi. Pur essendoci delle regolarit nellasuccessione di impulsi, tali regolarit sono difficilmente individuabili e

  • 8/6/2019 messaggi e comunicazione

    8/328

    8

    senza la chiave interpretativa il segnale appare casuale, anche se ogniimpulso in realt strettamente determinato dal messaggio e nessun bit puessere alterato senza alterare il messaggio stesso. La probabilit di ottenereper puro caso il segnale binario di cui sopra 0.5 elevato alla 152 cio circadue volte ogni dieci miliardi di miliardi di miliardi di miliardi di miliardi ditentativi (1.75 E-46).Un altra possibilit consiste nell'utilizzare un unico impulso: l'interruttoredi una lampadina.In tal caso i due soggetti A e B potrebbero essersi accordati sul fatto chequalora una lampadina ben in vista si accende allora si desume che: "le melesono mature".In tali circostanze un unico impulso sufficiente e la sua probabilit di un

    mezzo (0.5). Il messaggio trasmesso lo stesso, ma il canale di trasmissioneha potenzialit molto diverse. Dal punto di vista del soggetto C il messaggio costituito da un singolo impulso che si presenta oppure no. Sarebbe per luimolto pi facile mettere in relazione il verificarsi di un tale evento con il fattoche "le mele sono mature", sempre che tutto ci possa avere un senso per ilsoggetto C. Per trasmettere messaggi diversi sarebbero necessari altri canalipredisposti appositamente allo scopo. Aumentare il numero di messaggitrasmessi sullo stesso canale significa aumentare la complessit della codificadei messaggi stessi. possibile ridurre la complessit della codifica dei messaggi aumentando ilnumero dei canali, anche se in realt la complessit del messaggioglobale non viene ridotta, infatti colui che riceve i messaggi dovr fare unasintesi riconoscendo ogni canale che potenzialmente trasporta un certotipo di messaggio.

    Un modo per farsi un'idea di che cosa significa "rappresentazione dellaconoscenza" consiste nel considerare la seguente ipotetica situazione: duesistemi che comunicano tramite un canale informativo.Due sistemi S1, S2 in comunicazione tramite un canale si scambiano messaggirelativamente a qualcosa che di solito si referenzia come la "realt" esterna,ovvero oggettiva, nel senso di conoscibile o riconoscibile da entrambi i sistemiS1, S2. Se denotiamo con R la realt oggettiva, nel senso di "insieme diinformazioni" condivisibili dai due sistemi allora il messaggio che S1 pu

    trasmettere a S2, facente riferimento a qualche informazione di R, dovr essererappresentabile sia in R1, rappresentazione di R per S1, sia in R2rappresentazione di R per S2. Ora, lasciando in sospeso il problema dellagenerazione delle rappresentazioni R1 ed R2 a partire da una interazione diS1 e S2 con R, ci si pu concentrare nell'analisi del flusso di messaggi nelcanale di comunicazione tra S1 e S2.

  • 8/6/2019 messaggi e comunicazione

    9/328

    9

    (fig 1.1)

    Infatti due sistemi comunicano attraverso un canale di comunicazione chepossiede una determinata struttura sia fisica che logica.Consideriamo un caso semplice, due sistemi che comunicano scambiandosimessaggi selezionati da un determinato repertorio finito attraverso un canalebinario. Ogni messaggio si presenta nella forma di successione di bit per es.. Ad ogni messaggio associato un insieme ordinato di bit, taleassociazione condivisa da entrambi i sistemi. Consideriamo un caso banale: ilcanale di comunicazione pu essere solo in ON oppure in OFF. In altri terminiil canale consiste di un interruttore che pu essere o acceso o spento.La realt condivisibile R tra S1 e S2 consiste semplicemente in un bit.Ipotizziamo che una bella ragazza e il suo spasimante si accordino di

    scambiarsi un messaggio di tipo binario: se la ragazza si trova in casa tieneaperta la finestra, quando esce chiude la finestra. Per lo spasimante la finestraaperta o chiusa rappresenta un canale di comunicazione binario:

    La ragazza si trova in casa :- Finestra aperta. La ragazza uscita :- Finestra chiusa.

  • 8/6/2019 messaggi e comunicazione

    10/328

    10

    Se i due amanti non possiedono altri canali di comunicazione, allora, per lospasimante la ragazza risulta inconoscibile ed rappresentabile da qualcosa,su cui si pu fantasticare, ma che sostanzialmente c' quando la finestra aperta e che non c' quando la finestra chiusa. L'idea che lo spasimante sicrea ( la rappresentazione della ragazza nella testa dello spasimante ) riguardoalla ragazza e alla situazione potrebbe essere varia e articolata ma certamentefondata solamente su rappresentazioni generate da situazioni del tuttodiverse da quelle relative allo stato della finestra, da altri canali dicomunicazione, da altre situazioni; in altri termini da una realt diversa daquella condivisa con la ragazza nella realt.Dall'esempio emerge che la realt R condivisa da due sistemi checomunicano sia una mera convenzione tra S1 e S2; tale convenzione si esplica

    in una relazione tra una rappresentazione arbitraria in S1 e unarappresentazione corrispondente in S2 altrettanto arbitraria e sostanzialmenteinconoscibile nella reale forma. Allora il processo di comunicazione consistein un processo di corrispondenza tra stati arbitrari di S1 e S2.Vediamo un altro esempio: supponiamo che il messaggio tra S1 ed S2 sia: hovisto un cavallo alato.S2 che riceve il messaggio da S1 cerca di far corrispondere larappresentazione che S1 gli evoca tramite il messaggio con la propriaesperienza passata; cerca pertanto di ricordare se tra i propri ricordi vi sial'esperienza di aver visto un cavallo alato. La parola cavallo recupera dallamemoria un animale quadrupede correlato di un certo numero di caratteristiche,immagini, esperienze, ecc... in altri termini rappresentazioni. La caratteristicadi essere un animale con le ali non trova riscontro nelle rappresentazioni di S2,per cui S2 risponde ad S1 che non "crede" al messaggio che S1 gli ha inviato;S1 di rimando dice: era in una raffigurazione di un famoso pittore. S1 allorariconosce il messaggio iniziale come vero, infatti egli stesso aveva inprecedenza avuto occasione di vedere il quadro a cui fa riferimento S2;semplicemente non aveva collegato tale rappresentazione al messaggio si S1,d'altra parte la parola cavallo denota, nel contesto considerato, sia un animaleche un disegno: oggetti estremamente diversi. Eppure chiunque riconoscefacilmente che una raffigurazione di un cavallo e l'animale cavallo in carne edossa possiedono, indubbiamente, in comune qualcosa di essenziale.

    Consideriamo due sistemi S1, S2 identici, con rappresentazioni identiche e chesi evolvono nel tempo in maniera identica.Supponiamo che S1 decida di informare S2 sul proprio stato, per far ciinvier ad S2 un messaggio.Il messaggio rappresenter lo stato di S1.

  • 8/6/2019 messaggi e comunicazione

    11/328

  • 8/6/2019 messaggi e comunicazione

    12/328

    12

    ed M2, M1 M2 = M3, allora solo k degli n messaggi di S1 risultacomprensibile ad S2, nel senso di messaggi riconoscibili. Affinch unnuovo messaggio msg1(k+1) possa essere riconosciuto da S2 occorre che sistabilisca una relazione tra msg1(k+1) M1 e un messaggiomsg2(k+1) M2 di S2. Tale relazione si pu stabilire solo semsg1(k+1) deriva da una combinazione di messaggi di M3 oppure da altricanali di comunicazione.Nel caso non esistano altri canali di comunicazione allora msg1(k+1) unafunzione di un sottoinsieme di M3, il nuovo messaggio risulta essere unacombinazione di un sottoinsieme particolare di vecchi messaggi. Infatti se S1,S2 sono due sistemi che comunicano tramite k possibili messaggi attraverso ununico canale, in altri termini nel caso non esistano altri canali dicomunicazione, l'unico modo per comprendere un nuovo messaggio adisposizione di S2 interpretarlo attraverso la trasmissione di un insieme dimessaggi riconoscibili.In sostanza nessun nuovo messaggio pu essere appreso, ma sonopossibili solo raggruppamenti di messaggi in un nuovo codice.In pratica l'unica possibilit di creare nuovi messaggi consiste in unaoperazione di codifica.

    Supponiamo, ora, che i sistemi S1, S2 siano macchine a stati finiti, come adesempio lo sono i calcolatori elettronici.In particolare consideriamo la memoria M1 di S1: M1 pu essere visto come

    il risultato prodotto dal sistema di memorizzazione a disposizione del sistemaS1; in M1 sono rappresentati tutti i messaggi selezionabili da S1. In M1 visaranno un certo numero di stati possibili n, ed un certo numero di statisignificativi k, corrispondenti a messaggi memorizzati.Per come sono costruiti i computer gli stati elementari di base sono statibinari {0,1}. La memoria M1 diviene rappresentabile da un vettore di n statibinari: n bit. I bit della memoria possono essere raggruppati in maniera daassumere un significato simbolico comprensibile da un utilizzatore umano.La comunicazione tra un elaboratore elettronico ed un essere umano vieneinfatti mediata dal linguaggio.

    Da quanto tratteggiato risulta evidente come la rappresentazione della

    conoscenza in generale sia un processo estrememente fumoso ed arbitrario:l'uomo opera con una conoscenza limitata e incerta. Criteri di valutazionecome la completezza e la consistenza relativamente ad una concretarappresentazione della conoscenza sono applicabili solo in domini ristretti eben definiti.

  • 8/6/2019 messaggi e comunicazione

    13/328

    13

    A questo proposito vorrei riportare alcune considerazioni filosofiche che alcunipensatori hanno espresso in relazione ai processi cognitivi.

    Ogni sapere nel mondo si riferisce ad oggetti particolari e vieneconquistato, con determinati metodi, da punti di vista determinati.(Karl Jaspers) perci errato assolutizzare in un sapere totale un qualsiasi sapere.

    Volont di potenza e volont di verit nella scienza sono spesso incontraddizione, solo chi si pone umilmente in ascolto pu interpretarecorrettamente i messaggi particolarmente contrastanti le credenze che si sonoaffermate nella storia e nella scienza in un particolare periodo storico.

    Cosa sono ragione ed intelletto?La ragione un moto senza un punto fisso! stimolo a criticare ogni posizione acquisita.Si contrappone alla tendenza ad adagiarsi su dogmi fissati.Esige ponderazione - si contrappone all'arbitrio.Sviluppa la conoscenza di s rendendo consapevoli i limiti.Esige un incessante ascolto e sa attendere. il contrario dell'ebbrezza affettiva immediata.La ragione volont di unit.Essa non pu tralasciare nulla di ci che esiste, nulla trascurare, nullaescludere.Essa in s stessa apertura illimitata.La ragione attratta da ci che le pi estraneo.La ragione non vuole ingannare s stessa mistificando la realt.La ragione indissolubilmente legata alla volont di comunicazione.La verit senza comunicazione appare ad essa identica alla non-verit.Non la ragione che porta la verit, ma la cerca insieme a colui che incontra,ascoltando, interrogando, sperimentando.La verit non pu essere esaurita nel tempo.Per l'uomo nel tempo la verit esiste solo nella forma della verit che divienetale nella comunicazione.

    Noi non sappiamo gli uni degli altri nulla di essenziale fuorch quandoentriamo in reciproca comunicazione.

    La ragione ha un potente avversario che si annida dentro di noi, c' qualcosache fa parte della vita, una pulsione all'affermazione della trascendenza.C' qualcosa in noi che desidera non la ragione ma il mistero.

  • 8/6/2019 messaggi e comunicazione

    14/328

    14

    Tutto ci che la ragione non afferra spinge potentemente contro di essa eallora siamo allettati irresistibilmente da questa esplosione e non ci basta pil'efficacia razionalmente fondata ma la magia assurge a dogma, non la fidatafedelt ma l'avventura. Ma anche in questo caso la potenzialit dellacomunicazione si esprime nella variet espressiva, per esempio nel parlare perimmagini, nell'interminabile spiegare la spiegazione.Nonostante tutto un messaggio, sia pur nella sua incertezza, viene trasmesso ecomunicato e pu essere parzialmente interpretato dalla ragione.La perversione della non-ragione consiste nell'impulso diretto a disfarsi dellapropria realt, verso cui si responsabili, ed a spostarla su qualcos'altro, su unarcano, un essente autentico, lasciandosi prendere dal fascino del mormorio dici che manca di ragione.

    Come presunta verit dell'essenza non resta che una fantasia nonvincolante, risolventesi in sentimenti di commozione privi di affetto. facile cadere in un invasamento: questa tendenza a rendere assoluto il propriopensiero, a farne l'unico vero, a identificare se stesso con la cosacoinvolgendosi in essa con interessamento egocentrico, ed allontanare quantonon favorisce la propria causa. Affinch nel mondo del pensiero si instauri unpieno disinteresse, necessario che coloro che pensano siano interiormenteindipendenti. E tale l'uomo diviene solo quando spenta in lui la volont dipotenza, e forse anche solo quando si trova di fatto in condizioni di impotenza.L'impotenza sembra la condizione per operare effettivamente in modo libero edestare la libert. Nell'accontentarsi senza voler imporre a tutti i costi la propriavolont, il singolo uomo ha la probabilit di contribuire per la suapiccolissima parte a far s che si crei uno spazio in cui la verit possaprosperare.

  • 8/6/2019 messaggi e comunicazione

    15/328

  • 8/6/2019 messaggi e comunicazione

    16/328

    16

    Le leggi sono un altro aspetto che deve essere tenuto presente.Le leggi hanno, di solito, la forma: SE si verifica il tal fatto ALLORA il talaltro fatto vero.Occorre avere particolare cura per generalizzare un fatto o una legge comeuniversale; infatti le leggi hanno spesso solo una validit particolare,contestuale, non universale.

    Perci, sempre importante accertarsi che la legge sia usata nel modoappropriato e nel dominio di competenza per poter decidere se la conclusioneche traiamo corrisponde a un fatto affidabile oppure no.

    A causa del fatto che non ci possiamo garantire sulla verit delle nostre

    affermazioni, la conoscenza nella vita di tutti i giorni frammentaria e nonorganizzata. Essa anche contradditoria. La conoscenza, in ambitoaccademico, non pu essere contradditoria. Comunque, nella vita di tutti igiorni, noi possiamo convivere con una conoscenza contradditoria fintantoche tale conoscenza non diviene contradditoria in un qualche sensoimmediato. Quando la conoscenza diviene contradditoria, tentiamo diespanderla e di aggiungere alcune condizioni extra per renderla noncontradditoria.

    La conoscenza richiede spiegazione.La conoscenza senza spiegazione semplicemente un assioma.Generalmente la spiegazione fornita utilizzando la ricostruzione a partiredagli elementi principali. In altre parole, spieghiamo un concetto combinandoi concetti parziali che lo compongono e i concetti elementari.

    La conoscenza aumenta con lo studio ed ulteriormente espansadall'inferenza. Comunque non si pu considerare affidabile il risultato diun'inferenza se non vengono confermati i fatti a cui tale inferenza porta.

    Consideriamo due sistemi S1 ed S2 che comunicano tramite un canale dicomunicazione binario.Proponiamoci di analizzare il processo di riconoscimento di un messaggiinviato da S1 ad S2.

    Il processo consiste sostanzialmente nel collegare un messaggio msg1 inviatonel canale binario, arbitraria successione di bit, con una rappresentazione x1interna al sistema S2.Allora x1 = f(msg1), la rappresentazione x1 di S2 esprimibile in funzionedel messaggio msg1. In altri termini tutto funziona come se fosse x1 = msg1 ;la rappresentazione x1 pu essere identificata con il messaggio ad essa

  • 8/6/2019 messaggi e comunicazione

    17/328

    17

    collegata. Essendo msg1 una stringa di bit, anche x1, la rappresentazioneinterna di S2 corrispondente a msg1 messaggio inviato da S1, pu essereconsiderata come una stringa di bit.Infatti ogni rappresentazione interna presente nella memoria di un calcolatorecorrisponde ad una stringa di bit.Eppure noi parliamo di oggetti, di attributi, di dati, ecc...Oggetti, attributi, dati, ecc... non sono altro che interpretazioni, in particolareogni raggruppamento arbitrario di bit potrebbe essere associato ad unaspecifica interpretazione. chiaro comunque che solo alcuni tra tutti iraggruppamenti di bit possibili sono significativi; a tali raggruppamenticorrispondono infatti i simboli che utilizziamo nel colloquio con l'e laboratore.Il problema diviene, dunque, quale la relazione tra i simboli che utilizziamo

    e le stringhe di bit; essenzialmente un problema di codifica.

    Se V = il vettore binario con cui rappresentiamo lamemoria di S2, allora ogni sottoinsieme di V puo essere connesso ad unsimbolo per noi significativo.Il messaggio msg1 inviato da S1 pu allora essere considerato come unsottoinsieme x1 di V.

  • 8/6/2019 messaggi e comunicazione

    18/328

    18

    2. LE SIMIGLIANZE

    2.1 Induzione di una metrica su insiemi

    In una struttura di memorizzazione di dati le informazioni sonomemorizzate in termini di rappresentazioni e tali rappresentazioni si avvalgonodi un supporto fisico che specifico del sistema utilizzato.Supponiamo di poter parlare in termini di propriet o attributi che identificanole rappresentazioni e che da tali rappresentazioni si possa risalire alle

    informazioni originarie.Ogni propriet raggruppa tutte le entit che posseggono la propriet medesima;ogni propriet crea pertanto una partizione dello spazio di rappresentazione. possibile considerare due rappresentazioni pi o meno simili (o dissimili)sulla base di considerazioni concernenti le propriet che esse mostrano. Inparticolare considerazioni su quali e quante propriet esse hanno in comune o sipresentano nell'una e non nell'altra.Il concetto di dissimiglianza un criterio metrico che ci consente di associarele ricorrenze di dati in maniera dinamica senza la necessit di creare rigideclassi di equivalenza. possibile far dipendere il processo di associazione tra la ricorrenza A e laricorrenza B (oppure l'insieme di ricorrenze B1,B2,...,Bm) da un parametro

    di soglia che misura il grado di dissimiglianza oltre il quale le ricorrenze nonsono pi associabili.Descrivendo gli oggetti della nostra rappresentazione, le entit, in termini dipropriet possiamo creare dei processi associativi e generare degli schemiclassificatori basati su considerazioni intrinseche agli oggetti stessi e in cuitutto il contenuto informativo rappresentato presente nel dato.Le classi ottenute in tal modo sono dinamiche e si autogenerano nel modellosulla base delle ricorrenze specifiche presenti in memoria.Uno spazio di memorizzazione contiene dati, i dati sono sostanzialmenterappresentabili ( almeno per un elaboratore ci vero) tramite un vettorebinario finito.Possedere un criterio associativo basato sulle propriet delle

    rappresentazioni in memoria produce una semplificazione in moltiproblemi di memorizzazione e ricerca delle informazioni. possibile considerare simili due rappresentazioni in memoria quando ilpeso degli attributi comuni alle due rappresentazioni supera il peso degliattributi diversi.

  • 8/6/2019 messaggi e comunicazione

    19/328

    19

    Per fissare le idee consideriamo l'insieme degli stati possibili di un genericosistema di memorizzazione e rappresentiamolo con un insieme di vettoriV = .Costruiamo un criterio di dissimiglianza che consenta di associare oppure nouno stato possibile vk nello spazio dei vettori V da un arbitrario stato vl o da uninsieme di stati vl1,vl2,...,vlm.Generiamo perci una funzione distanza definita tra i vettori dello spazio V.La funzione costruita sul rapporto tra la misura dell'insieme differenzasimmetrica e la misura dell'insieme unione tra due vettori di V, vk e vl cifornisce una metrica particolarmente interessante per trattare la differenza trarappresentazioni.L'insieme differenza simmetrica contiene le propriet che appartengono ad una

    rappresentazione ma non all'altra e viceversa.L'insieme unione contiene le propriet che appartengono o ad unarappresentazione o all'altra.In altre parole il rapporto tra il numero di attributi che sono in comune e ilnumero di attributi complessivamente coinvolti nella descrizione deglioggetti confrontati una funzione metrica e ad essa attribuiamo un ruolodeterminante nel processo di associazione e di valutazione delle simiglianze trarappresentazioni.La funzione sopra descritta induce effettivamente una metrica ed notevolenotare come essa non dipenda da tutte le propriet definite su V ma dipendasolamente da quelle appartenenti ad uno o all'altro tra gli insiemi confrontati;di pi essa ha una validit del tutto generale.La caratteristica di cui appena detto risulta particolarmente valida in quantonon richiede una definizione preliminare di tutto lo spazio metrico generato(tutti gli attributi gestiti dal sistema, tutti i domini, ecc...) si presenta invece inmaniera dinamica: ogni attributo viene aggiunto solo nel momento in cuiviene utilizzato; tipicamente quando un oggetto che possiede tale attributo entrain relazione col sistema di memorizzazione.In altri termini, la dissimiglianza tra due entit rappresentate nel sistema vienemisurata sulla base delle propriet effettivamente manifestate dalle entitconfrontate e non sulla base di propriet ipotetiche o possibili: il riferimento circostanziale e determinato e non assoluto e trascendente.

  • 8/6/2019 messaggi e comunicazione

    20/328

    20

    2.2 Definizione di una metrica associativa

    Descriviamo la notazione che utilizzeremo nel seguito.Il simbolismo di cui faremo uso si considera come una particolare forma dilinguaggio scientifico. Quest'ultimo si distingue dal linguaggio ordinario perla sua precisione, in quanto un segno o un insieme di segni di un linguaggioscientifico deve soddisfare l'esigenza di avere, per coloro che l'impiegano, ununico significato, e questo non sempre avviene nel linguaggio ordinario.

    A meno che non venga specificato diversamente, in un certo contesto, ai fini diuna maggiore chiarezza espositiva, utilizzeremo la seguente notazione:

    a) Simboli del calcolo delle proposizioni:

    P - proposizioneP - negazioneP & Q - congiunzioneP v Q - disgiunzioneP -> Q - implicazioneP Q - doppia implicazione

    b) Simboli del calcolo delle classi

    x - appartenenza - inclusione = - identit' - complementazione - intersezione - unione

    c) Quantificatori

    (x) - universale (per ogni)(x) - esistenziale (esiste un)

  • 8/6/2019 messaggi e comunicazione

    21/328

    21

    Definiamo ora una metrica associativa su un arbitrario insieme di oggetti,consideriamo alcune definizioni.

    Definizione 2.2.1 (Definizione di -anello)

    Sia X un insieme non vuoto e S un sottoinsieme non vuoto di|P(X), potenza di X, S un anello se:

    (i) xi, xj S => xi \ xj S

    (ii) xn S (n) |N => xn S

    n=1

    Se, di pi, X S, allora S una -algebra.

    Definizione 2.2.2 (Definizione di Spazio Topologico)

    Sia T una topologia per X; (x,T) spazio topologico:

    1) T e X T

    2) (xi),(xj) xi,xj T xk Tk=i,j

    3) (x1),(x2),...,(xn) con n finito x1,x2,...,xn T

    n xk Tk=1

    allora T una -algebra.

  • 8/6/2019 messaggi e comunicazione

    22/328

    22

    TEOREMA 2.2.3

    Se : X --> Y e T un -anello di sottoinsiemi di Y,

    -1allora { (y): y T } un -anello di sottoinsiemi di X.

    Se S un -anello di sottoinsiemi di X, allora

    -1{ y : y Y, (y) S } un -anello di sottoinsiemi di Y.

    (fig 2.1)

  • 8/6/2019 messaggi e comunicazione

    23/328

    23

    TEOREMA 2.2.4

    INDUZIONE DI SPAZI METRICI ISOMETRICI SU INSIEMI

    Sia 1 : T1 --> |R+ \ {} una misura finita sulla topologia T1

    (X,T1) , vale :

    (i) 1 non negativa

    (ii) 1() = 0

    (iii) 1 numerabilmente additiva

    (iv) 1 finita

    di pi valga (v) 1(xi) 0 (xi) T1 , xi

    Siano (X,T1) , (Y,T2) due spazi topologici.-1

    Sia : T1 ---> T2 tale che () = .

    Consideriamo la seguente funzione 2 : T2 ---> |R+ \ {}-1

    cos definita: 2(y) = ( (y)) , y T2

    allora 2 una misura finita infatti :

    (i) 2 non negativa-1

    (ii) 2() = 1( ()) = 1() = 0

  • 8/6/2019 messaggi e comunicazione

    24/328

    24

    (iii) 2 numerabilmente additiva essendolo 1

    (iv) 2 finita

    -1e allora vale 2(yi) = 1( (yi)) = 1(xi)

    dove xi T1 e yi T2 .

    Poniamo

    1(xi xj)a) dx (xi,xj) = kx (xi),(xj) T1

    1(xi xj)

    2(yi yj)b) dy (yi,yj) = ky (yi),(yj) T2

    2(yi yj)

    dx e dy sono distanze e inducono spazi metrici

    su T1 e T2 Mx = (T1,dx) , My(T2,dy)

    allora (xi),(xj),(yi),(yj) xi,xj T1 yi,yj T2

    2.2.5) dx (xi,xj) = dy (yi,yj)

    vale a dire Mx isometrico a My.

    Dimostrazione della 2.2.5).

    -1 -1 -1poich (yi) \ (yj) = (yi \ yj) ,

  • 8/6/2019 messaggi e comunicazione

    25/328

    25

    -1 -1 ( yn ) = ( yn ) e

    n=1 n=1

    -12 ( y ) = 1 ( ( y ))

    si ha-1

    2 ( yi yj) = 1 ( ( yi yj ) =

    -1 -1= 1 ( ( yi ) ( yj )) = 1 ( xi xj )

    e-1

    2 ( yi yj) = 1 ( ( yi yj ) =

    -1 -1= 1 ( ( yi ) ( yj )) = 1 ( xi xj ) .

    allora

    2(yi yj) 1(xi xj)dy (yi,yj) = ky = ky =

    2(yi yj) 1(xi xj)

    ky 1(xi xj) 1= kx = dx (xi,xj)

    kx 1(xi xj)

    kxdove =

    ky

  • 8/6/2019 messaggi e comunicazione

    26/328

    26

    Esempio:

    consideriamo una : X ---> Y

    dove X = [1,4]

    Y = [1,2[ , [3,4[ , [5,6]

    (x) = x x [1,2[

    (x) = x + 1 x [2,3[

    (x) = x + 2 x [3,4]

    (fig 2.2)

  • 8/6/2019 messaggi e comunicazione

    27/328

    27

    sia la misura 1:

    1 ([xi,xj]) = xj - xi

    allora

    2 ([(xi),(xj)]) = xj - xi

    per esempio:-1 -1

    2([1,4]) = 1([ (1), (4)]) = 1([1,3]) = 3 - 1 = 2

    1([1,2] [3,4]) (2-1)+(4-3) 2dx ([1,3],[2,4]) == =

    1([1,4]) 4 - 1 3

    2([1,2] [5,6]) 2([1,2])+2([5,6])dy ([1,4],[2,6]) = =

    2([1,6]) 2([1,6])

    1([1,2])+1([3,4]) (2-1)+(4-3) 2= = =

    1([1,4]) 4 - 1 3

    TEOREMA 2.2.6

    Definizione di una metrica su insiemi

    Sia X un insieme non vuoto e S un sottoinsieme di

    |P(X), la potenza di X.Sia : S ---> |R+ \ {} una misura su S.

    Allora la funzione d : S x S ---> |R+ , k |R+

  • 8/6/2019 messaggi e comunicazione

    28/328

    28

    definita come:

    a) d(,) = 0 per xi=xj=

    b) d(xi,xj) = k se (xi xj) = 0

    (xi xj)c) d(xi,xj) = k (xi), (xj), xi,xj S

    (xi xj) xi,xj (xi xj) 0

    dove

    (xi xj) = (xi xj) \ (xi xj) la differenza asimmetrica;

    soddisfa a:

    1) 0 d(xi,xj) < +

    2) d(xi,xj) = 0 sse xi=xj

    3) d(xi,xj) = d(xj,xi)

    4) d(xi,xj) + d(xi,xk) d(xj,xk) (xi),(xj),(xk) S

    e pertanto (S,d) uno spazio metrico

    e d una distanza.

    Dimostrazione :

    La dimostrazione dei punti 1) 2) e 3) segue immediatamente dalle definizioni.

  • 8/6/2019 messaggi e comunicazione

    29/328

    29

    Per dimostrare il punto 4) procediamo come segue:

    4) d(x1,x2) + d(x1,x3) - d(x2,x3) 0 (x1),(x2),(x3) S

    LEMMA 2.2.7

    A.1) (x1 x2) (x1 x3) - [ (x3) - (x3 x2) ]

    Dimostrazione della A.1:

    poich la misura dell'unione di due insiemi disgiunti sempreuguale alla somma della misura dei due insiemi vale:

    per ogni xm,xn S

    B.1 (xm) = (xm xn) + (xm \ xn)

    B.2 (xm \ xn) = (xm) - (xm xn)

    in particolare

    B.3 (x1 x3) = (x1 x3 x2) + ((x1 x3) \ x2)

    B.4 (x3) - (x3 x2) = (x3 \ x2)

    ora poich per ogni xm, xn, xk S vale:

    (con xm' si indica il complementare di xm)

    C.1 xm \ xn = xm xn'

    C.2 (xm \ xn) \ [xm \ (xn xk)] == (xm xn') [xm (xn xk)']' == (xm xn') [xm' (xn xk)]

  • 8/6/2019 messaggi e comunicazione

    30/328

    30

    applicando le regole di De Morgan

    (A B)' = A' B'e

    (A B)' = A' B'

    la C.2 diviene

    C.2 [(xm xn') xm'] [(xm xn') (xn xk)] =

    [(xm xn' xn) (xm xn' xk)] = xm xn' xk

    (fig. 2.3)

    perci

  • 8/6/2019 messaggi e comunicazione

    31/328

    31

    C.3 (xk xm) \ xn = (xk xm) xn' = xk xm xn'

    C.4 (xm \ xn) \ [xm \ (xn xk)] = (xk xm) \ xn

    da cui

    D.1 (xm \ xn) = ((xk xm) \ xn) + (xm \ (xn xk))

    quindi applicata nel nostro caso:

    D.2 (x3 \ x2) = ((x1 x3) \ x2) + (x3 \ (x2 x1))

    (fig. 2.4)

  • 8/6/2019 messaggi e comunicazione

    32/328

    32

    Allora la A.1, per la B.3 e per la B.4, diviene

    A.1 (x1 x2) (x1 x3) - [(x3) - (x3 x2)]

    (x1 x2) (x1 x3 x2) + ((x1 x3) \ x2) -

    - [(x3) - (x3 x2)]

    (x1 x2) (x1 x3 x2) + ((x1 x3) \ x2) - (x3 \ x2)

    per la D.2 si ottiene

    (x1 x2) (x1 x3 x2) + ((x1 x3) \ x2) -

    - ((x1 x3) \ x2) - (x3 \ (x2 x1))

    pertanto

    (x1 x2) (x1 x3 x2) - (x3 \ (x2 x1))

    che dimostra l'asserto (Lemma 2.2.7)

    LEMMA 2.2.8

    A.2 (x1 x2) = (x1) + (x2) - (x1 x2)

    la dimostrazione immediata.

    Consideriamo la 4)

    4) d(x1,x2) + d(x1,x3) - d(x2,x3) 0

    (x1 x2) (x1 x3) (x2 x3)+ - 0(x1 x2) (x1 x3) (x2 x3)

  • 8/6/2019 messaggi e comunicazione

    33/328

    33

    (x1 x2) - (x1 x2) (x1 x3) - (x1 x3)+ -

    (x1 x2) (x1 x3)

    (x2 x3) - (x2 x3)- 0

    (x2 x3)

    Consideriamo il termine:

    (x2 x3) - (x1 x3) (x2) + (x3) - 2 (x2 x3)T.1=

    (x2 x3) (x2) + (x3) - (x2 x3)

    dal lemma A.1 (x2 x3) (x2 x1) - [(x1) - (x1 x3)]

    otteniamo

    (x2 x3) - (x1 x3)

    (x2 x3)

    (x2) + (x3) - 2 {(x2 x1) -[(x1) - (x1 x3)]}(x2) + (x3) - (x2 x1) + [(x1) - (x1 x3)]

    (x2) + (x3) + 2(x1) - 2(x2 x1) - 2(x1 x3)=(x1) + (x2) + (x3) - (x2 x1) - (x1 x3)

    (x1) + (x2) - (x2 x1) - (x2 x1)= +(x1) + (x2) - (x2 x1) + [(x3) - (x1 x3)]

  • 8/6/2019 messaggi e comunicazione

    34/328

    34

    (x1) + (x3) - (x1 x3) - (x1 x3)+ =(x1) + (x3) - (x1 x3) + [(x2) - (x2 x1)]

    (x1 x2) - (x1 x2)= +(x1 x2) + [(x3) - (x1 x3)]

    (x1 x3) - (x1 x3)+(x1 x3) + [(x2) - (x2 x1)]

    poich [(xm) - (xm xn)] 0 vale:

    (x1 x2) - (x1 x2) +(x1 x2) + [(x3) - (x1 x3)]

    (x1 x3) - (x1 x3)+ (x1 x3) + [(x2) - (x2 x1)]

    (x1 x2) - (x1 x2) (x1 x3) - (x1 x3)+

    (x1 x2) (x1 x3)

    che dimostra la tesi. (punto 4)

    Esempio:

    d(xi,xk) + d(xk,xj) d(xi,xj)

    Consideriamo come elementi dell'insieme S tre intervalli in |R.

    x1 = [1,4] x2 = [3,5] x3 = [2,6]

  • 8/6/2019 messaggi e comunicazione

    35/328

    35

    ([1,4] [2,6]) (2-1)+(6-4) 3d(x1,x3) ===

    ([1,4] [2,6]) (6-1) 5

    ([2,6] [3,5]) (3-2)+(6-5) 2d(x3,x2) ===

    ([2,6] [3,5]) (6-2) 4

    ([1,4] [3,5]) (3-1)+(5-4) 3d(x1,x2) ===

    ([1,4] [3,5]) (5-1) 4

    3 2 22 15 3+= > =5 4 20 20 4

    1 2 3 4 5 6x1 []

    x2 []

    x3 []

    (fig 2.5)

  • 8/6/2019 messaggi e comunicazione

    36/328

    36

    2.3 Il processo di inferenza

    Il processo di inferenza essenzialmente un processo di prova ed errore.Quando un programma analizza un certo stato, deve essere in grado di deciderese sta andando nella direzione giusta o se deve cambiare direzione. Questadecisione un compito estremamente difficile, in essa si riassume tutta lapotenzialit dell'algoritmo di soluzione.Metodi euristici cercano di produrre inferenze generate dal computerprocedendo nello stesso modo in cui noi procederemmo sulla base della nostraesperienza. Affinch un programma possa produrre inferenze corrette necessario che utilizzi quei principi euristici che sono pi efficaci per unoscopo particolare: pi lo scopo particolare e definito pi i principi euristicipossono essere efficaci. importante a questo scopo scoprire come siapossibile utilizzare la conoscenza euristica umana nei programmi a computer.

    I metodi di inferenza possono essere classificati in :

    1) inferenza probabilistica;2) inferenza induttiva;3) inferenza basata sul ragionamento del senso comune4) inferenza basata sul ragionamento qualitativo5) inferenza basata sul ragionamento analogico

    Il processo di scoprire le similarit e di usarle in una inferenza esso stessoun'inferenza nota come principio di inferenza, e tale inferenza esiste ovunque eovunque viene utilizzata. Infatti ovunque nel ragionamento umano troviamoquesto principio di inferenza: il riconoscimento delle similarit.Non si potrebbe vivere senza operare con tale inferenza.Nel giudizio che diamo, costantemente, su di un fatto presente, teniamo inconsiderazione tutti i fatti precedenti che presentano delle relazioni con il fattoattuale e il nostro giudizio si basa sulla quantit di similarit che riusciamo ascoprire. Inferire una conclusione da un'inferenza - regola di inferenza -trovando le similarit dalle sue ipotesi un importante tecnica. Le similarit simanifestano grazie ad un accordo o concomitanza delle rappresentazioni deifatti considerati. Anche nel caso di accordo perfetto, ci sono molte forme in cui

    si manifesta questo accordo, per esempio, l'accordo di due simboli, l'accordodi due liste di simboli, l'accordo di due strutture o l'accordo di due strutturegrafiche. Nel caso di accordo non perfetto, vi sono ancora parecchiepossibilit. Basta pensare a cosa intendiamo quando diciamo che due stringhedi caratteri sono simili, o che due strutture grafiche sono simili, o due frasi,oppure quando riconosciamo similarit fra due figure bidimensionali, disegni,

  • 8/6/2019 messaggi e comunicazione

    37/328

  • 8/6/2019 messaggi e comunicazione

    38/328

    38

    Il tesaurus di Roget sembra sottolineare i sinonimi piuttosto chel'organizzazione di parole per concetti generali e parole per concettispecifici.

    TABELLA Tesaurus di Roget---------------------------------------------------------------------------------

    classe sezione codice---------------------------------------------------------------------------------1. relazioni astratte esistenza 1-8

    relazioni 9-24quantit 25-57

    ordine 58-83numero 84-105tempo 106-139cambiamento 140-152causalit 153-179

    2. spazio spazio in generale 180-191dimensioni 192-239forma 240-263movimento 264-315

    3. materia materia in generale 316-320materia inorganica 321-356materia organica 357-449

    4. intelletto (uso della mente)(1) formazione di idee in generale 450-454

    condizioni a priorie operazioni 455-466materiale per ilragionamento 467-475processi per ilragionamento 476-479risultati delragionamento 480-504estensioni del

    pensiero 505-513pensiero creativo 514-515(2) comunicazione delle idee natura delle idee

    comunicate 516-524modelli dicomunicazione 525-549

  • 8/6/2019 messaggi e comunicazione

    39/328

    39

    significato delleidee comunicate 550-5995. volont (esercizio della volont)

    (1) volont individuale volont in generale 600-619volont prospettica 620-679azione volontaria 680-703antagonismo 704-728esito dell'azione 729-736

    (2) volont sociale volont socialein generale 737-759volont socialeparticolare 760-767

    volont socialecondizionata 768-774relazioni possessive 775-819

    6. emozione,religione e moralitgenerale 820-826emozione personale 837-887emozioneinterpersonale 888-921moralit 922-975religione 976-1000

    ---------------------------------------------------------------------------------------

    (fig 2.6)

    A differenza del thesaurus di Roget che presenta un carattere generale, lamaggior parte dei thesaurus costruiti si occupano di termini tecnici propri disettori particolari. I concetti propri di aree tecniche come per esempiol'ingegneria elettronica, la scienza del computer o l'economia sono espressiin termini tecnici. necessario raggruppare tutti i termini tecnici di unaparticolare materia e chiarire le relazioni tra tali termini per rendere ilsignificato dei termini e delle strutture il pi chiaro possibile. A differenza diun thesaurus di termini generali, un thesaurus di termini tecnici di solitocreato con un preciso proposito; come per esempio creare un sistema di ricerca

    delle informazioni con una determinata organizzazione e utilizzare taleorganizzazione come strumento per processare il linguaggio naturale.

  • 8/6/2019 messaggi e comunicazione

    40/328

    40

    possibile individuare le seguenti relazioni dalle connessioni tra terminitecnici:

    1) relazioni tra nomia) sinonimi - antinomieb) termini generali - termini specificic) parole similid) relazioni

    d1) relazione parte_di, relazione composto_dad2) relazione d'ordine, di causa-effetto, successioned3) relazione logicad4) relazione di simiglianza

    (determinata dall'avere le stesse caratteristiche)e) parole composte - parole derivate

    2) relazioni tra verbi e nomi esempioa) soggetto del verbo il cane abbaiab) oggetto comprare un libroc) beneficiario dare qualcosa al caned) strumento, metodo mangia col cucchiaioe) locazione va a Romaf) tempo arriva alle cinquef) causa arriver tardi a causa di un terremotog) ruolo la sua funzione dirigente

    I sistemi di Information - Retrieval usano spesso relazioni che valgono tra leparole, come nel caso 1). Le relazioni del tipo 2) tra verbi e nomi vengonoutilizzate per analizzare frasi oppure per analizzare il contesto di un'azionenell'ambito della rappresentazione della conoscenza. Nell'ambito di un'areatecnica una parola conserva un preciso significato tecnico a cui fortementelegata. Considerando il mondo accademico come un'area tecnica specifica,notiamo che oltre alle parole che sono considerate standard nel mondoaccademico, varie altre parole possono essere usate per indicare lo stessooggetto.

    Una parola che sia ufficialmente riconosciuta come indice chiamatadescrittore; altre parole sono considerate non descrittori.

  • 8/6/2019 messaggi e comunicazione

    41/328

  • 8/6/2019 messaggi e comunicazione

    42/328

  • 8/6/2019 messaggi e comunicazione

    43/328

    43

    2.4 Il trattamento dell'incertezza

    Consideriamo, ora brevemente, il tema della conoscenza inferenziale e dellarisoluzione di problemi.(Inferential Knowledge and Problem Solving).

    Il primo compito che ci si prefigge quando si affronta un problema, cercandoneuna soluzione automatica, consiste nel rappresentare lo spazio degli stati delproblema stesso.

    Vi sono principalmente due tipi di informazione che descrivono gli statiaccessibili di un problema:

    a) primo tipo di conoscenza: certi fatti sono veri;b) secondo tipo di conoscenza: regole del tipo "IF fatto1 THEN fatto2".

    Per esempio consideriamo il seguente semplice problema: depositiamo tremonete sul tavolo a caso, alcune saranno rivolte dalla parte testa altre dallaparte croce. Il gioco consiste nell'ottenere tutte le monete girate nellostesso verso, tutte testa o tutte croci, a partire dalla configurazione casualeiniziale; l'unica mossa consentita consiste nel girare due monete

    contemporaneamente.Allora, riassumendo, si hanno i seguenti punti:

    1) La soluzione la configurazione con tutte e tre le monete dalla stessafaccia: T T T oppure C C C.

    2) Ad ogni istante il problema espresso da uno stato particolare.

    3) Le regole del gioco consistono nella transizione da uno stato ad un'altro.

    4) Sono permesse parecchie transizioni che creano una struttura ad albero.Tale struttura chiamata: albero di ricerca (search tree). Poich il numero

    degli stati finito abbiamo uno spazio degli stati finito (state-space search). Adogni transizione ogni transizione successiva ammessa: gli stati successivisono in relazione OR (Or tree). Avremo un grafo degli stati (state graph).La verifica delle regole della forma A --> B detta pattern matching.

  • 8/6/2019 messaggi e comunicazione

    44/328

    44

    Questo primo semplice esempio contiene gli elementi principali da definirenella formalizzazione della soluzione automatica di problemi. Nell'esempio leconfigurazioni possono essere elencate una per una e rappresentate peresempio come (T,C,T).Vediamo un caso leggermente pi complesso, consideriamo n monete. In talcaso il numero delle configurazioni diviene eccessivo. Rappresentiamo alloragli stati raggruppandoli (grouping state) con la coppia di valori numerici(n1,n2) che rappresentano:

    1) n1 = numero di T teste nella configurazione;2) n2 = numero di C croci nella configurazione;3) n1 + n2 = n ;

    4) n1 ed n2 positivi.

    Le regole diventano:

    stato corrente stato successivoa) (n1,n2) (n1-2,n2+2)b) (n1,n2) (n1+2,n2-2)

    Il Goal : (0,n) oppure (n,0).

    Dagli esempi risulta evidente come l'algoritmo di soluzione sia legato al tipodi rappresentazione del problema.

    Per affrontare problemi di una certa complessit occorre raffinare gli algoritmidi risoluzione e implementare con metodo la base di conoscenza. Alcunetipologie di risoluzione e di rappresentazione della base di conoscenza sonodivenute di uso corrente grazie alla diffusione e standardizzazione dei sistemiesperti, anche se la ricerca in tale settore non li rende definitivi, oggigiornopossiamo trovare sistemi esperti efficienti ed affidabili.I sistemi esperti si compongono di:

    a) una base di conoscenza;b) un motore inferenziale.

    I principali problemi non ancora completamente risolti ed oggetto di ricercanel settore dei sistemi esperti possono essere riassunti nei seguenti punti:

  • 8/6/2019 messaggi e comunicazione

    45/328

  • 8/6/2019 messaggi e comunicazione

    46/328

    46

    d) le regole che definiscono le possibili transizioni tra unostato e l'altro;

    e) i fatti e le regole che aiutano a decidere la via migliore daseguire per passare da uno stato ad un altro(conoscenza euristica).

    utilizzando la conoscenza euristica che si stabiliscono le "priorit" tra glistati. La conoscenza, per poter essere interpretata dal motore inferenziale,deve essere "racchiusa" in strutture formali adeguate.

    Il metodo principale consiste nella rappresentazione della conoscenza tramite

    regole.

    L'insieme delle regole e delle proposizioni della base di conoscenza forma ungrafo (e non un albero) in quanto regole diverse possono avere in comune delleproposizioni antecedenti e possono avere la stessa proposizione comeconseguente. Proposizioni che sono fra gli antecedenti di una regola possonoessere conseguenti di altre. Un importante problema che ci si pone durante laprogettazione degli algoritmi risolutivi come trasformare il grafo delproblema in un albero.

    Le regole si possono suddividere in tre classi:

    1) question - affermazioni iniziali ;2) proposizioni intermedie ;3) goal - deduzioni finali.

    Esiste un nodo spinoso noto a coloro che si occupano di risoluzione diproblemi tramite l'utilizzo di grafi e consiste nel problema dei grafi viziosi:grafi che presentano dei cicli ineliminabili (loop).Il problema dei grafi viziosi pu essere formulato nel modo seguente:

    Esiste un ai {a1,a2,...,an} tale che se:

    {a1,a2,...,an}--> bj ; {...,bj,...}-->......--> vk ; {...,vk,...}--> z tale che z = ai

    Le principali tecniche per descrivere la conoscenza necessaria a imitarel'euristica sono:

  • 8/6/2019 messaggi e comunicazione

    47/328

    47

    a) l'uso di metaregole, regole che parlano di regole, che consigliano la scelta diregole al posto di altre ( es. probabilit e livello di astrazione ) ;

    b) l'uso di funzioni di valutazione, in altri termini indicatori con cui valutare ilpercorso pi probabile.

    Nella soluzione di un problema la ricerca euristica e la ricerca sistematicapossono essere utilizzate in maniera sinergica. La ricerca euristica nongarantisce la soluzione ottima, in particolare si osserva:

    a) adeguatezza statistica dell'euristicain contrasto con la

    b) particolarit individuale dell'evento.

    Consideriamo, ora, il funzionamento di un sistema esperto dal punto di vistaalgoritmico.Un sistema esperto funziona sulla base del motore inferenziale.Il funzionamento del motore inferenziale costituito essenzialmente da unaiterazione di cicli di riconoscimento/attivazione di regole, tipicamentesuddivise in:

    a) ricerca nella base di conoscenza delle regole pertinenti, ossia quellecollegate con lo stato attuale nel processo di soluzione del problemaconsiderato;

    b) selezione della prima regola incontrata oppure della regola pi appropriata(strategia prefissata);

    c) esecuzione della regola e registrazione nella base di dati dei cambiamenticonseguenti all'applicazione della regola.

    Ad ogni ciclo si producono nuove informazioni che si aggiungono alla basedi dati e che vengono utilizzate nei cicli successivi.Il processo si arresta quando viene trovata la soluzione. importante ricordare che si hanno due diversi livelli di soddisfacimento per

    una proposizione:

    1) il livello di valutazione parziale che si ha quando stata applicata unaregola che ha come conseguente una certa proposizione;

  • 8/6/2019 messaggi e comunicazione

    48/328

    48

    2) il livello di valutazione globale che si ha quando sono state applicate tutte leregole che hanno quelle proposizioni come con seguente.

    Quando il motore inferenziale tratta l'incertezza necessario che per lavalutazione globale si tenga conto dei contributi apportati da tutte le singoleregole che hanno quella proposizione come conseguente cio tutte levalutazioni parziali.

    Esistono due modalit di procedere nella ricerca di una soluzione, goal, datecerte premesse: modalit forward e modalit backward:

    a) forward - si procede dal basso verso l'alto (bottom-up)

    (questions) dai dati del problema ---> goal;

    b) backward - si procede dall'alto verso il basso (top-down)dal goal ---> ai dati del problema (questions).

    Esistono alcuni modi di percorrere l'albero di ricerca, in particolare:

    1) da sinistra verso destra (breadth first) un livello dopo l'altro;

    2) in profondit, dall'alto al basso nell'albero (depth first);

    3) con funzione di valutazione, il percorso pi promettente (best first).

    Soffermiamoci, in particolare, sul metodo best first.Data la lista dei nodi iniziali si esplora il primo nodo, e si genera la lista deinodi figli. Con l'aiuto di una funzione euristica si riordina la lista totale, ovveroquella iniziale unita a quella dei nodi figli generati nella prima esplorazione.Alcuni nodi possono essere scartati. Si prende il primo nodo e si genera la listadei nodi figli. Il processo si ripete. Il risultato una visita in alcuni tratti inprofondit e in altri per livelli.

    Quando si gestisce l'incertezza bisogna tener conto di tutte le componenti checontribuiscono alla valutazione di una proposizione. Col metodo best first non

    si tiene conto del contributo di quelle componenti che si suppongonoininfluenti al fine della valutazione globale di una proposizione; si effettuanocio delle potature sui rami che vengono valutati portare contributo nullo.

    Vediamo, nel seguito succintamente, una struttura teorica per il trattamentodell'incertezza.

  • 8/6/2019 messaggi e comunicazione

    49/328

    49

    I sistemi esperti che trattano l'incertezza lavorano con regole e proposizioni acui sono associati dei pesi che, in generale, consistono di numeri reali. Ilmotore inferenziale non deve solo individuare una soluzione (goal) vera,piuttosto deve essere in grado di gestire e "diffondere" l'incertezza espressanei pesi delle question e delle regole attraverso tutta la rete di deduzioni, perfornire il peso di ogni goal.La propagazione dell'incertezza prevede passi di quattro tipi:

    1) il peso delle proposizioni negate deve essere derivato dal peso delleproposizioni affermative;

    2) il peso di una proposizione conseguente deve essere calcolato dai pesi delle

    proposizioni antecedenti;

    3) il peso di una proposizione conseguente di una regola riceve da tale regolaun contributo dipendente dal peso della regola;

    4) una proposizione conseguente varie regole riceve un peso globale ottenutocomponendo i contributi di ciascuna regola.

    Si denota come "combining function" la funzione che combina i pesi nellamaniera richiesta dai punti sopra esposti.Esistono due tipi di approccio al problema dei pesi:

    a) approccio "estensionale" - in questo approccio non si parla di pesi comeprobabilit classiche, ma ci si pone al di fuori di qualsiasi strutturaprobabilistica;

    b) approccio "intensionale" - in questo approccio si cerca di interpretare i pesicome delle probabilit.

    Analizziamo alcune caratteristiche tipiche di una "combining function".

    Assumiamo che l'insieme dei pesi sia contenuto nell'intervallo [-1,1] dove siintende:

    peso 1 - certamente veropeso -1 - certamente falsopeso 0 - completamente indeterminato - sconosciuto.

  • 8/6/2019 messaggi e comunicazione

    50/328

    50

    definiamo allora:

    1) w(P) - peso globale della proposizione p ;2) w(P) - peso della negazione della proposizione p ;3) wr(A) - peso antecedente della regola r ;4) w(r) - peso della regola r ;5) wr(P) - peso parziale della proposizione P dovuto alla regola r.

    gli operatori della combining function diventano:

    a) neg(w(P)) = w(P) peso di una proposizione negata;b) conj(w(a1),...,w(an)) = wr(A) peso di un antecedente;c) ctr(wr(A),w(r)) = wr(P) peso parziale;d) glob(w1(P),...,wn(P)) = w(P) peso globale.

    Descriviamo per sommi capi il sistema di deduzione di Hajek.Poich per la propagazione della conoscenza incerta ci avvaliamo di un certonumero di funzioni operanti su un insieme di pesi, ragionevole pensare dipoterla inquadrare in una struttura algebrica, in particolare in un gruppo.Una struttura algebrica composta da:

    1. un insieme S detto sostegno;2. un certo numero di operazioni defiite su S;

    3. un certo numero di assiomi: propriet che le operazioni debbono soddisfare.Esaminiamo le esigenze di propagazione dell'incertezza.Oltre al livello di fiducia attribuito ad una proposizione o regola dobbiamoessere in grado di esprimere anche un grado di fiducia "indifferente" o"sconosciuto"; lo indicheremo con e elemento neutro :

    e: S ---> S

    La funzione glob deve calcolare il peso globale di una proposizione infunzione dei contributi che le derivano dalle regole di cui conseguente. Sipu dedurre da un'operazione binaria di composizione:

    + : S x S ---> Stale che

    glob(w1,w2,...,wn) = w1 + w2 + ... + wn

  • 8/6/2019 messaggi e comunicazione

    51/328

    51

    Poich vogliamo che l'ordine delle regole convergenti ad una proposizionesia ininfluente sul peso globale delle proposizioni la composizione + devegodere delle seguenti propriet:

    1) associativa: (w + v) + u = w + (v + u) = w + v + u2) commutativa: w + v = v + w3) elemento neutro: w + e = w

    La funzione neg calcola, noto il peso di una proposizione, il peso della suanegazione. Si pu esprimere tale funzione mediante l'operazione unaria:

    _( ) : S ---> S

    di simmetria:_ _

    neg(w) = w inoltre w + w = e

    vogliamo infine essere sempre in grado di dire quale il minore fra due pesidati: introduciamo una relazione d'ordine tale che per ogni w, v, u :

    1. w v oppure w > v per cui l'ordine totale su S2. w v , v u ---> w u3. w v ---> w + u v + u

    Abbiamo cos identificato un gruppo abeliano ordinato G composto di:a) un sostegno Sb) operatori - 1. zeraria: elemento neutro e

    _2. unaria: elemento simmetrico ( )3. binaria: composizione +

    c) assiomi:1. associativit (w+v)+w = w+(v+u) = w+v+u2. commutativit w+v = v+w3. w+e = w

    _4. w+w = e5. wv oppure w>v6. wv , vu --> wu7. wv --> w+u v+u

  • 8/6/2019 messaggi e comunicazione

    52/328

    52

    Vediamo allora come si presenta il sistema di deduzione di Hajek.

    1. Un sistema di regole R esente da loop.

    2. Un opportuno dominio D nell'intervallo [-1,1] di pesi_

    3. Una struttura < D,+,( ),e, > che sia la chiusura di un gruppo abelianoordinato

    4. Le funzioni neg, conj, ctr definite come segue:_

    a) neg(a) = a

    b) conj(a,b) = min(a,b)

    c) ctr(a,b) = min(a,b) se a > e , b > e oppure___ _min(a,b) se a > e , b e oppure

    e se a e

    d) la funzione glob definita come

    w1,w2,...,wn D : glob(w1,w2,...,wn) = w1+w2+...+wnCon queste assunzioni siamo pertanto in grado di determinare:

    1. il peso di una regola2. il peso globale di una proposizione

    Per quanto riguarda l'approccio probabilistico al trattamento dell'incertezza possibile riportare le seguenti considerazioni. Si pu interpretare il peso di unaproposizione come una "misura" (essenzialmente una misura di probabilit)della collezione di tutti i possibili mondi in cui la proposizione vera.Il tentativo indirizzato a trovare la migliore distribuzione che soddisfi le

    condizioni marginali e usarle per trovare le probabilit delle proposizioni.Esistono due approcci:

    a) teoria della probabilit diretta;b) teoria della probabilit condizionata.

  • 8/6/2019 messaggi e comunicazione

    53/328

    53

    La teoria della probabilit condizionata osserva che le probabilit associate aipossibili risultati cambiano ad ogni passo in dipendenza dello svolgersi deglieventi. Queste osservazioni suggeriscono che l'accumularsi di evidenzepu cambiare le probabilit degli eventi.In generale non ci sono ragioni "a priori".

    Vediamo un approccio, dovuto ad Hajek, al trattamento dell'incertezza conutilizzo dei concetti della probabilit.Consideriamo le regole espresse nella forma: A ---> H(w) dove:A = antecedente, H = conseguente, w = peso.

    Per semplificare supponiamo siano vere le seguenti affermazioni:

    1. La base di conoscenza non deve avere proposizioni intermedie, vi sarannosolo question e goal;

    2. I pesi appartengono all'intervallo [0,1] anzich a [-1,1];

    3. L'utente ha la possibilit di rispondere utilizzando solo i pesi {0,0.5,1} checorrispondono rispettivamente a no, non so, si.

    Se un certo campo di conoscenza e K un sistema di pesi allorapossiamo scrivere = (,K). Per ogni goal H e ogni congiunzione

    elementare E di question possiamo definire peso globale di H dato Ecome:

    1) W() = (+) K(En --> E) per ogni En appartenente ad E

    Una distribuzione congiunta su Quest Goal una funzione D associata adogni congiunzione elementare di elementi di Quest Goal tale che:

    2) (+) D(K) = 1 per ogni K appartenente al dominio di D

    La probabilit

    3) P(K) = (+) D(Kn) per ogni K appartenente alD dominio di D e per tutti i

    Kn che contengono K

  • 8/6/2019 messaggi e comunicazione

    54/328

    54

    la probabilit condizionata E Ques, H Goal data da:

    P(H,E)D

    4) P(H/E) = D P(E)

    D

    L'approccio probabilistico al trattamento dell'incertezza presenta notevolidifficolt sia tecniche che concettuali e la ricerca ancora lontana da unasoluzione definitiva o anche semplicemente dalla costruzione di un modelloprobabilistico soddisfacente.A questo riguardo, trovo utile riportare alcune considerazioni ed alcuni teoremisignificativi nello studio della problematica connessa all'approccioprobabilistico del trattamento dell'incertezza in un sistema di deduzioni.

    Facendo riferimento al modello di Gaines vi sono alcuni punti da tenere inconsiderazione. La conoscenza che deve essere acquisita consiste in:

    a) conoscenza fattuale ovvero descrizione del mondo e metodi di risoluzione;b) valutazioni euristiche ed empiriche.

    La nozione centrale di tale modello il concetto di distinzione.

    Le distinzioni sono le strutture pi elementari dell'informazione, ci che distinguibile da tutto il resto; le distinzioni possono riguardare elementi staticio elementi dinamici. In particolare una semplice classificazione delledistinzioni potrebbe essere la seguente:

    a) costruzioni - le distinzioni fatte sugli eventi del mondo;b) esperienze - eventi che capitano o che facciamo accadere;c) ipotesi - razionalizzazioni dell'esperienza;d) analogie - corrispondenza rilevante tra ipotesi diverse;e) astrazioni - raffinamenti delle analogie;f) trascendenze - ci che va al di l dell'astrazione.

    L'acquisizione delle valutazioni segue la fase di rappresentazione dellaconoscenza questo processo riguarda:

    1) lo schema di percezione dell'incertezza;2) il metodo di propagazione dell'incertezza;

  • 8/6/2019 messaggi e comunicazione

    55/328

    55

    3) le valutazioni sugli elementi del mondo e sui mezzi di soluzione deiproblemi.

    In relazione alla possibilit di costruire un gruppo abeliano idoneoall'implementazione di un sistema di deduzione con caratteristiche analoghe aisistemi prospettati divengono utili i seguenti teoremi e le seguentiproposizioni.

    TEOREMA 2.4.1 (di Levi).

    In base al teorema di Levi un gruppo pu essere ordinato se e solo se perogni x diverso da e elemento neutro, per ogni n numero naturale positivo si

    ha:

    1. n * x = x + x + ... + x diverso da e

    PROPOSIZIONE 2.4.2_

    Dato il gruppo abeliano ordinato G = < S1, + , ( ) , >, se S ha almeno unelemento oltre ad e, allora non esiste in G un elemento che sia massimo n unoche sia minimo, per cui G infinito.La dimostrazione segue dalle seguenti osservazioni:

    1. per ogni x G se x < e --> x + x < x (x + x) G,2. per ogni x G se e < x --> x < x + x (x + x) G.

    PROPOSIZIONE 2.4.3

    Sia una funzione crescente di [-1,1] su [-,+], sostegno del gruppoadditivo di reali |R = .Su [-1,1] esiste un gruppo abeliano ordinato archimedeo G = tale per cui un isomorfismo da G ad |R se e solo se dispari, ossia seper ogni x vale:

    1. (-x) = - (x) .

  • 8/6/2019 messaggi e comunicazione

    56/328

    56

    PROPOSIZIONE 2.4.4

    Ogni gruppo ordinato G = isomorfo al gruppo additivodei reali |R = .Per ogni x [0,1] vi un unico isomorfismo di G su |R che ad x assegnaimmagine 1 [-,+].

    PROPOSIZIONE 2.4.5

    Siano 1 ed 2 funzioni crescenti dispari di [-1,1] su [-,+].Esiste un gruppo ordinato G su [-1,1] tale che sia 1 che 2 trasformano

    isomorficamente G in |R, se e solo se esiste un c>0 tale che 1(x) = c 2(x).PROPOSIZIONE 2.4.6

    Per ogni gruppo abeliano ordinato archimedeo G = esisteun'unica minima estensione non-archimedea G1 contenuta o uguale a Gdeterminata a meno di un isomorfismo.

    TEOREMA 2.4.7 (Belief network decomposition)

    Data una rete di affidabilit arbitraria (belief network) che possa esseresuddivisa in due insiemi di nodi, A e B, connessi con un singolo arco da un

    nodo x in A ad un nodo y in B. Se l'evidenza negli insiemi e(A) ed e(B),allora la probabilit a posteriori:

    P{A/e(A),e(B)} e P{B/e(A),e(B)}

    pu essere calcolata trasmettendo un singolo messaggio con un numero perciascun valore possibile di x da un insieme all'altro. In pi, i due messaggisono indipendenti.

  • 8/6/2019 messaggi e comunicazione

    57/328

    57

    (fig 2.8)

    I messaggi mandati tra A e B contengono tutte le informazioni rilevanti suciascun insieme.

    Il vantaggio di utilizzare messaggi per aggiornare la situazione sui nodi,anzich ricalcolare tutte le probabilit utilizzando le formule di Bayes, consistenel fatto che possibile comunicare solo le variazioni conservando integra laconoscenza sul sistema.Questo teorema rappresenta una fondamentale indicazione sulla dinamica disistemi in comunicazione reciproca e ci fornisce un importante analogia inrelazione a quanto si verr sostenendo nel seguito.

  • 8/6/2019 messaggi e comunicazione

    58/328

    58

    3. IL PROCESSO DI ASTRAZIONE

    3.1 Principali meccanismi di astrazione

    La conoscenza generalizzata attraverso il processo di astrazione. Laclassificazione di fatti simili selezionati in una larga collezione di fatti unparticolare tipo di astrazione.

    L'astrazione un procedimento mentale che si adotta quando si evidenzianoalcune propriet e caratteristiche di un insieme di oggetti, escludendone altre

    giudicate non rilevanti e giungendo alla definizione di un nuovo oggetto comeconcetto unificante rispetto alle propriet considerate.Il processo di astrazione non ancora ben compreso, n chiaro in chemodo esso si presenti nel ragionamento umano, possibile comunqueelencare alcune tipologie di astrazione: la classificazione, l'aggregazione, lageneralizzazione, l'associazione.a) La classificazione il processo di astrazione fondamentale che conducealla definizione di una classe di oggetti basandosi sulla osservazione che talioggetti hanno alcune propriet in comune.b) L'aggregazione un processo di astrazione mediante il quale si giunge ad un"oggetto" nuovo aggregando oggetti. Il fatto di costituire un nuovo oggettodiviene una propriet che si aggiunge a ciascun oggetto costituente

    l'aggregato.c) La generalizzazione consiste in una aggregazione di classi di oggettibasandosi sulle propriet comuni.d) L'associazione consiste nel suddividere un determinato insieme di oggetti ingruppi separati. La propriet di appartenere ad un determinato gruppo siaggiunge a tutti gli oggetti costituenti il gruppo medesimo.

    Nel lavoro di analisi di problemi per la loro rappresentazione simbolicaesistono alcuni termini particolarmente significativi che vengono solitamenteutilizzati:

    1) Entit

    Le entit sono degli elementi base di ogni rappresentazione, l'ossatura, laparte costituente.Un'entit descrive un concetto, un oggetto, un fatto,...Un'entit possiede un nome e in relazione a tale nome si aggregano gli attributiche descrivono l'entit. Il nome dell'entit il suo primo attributo, anche se nonsempre esso risulta essere univoco.

  • 8/6/2019 messaggi e comunicazione

    59/328

    59

    2) Gli attributiGli attributi sono anch'essi elementi fondamentali nella rappresentazione,esprimono le caratteristiche delle entit, la conformazione, le parti costituenti,ma anche la sintesi, il concetto unitario, la forma. Gli attributi possiedono unnome, una descrizione con cui sono identificati.

    3) Le proprietAnche le propriet descrivono le entit e svolgono un ruolo analogo agliattributi; anche se vi sono differenze concettuali, al fine di descrivere entit, lepropriet vengono considerate equivalenti agli attributi.

    4) Gli oggettiGli oggetti rappresentano entit con un certo spessore ed una particolareindividualit. Un oggetto richiama direttamente alla mente qualcosa diconcreto e tangibile, a differenza dell'entit che appare un concetto piastratto. Comunque esistono fraintendimenti ed ambiguit che avvicinano ilconcetto di oggetto al concetto di entit molto pi di quanto possa sembrare adun'analisi superficiale: per esempio un albero un oggetto o un'entit?L'albero che ho in giardino potrebbe essere un oggetto in un senso pi forterispetto all'abete che rappresenta una famiglia di alberi illustrato sul libro dibotanica. Il primo possiede un'esistenza propria, il secondo unarappresentazione di una classe astratta, ma, occorre ricordare, che a livello dicostruzione di sistemi automatici, per esempio i computer, ogni componente una rappresentazione astratta rispetto ad una "realt di interesse" ad essoestranea.

    5) I terminiIn ogni caso qualsiasi tipo di rappresentazione simbolica utilizza simboli, e talisimboli costituiscono l'abecedario con cui entit, oggetti, attributi, proprietpossono esprimersi nella rappresentazione: il simbolo, il nome, il terminerappresentano il mattone fondamentale su cui tutta la rappresentazione vienecostruita.

    6) Le classi

    I raggruppamenti di oggetti, o di entit rappresentano delle classi: peresempio gli abeti. Ora, i raggruppamenti di attributi rappresentano oggetti,raggruppamenti di oggetti rappresentano entit, raggruppamenti di entitrappresentano classi; ma appartenere ad una determinata classe un attributoo una propriet di un oggetto, pertanto un raggruppamento di entitrappresenta un attributo.

  • 8/6/2019 messaggi e comunicazione

    60/328

    60

    7) I dominiUna classe di entit che gode di una certa propriet viene chiamata dominiodella propriet stessa. I domini sono classi che possiedono una determinatacaratteristica idonea all'espletazione di un certo compito; uno specifico dominioviene di solito definito in relazione ad una specifica funzione.

    8) Le regoleUna trasformazione da un oggetto ad un'altro oggetto, da una propriet adun'altra propriet, descrivibile con una regola. Una regola consiste in unarelazione tra insiemi di oggetti o insiemi di attributi e di solito si esprime nellaforma: Se fatto-1 allora fatto-2.

    9) I legamiI legami tra oggetti o tra attributi descrivono una prima relazionefondamentale in cui gli oggetti o gli attributi stessi entrano in reciprocorapporto. Per cui se esiste una regola del tipo "Se fatto-1 allora fatto-2" esisteanche un legame tra il fatto-1 e il fatto-2, una connessione logica esprimibile inconcomitanza di eventi spazio temporali oppure semplicemente di coincidenzafra termini nella rappresentazione; I termini e i legami, in particolare i legamibinari, costituiscono l'ossatura di qualsiasi sistema di rappresentazione a statifiniti.

    10) I processiI processi attuano le regole. I processi realizzano ci che le regole descrivono.Un processo possiede una dimensione temporale attraverso cui esso stesso sisvolge; partendo da certe premesse produce determinati risultati. I processisono trasformazioni nella rappresentazione; le trasformazioni descritte daregole determinano l'evoluzione del sistema di memorizzazione.

    11) Frames o struttureI termini non sempre assolvono con efficacia al loro compito di rappresentareoggetti o attributi; la ragione principale di questa inadeguatezza risiede nellanon univocit dei termini utilizzati rispetto alla complessit della "realt diinteresse". Ragioni di efficenza costringono alla sintesi e pertanto divienenecessario ricondurre ad ambiti ristretti di validit, frames o strutture appunto,

    il significato che il termine esprime.

    12) Il contestoIl contesto un particolare tipo di struttura, con un significato intuitivospecifico, relativamente alla restrizione ad un particolare ambito deglielementi della rappresentazione.

  • 8/6/2019 messaggi e comunicazione

    61/328

    61

    13) I fattiI processi fanno riferimento ad un divenire, a trasformazioni nel tempo; i fatti ogli eventi, rappresentano gli oggetti nella loro dimensione temporale, insostanza gli oggetti possono essere pensati come a raggruppamenti di eventiche presentano una particolare costanza e continuit rispetto a determinatiattributi.

    14) La relazione parte_diUn oggetto pu essere parte di un altro oggetto.Gli oggetti possono essere scomposti in parti, in particolare ogni attributo diun oggetto pu essere discriminante e consentire l'individuazione di un oggettoche parte dell'oggetto originario: nella rappresentazione, oltre al nome, le

    sole informazioni che possediamo sugli oggetti sono costituite dall'insiemedi attributi che tali oggetti possiedono, per cui la possibilit di individuare leparti costituenti un oggetto risiedono esclusivamente nella possibilit didistinguere gli attributi da esso posseduti. Esiste una analogia tral'appartenere ad un insieme ed essere parte di un altro oggetto.

    15) La relazione composto_daUn oggetto pu essere composto da altri oggetti.Esiste una analogia tra essere un insieme di elementi ed essere composto daun insieme di altri oggetti.

    16) I verbiI verbi sono gli operatori del linguaggio naturale, e nello stesso tempodescrivono i processi, le trasformazioni, le azioni che si svolgono nella realt.In una rappresentazione utilizzabile da una procedura automatica i verbipossono essere descritti da regole e da relazioni.

    17) Gli operatoriGli operatori sono processi definiti che operano trasformazioni sugli oggettinella rappresentazione. Gli operatori possono essere descritti da insieme diregole che definiscono, a partire da certi stati in ingresso, quali debbonoessere gli stati in uscita, dopo l'esecuzione dell'operatore medesimo.

    18) I datiTutte le informazioni che il sistema di rappresentazione in grado dimanipolare debbono essere trasformate in dati, ovvero, configurazioni statichee definite di componenti del supporto di memorizzazione; una taletrasformazione implica un processo fondamentale a cui l'informazione sottoposta per poter essere memorizzata: la codifica.

  • 8/6/2019 messaggi e comunicazione

    62/328

    62

    19) Gli aggregatiIl processo di aggregazione il processo fondamentale che consente lacostruzione di classi e di raggruppamenti caratterizzanti gli oggetti e gliattributi che sono descritti nella rappresentazione. L'aggregazione tra elementicostituenti il sistema di rappresentazione non avviene in maniera statica unavolta per tutte, piuttosto un processo dinamico in continua evoluzione;non esistono aggregati definitivi, ogni raggruppamento possibile al fine diottenere un determinato risultato. Non si riparte, comunque, sempre da capo,ogni raggruppamento che ha prodotto risultati significativi lascia una traccia dis che pu essere utilizzata dal sistema di rappresentazione: in particolare unavolta attribuito un nome ad una determinata classe, questa risulta presentenella rappresentazione.

    20) Le registrazioniIl processo di memorizzazione delle informazioni avviene effettuando delleregistrazioni; le registrazioni consistono nella effettiva modificazione deglistati interni alla rappresentazione che conserveranno traccia degli eventiassociati alle registrazioni medesime: una tale variazione di stati pucoinvolgere, nel contempo, la costruzione o identificazione di aggregati confunzione classificatoria delle informazioni memorizzate.

    21) Le inferenzeLe inferenze rappresentano ci che il sistema di rappresentazione si aspettasucceda in realt nel mondo. Le inferenze dovrebbero avere una base statistica,anche se, affinch la statistica sia valida occorre che i parametri di valutazionedelle previsioni siano conformi, non solo nella forma ma anche nella sostanza,con i fenomeni reali, per definizione inconoscibili, che avvengono nella "realtdi interesse". Le inferenze si esprimono attraverso regole, ovvero attraverso larelazione di causa ed effetto tra eventi rappresentati nel sistema; una talerelazione viene espressa solitamente nella forma: Dal fatto-1 ne consegue,salvo evidenza del contrario, il fatto-2.

    Vedremo in seguito come, in una particolare rappresentazione degli oggetti edelle classi, si possa ricondurre i suddetti processi di astrazione in un unicoschema. Introdurremo nel seguito un esempio di rappresentazione formale

    che ci consentir ulteriori considerazioni su tali processi fondamentali diastrazione, per far ci ci serviremo del formalismo della programmazionelogica. Partiremo con l'indroduzione alla logica matematica, ma primatratteremo del concetto di simiglianza in un senso molto generale.

  • 8/6/2019 messaggi e comunicazione

    63/328

    63

    3.2 Il processo di categorizzazione

    Il mondo di cui ognuno ha esperienza composto da una quantit enorme dioggetti, se rispondessimo in modo unico registrando tutte le differenze tra lecose ben presto saremmo sopraffatti dalla complessit dell'ambiente. Lacreazione di categorie rende "equivalenti" cose discernibilmente diverse,consente di raggruppare gli oggetti e gli eventi in classi, e di rispondere ad essiin funzione della loro appartenenza ad una data classe piuttosto che della lorounicit (J.S.Bruner, 1956).

    Vi sono principalmente almeno cinque vantaggi nella formazione di categorie(Stephen K. Reed, Psicologia cognitiva):

    1) riduzione della complessit ambientale;

    2) strumento di identificazione (riconoscimento);

    3) minore necessit di apprendimento costante;

    4) possibilit di decidere sull'appropriatezza delle azioni;

    5) possibilit di ordinare e porre in relazione classi di oggetti o eventi;

    In particolare ,occorre sottolineare un aspetto fondamentale, riconducibile alfatto di possedere uno schema di classi: le categorie consentono di riconoscereoggetti nuovi sulla base del confronto con oggetti simili.

    Consideriamo il processo di identificazione dei concetti.Tale processo riguarda la capacit di riconoscere fatti, eventi, idee, oggetticome appartenenti ad uno schema pi generale; in altri termini riconoscerliappartenenti ad una classe sulla base delle caratteristiche che tali oggettipresentano.

    possibile isolare quattro regole principali di combinazione logica dicaratteristiche che consentono di individuare concetti:

    a) regola congiuntiva;AND - identificazione di una o pi caratteristiche per un certo scopo;

    b) regola disgiuntiva:OR - equivalenza tra due o pi caratteristiche per un certo scopo;

  • 8/6/2019 messaggi e comunicazione

    64/328

    64

    c) regola condizionale:IF fact-1 THEN fact-2 - se si verifica una determinata condizione fact-1 allora possibile una certa azione fact-2;

    d) regola bicondizionale:IF fact-k THEN SELECT fact-1 fact-2 ... fact-n - se si verifica unadeterminata condizione allora si applica una determinata regola di selezione;esempio: caratteristica condizionata da altre caratteristiche IF maschio THENentra SOLO SE ha la cravatta.

    Nel processo di identificazione dei concetti sulla base delle caratteristicheriscontrate nell'esperienza si rileva statisticamente che, oltre all'uso sistematico

    delle regole sopra riportate, esiste una dominanza legata alla frequenza dei casipositivi, sembrerebbe che vi sia uno squilibrio di base nella valutazionedei fatti tra eventi che accadono ed eventi che potrebbero accadere o che sononegati.

    esperienza comune che esistano delle categorie a cui tutti fannoriferimento, categorie fortemente condivise dalla comunit; le categorienaturali. Le categorie naturali si sono formate evolutivamente e hannoraggiunto per l'uomo una notevole stabilit, eppure le categorie naturali nonraccolgono esemplari ugualmente buoni, consideriamo per esempio i colori,essi sono distinti in intervalli di lunghezza d'onda e si presentano allapercezione con caratteristiche estremamente diverse l'uno dall'altro; dal puntodi vista dei fenomeni fisici la differenza tra il colore viola e il colore rosso piccola mentre percettivamente sono colori nettamente distinti.Se analizzate in dettaglio le categorie naturali mostrano una strutturagerarchica e dimensioni continue piuttosto che discrete. Nelle categorienaturali alcuni esemplari sembrano essere pi centrali di altri.Una affermazione di particolare interesse la seguente:

    La differenziazione delle categorie misurabile determinando in quale misura imembri di una categoria condividono alcuni attributi e posseggono attributidiversi da quelli di altre categorie.(Rosch, Gray, Johnsen e Boyes-Braem, 1976).

    possibile pensare ad un buon esemplare per ciascuna categoria, ma si trattadi un oggetto ben diverso dalla media di tutti gli esemplari. Il concetto diesemplare medio assume significato quando si pensa agli oggetti di unamedesima categoria base. Mentre assurdo tentare di definire la forma mediadi una classe: per es. la forma media dei mobili ?

  • 8/6/2019 messaggi e comunicazione

    65/328

  • 8/6/2019 messaggi e comunicazione

    66/328

    66

    Medin e Schaffer(1978) proposero un modello in cui gli esemplari di unacategoria vengono depositati in memoria e le configurazioni nuove vengonoconfrontate con gli esemplari recuperati sulla base delle somiglianze.Maggiore la somiglianza tra le configurazioni nuove e un esemplare inmemoria, maggiore la probabilit che questo venga recuperato. Il modello diMedin e Schaffer misura la somiglianza di combinazioni di caratteristiche.

    Consideriamo il problema dell'organizzazione semantica della struttura dimemorizzazione. Uno scienziato deve organizzare la propria base diconoscenza.

    La costruzione dell'edificio scientifico ha bisogno dei fatti allo stesso modo in

    cui la costruzione di una casa ha bisogno delle pietre; ma un'accumulazione difatti non costituisce una scienza pi di quanto un mucchio di pietre noncostituisce una casa. (Henri Poincar).

    Allo scopo di recuperare le informazioni rilevanti dalla memoria a lungotermine MLT, dobbiamo essere in grado di organizzare la nostra memoria.Molta dell'organizzazione semantica, cio si basa sul significatodell'informazione. Un modo particolarmente efficiente di organizzarel'informazione consiste nella formazione di gerarchie.Fondamentalmente esistono due modelli di memoria semantica:

    1) uno si basa sull'assunzione che le persone confrontano le caratteristichedelle due categorie allo scopo di determinare la loro relazione.

    2) l'altro modello si basa sull'assunzione che la relazione tra due categorieviene immagazzinata direttamente nella rete semantica, una strutturaconsistente in concetti coll