IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la...

6
,liadime~~ mOOMM 4«°5225;=3"- d=2° 4:57 .114111n7 .4110," .44/111F i '''....~..- -.m...mmn "- '' -."..'"'""»:. .-.,........__ mmm. mm.... --».' '..m... «.4%7Mm. --Z-m~M., - ._ 15 glith .."~aum 44111~,„, -*m à7 °Mglalib~_ -~lei m. 1111.n _ MaieRImm- "«"L-"ZrZ,,. .~ = b«11111911111:t2h:"~,_ ....egi = =ish. INS: IN 14‘s,,sio qi~ - ; tew.w.ae....7G . nnn =" nn..;"...~••••"" IN DIRETTA L'intelligenza come sistema integrato di comportamenti, buon senso e capacità di apprendere direttamente dall'esperienza: il «Modello avanzato di intelligenza artificiale» dell'IRST di Trento. IL PROGETTO MAIA di Luigi Stringa N on essendo né sostanza né accidente, la pe- ste non può esistere: e così don Ferrante morì di peste. Ma c'è anche chi ha rea- lizzato e collaudato con successo delle bellissime macchine termiche quando la teoria termodina- mica non era ancora stata inventata. Forse non brillavano per rendimento, ma funzionavano benissimo. L'intelligenza artificiale (R) non è proprio la peste (anche se alcune sue caratteri- stiche sembra possederle), ma non gode certo del supporto di un'elegante e convincente teoria unitaria. Sempre che ve ne possa mai essere una, e che la ricerca di questa non sia, per dirla con Douglas B. Lenat, frutto di invidia per la fisica. Forse non sarà contagiosa come la peste, ma c'è chi la condanna al pari o peggio di essa e, ciò che alla peste non è proprio successo, prima an- cora di lasciarle il tempo di venire compiuta- mente alla luce. Già, non esiste ancora, eppure una grande folla di «pensatori» è pronta a ga- rantirvi quali mete non potrà mai raggiungere. C'è persino chi ha definito «intelligenza» pro- prio quello che le macchine non potranno mai fare, come afferma il cosiddetto «teorema di Te- ster». E anche nel mondo degli addetti ai lavori le risse, talora furibonde e pestifere, non man- cano affatto. Basta leggere l'articolo di Paul Wallich Creature di silicio, comparso sul nume- ro 282 di «Le Scienze» (febbraio 1992), per con- vincersene, al di là di ogni ragionevole dubbio. Però che l'intelligenza artificiale sia una disci- plina così chiacchierata e contestata non deve meravigliare più di tanto: quella naturale non è certo da meno. Da sempre la sua definizione è un vero e proprio pomo della discordia. E per- sino l'uomo della strada, ben lungi anche solo dal porsi il problema di definirla, sa invece be- nissimo dirvi se non c'è (contate al proposito il numero di volte che avete sentito dare dello sce- mo e confrontatelo con il numero di volte che avete sentito dare dell'intelligente...). La mia po- sizione è elettivamente più vicina ai progettisti di macchine termiche: naturalmente, se la teoria ci fosse, cercherei di farne tesoro; ma, in assenza di questa, mi par meglio realizzare qualche «macchina utile». E la definizione di intelligenza artificiale? Potrei sempre cavarmela con un sec- co «Lei mi dica cos'è l'intelligenza, che a spie- LE SCIENZE n. 290, ottobre 1992 87

Transcript of IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la...

Page 1: IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la condanna al pari o peggio di essa e, ciò ... gica, le «leggi del pensiero» di George

,liadime~~

mOOMM

4«°5225;=3"-d=2° 4:57

.114111n7.4110," .44/111F

i '''....~..- -.m...mmn"-'' -."..'"'""»:. .-.,........__

mmm. mm.... --».' '..m...«.4%7Mm. --Z-m~M., - ._

15 glith .."~aum 44111~,„, -*mà7 °Mglalib~_ -~lei

m.1111.n _ MaieRImm-"«"L-"ZrZ,,..~

= b«11111911111:t2h:"~,_ ....egi

= =ish.INS: IN 14‘s,,sioqi~

-; • tew.w.ae....7G .nn•n="n•n•

..;"...~••••""

IN DIRETTA

L'intelligenza come sistema integratodi comportamenti, buon senso e capacità

di apprendere direttamente dall'esperienza:il «Modello avanzato di intelligenza

artificiale» dell'IRST di Trento.

IL PROGETTO MAIAdi Luigi Stringa

N

on essendo né sostanza né accidente, la pe-ste non può esistere: e così don Ferrantemorì di peste. Ma c'è anche chi ha rea-

lizzato e collaudato con successo delle bellissimemacchine termiche quando la teoria termodina-mica non era ancora stata inventata. Forse nonbrillavano per rendimento, ma funzionavanobenissimo. L'intelligenza artificiale (R) non èproprio la peste (anche se alcune sue caratteri-stiche sembra possederle), ma non gode certodel supporto di un'elegante e convincente teoriaunitaria. Sempre che ve ne possa mai essere una,e che la ricerca di questa non sia, per dirla conDouglas B. Lenat, frutto di invidia per la fisica.Forse non sarà contagiosa come la peste, ma c'èchi la condanna al pari o peggio di essa e, ciòche alla peste non è proprio successo, prima an-cora di lasciarle il tempo di venire compiuta-mente alla luce. Già, non esiste ancora, eppureuna grande folla di «pensatori» è pronta a ga-rantirvi quali mete non potrà mai raggiungere.C'è persino chi ha definito «intelligenza» pro-prio quello che le macchine non potranno maifare, come afferma il cosiddetto «teorema di Te-ster». E anche nel mondo degli addetti ai lavorile risse, talora furibonde e pestifere, non man-cano affatto. Basta leggere l'articolo di PaulWallich Creature di silicio, comparso sul nume-ro 282 di «Le Scienze» (febbraio 1992), per con-vincersene, al di là di ogni ragionevole dubbio.

Però che l'intelligenza artificiale sia una disci-plina così chiacchierata e contestata non devemeravigliare più di tanto: quella naturale non ècerto da meno. Da sempre la sua definizione èun vero e proprio pomo della discordia. E per-sino l'uomo della strada, ben lungi anche solodal porsi il problema di definirla, sa invece be-nissimo dirvi se non c'è (contate al proposito ilnumero di volte che avete sentito dare dello sce-mo e confrontatelo con il numero di volte cheavete sentito dare dell'intelligente...). La mia po-sizione è elettivamente più vicina ai progettistidi macchine termiche: naturalmente, se la teoriaci fosse, cercherei di farne tesoro; ma, in assenzadi questa, mi par meglio realizzare qualche«macchina utile». E la definizione di intelligenzaartificiale? Potrei sempre cavarmela con un sec-co «Lei mi dica cos'è l'intelligenza, che a spie-

LE SCIENZE n. 290, ottobre 1992 87

Page 2: IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la condanna al pari o peggio di essa e, ciò ... gica, le «leggi del pensiero» di George

L'Istituto per la ricerca scientifica e tecnologica (IRST) sorge in collina, vicino aTrento. Con un personale di 180 unità tra cui oltre 100 ricercatori, l'IRST è unodei leader mondiali della ricerca sull'intelligenza artificiale. Quello adottato dal-l'IRST è un approccio integrato nel quale convergono i principali campi di ricercadel settore: visione, riconoscimento e sintesi del parlato, elaborazione del linguaggionaturale, ragionamento meccanizzato e pianificazione, fattori umani, rappresenta-zione delle conoscenze. Il progetto MAIA (acronimo di «Modello avanzato di intel-ligenza artificiale») è l'espressione concreta di questa metodologia di lavoro.

La piattaforma sperimentale di MAIA è un sistema integratocostituito da tre componenti principali: un concierge automa-tico, che interagisce con i visitatori in linguaggio naturale ri-spondendo alle loro domande sul ruolo, gli obiettivi, la strut-

tura dell'IRST; una bibliotecaria elettronica, che gestisce iprestiti e le restituzioni riconoscendo le persone e i libri; unafamiglia di robot mobili dai compiti diversi, capaci di «navi-gare», cioè spostarsi autonomamente, nei corridoi dell'IRST.

garLe l'attributo artificiale sono bravis-simo anch'io!». Per me quello che chia-miamo intelligenza è un insieme di com-portamenti; l'intelligenza artificiale è ladisciplina impegnata nello sviluppo dimacchine in grado di esibire quell'insie-me di comportamenti (o almeno una loroparte cospicua).

La verità è che con l'IA affrontiamoun tema di ricerca tra i più affascinantie, per certi aspetti, del tutto unico. È laprima volta nella storia della scienza chesoggetto, strumento e oggetto della ri-cerca coincidono: il pensiero (l'intelli-genza) analizza se stesso per produrrepensiero (intelligenza). Strumento: an-cora l'intelligenza, del ricercatore. Lanatura del pensiero, insieme con l'origi-ne della vita e l'origine e la struttura del-l'universo, sono le tre grandi sfide dellascienza moderna.

La nascita dell'IA

Veniamo alla storia. Possiamo pren-dere come data di nascita il 1950, annoin cui apparve il saggio Computing Ma-chinery and lntelligence di Alan M. Tu-ring (tradotto in italiano Macchine cal-colatrici e intelligenza). Oppure il 1956,anno in cui Marvin Minsky e John Mc-Carthy coniarono la denominazione «uf-ficiale» Artificial Intelligence in occa-sione di uno storico convegno al Darth-mouth College. In ogni caso l'IA ha daun pezzo superato la trentina. E tuttaviala domanda iniziale «Possono pensare lemacchine?» attende ancora una rispostasoddisfacente. Si può anzi dire che oggi,

dopo oltre trent'anni di intensa attività,manca ancora chiarezza sul significatodi termini così fondamentali quali «in-telligenza» e «pensiero» (si pensi al di-battito sulla «stanza cinese» di John R.Searle). Questo non significa che l'IAnon abbia fatto progressi significativi.Però questa mancanza di chiarezza, que-sta mancanza di un paradigma comuneal quale fare riferimento, evidenzia lacrescente necessità di una riflessione se-ria sugli obiettivi e sul metodo di questadisciplina (anche per distinguerla dallealtre discipline con cui viene spesso con-fusa, dall'informatica tradizionale allafilosofia della mente).

Agli inizi «intelligenza» era soprattut-to ragionare, dimostrare teoremi, giocarea scacchi. I ricercatori dell'IA eranoconvinti che la costruzione di macchinelogiche portentose (nello spirito dell'Arsmagna di Raimondo Lullo e del Calcu-lus ratiocinator di Gottfried WilhelmLeibniz) li avrebbe condotti direttamen-te al nucleo dell'intelligenza. Oggi cirendiamo conto che le cose stanno diver-samente. Ciò che avrebbe dovuto costi-tuire il livello più alto (il rigore della lo-gica, le «leggi del pensiero» di GeorgeBoole) è stato raggiunto con una certarapidità, perlomeno entro certi limiti.Paradossalmente, però, i sistemi svilup-pati non sembrano in grado di fornire so-luzioni soddisfacenti proprio per queiproblemi che il senso comune reputereb-be più semplici. Così, per esempio, oggiabbiamo programmi capaci di giocare ascacchi ad altissimo livello. Eppure unsistema che abbia almeno le capacità vi-

sive di un insetto è ancora un obiettivolontano. Non solo. Ci siamo anche resiconto di quanto sia difficile produrre ilsoftware adatto a svolgere questi compi-ti, di quanto software occorrerebbe per«replicare» anche i comportamenti ap-parentemente più elementari, come rico-noscere oggetti semplici in base all'in-formazione visiva.

Genesi di MAIA

È in questo scenario che si colloca lanascita dell'IRST e del progetto MAIA.A 35 anni dalla comparsa di ComputingMachinery and Intelligence mi ero con-vinto che si dovesse por mano a una ri-definizione del problema, prendendo an-zitutto le mosse da questa «lezione sto-rica». Nel giugno 1984 (ero allora am-ministratore delegato della Selenia), ilsenatore Bruno Kessler mi chiese un pa-rere su un suo ambizioso progetto: rea-lizzare a Trento un centro di ricerca d'a-vanguardia, ma con i piedi saldamentepiantati per terra, capace cioè di genera-re efficacemente conoscenza strategica,ma applicabile. • Considerai subito l'oc-casione unica e irripetibile: poter rea-lizzare in Italia un approccio nuovo,pragmatico, all'intelligenza artificiale.Meno di un anno dopo ero già a Trento,a stilare il piano quinquennale per lo svi-luppo di un sistema integrato di IA. L'o-biettivo: un sistema magari modesto, mafunzionante, come le macchine termi-che, utile; forse non brillante, ma dibuon senso.

Stando alla definizione pragmatico--operativa del test di Turing, per es-sere «intelligente» un sistema dovevacomportarsi come una persona, per e-sempio in un dialogo cieco attraversouna parete. Ma nell'interpretazione u-suale, questa definizione non evidenzia-va uno degli aspetti più rilevanti delcomportamento intelligente: l'apprendi-mento. L'incapacità dei sistemi svilup-pati di evolversi da soli, di imparare,senza bisogno di essere completamenteprogrammati, era secondo me una bar-riera che l'IA doveva superare per poterraggiungere gli scopi prefissi, sia sulpiano scientifico sia sul piano applicati-vo. Ero sicuro che un sistema artificiale- per esempio un robot, o il calcolatoreche lo controlla - ci sarebbe sembratotanto più intelligente quanto più sarebbestato capace di imparare da solo esplo-rando il mondo circostante, anche se lesue prestazioni globali potevano inizial-mente sembrare piuttosto modeste.

Non bastava quindi costruire un siste-ma esperto abilissimo nel gioco degliscacchi, o un sistema capace di effettua-re diagnosi mediche accuratissime: permeritarsi l'attributo «intelligente», il si-stema doveva essere in grado di miglio-rarsi da solo. Doveva poter interagire di-rettamente con l'ambiente fisico e impa-rare dall'esperienza. Il sistema avrebbeesibito un comportamento «intelligente»se avesse dimostrato di essere in qualche

modo «curioso» di esplorare il mondoper scoprire e apprendere fatti nuovi.

Uno dei contributi più costruttivi deiprimi 30 anni era stata la nozione di TAcome «disciplina sperimentale». Questacaratteristica acquistava un significatoancora maggiore alla luce delle conside-razioni fatte sopra. Un adeguato approc-cio al problema dell'apprendimento ri-chiedeva lo sviluppo di un'idonea piat-taforma sperimentale, di un sistema concapacità sensoriali e motorie atte a inte-ragire direttamente con le persone e colmondo fisico. Ed era chiaro che unapiattaforma di questo tipo doveva esserein grado di gestire contemporaneamentediverse fonti di informazione e diversesorgenti di conoscenza. Doveva essere -in breve - una piattaforma «integrata».

I primi anni di vita dell'IA erano sta-ti invece caratterizzati da un'eccessivaframmentarietà della ricerca. Tanto neicentri accademici quanto in quelli indu-striali, lo sviluppo parallelo e solo par-zialmente interagente nei vari campi diricerca aveva spesso condotto a risultatiche, se non contrastanti, non si connet-tevano l'uno all'altro in maniera omoge-nea; non consentivano quindi prestazio-

CONCIERGE

ni globali soddisfacenti. Trecento anniprima di Turing, Cartesio aveva dichia-rato che i limiti delle macchine nei con-fronti dell'uomo risiedono essenzial-mente nella natura specialistica delleprime: «Quand'anche quelle fossero ingrado di fare certe cose al pari dell'uo-mo - se non meglio - esse commettereb-bero comunque errori in altre cose, rive-lando in tal modo come il loro agire siadettato non dalla sapienza, bensì dal pu-ro e semplice posizionamento delle par-ti che le costituiscono.» Naturalmentequesta posizione risentiva pesantementedi una concezione di «macchina» ormaiobsoleta. I sistemi esperti sviluppati dal-l'IA erano ben diversi dai rozzi automidel XVIII secolo. Ciononostante biso-gnava ammettere che nessuna esibiva uncomportamento «intelligente». Al mas-simo potevamo dire di aver sviluppatouna gran varietà di sofisticati sistemi ingrado di espletare alla perfezione (o qua-si) i compiti loro assegnati, ma soloquelli. (Anche perché gran parte dellegrandi industrie produttrici di calcolato-ri, lungi dal combattere la tesi cartesia-na, aveva paradossalmente propaganda-to una concezione molto affine mediante

lo slogan «le macchine fanno solo ciòche viene loro richiesto»: come se lapresunzione umana di possedere il mo-nopolio dell'intelligenza si basasse su unbisogno di autoprotezione psicologica.)

In breve, è vero che Turing aveva de-terminato un salto di qualità nell'approc-cio scientifico al problema dell'intelli-genza nelle macchine, ma è altrettantovero che poi si era perso di vista quantoTuring avesse insistito sull'aspetto glo-bale dell'intelligenza. L'expertise localenon poteva essere considerato un ingre-diente sufficiente (e forse nemmeno ne-cessario) del comportamento intelligen-te. E l'IA non poteva limitarsi allo svi-luppo di sistemi artificiali capaci di ese-guire determinati compiti in modo stu-pidamente perfetto. Per ottenere risultatisignificativi, era necessario un approccioglobale all'IA che fosse qualcosa di piùdella semplice aggregazione di gruppi diricerca impegnati in campi diversi: oc-correva un progetto che, al di là delleesigenze specifiche, garantisse l'integra-zione delle varie aree di ricerca unifican-dole con un solo obiettivo.

Nacque così il progetto MAIA (acro-nimo di «Modello avanzato di intelli-

BIBLIOTECARIA

88 LE SCIENZE n. 290, ottobre 1992

LE SCIENZE n. 290, ottobre 1992 89

Page 3: IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la condanna al pari o peggio di essa e, ciò ... gica, le «leggi del pensiero» di George

I robot mobili di MAIA sono attualmente due: un robot principale (a sinistra), do-tato di telecamera e sensori a ultrasuoni e in grado di comunicare a voce con lepersone (mediante microfono e altoparlante), al quale si affianca un secondo robotdi minori dimensioni (a destra), utilizzato per funzioni speciali (per esempio, la sor-veglianza dell'Istituto) e per la sperimentazione di nuove tecniche di navigazione.

Collocato all'ingresso dell'Istituto, il concierge di MAIA è un terminale che dialogacon i visitatori in un italiano abbastanza flessibile, fornendo informazioni sull'IRST.L'interazione è multimediale (tastiera, mouse, immagini, grafica): qui l'utente in-dica la persona su cui chiede informazioni. È prevista l'aggiunta di un sistema diriconoscimento e sintesi del parlato, che consentirà un vero e proprio colloquio.

L'utente mostra il libro alla bibliotecaria elettronica di MAR. Essendo in grado diriconoscere le immagini della copertina del libro e della faccia dell'utente, il sistemaprocede alla registrazione automatica della transazione (prestito o restituzione).

genza artificiale»). Oggi vi lavorano piùdi 100 ricercatori, con competenze di-verse (visione, riconoscimento e sintesidel parlato, linguaggio naturale, fattoriumani, rappresentazione delle conoscen-ze, ragionamento meccanizzato), ma conun unico obiettivo: realizzare fisicamen-te un sistema su cui verificare sperimen-talmente la correttezza dell'approcciointegrato già discusso, per disporre poidi una piattaforma che consenta, par-tendo dal basso, dalla percezione del-l'ambiente, di affrontare il problema del-

l'apprendimento, acquisendo autonoma-mente esperienza dall'interazione direttacon le persone e col mondo fisico. Maquesto sarà il principale obiettivo delprossimo piano quinquennale: per ora cibasta poter scalfire il problema dell'ap-prendimento a livelli più modesti, comevedremo meglio nel seguito.

Nel 1986, la posizione era tutt'altroche condivisa. C'era persino chi facevacoincidere l'IA con... l'uso di qualchelinguaggio di programmazione, per altroormai in totale declino (LISP, per esem-

pio). Quando leggo che finalmente, nel1990, Allen Newell della Carnegie Mel-lon University lanciava un appello af-finché i ricercatori cooperassero percostruire «sistemi intelligenti integra-ti», riguardo il mio piano quinquennale1986-1990 con una certa soddisfazione.Era proprio questo infatti il principio in-formatore del piano: «L'approccio fon-damentale può essere s.intetizzato conl'aggettivo "sistemistico"». L'approccioconsisteva nel condurre la propria atti-

vità in modo da rendere il più omogeneapossibile la comunità dei ricercatori, che«dovrà muoversi senza limitare le pro-prie capacità creative, ma cercando concontinuità una confluenza di fondo suicontenuti e sui metodi». Ciò anche nellaconvinzione che «questo approccio, ba-sato su un'accorta integrazione di com-ponenti concettuali, possa portare a ri-sultati di sintesi abbastanza soddisfacen-ti, anche al di là di quanto le singolecomponenti facciano sperare».

I primi due anni del piano quinquen-nale (1986-1987) sono stati dedicati allacreazione delle risorse: nel 1985 l'Istitu-to aveva una ventina di ricercatori, nes-suno dedicato a temi di LA. Lo sviluppodei primi moduli di MAIA ha di fattoavuto inizio nel 1988. E subito si è postoil problema della definizione delle fun-zioni che il sistema avrebbe dovuto svol-gere: le «specifiche funzionali», come sidice in gergo. I criteri informatori eranoanch'essi molto semplici e pragmatici.Si dovevano individuare funzioni che ri-sultassero significative ai fini dei nostriobiettivi scientifici, cioè adatte a verifi-care la validità dell'ipotesi comporta-mentale di cui ho parlato all'inizio. Lefunzioni dovevano essere esauriente-mente collaudabili in IRST, altrimentiavremmo una volta di più fatto un eser-cizio puramente congetturale, dai risul-tati poco attendibili, come purtroppospesso accade: la letteratura scientifica èpiena di elegantissimi algoritmi, col 100per cento di prestazioni.., provate su unadecina di esempi! Ma il criterio di granlunga più stringente, in armonia con gliobiettivi di fondo dell'Istituto, era quellodi individuare funzioni la cui realizza-zione consentisse lo sviluppo di tecnichee sottosistemi applicabili industrialmen-te, per ridurre quanto più possibile la di-stanza tra ricerca e ricaduta applicativa(si veda la «finestra» a pagina 92).

La piattaforma sperimentale di MAIAè concepita e sviluppata come un siste-ma integrato costituito da diverse «men-ti» e alcuni «bracci». Come vedremo, lementi sono realizzate con una serie diprogrammi distribuiti su una rete di cal-colatori che, interagendo cooperativa-mente tra loro, governano lo svolgimen-to delle funzioni dei tre principali braccidi MAIA: il concierge dell'Istituto, labibliotecaria elettronica e una famigliadi robot mobili dai compiti diversi, ca-paci di spostarsi autonomamente all'in-terno dell'IRST (si veda l'illustrazionea pagina 89).

La metafora del concierge

Quella del concierge è una comodametafora per descrivere sinteticamenteuna buona parte delle più significativefunzioni che il sistema MAIA deve svol-gere. Un buon concierge sa rispondere aqualsiasi domanda sull'organizzazionecui appartiene, sul ruolo e sui compitidelle persone che la compongono; safornire indicazioni sui più disparati ar-gomenti, dal nome del direttore all'ubi-cazione dell'ufficio acquisti; dal perio-do di chiusura estiva, al mezzo pubblicopiù conveniente per raggiungere la sta-zione ferroviaria. Se è bravo, vi ricono-sce se vi ha già visto anche una sola vol-ta. Magari sa anche con chi di solito vo-lete parlare. E vi dice subito se c'è, oquando e dove lo potete trovare. Insom-ma, un banco di prova ideale per le no-stre idee sull'intelligenza artificiale. In-teragire gradevolmente con persone notee sconosciute, utilizzando in maniera in-tegrata diverse sorgenti di conoscenza,sono le caratteristiche peculiari del con-cierge. E questa è la scelta che abbiamofatto, coerente con i criteri informatoriche ci siamo imposti: quello scientificodella significatività dal punto di vistacomportamentale e quello della speri-mentabilità effettiva in Istituto. Ma an-che e soprattutto dal punto di vista dellepossibili ricadute applicative: lungo tuttala durata del progetto sarà possibile de-rivare dal concierge di MAIA una seriedi sistemi sempre più evoluti - capaci didialogare in linguaggio naturale anchecon utenti non specialisti - per interro-gare banche dati e basi di conoscenzaprivate e pubbliche. Con un mercato po-tenziale enorme, sia nel settore dei ser-vizi sia in quello produttivo. A solo ti-tolo di esempio, si pensi a quanti servizidi informazione devono fornire le pub-bliche amministrazioni!

Fisicamente il «braccio» concierge diMAIA è un terminale ubicato all'ingres-so dell'Istituto. Oltre a monitor, tastierae mouse, impiegherà una telecamera, unmicrofono e un altoparlante per vedere,ed eventualmente riconoscere, l'interlo-cutore, dialogare con lui a voce o a mez-zo tastiera. Il monitor, poi, consente siadi presentare immagini in risposta allerichieste dell'utente sia a quest'ultimo dipuntare col dito la parte di immagini diinteresse, grazie al dispositivo di touchscreen di cui il monitor è dotato. Ciòpermette un'interazione che si basa suuna vasta gamma di modalità, lasciandoall'utente un'ampia possibilità di scelta.

Il concierge inoltre interagisce diret-tamente con altri bracci di MAIA. Peresempio, può affidare il visitatore chedeve venire da me a uno dei robot mo-bili, che lo guida sino alla porta del mioufficio. Oppure può inviare il robot invarie parti dell'edificio per assolvere acompiti specifici come consegnare laposta, ritirare un libro in biblioteca ec-cetera. Insomma, anche il nostro con-cierge elettronico ha la sua squadra di

facchini e inservienti, che eseguono ze-lantemente i compiti loro affidati.

La bibliotecaria elettronica

Ubicata nella biblioteca dell'Istituto,il braccio «bibliotecaria elettronica» èun terminale la cui composizione non sidiscosta molto da quella del concierge:monitor, tastiera e mouse, e, naturalmen-te, telecamera, microfono e altoparlante.Ci si presenta di fronte alla telecamera,mostrando la faccia proprio come si fadavanti a un video-citofono. MAIA (opiù precisamente la sua bibliotecariaelettronica) se ne accorge. Vi chiede co-sa volete e, se vi identifica, riconoscen-do la vostra faccia e la vostra voce, vi

autorizza a utilizzare la biblioteca. Bastapresentare il libro che volete restituire (oche volete prendere in prestito) in modoche la telecamera ne veda la copertina.Il sistema se ne accorge, lo riconosce edeffettua automaticamente la registrazio-ne del prestito (o della restituzione) avostro nome. Non è necessario un posi-zionamento preciso: il libro va posto ap-prossimativamente a un metro dall'o-biettivo, in modo naturale, senza troppivincoli né sulla distanza, né sull'orien-tamento. Qualora il libro non fosse noto,la bibliotecaria elettronica ne dovrà leg-gere il titolo, l'autore e gli altri datiidentificativi.

Fornire suggerimenti bibliografici ba-sati su ragionamento ed esperienza fa

90 LE SCIENZE n. 290, ottobre 1992

LE SCIENZE n. 290, ottobre 1992 91

Page 4: IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la condanna al pari o peggio di essa e, ciò ... gica, le «leggi del pensiero» di George

a) MODULI REALIZZATI E INTEGRATIi

• comprensione linguaggio naturale• generazione linguaggio naturale• grafica e fattori umani• rappresentazione delle conoscenze

Concierge •

•< •riconoscimento libririconoscimento faccericonoscimento marcatura della voce

Bibliotecaria

• navigazione mediante visioneRobot • • navigazione mediante sonar

• interazione orale (riconoscimento + sintesi)

b) INTERAZIONE UTENTE-CONCIERGE

Utente :ConciergeUtente :ConciergeUtenteConciergeUtenteConciergeUtente :Concierge

«Qual è la struttura dell'IRST?»mostra su monitor organigramma IRST«Da chi è diretto?»«Luigi Stringa»«Dov'è il suo ufficio?»mostra mappa IRST con ufficio direzione lampeggiante«Chi lavora nel gruppo linguaggio naturale?»mostra lista ricercatori«Puoi mostrarmi una foto del gruppo?»mostra foto

c) INTERAZIONE UTENTE-ROBOT

«Dove devo andare?»«Vai in segreteria»«Quale segreteria?»«Quella di Lazzari»«Cerco di andare in segreteria Intelligenza Artificiale--- Adesso trovo un piano--- Adesso vado»

Robot :UtenteRobot :UtenteRobot •

Stato di avanzamento del progetto MAIA

I a maggior parte dei moduli di base per la visione, ilriconoscimento del parlato e l'elaborazione del lin-

guaggio naturale - moduli che hanno consentito una pri-ma versione abbastanza completa di MAIA, presentatanel febbraio del 1992 - è stata sviluppata tra il 1988 e il1990. La sperimentazione ha mostrato un primo esempiodi comportamento integrato concierge-robot. mentre l'in-tegrazione dei tre sottosistemi della bibliotecaria dovreb-be essere ultimata per la fine del 1992. Nel prossimo fu-turo sono previsti ulteriori sviluppi fra cui l'integrazione nelconcierge di un sottosistema di riconoscimento-sintesi delparlato (per consentire l'interazione orale con il visitatore)e l'utilizzo del robot principale per missioni di trasporto di

oggetti (libri, per esempio). Inoltre, la base di dati dei librinoti alla bibliotecaria (attualmente 500 volumi) verrà am-pliata. e così pure quella dei volti delle persone riconosci-bili (attualmente 55, 34 maschi e 21 femmine). Queste ele altre prestazioni del sistema MAIA descritte nel testodovranno essere ottenute, sul sistema completamente in-tegrato e operante in tempo reale, entro il 1995.

Gli sviluppi effettuati hanno inoltre reso disponibili sot-tosistemi e tecnologie vendibili e vendute (riconoscimentodi caratteri, identificazione delle persone, sistemi di det-tatura eccetera). Macchine «modeste», ma utili. E semprepiù ne verrano con i perfezionamenti e le nuove funzioniin corso di sviluppo.

La prima versione della piattaforma sperimentale diMAIA è stata presentata nel febbraio 1992. In a sono sche-maticamente riportati i principali moduli realizzati, alcuni

già integrati, mentre b e c esemplificano rispettivamente lecapacità di interazione operatore-concierge (a mezzo ta-stiera) e utente-robot (a voce) dimostrate dal prototipo.

•41 agi

NAM4StkLZekrinflAid;lwouPtiriglaN

SENSORE(TELECAMERA)

Il sistema di navigazione del robot principale di MAIA utilizzaun insieme di riflessi autonomi, ciascuno dei quali viene sin-tetizzato come un sistema di controllo sensori-attuatori-sen-

sori. Per esempio, il riflesso autonomo «segui la mezzeria»,qui schematicamente raffigurato, mette il robot in condizio-ni di spostarsi mantenendosi sempre al centro del corridoio.

parte dei compiti del sistema: ancora unavolta, un braccio che consente un'ampiaverifica dell'approccio IRST all'intelli-genza artificiale, che è operativamentecollaudabile in Istituto e che è suscetti-bile di una vasta gamma di applicazioni.Basti pensare al mercato dei sistemi perl'identificazione delle persone!

I robot mobili

Il terzo braccio di MAIA è costitui-to da un robot principale e da alcuni«robottini» per compiti speciali (sorve-glianza, esplorazione, sperimentazione

di nuove tecniche di navigazione). Hogià descritto le loro principali funzioni.Le loro missioni, oltre che dal concierge,possono essere richieste dall'utente, avoce, parlando direttamente al robot. Icampi di applicazione sono sotto gli oc-chi di tutti.

Già oggi una parte della ricerca svoltadall'Istituto trova applicazione nel pro-getto EUREKA-FIRST (dove FIRST staper Friendly Interactive Robot for Ser-vice Tasks) di cui l'IRST è il principaleattore. Si tratta di un progetto CEE cheprevede lo sviluppo di un sistema intel-ligente per impiego in ambienti ospeda-

COMANDOALL'ATTUATORE

lieri. Il sistema sarà costituito da unaparte fissa e una parte mobile (da usarsiper esempio per il trasporto di medici-nali) e dovrà essere caratterizzato da unelevato livello di interattività con utentinon specializzati. Un progetto, come sivede, che presenta molti punti in comu-ne con MAIA.

La visione

Tutti e tre i componenti del sistemaMAIA utilizzano la visione per svolgerele loro funzioni: i robot mobili per navi-gare (aggirarsi) autonomamente per l'I-

RILEVAZIONEDISALLINEAMENTO

ELABORAZIONEDIREZIONE CORRETTA

La telecamera della bibliotecaria elettronica di MAIA conti-nua a «guardare» la scena circostante: non appena qualcunoo qualcosa entra nel suo campo visivo, se ne accorge e ne se-para l'immagine da quella dello sfondo con un procedimentomolto semplice. Se le immagini che si susseguono sono sostan-zialmente identiche, la scena è statica, non vi è nulla di nuovoda vedere; se invece vi sono differenze significative, la parte

variata è l'immagine dell'oggetto entrato nel campo. Qui sonoillustrati i passi salienti del processo di estrazione dell'imma-gine di un libro: immagine dello sfondo (a sinistra), immaginedel libro entrato nel campo visivo (al centro), immagine bina-rizzata della «differenza» tra le due (a destra). Lo stesso pro-cedimento viene impiegato per avvertire la presenza di unapersona ed «estrarne» la faccia ai fini del riconoscimento.

92 LE SCIENZE n. 290, ottobre 1992

LE SCIENZE n. 290, ottobre 1992 93

Page 5: IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la condanna al pari o peggio di essa e, ciò ... gica, le «leggi del pensiero» di George

D MASSIMO

ISTOGRAMMA VERTICALE

ISTOGRAMMA ORIZZONTALE

VERY

IMPORTAMI

BOOKS

L. S.

Per riconoscere i libri, la bibliotecaria elettronica scandisceriga per riga l'immagine della copertina dopo averla identifi-cata nella scena (si veda l'illustrazione in basso a pagina 93).L'istogramma ottenuto proiettando sull'asse verticale il nu-mero di transizioni chiaro-scuro dà una descrizione dellastruttura grafica di solito sufficiente al riconoscimento. Ana-lizzando anche l'istogramma orizzontale, nella sezione in cui

tali transizioni sono in numero massimo, il potere discrimina-tivo è tale da evitare, con i 500 libri sinora noti al sistema,errori. In questo caso il riconoscimento si configura come unprocesso «gestaltico». Un altro approccio estrae le righe ditesto (anche sulla base degli istogrammi sopra illustrati) e ri-conosce i caratteri che le costituiscono: un procedimento ne-cessario se il libro è mostrato al sistema per la prima volta.

D

D1111111~... vsel,..11211

.....t~taamar

Il riconoscimento delle facce viene effettuato confrontandol'immagine acquisita dalla telecamera con un archivio di im-magini memorizzate (i soggetti già «noti» a MAIA). Il sistemacomincia con il determinare la posizione degli occhi basandosisu una analisi delle variazioni di tonalità di grigio nell'imma-gine (a sinistra). Poiché gli occhi sono la parte più strutturatadi un volto, la loro posizione determina un picco nella proie-zione verticale delle transizioni chiaro-scuro. Determinata conprecisione la posizione delle pupille, l'immagine viene quindiridotta a un formato standard e si cerca la più simile tra quellenote. Un secondo metodo si basa invece sull'estrazione di ca-ratteristiche tipiche quali occhi, bocca e mento (a destra).

stituto; il concierge e la bibliotecariaelettronica per riconoscere le persone«guardandole» attraverso una telecame-ra, e per riconoscere le copertine dei librie leggerne i titoli. Questa scelta sottoli-nea l'importanza che attribuiamo alla vi-sione nel determinare il comportamentointelligente: vedere consente di acquisireuna enorme quantità di informazioni sulmondo esterno, fornendo gli elementinecessari a interagire correttamente conesso, sia in termini di ambiente, sia dipersone, o, più in generale, di altri agen-ti. Per esempio, un robot mobile può in-contrare lungo il proprio percorso tantoricercatori dell'IRST quanto altri robotdel sistema MAIA. In particolare, nelcaso dei robot mobili, la visione ha unruolo fondamentale, fornendo al sottosi-stema di navigazione le informazioni ne-cessarie a orientarsi, a evitare gli osta-coli, a individuare la propria posizionericonoscendo punti notevoli come porte,finestre eccetera. Questo sottosistemagoverna il movimento dei robot utiliz-zando anche dati di altri sensori, qualiuna serie di misuratori di distanza a ul-trasuoni e gli odometri che, sulla basedel numero di rotazioni eseguite dalleruote, rendono disponibili le informazio-ni sul cammino percorso (proprio comeil contachilometri parziale della vostra

automobile vi informa sulla distanza co-perta dall'inizio del viaggio). Tali infor-mazioni, integrate con una schematicamappa dell'Istituto, consentono al robotdi sapere dove si trova, e di pianificareil percorso per raggiungere la destina-zione assegnata come obiettivo.

Dal punto di vista dell'architettura, ilsottosistema di navigazione si fonda sudue schemi comportamentali distinti:uno basato su «riflessi», che chiameròcomponente spinale, e uno, più conven-zionale, basato sulla pianificazione, chechiamerò corticale. I riflessi provocanoreazioni immediate a particolari stimoli,senza richiedere alcun «ragionamento»:se il robot sta per urtare contro un osta-colo, i sensori a ultrasuoni lo segnalanodirettamente agli asservimenti che con-trollano i motori, provocandone l'arre-sto. Più in generale, i riflessi sono rea-lizzati come anelli di retroazione (feed--back loop), semplici sensori-attuatori--sensori; per esempio, il sistema di vi-sione può estrarre dall'immagine gli spi-goli, evidenziando i confini pavimento--muro (si veda l'illustrazione in alto apagina 93). Il riflesso, che abbiamochiamato «segui la mezzeria», mantieneil robot al centro del corridoio. Evitareostacoli, imboccare un altro corridoio,avanzare di una distanza prefissata sono

ulteriori esempi di riflessi autonomi.La componente corticale si occupa in-

vece della pianificazione delle azioni.Essa controlla i riflessi e ha accesso auna mappa dell'Istituto. Ciò le consentedi tradurre richieste anche in linguaggionaturale (come «vai nell'ufficio di Strin-ga») in comandi comprensibili al sotto-sistema di navigazione. Le coordinatedel mio ufficio sono rilevabili dallamappa. Occorre pianificare una traietto-ria per raggiungerlo. Basta poi tradurlain una sequenza di comandi del tipo:«Segui la mezzeria del corridoio per 10metri; gira a destra; avanti per altri 5 me-tri; gira a sinistra.» I riflessi provvede-ranno a governare l'esecuzione, evitan-do gli ostacoli, anche non previsti nellamappa. La componente corticale useràanche informazioni più complesse, ela-borate dal sistema di visione, per identi-ficare la posizione dal riconoscimentodei punti notevoli (landmark), prevedereostacoli lontani, verificare il proprioorientamento eccetera. Si potrebbe dire:la componente spinale ha una funzionepiù tattica e immediata; quella corticale,strategica e di più alto livello. La distin-zione è soprattutto dettata da ragionipratiche: i riflessi sono implementati inperiferia, con routine molto semplici, suun hardware dedicato al controllo della

piattaforma mobile. Ciò semplifica no-tevolmente i problemi di gestione, sca-ricando il sistema di elaborazione cen-trale e aumentando l'affidabilità.

E questo un caso in cui l'analogia coisistemi biologici sembra vincente! An-che per il riconoscimento delle personee degli oggetti, come i libri, vi è, almenoconcettualmente, un'architettura analo-ga. Le telecamere del concierge e dellabibliotecaria elettronica continuano a«guardare» confrontando immagini suc-cessive: se queste sono identiche, vuoldire che la scena è statica, che non stasuccedendo niente, che non vi è nessunoggetto o persona nuova da riconoscere.Un'operaiione periferica semplice, qua-le sottrarre da ciascuna immagine la pre-cedente, risolve il problema: se il risul-tato è zero per tutti gli elementi dell'im-magine (pixel), non vi è nulla da rico-noscere. Appena il numero di pixel va-riati è abbastanza consistente, bisognaconcentrare l'attenzione sulla parte diimmagine che è variata: potrebbe esserela faccia di una persona da identificareo un libro da riconoscere. L'approccio èsemplice ed efficacissimo; consente dirisolvere nella maggioranza dei casi diinteresse pratico uno dei più importantiproblemi della visione: segmentare l'im-magine di una scena estraendo solo l'og-getto che interessa (si veda l'illustrazio-ne in basso a pagina 93).

Anche in questo caso, l'analogia coni sistemi biologici è forte: alcuni anima-li vedono solo gli oggetti in movimen-to e anche nel sistema visivo dell'uomovi sono neuroni, le cosiddette «cellulecomplesse» della corteccia visiva prima-ria, che rispondono sostanzialmente soloa stimoli provenienti da oggetti in mo-vimento. La spiegazione potrebbe esseresemplice: se tutto è fermo, non vi sonopericoli. Nessun problema per la soprav-vivenza, né come prede né come preda-tori: nulla cui dare la caccia! Anzi, pareproprio che se non muovessimo gli oc-chi, non potremmo vedere le scene sta-tiche: un'immagine ferma su una zonadella retina per più di un secondo svani-sce, non viene più percepita. Quando cipare di fissare una scena statica, di fattonon teniamo gli occhi perfettamente fer-mi, ma facciamo loro eseguire dei pic-coli movimenti (microsaccadi).

Per riconoscere un volto si procededunque così: estratto il volto dallo sfon-do e determinata la posizione delle pu-pille, l'immagine viene normalizzata eraddrizzata, in modo da ridurla a di-mensioni standard (le stesse delle imma-gini memorizzate nella fase di apprendi-mento), ingrandendola se è troppo pic-cola e riducendola se è troppo grande. Sicerca poi l'immagine «più simile» fraquelle note, misurandone la correlazione(quanto si «sovrappongono» bene: sot-

traendo a un'immagine un'altra uguale,non rimane nulla; se ne sottraggo una si-mile, rimarrà poco!). Oppure si estrag-gono alcune caratteristiche tipiche (siveda l'illustrazione nella pagina a fron-te). Anche le prestazioni sin qui ottenutesono molto incoraggianti: su un campio-ne di 220 immagini facciali relative a 55persone, il primo approccio ne riconosceil 100 per cento, con un tempo di elabo-razione inferiore a 0,2 secondi per fac-cia; il secondo approccio ne riconosceoltre il 90 per cento, con tempi di elabo-razione simili.

Anche i libri vengono riconosciutidalla bibliotecaria elettronica usandodue approcci alternativi e complementa-ri. Il libro viene isolato dallo sfondo colmetodo già illustrato: quando lo avvici-no alla telecamera, la scena varia, e laparte variata è quella che mi interessa. Ilprimo approccio, il meno convenziona-le, estrae un'informazione globale, lega-ta alla struttura grafica della copertinadel libro. Il secondo approccio, più clas-sico, si basa sull'estrazione delle righedi testo (titolo, autore, editore eccetera)e sul riconoscimento dei caratteri che lecompongono. In entrambi i casi l'imma-gine viene prima normalizzata, come nelcaso delle facce: l'impresa è un po' me-no complessa, data la semplicità geome-trica del libro, che è sostanzialmente unrettangolo.

94 LE SCIENZE n. 290, ottobre 1992LE SCIENZE n. 290, ottobre 1992 95

Page 6: IL PROGETTO MAIA - tev-static.fbk.eu · Forse non sarà contagiosa come la peste, ma c'è chi la condanna al pari o peggio di essa e, ciò ... gica, le «leggi del pensiero» di George

Nella nuova tecnica di navigazione sperimentata sui robot di MAIA, la memoriaprende il posto dell'elaborazione. L'idea è semplice ma estremamente efficace.L'immagine dell'ambiente, acquisita dalla telecamera (a), viene pre-elaborata estra-endone gli spigoli principali (b). Il robot confronta quindi tale immagine con quellememorizzate nella fase di addestramento, del tipo di quelle rappresentate in c-e,estrae la più simile e fornisce agli attuatori il comando di navigazione a essa as-sociato. Per esempio, se l'immagine più simile è c, significa che il robot è troppoa destra: il comando associato a questa posizione è quindi «spostati a sinistra»; ad è invece associato il comando «vai diritto», a e il comando «spostati a destra».

Linguaggio naturale, orale e scritto

Fin qui ho parlato di visione. Per svol-gere le funzioni più sopra definite, il si-stema MAIA deve anche essere in gradodi comprendere il linguaggio naturale,per esempio l'italiano, sia parlato siascritto, o comunque battuto su una ta-stiera. Deve inoltre generare testi orali escritti. Deve, più in generale, poter inte-ragire con operatori anche non specializ-zati, usando un'interfaccia multimedialeche include, oltre al linguaggio parlato escritto, il puntamento a immagini, la gra-fica, programmi di realtà virtuale ecce-tera. Il tutto per rendere il rapporto conMAIA il più gradevole possibile e perarricchirne le prestazioni comportamen-tali. Queste tematiche sono sviluppate dagruppi di ricercatori che operano in fortesinergia tra loro nei settori dell'elabora-zione del linguaggio naturale, del rico-noscimento e della sintesi del parlato,dei fattori umani, della rappresentazionedelle conoscenze e del ragionamentomeccanizzato.

Nel campo del riconoscimento delparlato, la ricerca che si svolge all'IRSTè focalizzata sul modello del linguaggio.L'obiettivo finale è la realizzazione diun sottosistema di riconoscimento indi-pendente dal parlatore, che consenta aun utente di colloquiare con i bracci delsistema MAIA in parlato connesso (cioèparlando senza pause tra una parola e lasuccessiva) e in condizioni di rumorepiuttosto normali per un ambiente d'uf-ficio (i messaggi da riconoscere farannotipicamente riferimento alle funzioni e aicompiti specifici previsti per il sistemaMAIA).

Il gruppo di ricerca sull'elaborazionedel linguaggio naturale, oltre alle attivitàlegate al riconoscimento del parlato, svi-luppa temi di grande interesse, quali lagenerazione di rapporti, l'elaborazionedi testi e la traduzione semiautomatica.Oltre a dialogare con l'utente, le speci-fiche prevedono che il sistema MAIAsia in grado di stilare rapporti in linguag-gio naturale su eventi accaduti o forniredescrizioni di situazioni anche comples-se. Per esempio, l'utente può chiedere alconcierge di reperire una persona o diinviare il robot in un ufficio a consegna-re del materiale: al termine delle suemissioni, il sistema deve fornire all'u-tente i dovuti ragguagli sui compiti svol-ti e su eventuali difficoltà incontrate.

Un'ulteriore componente che si ritie-ne di poter integrare è un sottosistemaper l'elaborazione di testi. Si pensi a unsistema in grado di fare il riassunto dellenotizie di maggior interesse per l'utentea partire da una serie di articoli di gior-nale. Oppure a un sistema che aiuti a ri-trovare la giurisprudenza relativa a unacerta legge. Lo sviluppo di tali sistemirichiede potenti strumenti di analisi lin-guistica, in parte diversi da quelli utiliz-zati per il dialogo. Con vincoli ancoramaggiori, ci si propone di dotare il siste-ma della capacità di interagire con un

utente straniero (inizialmente tramite ilconcierge e successivamente anche tra-mite la bibliotecaria elettronica) tradu-cendo un testo nella sua lingua. Di gran-de importanza sono anche gli aspetti le-gati ai cosiddetti fattori umani: l'inter-faccia uomo-sistema deve consentire al-l'utente di interagire con MAIA con mo-dalità appartenenti al repertorio tipicodelle relazioni umane.

Ho detto sopra che un sistema intelli-gente deve essere in grado di percepiredirettamente l'ambiente che lo circonda(mediante sensori fisici di varia natura),e ho brevemente descritto il nostro ap-proccio con riferimento, soprattutto, aproblemi di visione e di dialogo. Persvolgere le funzioni richieste, il sistemaMAIA deve però conoscere l'ambienteIRST non solo dal punto di vista fisico,ma anche dal punto di vista organizzati-vo. Ci si è quindi dedicati alla realizza-zione di una «piattaforma» di conoscen-ze relative all'IRST fruibile sia dal siste-ma MAIA, sia direttamente dall'utente.Essenzialmente vengono considerati tretipi di conoscenze: conoscenze struttura-li (sulla struttura organizzativa, sul per-sonale e sulle risorse non umane dell'I-stituto); conoscenze procedurali (sullenormative adottate dall'organizzazione);modelli degli agenti (non solo informa-zioni sugli individui, ma anche informa-zioni che gli individui usano nello svol-gimento della propria attività). Si trattadi conoscenze eterogenee, che richiedo-no metodologie di rappresentazione di-verse, ma mutuamente trasparenti e fa-cilmente aggiornabili.

Apprendimento,elaborazione e memoria

La piattaforma sperimentale di MAIAè dunque nata, e i primi frutti dell'in-tegrazione cominciano a evidenziarsi.Molti comportamenti sono sin d'ora «ra-gionevoli» e le prossime tappe, ormaiben delineate, fanno prevedere una cre-scita del sistema sostanzialmente alli-neata con i piani. Ma secondo il nostroapproccio, un comportamento in qual-che modo intelligente richiede una spic-cata capacità di evolvere autonomamen-te, imparando a interagire sempre me-glio con l'ambiente, accumulando cono-scenza ed esperienza, per poi usarla co-struttivamente. In una parola: occorreuna grande capacità di apprendimento.Non solo di dati e conoscenze semplici,come il rilevare la presenza di un nuovomobile in un corridoio e di conseguenzaaggiornare automaticamente la mappa,oppure acquisire l'immagine del voltodi una persona prima mai vista, per po-terla in seguito riconoscere; o ancora,aggiungere una parola nuova al vocabo-lario. Questi tipi di apprendimento sonogià previsti nelle attuali specifiche diMAIA. Bisogna invece che il sistemasappia derivare dall'esperienza nuovicomportamenti, nuove strategie e quindile tattiche per realizzarle. Nei sistemi di

oggi, a ogni funzione corrispondonoprocedure, algoritmi ad hoc realizzati daappropriati programmi, magari flessibilie capaci di utilizzare dati e conoscenzeacquisite con l'esperienza, ma comun-que sempre programmi sviluppati dalprogettista e non autonomamente dal si-stema. Con questa impostazione, l'insie-me dei comportamenti rimane sostan-zialmente «chiuso», limitato a quelliprevisti dal progettista. Occorre inveceche il sistema possa apprendere nuovefunzioni, che l'insieme dei suoi compor-tamenti sia «aperto» e continuamenteaggiornabile sulla base dell'esperienza.

Attaccare e cercare almeno di Scalfirequesto problema è il nostro principaleobiettivo scientifico per i prossimi anni.Appena lo si imposta, si è subito assalitida un dubbio fondamentale. Se a ogninuova funzione deve corrispondere unaspecifica procedura, il numero delle pro-cedure, e quindi dei programmi, dovràcontinuare a crescere. É davvero ragio-nevole? Se non altro: è pratico? E poi:saremo mai capaci di individuare unmeccanismo così generale da essere ingrado di derivare da qualsiasi insieme diesperienze le appropriate procedure?Esisterà, almeno concettualmente, unmeccanismo inferenziale così potente? Eanche se fosse, questa strada sarebbepercorribile praticamente?

Un sistema siffatto, con un numero diprogrammi che continua a crescere au-tonomamente, mi par proprio poco plau-sibile, complicato e assai poco gestibile!Ed ecco allora l'alternativa: sostituire lamemoria all'elaborazione. Invece di ese-guire calcoli di rotta misurando distanzeda pareti e ostacoli, il robot impara a se-guire la mezzeria del corridoio sempli-cemente associando a ogni immagine ilcomando di direzione impartitogli dall'i-struttore. Dopo aver memorizzato un nu-mero sufficiente di coppie immagine-co-mando, è in grado di navigare da solo,anche in ambienti sconosciuti. Gli bastaestrarre dalla memoria l'immagine più«simile» a quella che sta «vedendo» efornire agli attuatori il comando di dire-zione a essa associato (si veda l'illustra-zione nella pagina a fronte).

Abbiamo potuto sperimentare che ilrobot naviga benissimo. Anzi, fa menoerrori: l'approccio sembra più «affidabi-le» di quello basato su procedure e al-goritmi di calcolo della rotta e più adattoad affrontare situazioni impreviste. Sepoi si dotasse il sistema di un elementare«surrogato dell'istinto di conservazio-ne» grazie al quale ogni volta che il ro-bot stesse per sbattere contro qualcheostacolo forzasse un comando nella di-rezione opposta al precedente e lo me-morizzasse assieme all'immagine chesta vedendo, allora non servirebbe nep-pure un istruttore: il sistema imparereb-be a navigare da solo! Abbiamo così so-stituito all'elaborazione delle misure didistanze e di calcolo della rotta (traiet-toria) un processo mnemonico di asso-ciazione immagine-comando.

L'approccio sembra convincente, ef-ficace e di una semplicità entusiasmante:viene subito voglia di generalizzarlo.Sostituire dappertutto l'elaborazione conla memoria! E ciò che si tenta di farecon gli approcci di tipo «connessionisti-co» oggi forse sin troppo di moda, basatisulle cosiddette reti neuronali, per la lorosia pur pallidissima somiglianza archi-tetturale con le strutture biologiche delsistema nervoso. Anch'esse possono inqualche modo considerarsi alla streguadi memorie associative: per addestrarlebasta fornire una serie di esempi e le re-lative risposte volute. La rete si modifica(variando per esempio i pesi delle con-nessioni tra i nodi) ed è poi capace difornire la risposta corretta anche per sti-moli un po' diversi da quelli corrispon-denti agli esempi (come riconoscere unaA stampata in stile Bodoni avendo im-parato solo A dello stile New York!). Iocredo che l'idea di fondo sia valida, mala strada da percorrere perché le nostrereti possano approssimare da vicino leprestazioni delle reti di neuroni «vere» èancora lunghissima.

Forse non si potrà proprio ridurre tut-to a memoria (o forse sì). Ma questa èun'altra storia: un nuovo affascinantecapitolo per la storia della intelligenzaartificiale. Quale trade-off memoria-ela-borazione risulterà vincente? Un temaaffascinante, su cui si lavora in tutto ilmondo e che ci aiuta anche a capirequalcosa di più sul nostro cervello, sul-l'intelligenza naturale.

BIBLIOGRAFIA

TURINO ALAN M., Macchine calcola-trici e intelligenza in La filosofia de-gli automi, a cura di Vittorio Somenzi eRenato Cordeschi, Boringhieri, Torino,1986.

BOLC L. (a cura), Computational Mo-dels of Learning, Springer Verlag, Ber-lino, 1987.

STRINGA LUIGI, Un approccio integra-to all'intelligenza artificiale: il progettoMAIA dell' IRST in «AI*IA Notizie», 4,n. 1, pp. 13-19, 1990.

STRINGA LUIGI, Macchine e comporta-mento intelligente in Capire l'artificiale,a cura di Massimo Negrotti, Bollati Bo-ringhieri, Torino, 1990.

STOCK OLIVIERO, Natural Languageand Exploration of an Information Spa-ce: The ALFresco Interactive System in«Proceedings of the 12th InternationalJoint Conference on Artificial Intelli-gence (IJCAI-91), 2, pp. 972-978, 1991.

POGGIO TOMASO e STRINGA LUIGI, AProject for an Intelligent System: Vi-sion and Learning in «InternationalJournal of Quantum Chemistry», 42,pp. 727-739, 1992.

WALLICH PAUL, Creature di silicio in«Le Scienze», n. 282, febbraio 1992.

96 LE SCIENZE n. 290, ottobre 1992 LE SCIENZE n. 290, ottobre 1992 97