Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco...

57
della parola: della parola: un percorso tra un percorso tra scienza, scienza, psicologia e psicologia e linguistica linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica applicata alla comunicazione multimediale a.a. 2014-2015

Transcript of Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco...

Page 1: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Le tecnologie della parola:Le tecnologie della parola:un percorso tra scienza, un percorso tra scienza, psicologia e linguisticapsicologia e linguistica

Cristina BoscoDipartimento di Informatica, Università di Torino

Informatica applicata alla comunicazione multimediale

a.a. 2014-2015

Page 2: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Cosa sono le tecnologie della parola • Brevissima storia dell’Intelligenza Artificiale • Un po’ di fantascienza• Apprendimento del linguaggio umano• Rappresentazione del linguaggio umano

IndiceIndice

Page 3: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Tecnologie della parolaTecnologie della parola• Telefoni smartphone, navigatori satellitari,

tablet e smartTV che rispondono a comandi vocali

• Motori di ricerca sempre più abili nel trovare i documenti che ci servono

• Siti web che forniscono traduzioni• Correttori ortografici che correggono gli

strafalcioni o completano le parole mentre scriviamo un sms

Page 4: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Tecnologie della parolaTecnologie della parola• Sistemi automatici che rispondono alle

richieste di informazioni su orari e servizi • Sistemi che rilevano opinioni e sentimenti

espressi nei social media, ad es. analizzano recensioni per scoprire la valenza commerciale di prodotti, o post di Twitter per valutare l’orientamento della popolazione nei confronti di personalità politiche, del mondo dello sport o dello spettacolo.

Page 5: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

felicitta.di.unito.itfelicitta.di.unito.it

Page 6: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

felicitta.di.unito.itfelicitta.di.unito.it

Page 7: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Tecnologie della parola?Tecnologie della parola?• Tutte queste tecnologie sono state rese

possibili dallo sviluppo dell’intelligenza artificiale e di quella sua parte che si occupa del linguaggio umano, detta linguistica computazionale

• Esse comportano forme di COMPRENSIONE DEL LINGUAGGIO UMANO

• Ma i computer comprendono davvero la nostra lingua?

Page 8: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Storia e computerStoria e computer• Nel corso dei secoli passati, grazie anche agli

studi di anatomia e all’affermarsi del razionalismo si è sviluppata l’idea di cervello come macchina

• Di lì il passo è breve ad immaginare, come fecero Cartesio e Leibniz, la possibilità di costruire macchine in grado di pensare e quindi anche di manifestare tale capacità tramite forme di espressione in linguaggio umano

Page 9: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Alan Turing (1912-1954) intorno al 1935 getta le basi teoriche per la costruzione dei computer, descrivendo la cosiddetta “macchina di Turing”, un modello a cui si ispirerà il computer reale costruito qualche anno dopo

Storia e computerStoria e computer

Page 10: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Ben presto i ricercatori cominciano ad intuire le potenzialità del computer, e a progettare applicazioni in molti campi in cui esso potrebbe sostituire utilmente l’uomo, anche superandone le capacità in termini di efficienza e rapidità

• Quando si tratta di applicazioni che richiedono intelligenza, si parla di INTELLIGENZA ARTIFICIALE

Storia e computerStoria e computer

Page 11: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• L'espressione Artificial Intelligence fu coniata nel 1956 dal matematico americano John McCarthy, durante uno storico seminario interdisciplinare svoltosi nel New Hampshire

• Secondo le parole di Marvin Minsky, uno dei "pionieri" della A.I., lo scopo di questa nuova disciplina sarebbe stato quello di "far fare alle macchine delle cose che richiederebbero l'intelligenza se fossero fatte dagli uomini"

Intelligenza artificialeIntelligenza artificiale

Page 12: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Uno dei primi compiti intelligenti a cui si pensò di poter applicare il computer fu la traduzione da una lingua all’altra

• Si trattava di un compito che richiedeva conoscenza linguistica (il dizionario) ma anche capacità di ragionamento, poiché tradurre non consiste semplicemente nel sostituire in un testo le parole di una lingua con le parole di un’altra

Traduzione automaticaTraduzione automatica

Page 13: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Il problema della traduzione era urgente• Le differenze linguistiche cominciavano ad

essere percepite come barriere allo sviluppo economico e scientifico, ma anche ai rapporti sociali

• La conoscenza di lingue straniere era allora retaggio di pochi

Traduzione automaticaTraduzione automatica

Page 14: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Una macchina in grado di tradurre dal russo all’inglese e viceversa sarebbe stata uno strumento strategico fondamentale per affrontare con successo la “guerra fredda”

• USA e URSS, alleate durante la II guerra mondiale, si spiavano reciprocamente per evitare di esporsi a nuove esperienze belliche

Traduzione automaticaTraduzione automatica

Page 15: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• La soluzione del problema della traduzione sembrava essere a portata di mano

• Molti ricercatori matematici, ingegneri, informatici ante litteram, erano convinti che nel giro di pochi anni sarebbero state costruite macchine in grado di tradurre da una lingua all’altra come dei traduttori professionisti umani

• Tra gli altri fecero il madornale errore di non consultare i linguisti e i traduttori

Tradurre e decrittareTradurre e decrittare

Page 16: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• La vittoria ottenuta sulla Germania dagli alleati anglo-americani era dipesa in modo significativo dalle efficienti macchine che gli inglesi avevano costruito per la decrittazione dei messaggi radio dell’esercito tedesco

• Proprio Alan Turing, aveva lavorato per i servizi segreti inglesi ed aveva coordinato lo sviluppo delle macchine per la decrittazione

Tradurre e decrittareTradurre e decrittare

Page 17: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• La ricostruzione di una macchina per la decrittazione (denominata “bomba”) costruita da Turing e il suo team a Bletchley Park nel 1939

Tradurre e decrittareTradurre e decrittare

Page 18: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Ma decrittare un codice segreto e tradurre da una lingua all’altra sono la stessa cosa?

• Nascono i primi sistemi di traduzione automatica, progenitori di Google Translate e di tutti quei sistemi che oggi ci consentono di ottenere una (abbastanza accettabile) traduzione da una lingua all’altra

Tradurre e decrittareTradurre e decrittare

Page 19: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Nel 1950, Turing era convinto che entro l’anno 2000 sarebbero state create delle macchine in grado di replicare le prestazioni di una mente umana

• Per verificare le prestazioni di una macchina propose un test, noto come “test di Turing”, che consente di capire se il comportamento che la macchina esibisce può essere considerato intelligente

Il test di TuringIl test di Turing

Page 20: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Il test di TuringIl test di Turing• Il test si basa sulla capacità della macchina di

utilizzare il linguaggio umano, mostrando di comprenderlo e di saperlo generare in modo adeguato

• Il computer supera il test se fornisce risposte tali da indurre degli esseri umani a credere di avere a che fare con un altro parlante umano (in almeno il 30% dei casi in una conversazione della durata di 5 minuti)

Page 21: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Il test di Turing e oltreIl test di Turing e oltre• Nel 2014 “Eugene Goostman”, un chatbot

costruito in Russia, ha superato il test di Turing

• Si presenta come un 13enne ucraino che vanta di sapere tutto, ma è costretto a palesare varie lacune. L’insicurezza di un adolescente è usata come una maschera per abbassare le aspettative dell’interlocutore rispetto alle capacità dialogiche del sistema

• La macchina ha mostrato capacità di simulazione o vera intelligenza?

Page 22: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Il test di Turing e oltreIl test di Turing e oltre• I ricercatori continuano ad interrogarsi su cosa

significa intelligenza• Superare il test di Turing sembra non

sufficiente per mostrare l’intelligenza di una macchina

• La soglia per verificare l’”intelligenza” di una intelligenza artificiale si è spostata anche verso la creatività, le emozioni e la capacità di fare ironia.

Page 23: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Un po’ di fantascienzaUn po’ di fantascienza• La produzione legata all’immaginario della

fantascienza ha mostrato moltissimi esempi di intelligenze artificiali in grado di dialogare con l’uomo e assumerne i comportamenti.

• Una quantità di libri e film hanno proposto entità artificiali dotate di capacità di linguaggio e ragionamento molto simili a quelle degli umani.

Page 24: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Nel 1968, Stanley Kubrik, nel film “2001 ODISSEA NELLO SPAZIO”, immagina che nel 2001 lo sviluppo dell’intelligenza artificiale sia stato tale da poter costruire macchine pensanti e parlanti.

Un po’ di fantascienzaUn po’ di fantascienza

Page 25: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• HAL9000 è l’IA del film, macchina "incapace di commettere errore", capace di pensare e di comunicare in linguaggio umano, ma anche di tentare di distruggere gli esseri umani per evitare di essere spenta.

Un po’ di fantascienzaUn po’ di fantascienza

Page 26: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Nel 1982, Ridley Scott ambienta nel 2019 il film “BLADE RUNNER”, in cui macchine che sono in grado di superare il test di Turing sono realtà.

• Si tratta di replicanti, esseri che condividono con gli esseri umani l’aspetto e la capacità di provare emozioni grazie all’innesto di ricordi emotivamente carichi. Questo rende molto difficile distinguerle dagli umani.

Un po’ di fantascienzaUn po’ di fantascienza

Page 27: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Un po’ di fantascienzaUn po’ di fantascienza• C3PO è il droide di

protocollo di “STAR WARS”, in grado di dialogare con gli esseri umani in 6.000.000 di lingue diverse parlate nella galassia.

Page 28: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Un po’ di fantascienzaUn po’ di fantascienza• In “INTERSTELLAR“

l’intelligenza artificiale TARS, dall’aspetto poco umano, dialoga con i protagonisti facendo anche ironia, e li aiuta nel corso del loro viaggio attraverso lo spazio-tempo.

Page 29: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Molti altri libri e film hanno proposto in forme diverse le macchine pensanti capaci di parlare e superare brillantemente il test di Turing.

• Dai tempi di Turing, tra alterne vicende, le tecnologie della parola hanno fatto piccoli e grandi passi avanti, e oggi pervadono la nostra esistenza. Ma non sempre con i risultati che vorremmo.

Un po’ di fantascienzaUn po’ di fantascienza

Page 30: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Nel 2011 Brad Lewis e John Lasseter nel film per Disney - Pixar “CARS 2” mostrano dispositivi controllati dalla voce, che ogni tanto sbagliano anche a comprendere i comandi.

• Questa non è più fantascienza, è realtà (in un film di pura fantasia!).

Un po’ di fantascienzaUn po’ di fantascienza

Page 31: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Un po’ di fantascienzaUn po’ di fantascienza

Page 32: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

LimitiLimiti• Una soluzione ottimale del problema della

traduzione e di vari altri legati al linguaggio non è ancora stata raggiunta

• Non esistono oggi computer che producono per qualunque testo in qualunque circostanza prestazioni linguistiche della stessa qualità di quelle prodotte da un essere umano.

• Ma la ricerca procede e le prestazioni dei sistemi migliorano gradualmente

Page 33: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

LimitiLimiti• Tutti questi anni di ricerca hanno portato ad

una conoscenza molto più profonda del linguaggio umano e del suo funzionamento, ma anche alla consapevolezza della complessità che lo caratterizza sotto molti punti di vista

• Linguisti, traduttori, filosofi, scienziati cognitivi, psicologi e altri scienziati oggi sono attori di primaria importanza nella linguistica computazionale

Page 34: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

LimitiLimiti

• MA la competenza linguistica dei parlanti umani è ben lungi dall’essere completamente spiegata

Page 35: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

LimitiLimiti• Si tratta di compiti molto complessi che

richiedono conoscenza linguistica ed extra linguistica

• Ad es. la traduzione automatica da una lingua A ad una lingua B comporta:–Recepire il testo in lingua A–Comprendere il significato del testo–Generare il testo corrispondente in lingua B

Page 36: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Problemi del linguaggioProblemi del linguaggio• La comprensione di un testo può richiedere la

conoscenza del contesto di enunciazione:• Ad esempio possiamo dire che la frase

“questa è un’aula molto grande” ha significato (vero o falso) solo se siamo in grado di vedere il luogo in cui viene pronunciata

Page 37: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Problemi del linguaggioProblemi del linguaggio• La comprensione di un testo può richiedere la

conoscenza del mondo:• Ad esempio, se confrontiamo le frasi

“La penna è dentro la scatola” e “La scatola è dentro la penna”non abbiamo difficoltà a riconoscere che la prima ha senso e la seconda non ne ha, ma solo perchè sappiamo che le scatole sono più grandi delle penne

Page 38: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Problemi del linguaggioProblemi del linguaggio• La comprensione di un testo può richiedere la

conoscenza di comportamenti sociali:• Se in una conversazione dico “Su, dimmi

qualcosa.” non lo faccio per sentir dire dal mio interlocutore “Qualcosa.” perchè mi baso su delle convenzioni sociali per cui con una simile richeista si esprime un invito a comunicare e non una richiesta di pronunciare una parola

Page 39: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

LimitiLimiti• I computer di oggi mostrano di poter trattare il

nostro linguaggio entro certi limiti• Le tecnologie della parola funzionano nello

svolgimento di certi compiti, su certi tipi di testi e in certi contesti di applicazione

• L’area dell’Intelligenza Artificiale che si occupa specificamente del linguaggio umano si chiama LINGUISTICA COMPUTAZIONALE o TRATTAMENTO AUTOMATICO del LINGUAGGIO (TAL, NLP natural language processing)

Page 40: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Cosa fanno i sistemi di TAL Cosa fanno i sistemi di TAL • Al pari di un essere umano, per poter

comunicare in linguaggio umano un sistema di TAL deve:

• acquisire la conoscenza relativa al linguaggio • rappresentare al suo interno tale conoscenza• utilizzare tale conoscenza in modo da poter

ricevere domande, coglierne il significato, generare risposte, tradurre, ecc.

Page 41: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Cosa fanno i sistemi di TAL Cosa fanno i sistemi di TAL Acquisizione Rappresentazione Utilizzo

Traduzione Risposta a domande Rilevazione di opinioni …

Page 42: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Acquisire la conoscenzaAcquisire la conoscenza• Noi umani acquisiamo la conoscenza della

lingua madre mentre cresciamo e continuamente veniamo esposti ad esempi.

• Astraiamo dagli esempi e interiorizziamo le regole della lingua a cui siamo esposti.

• Nel caso di altre lingue (es. inglese, francese, latino e greco antico) partiamo dallo studio delle regole e dall’esposizione ad esempi.

Page 43: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Acquisire la conoscenzaAcquisire la conoscenzaIl modo in cui apprendiamo fa sì che non ci

rendiamo conto:• di quanta conoscenza è necessaria per

utilizzare una lingua• di quali sono le nozioni che dobbiamo

conoscere per poter essere considerati parlanti di una lingua, anche se sappiamo ben valutare la competenza linguistica di una persona

Page 44: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

ProblemiProblemi• Il linguaggio si evolve costantemente e si

modifica, es.: oggi non parliamo l’italiano di Dante o di Manzoni

• Si caratterizza in base al luogo, assorbendo le influenza derivante dai dialetti o da altre lingue, es.: i parlanti provenienti dal Sud Italia usano con molta maggiore frequenza il passato remoto rispetto a quello del Nord

Page 45: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

ProblemiProblemi• Siamo inoltre abituati a comprendere il

linguaggio anche quando è “scorretto”• La necessità di comunicare infatti prevale sulle

regole della grammatica e ci porta a produrre messaggi sgrammaticati, pieni di espressioni sintetiche e creative, hashtag, emoji ed emoticon, come negli sms sui cellulari, nei messaggi di e-mail, nei post sui social media come Twitter e Facebook (a questo dedicheremo una lezione)

Page 46: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Lo sviluppo dei sistemi di TAL, ha mostrato che tante informazioni linguistiche che paiono irrilevanti ad un essere umano, e su cui non siamo abituati a focalizzarci, sono invece fondamentali per un sistema.

• Risulta fondamentale l’ambiguità che pervade il linguaggio umano a tutti i possibili livelli di analisi.

ProblemiProblemi

Page 47: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Sono molto diffuse le ambiguità morfologiche, ovvero determinate da parole che possono avere diverse categorie grammaticali o significato:

“Tutti hanno un TELEFONINO e a chi TELEFONINO non si capisce”

PESCA nome (il frutto, lo sport, l’estrazione)

verbo (l’attività) aggettivo (il colore)

ProblemiProblemi

Page 48: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Altrettanto frequenti le ambiguità sintattiche, ovvero determinate dalle relazioni tra parole:

• “Giorgio vide un uomo nel parco con il telescopio”

• “Chi uccise il poliziotto?”• “La vecchia porta la sbarra”

ProblemiProblemi

Page 49: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• E le ambiguità semantiche, ovvero determinate dal significato delle parole:

• “Ogni uomo ama una donna” significa che per ogni singolo uomo esiste una

singola donna che egli amaoppure significa che esiste una particolare

singola donna che ognuno degli uomini preso singolarmente ama

ProblemiProblemi

Page 50: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

Acquisire la conoscenzaAcquisire la conoscenza• Questa complessità rende il linguaggio un

oggetto molto difficile da apprendere, rappresentare ed utilizzare

• In pratica, non è per nulla intuitivo e semplice fare un elenco completo di tutte le cose che si devono sapere per utilizzare una certa lingua

• Ma questo elenco completo è proprio quello che sarebbe necessario per un sistema di TAL

Page 51: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• I computer non sono oggetto di evoluzione nel senso in cui lo sono gli esseri umani, e neppure vivono all’interno di un tessuto sociale come gli esseri umani. La conoscenza dobbiamo fornirgliela noi.

• Ma quale e quanta conoscenza è necessaria per riuscire ad usare il linguaggio umano?

Acquisire la conoscenzaAcquisire la conoscenza

Page 52: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• I primi sistemi contenevano delle basi di conoscenza in cui erano raccolte le regole della grammatica, i dizionari e tutte le informazioni che sembravano necessarie a trattare il linguaggio.

• Ma questo non era sufficiente: i risultati continuavano ad essere scarsi, la conoscenza non era mai abbastanza … e aggiungerne era molto costoso

Acquisire la conoscenzaAcquisire la conoscenza

Page 53: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• I sistemi più recenti contengono poca conoscenza, ma sono in grado di apprenderla da esempi con uno sforzo limitato

• Si costruiscono quindi delle grandi raccolte di esempi di uso del linguaggio, in cui le regole e le irregolarità sono presenti e possono essere utilizzate dai sistemi per fare astrazione

Acquisire la conoscenzaAcquisire la conoscenza

Page 54: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Ad es. se il sistema deve imparare ad utilizzare l’articolo, dovrà essere esposto ad un gran numero di frasi in cui l’articolo compare:

IL cane mangia in giardinoPaolo beve UNA birra ghiacciataLA migliore giornata fu quella in cui IL nonno gli

comprò L’album di figurineIeri ho comprato LO stesso tipo di frutta…

Acquisire la conoscenzaAcquisire la conoscenza

Page 55: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Che cosa si astrae dalle 4 frasi seguenti?IL cane mangia in giardinoPaolo beve UNA birra ghiacciataLA migliore giornata fu quella in cui IL nonno gli

comprò L’album di figurineIeri ho comprato LO stesso tipo di frutta• L’articolo precede il nome e non può seguirlo,

precede l’aggettivo e non può seguirlo, concorda con il nome …

Acquisire la conoscenzaAcquisire la conoscenza

Page 56: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

• Non esattamente nel modo in cui astraiamo noi, ma anche il computer riesce a produrre delle generalizzazioni delle informazioni che trova negli esempi e a formare una base di conoscenza

• Ovviamente deve avere esempi di tutte le possibili strutture

Acquisire la conoscenzaAcquisire la conoscenza

Page 57: Le tecnologie della parola: un percorso tra scienza, psicologia e linguistica Cristina Bosco Dipartimento di Informatica, Università di Torino Informatica.

RappresentareRappresentare lala

conoscenzaconoscenza• Non sappiamo esattamente in che forma la conoscenza necessaria all’uso del linguaggio sia codificata in un essere umano, nonostante i molti studi nelle scienze cognitive e linguistiche

• Per i computer invece i modi per rappresentare la conoscenza linguistica necessaria per trattare il linguaggio umano sono stati inventati.