Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica)...

46
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003

Transcript of Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica)...

Page 1: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Sistemi basati su conoscenzaComunicazione basata sul linguaggio

naturale(grammatica, semantica)

Prof. M.T. PAZIENZA

a.a. 2002-2003

Page 2: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

ComunicazioneLa comunicazione è lo scambio intenzionale

di informazioni effettuato attraverso la produzione e percezione di segni presi da un sistema condiviso di segni convenzionali

Linguaggio = sistema complesso e strutturato di segni per la comunicazione

Il linguaggio umano è altamente codificato e copre un numero infinito di istanze di comunicazione

Page 3: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Linguaggio

Parola qualsiasi tipo di segno comunicativo convenzionale

Parlante chi attiva la comunicazione

Ascoltatore chi riceve la comunicazione

Enunciato valore della comunicazione

Page 4: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Linguaggio per comunicare

Atti linguistici per trasferire informazione all’ascoltatore

Atti linguistici per far agire l’ascoltatore

Page 5: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Linguaggio per comunicare

Pianificazione

• Decidere quale atto linguistico attivare e quando per raggiungere l’obiettivo di comunicare una determinata informazione ad un ascoltatore

• Nondeterminismo degli atti linguistici

Page 6: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Linguaggio per comunicare

Comprensione degli atti linguistici

La sintassi e la semantica determinano la comprensione di un atto linguistico

Page 7: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Comprensione di atti linguistici

Grammatiche basate sulla struttura di frase (stringhe composte da sottostringhe o sintagmi)

S-> NP VP

Categorizzazione dei sintagmi

esempi:

Sintagmi nominali, NP, Noun Phrase

Sintagmi verbali, VP, Verb Phrase

Sintagmi preposizionali, PP, Prepositional Phrase

I sintagmi sono dei link tra grammatica e semantica.

Page 8: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

GrammaticheUna grammatica o sintassi G è definita da:V alfabeto di simboli terminaliN alfabeto di simboli non terminali (o

categorie sintattiche)P insieme finito di regole di produzione

sintattiche del tipodove ed V)

S assioma o simbolo iniziale G (V,N,P,S)

Page 9: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Esempio V= il, lo, gatto, topo, sasso, mangia, beve

N= <frase>,<sogg>,<verbo>,<comp-ogg>, <art>, <nome>

S=<frase>

P:

<frase>::=<sogg><verbo><comp-ogg>

<sogg>::=<art><nome>

< comp-ogg >::=< art><nome>

<art>::= il lo

<nome>::= gatto topo sasso

<verbo>::= mangia beve

Page 10: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

<frase>

<sogg> <verbo> <comp-ogg>

<art> <nome> mangia <art> <nome>

il gatto il topo

Esempio di albero sintattico

Page 11: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Modelli di comunicazione

Messaggio codificato

1- Il parlante ha in mente una proposizione P

2- Il parlante codifica la proposizione in segni W

3- L’ascoltatore tenta di decodificare il messaggio W per ricostruire la proposizione P

Si ipotizza di mantenere la stessa interpretazione ai tre livelli

Page 12: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Processi della comunicazione

Intenzione S vuole che H creda PGenerazione S sceglie le parole WSintesi S emette le parole WPercezione H percepisce W’Analisi H inferisce che W’ ha vari

significati Pi

Disambiguazione H inferisce che S intendeva affermare Pi

Assimilazione H decide di credere Pi

Page 13: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Processi della comunicazione

Page 14: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Parsing

Parsing: processo di assegnazione di una parte del discorso (nome, verbo,…) ad ogni parola di una frase ed al raggruppamento di parole in sintagmi (albero di analisi o sintattico)

Un albero sintattico è un albero in cui i nodi interni rappresentano sintagmi, gli archi rappresentano l’applicazione di regole grammaticali e le foglie rappresentano parole.

Page 15: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Processi della comunicazione

Interpretazione semantica: processo di estrazione del significato da un enunciato di un particolare linguaggio; associazione di significati a stringhe in isolamento (now); possibile ambiguità degli enunciati

Interpretazione pragmatica: associazione di significati ad enunciati e fatti in contesti specifici (S3); rappresentazione della situazione corrente

Page 16: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Linguaggio per comunicare

Si usa il linguaggio per comunicare se e solo se gli agenti coinvolti nella comunicazione:

• Condividono la conoscenza di un linguaggio

• Condividono la conoscenza del contesto della conversazione

• Sono razionali e quindi la loro reazione ad un atto linguistico è prevedibile

Page 17: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Modelli di comunicazione

Modello del linguaggio situato

Il significato di un messaggio dipende sia dalle parole che dalla situazione in cui le parole sono emesse

le stesse parole (strutture di) assumono significati diversi in contesti diversi

(es: sono qui, leggi questo libro. Il “valore” di qui, questo, cambiano con il tempo ed il luogo)

Page 18: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Comunicazione con Tell e AskAgenti che condividono lo stesso linguaggio di rappresentazione

interna e i simboli usati. (problema della condivisione della denominazione dei simboli e delle relazioni tra simboli)

possono accedere alle basi di conoscenza degli altri nello stesso modo che alla propria (tramite la Tell per inviare una proposizione e tramite la Ask per verificarne la conoscenza) (problema dell’aggiornamento delle Bdc)

Comunicazione telepatica

Page 19: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Comunicazione con Tell e Ask

Page 20: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Comunicazione tramite il linguaggio

Condivisione del linguaggio di comunicazione (ed, al più, del linguaggio interno ma non della Bdc)

Traduzione da linguaggio esterno a linguaggio interno

Problema di riconciliare le differenze tra le basi di conoscenza interne degli agenti

Page 21: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Comunicazione tramite il linguaggio

Page 22: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Linguaggio Naturale Necessità di definire una grammatica formale

• Dinamicità della lingua• Non grammaticalità di alcune espressioni• Comprensibilità del messaggio anche se

scorretto formalmente

I linguaggi formali sono assunti essere adatti a gestire i linguaggi naturali, ma con molti limiti e problemi

Page 23: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Linguaggio Naturale

• Definiamo lessico l’insieme delle parole ammissibili del vocabolario della lingua

• Le parole sono raggruppate in categorie o parti del discorso (nome, articolo, pronome,verbo,…)

• Classi aperte (nomi, verbi, aggettivi)• Classi chiuse (pronomi, avverbi, articoli,

preposizioni, congiunzioni)

Page 24: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Grammatica del linguaggio

Regole

• S-> NP VP S congiunzione S

• NP -> Pronome Sostantivo Articolo Sostantivo Cifra Cifra NP PP NP RelClause

• VP-> Verbo VP NP VP Aggettivo VP PP VP Avverbio

• PP -> Preposizione NP

• RelClause -> that VP

Page 25: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Analisi sintattica

• Ricostruzione della struttura della frase di un enunciato, data una grammatica

• Foresta di analisi: lista ordinata di Alberi di analisi

• Algoritmi di parsing: approccio top-down e bottom-up

Page 26: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Analisi di un enunciato

Page 27: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Descrivere grammatiche

BNF (problemi)

• Descrive stringhe (senza significato)

• Descrive grammatiche libere da contesto

S->NP VP

Sostantivo-> odore … … …

Page 28: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Grammatica logica

Logica del primo ordine

• Gestisce “stringhe con significato”

• Ogni nonterminale diventa predicato unario vero per stringhe che sono sintagmi di quella categoria

)(tan...)""(

)),(()()( 2121

stivoSosodores

ssConcatenaSsVPsNP

Page 29: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Grammatiche a clausole definite DCG

Una grammatica logica permette inferenze non limitate (quindi approccio risolutivo costoso, necessaria una limitazione)

Nelle grammatiche a clausole definite (DCG) ogni formula deve essere una clausola definita (in forma di Horn ha un solo atomo come conseguente e un atomo o una congiunzione di zero o più atomi come antecedente)

Con il formalismo DCG una grammatica è definita in termini di logica del primo ordine

Page 30: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Grammatiche a clausole definite DCG

Sul lato sinistro un singolo nonterminale (aumentato o meno)

Sul lato destro di una regola: • I simboli nonterminali possono essere aumentati

con argomenti (semantica) in più NP(s,sem)

• Una variabile può apparire sul lato destro di una regola DCG

• Un test logico tra graffe può apparire sul lato destro di una regola.

Page 31: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Grammatiche

Se non si distinguono i casi (ruoli sintat. e concord.) le grammatiche possono generare anche frasi sgrammaticate (overgenerazione)

Es. Io dare te la penne

Non è vero che qualunque NP si combina con qualunque VP e questo con qualunque PP in qualsiasi ordine

L’introduzione di nuove regole che considerino i casi farebbe esplodere (nel numero) le grammatiche

Page 32: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Grammatiche aumentate1. Parametrizzare le regole ed aggiungere delle

variabili permette di mantenere cost. il num. di regole di una grammatica (costo computazionale) e risolve anche il problema delle concordanze.

Esempio (in inglese)

S->NP(nominativo) VP ….

2. Sottogategorizzare i verbiEsempio (in inglese)

PP->Preposizione NP(accusativo)

Page 33: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Sottocategorizzazione verbale

Analisi dei complementi (sintagmi obbligatori che seguono un verbo all’interno del sintagma verbale)

• Lista di sottocategorizzazione (lista di categorie che il verbo accetta prioritariamente e che lo caratterizzano)

• Aggiunti (sintagmi non dominati del verbo: spazio e tempo)

E’ possibile che un verbo abbia più di una lista di sottocategorizzazione / E’ possibile che un sostantivo abbia più di una categoria

Page 34: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Sottocategorizzazioni verbali

Page 35: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Sottocategorizzazioni verbali

Aumentare la catergoria VP con un appropriato argomento di sottocategorizzazione (complementi necessari a formare un VP completo)

VP(sottocat)-> VP([NP!sottocat]) NP(accusativo)

!VP([Aggettivo!sottocat])Aggettivo

!VP([PP!sottocat]) PP

!Verbo(sottocat)[]

Page 36: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Sottocategorizzazioni verbali

Page 37: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Semantica dei linguaggi formali

Semantica composizionale

La semantica di un qualsiasi sintagma è funzione della semantica dei suoi sottosintagmi

(esempio, in aritmetica se conosciamo il significato di X,Y,+, allora conosciamo il significato di X+Y)

Page 38: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Semantica dei linguaggi naturali

• Il significato delle parole (e dei sintagmi) non dipende in maniera composizionale dal contesto circostante

• E’ possibile avere più interpretazioni semantiche corrette di una stessa locuzione

• Necessità di effettuare una disambiguazione, ovvero una scelta tra le possibili interpretazioni semantiche

Page 39: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Ambiguità lessicale

• Si ha ambiguità lessicale nel caso in cui una parola abbia più di un significato.

• L’ambiguità lessicale può essere trasversale rispetto alle categorie (es. piano)

Page 40: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Ambiguità sintattica (o strutturale)

• L’ambiguità sintattica può essere presente con o senza ambiguità lessicale

“La vecchia porta la sbarra”

Le ambiguità lessicale e sintattica portano all’ambiguità semantica

Page 41: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Ambiguità semantica

Una forma di ambiguità semantica è data dall’ambiguità dei riferimenti (ad esempio anaforici)

Egli urlava per avere a tutti i costi un pallone. Lo spinsi fuori dalla porta

Page 42: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Albero di analisi (espressioni aritmetiche)

Page 43: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Albero di analisi

Page 44: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Interpretazione pragmatica

Spesso è necessario completare l’interpretazione con informazioni relative:

1)alla situazione corrente; tale informazione non è composizionale e dipende dal contesto (es: riferimenti a soggetti sottintesi, ad avverbi temporali e spaziali,…)

2)ad oggetti citati precedentemente nel testo (anafora) Es.1 Dopo la proposta di Mario a Maria, hanno cercato un prete e si sono sposati. In luna di miele sono andati a Parigi. 2.Giovanni ama Maria, ma lei non ricambia il suo sentimento.

Page 45: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Interpretazione pragmatica

• L’interpretazione pragmatica prende in considerazione la situazione corrente per determinare l’effetto di un enunciato in un determinato contesto

Page 46: Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a. 2002-2003.

Disambiguazione

Per disambiguare una frase è necessario disporre del modello del parlante e dell’ascoltatore, oltre a conoscere il contesto.

• Modello del mondo• Mondo mentale• Modello linguistico

La disambiguazione è il processo in base a cui si decide quale delle possibili interpretazioni è quella intesa dal parlante