La Rappresentazione della Conoscenza · Linguistica e Nuovi Media . ... di conoscenza generale, ......

39
LINGUAGGIO E RAPPRESENTAZIONE DELLA CONOSCENZA Linguistica e Nuovi Media

Transcript of La Rappresentazione della Conoscenza · Linguistica e Nuovi Media . ... di conoscenza generale, ......

LINGUAGGIO E

RAPPRESENTAZIONE DELLA

CONOSCENZA

Linguistica e Nuovi Media

Cos’hanno in comune?

La Chimica

Scie di feromoni delle FORMICHE

Presenza di cibo: la formica rilascia una scia discontinua quando sta cercando il cibo. Una volta trovato il cibo la formica riempie la scia fino alla tana.

La Chimica

Scie di feromoni delle FORMICHE

Distanza: percorsi più brevi hanno scie di feromoni

più intense.

La Geometria

Danza delle API

Direzione: fiori situati direttamente in linea col sole sono rappresentati da fasi di ondeggiamento in direzione ascendente sui favi verticali, ed ogni angolo a destra o a sinistra del sole viene codificato da un corrispondente angolo a destra o a sinistra della direzione ascendente

La Geometria

Danza delle API

Distanza: il numero di giri a forma di 8 che l’ape compie è inversamente proporzionale alla distanza del giacimento di cibo

https://youtu.be/4NtegAOQpSs

Il Suono

Suoni e urla del CERCOPITECO

"Boom!" è il verso più ripetuto per avvertire il gruppo dell’imminente caduta di un ramo, o per comunicare alle altre scimmie la necessità di "traslocare" in un’altra area della foresta.

"Krak!" è un grido d’allarme ben preciso: attenzione, leopardo in vista!

"Hok!" usato quasi esclusivamente quando a minacciare le scimmiette, è uno dei più temibili rapaci della zona, l’aquila coronata

Uso dei suffissi ("-oo") per moltiplicare la gamma di vocalizzi (Krak-oo rappresenta allarme generico)

L’Ultrasuono

I delfini:

Segni Vocali, Non vocali auditivi, visuali e tattili

Segni Vocali: Fischi, o impulsi (stati d’animo, gioco, firma

personale)

Comunicazione ‘olografica’ ?

Segni non vocali auditivi: sbattere le pinne, ecc. (pericolo o

abbandonare un luogo, dipende dal contesto)

Dal suono alla Parola

• Laringe abbassata

• Canale fonatorio più largo

• Lingua più mobile e

flessibile

• Laringe in alto

• Quando si alza, epiglottide e

velo palatino si sovrappongono

impedendo al cibo di entrare

nel canale respiratorio

Le Parole ed i Concetti

Cours de linguistique générale ("Corso di linguistica

generale", 1916)

Ragionamento Diagrammatico

Rappresentazione del mondo di tipo Motivato

(meno arbitrario)

Rappresentazione Preposizionale:

‘the city 250 km south of Warsaw’

Rappresentazione Analogica:

Ragionamento Diagrammatico

Rappresentare il mondo: Platone

Rappresentare il mondo: Platone

Rappresentare il mondo: Aristotele

La Logica:

Adatta a rappresentare la conoscenza

Studia Nessi Inferenziali tra enunciati

Si occupa di inferenze deduttivamente valide

Se le premesse sono Vere, allora anche la Conclusione sarà

vera

‘Giovanni Paolo II è siciliano;

Tutti i siciliani sono Giardinieri;

Quindi: Giovanni Paolo II è giardiniere

Rappresentare il mondo: Aristotele

È importante che: Se le premesse sono vere, allora

anche la conclusione DEVE essere Vera

Altri tipi di ragionamento: Induttivo, Abduttivo e per

Default (non sono oggetto della Logica)

Tavole di Verità

Rappresentare la conoscenza

Concetti Relazioni

concreti astratti gerarchie proprietà

Trasmissione della Conoscenza

La relazione tra Concetti e Rappresentazioni deve

essere

condivisa da più individui

Trasmessa

È possibile trasmettere la Conoscenza alle

Macchine?

L’Intelligenza Artificiale

conferenza di Dartmouth : Minsky, McCarthy, Shannon e Rochester (1957)

La definizione dei calcolatori automatici come strumenti di

base per la simulazione dei compiti.

La programmazione di un calcolatore per la manipolazione del linguaggio, inteso come “l’uso di parole in base a regole di ragionamento e a regole di congettura” .

L’uso di reti di neuroni artificiali per la simulazione dei

processi mentali. Lo sviluppo di forme di auto-miglioramento delle macchine

intelligenti.

L’Intelligenza Artificiale

’60-’75: sistemi di “ricerca” (reasoning as search) che cercavano di risolvere problemi di dominio specifico attraverso una ricerca esaustiva di tutte le soluzioni possibili (Micro-Mondi, Reti Semantiche, giochi…)

’75-’80 o AI Winter: limiti delle macchine, necessità di enormi basi di conoscenza generale, di senso comune (Uso della Logica o dei Frames, sistemi esperti)

’80: Sviluppo di basi di conoscenza di senso comune (affidate agli utenti, come Cyc, Open Mind, ConceptNet

Second AI Winter: Interesse per la Robotica

’90: Sistemi ad agenti intelligenti, Fuzzy Logic, Machine Learning

2000+: Web Semantico e Ontologie

IA-complete

L'espressione IA-completo (F. Montalvo) designa un problema la cui risoluzione è considerata equivalente alla creazione di una IA realistica:

Bongard Problems (Phaeco)

Computer Vision

Natural Language Understanding

Test di Turing

Macchina intelligente: capace di concatenare idee e di esprimerle.

Dal Linguaggio Naturale alle Macchine

Il linguaggio:

Rappresenta la conoscenza

Aiuta la trasmissione della conoscenza

La parola al Computer

Come trasmettere la conoscenza alle macchine

attraverso le parole?

Thesauri

Basi di Dati Relazionali di tipo Semantico

Dizionari Elettronici

La parola al Computer

Tesauri

Liste di lemmi organizzate semanticamente

Connessione Gerarchica

tra le parole (iperonimia,

Iponimia)

Sinonimia

Es. WordNet

Thesauro Unesco

La parola al Computer

Basi di Dati Relazionali

Es. Matrici di co-occorrenza (distributional semantics)

Costruite a partire da grandi Corpus testuali;

La co-occorrenza di parole nel testo permette di attribuire un

valore relazionale tra queste

Per ogni parola si crea un vettore di co-occorrenza

Dallo scaling in 2 o 3D di ogni vettore si ottengono delle

coordinate

La parola al Computer

Basi di Dati Relazionali

Es. Matrici di co-occorrenza (distributional semantics)

La parola al Computer

Basi di Dati Relazionali

Es. Matrici di co-occorrenza (distributional semantics)

Specificano la somiglianza tra le parole

Individuano cluster semantici

La parola al Computer: Dizionari

Descrizione del lessico della

lingua:

presenza di glosse descrittive

Ordine Alfabetico:

fondamentale per la

consultazione

Descrizione del lessico della

lingua:

presenza di codici per la

categorizzazione e la

flessione automatica

Ordine Alfabetico:

velocità computazionale

Dizionari Cartacei Dizionari Elettronici

La parola al Computer: Dizionari

La parola al Computer: Dizionari

La parola al Computer: Dizionari

• Lemma

La parola al Computer: Dizionari

• Lemma

• Categoria grammaticale

La parola al Computer: Dizionari

• Lemma

• Categoria grammaticale

• Codice di flessione

La parola al Computer: Dizionari

• Lemma

• Categoria grammaticale

• Codice di flessione

• Informazioni Semantiche

• Conc = nome concreto

• Ncibo= è un alimento

La Morfologia

3 tipi di processi Morfologici:

Flessione: cas-(a|e), prensentat-(or|ric)(e|i), nonn-

(o|a|i|e)

Derivazione: cas-ett-a, bar-ista, dis-bosc-a-mento

Composizione: carta di credito, pianoforte, capo stazione

La Morfologia

Lo Stemming: Consiste nel ridurre alla radice le

parole

Poco utile per l’Italiano

Sistemi Probabilistici o di Machine Learning

A partire da un Training-Set di testi etichettati, un

sistema intelligente cerca di predire i tratti morfologici

La Morfologia

Uso combinato di dizionari e Automi a stati finiti

Aggiungendo all’interno del lemma una connessione

diretta tra la parola ed un determinato automa flessivo

La Morfologia

Oppure stabilendo regole valide per ogni parola che

accetta l’aggiunta di determinati morfemi:

Casa, cas-ett-a

Bello, bell-issim-o;

Alessandro Maisto