Elaborazione del linguaggio naturale morfologia, FSA, FST, POS esercizi
description
Transcript of Elaborazione del linguaggio naturale morfologia, FSA, FST, POS esercizi
Elaborazione del linguaggio naturalemorfologia, FSA, FST, POS
esercizi
Maria Teresa PAZIENZA
FSA
ESERCIZIO 1
1. Disegnare (se esistono) gli FSA che riconoscono/generano i seguenti linguaggi regolari:
La= {ac,abc,abbc,abbbc, …}
Lb= {ac,abb}
Lc= {ac,acdc,acdcdc, …}
Ld= {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …}
2. Scrivere le transition table relative agli FSA
Soluzione esercizio
q0q0 q2
q2
q1q1
ESERCIZIO 1
aa cc
bb
La = {ac,abc,abbc,abbbc, …}
Lb = {ac,abb}
q0q0 q1
q1
aa cc
q3q3
q2q2
bb
B
A
Soluzione esercizio
ESERCIZIO 1
Lc = {ac,acdc,acdcdc, …}
q0q0 q2
q2
q1q1
aa
q3q3
ddcc
cLd = {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …}
q0q0 q2
q2
q1q1
aa cc
db
D
C
Soluzione esercizio
INPUT
STATE a b c
q0 q1 0 0
q1 0 q1 q2
q2 0 0 0
ESERCIZIO 2
TRANSITION TABLE
A
INPUT
STATE a b c
q0 q1 0 0
q1 0 q3 q2
q2 0 0 0
q3 0 q2 0
TRANSITION TABLE
B
Soluzione esercizio
INPUT
STATE a b c d
q0 q1 0 0 0
q1 0 0 q2 0
q2 0 0 0 q3
q3 0 0 q2 0
ESERCIZIO 2
TRANSITION TABLE
C
INPUT
STATE a b c d
q0 q1 0 0 0
q1 0 q2 q2 0
q2 0 0 0 q1
TRANSITION TABLE
D
ESERCIZIO 1
Soluzione alternativa esercizio
Ld = {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …}
a b c d
0 1 / / /1 / 2 3 /2 / / / 13 / / / 1
Transition table
Regex
Ld = a(b|c)(d(b|c))*
FSA
1. Scrivere un FSA che riconosca espressioni “monetarie” del tipo:
“uno euro”, “due euro”, “venti tre euro”, “venti uno euro dieci cent”, “trenta due euro trenta quattro centesimi”, “due cent”….
Il cui vocabolario sia ={uno, due, tre,…dieci,venti,…,euro,cent}
2. Scrivere la relativa state-transition table
3. Scrivere l’espressione regolare associata all’FSA
ESERCIZIO 2
ESERCIZIO 2
Soluzione esercizio
Es 2
FSA
1. Scrivere un FSA che riconosca sintagmi nominali per l’Inglese, ovvero:
- nomi propri (es. “John”)
- nomi comuni preceduti da articoli e eventualmente da un numero variabile di aggettivi (es. “the new yellow table”)
- combinazione di sintagmi dei due punti precedenti preceduti da preposizioni (es. “the new yellow table of John”)
2. Scrivere la relativa state-transition table
ESERCIZIO 3
FSA per la morfologia
1. Scrivere un FSA che riconosca la morfologia derivazionale degli aggettivi inglesi, ovvero:
Un aggettivo può avere come prefisso negante “un-”
Un aggettivo può avere forma comparativa, superlativa e avverbiale (rispettivamente i suffissi –er,-est,-ly)
2. Aggiungere all’FSA il seguente fatto:
Esistono alcuni aggettivi “irregolari” che non possono prendere “un-” e “-ly” (es: big, cool)
3. Integrare il lessico: regolari: “clear, happy”, irregolari: “big,cool”
ESERCIZIO 4
ESERCIZIO 4
Soluzione esercizio
1
0 1 2 3
un- adj_reg
-er-est-ly
adj_reg
Clear
Happy
LESSICO
ESERCIZIO 4
2 a
0 1 2 4
un- adj_reg
-er-est-ly
3
adj_irr
-er-est
Soluzione esercizio
adj_reg adj_irr
Clear
Happy
Big
cool
LESSICI
ESERCIZIO 4
2 b
0 1 2 5
un- adj_reg
-er-est-ly
4
adj_irr
-er-est3
adj_reg
Soluzione esercizio
adj_reg adj_irr
Clear
Happy
Big
cool
LESSICI
Identificazione dei morfemi
A
1. Scrivere l’ FST che modelli la morfologia dei nomi singolari/plurali prendendo in considerazione la regola ortografica dell’ y-replacement: -y cambia in –ie prima della –s ES: berry berries
B
1. Scrivere l’ FST che modelli la morfologia dei verbi presente/passato prendendo in considerazione la regola ortografica della k-insertion, sapendo che:
In generale la forma passata si forma dal presente apponendo come suffisso la particella –ed (ES: presspress-ed)
La k-inserion prevede che ai verbi terminanti in vocale+c sia aggiunta la k (ES: panic panic + k +ed)
ESERCIZIO 5
A.1
0 1 7
s:s
3
:+
2
other
:y
i:
e:
4 5
:+
s:s
:i
:i6
:e
Soluzione esercizio 5
ESERCIZIO 5
B.1
0
1
7
d:d
3
:+
2
cons:cons
k:
voc:voc
c:c
4 5
:+:
6
e:e
6
e:e
d:d
:ESERCIZIO 5
Soluzione esercizio 5
POS Tagging: Chaos
ESERCIZIO 6
Verificare quali interpretazioni di POS tagging Chaos produrrebbe avendo in input le seguenti frasi:
a. “La vecchia porta la sbarra”
b. “I maestri di Platone furono critici”
Analizzando il processi nelle sue diverse fasi:
1. Ricerca nel lessico delle parole
2. Utilizzo delle regole lessicali per le parole non presenti nel lessico
3. Disambiguazione: scelta del POS tag più frequente
4. Utilizzo delle regole contestuali
Suggerimenti per esercizi
Per la migliore comprensione degli argomenti svolti nelle presentazioni NLP 1,2,3 si suggerisce di cimentarsi anche con gli esercizi del libro
Speech and Language Processing, Prentice Hall, 2000,
autori: D.Jurafsky, J. H. Martin
In particolare:Capitolo 2, esercizi n. 2.1, 2.3, 2.4, 2.5, 2.6, 2.8, 2.10
Capitolo 3, esercizi n. 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.8, 3.9
Capitolo 8, esercizi n. 8.1, 8.2, 8.3, 8.6 facoltativo
Chiunque sia interessato, può, ovviamente, aumentare il numero di esercizi del libro su cui cimentarsi e/o chiedere al docente ulteriori testi.