Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato...

18
Progetti nell’ area del Trattamento Automatico della Lingua (TAL) Andrea Paoloni

Transcript of Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato...

Page 1: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Progetti nell’ area del Trattamento Automatico della Lingua (TAL)

Andrea Paoloni

Page 2: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Attività FUB in ambito TAL

Forum TALForum TALPassaporto per l’Italia corso di italiano Passaporto per l’Italia corso di italiano in in ee--learninglearningIDEM software di riconoscimento del IDEM software di riconoscimento del parlanteparlanteTRASCRI sistema di trascrizione in TRASCRI sistema di trascrizione in ambito giudiziarioambito giudiziarioEMOVO corpus EMOVO corpus diparlatodiparlato emotivoemotivo

Page 3: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Il Forum TAL

Il Forum permanente sul TAL viene costituito in data 25 luglio 2002.

La prima riunione ufficiale si è tenuta in data 9 settembre 2002.

Page 4: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

4

Obiettivi del ForumMonitoraggio delle realtà coinvolte nel TAL;Sviluppo di strumenti linguistici innovativi;Ampliamento del mercato e dell’industria nazionale;Promozione di investimenti pubblici e privati;Studio dell’evoluzione del TAL;Uso della tecnologia della lingua italiana all’estero.

Page 5: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Membri del ForumCNIPACRUIExpert SystemFondazione Ugo BordoniCNR Istituto di Linguistica ComputazionaleCNR Istituto di Scienze e Tecnologie della CongizioneLoquendoMinistero delle Attività ProduttiveMinistero delle ComunicazioniMinistero della GiustiziaMinistero dei Beni CulturaliMIUR

Page 6: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Attività svolte

Libro Bianco sul TALMostra di FirenzeSito web: www.forumtal.itIl TAL in BibliotecaPartecipazioni:Forum PA , TALePConferenza TAL2006Evento langTech 2008

Page 7: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

3I - passaporto per l’Italiacorso di Italiano via internet, basato su contributi audiovisivi forniti dalla RAIfruito a partire da qualsiasi piattaforma di distribuzionededicato in particolare ai cultori della nostra lingua residenti all’estero o in Italia autosufficiente (non integrativo di lezioni in presenza) fruibile in modo asincrono (in qualsiasi momento)

Page 8: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Caratteristiche di 3Iè conforme allo standard SCORM 1.2 guida lo studente alla competenza nell'uso delle strutture linguistiche secondo una prospettiva funzionale, fa riferimento agli standard europei per l’apprendimento della lingua in e-learning;fa uso di materiali multimediali di qualità utilizzando registrazioni delle Teche RAI;al termine del corso l’utente è in grado di superare con successo un esame con certificazione coerente con il sillabus europeo.

Page 9: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

3I – Passaporto per l’Italia

Page 10: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

IDEM

Sistema semiautomatico per il riconoscimento del parlante ideato dalla Fondazione Ugo Bordoni ed adottato dal RaCIS (RagguppamentoCarabinieri Investigazioni Scientifiche) e dalla Gendarmeria Nazionale Argentina

Page 11: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Metodi di identificazione OGGETTIVI (PARAMETRICI)

SEMIAUTOMATICI AUTOMATICIIndividuazione automatica

dell’identità dalla voce

CONFRONTO DI CARATTERISTICHE

PERCETTIVE

CONFRONTO DI SONOGRAMMI

DECISIONI STATISTICHE COMPUTERIZZATE

MEMORIA A LUNGO TERMINE

Il campione da riconoscere è confrontato con quello noto che è in memoria dell'esaminatore

MEMORIA A BREVE TERMINE

Il campione da riconoscere è confrontato con quello noto che è disponibile

L'esaminatore confronta gli spettrogrammidelle voci in analisi

Interazione tra il calcolatore e l'esperto durante l'analisi

IDEM

Il computer è programmato in modo da limitare gli interventi decisionali dell'esperto

VERIFICA DEL PARLATORE

La voce da riconoscere è confrontata con quelle in memoria in maniera automatica

UDITIVI SPETTROGRAFICI

SOGGETTIVI (PSICOACUSTICI )Valutazioni soggettive della somiglianza

tra due voci

Page 12: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Misura delle frequenze formanti

Page 13: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

SPREAD elaborazione statistica

Calcola:

sulla base delle grandedezze W e PDove:W matrice di covarianza intraparlanteP matrice di covarianza interparlanti

Page 14: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Probabilità a posteriori

P(H0 | E)

P(H1 | E)

Probabilità a prioriA cura del Tribunale

P(H0)

P(H1)x

Rapporto diverisimigliasnza(LR)

A cura del Perito

P(E| H0)

P(E| H1)=

Valore della prova

interpretazione Bayesiana

Page 15: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

TRASCRI Rendicontazioneautomatica di sedute giudiziarie

ObiettivoRealizzazione di una piattaforma di trascrizione automatica di sedute giudiziarie in grado di permettere la pubblicazione del verbale multimediale (audio + trascrizione sincronizzata) entro la giornata in cui si svolge la seduta

Page 16: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Problematiche aperte

Le condizioni di ripresa non sono sufficienti a garantire una separazione ottimale delle voci e ad evitare effetti di variazione del volume del suono

Esempio Processo Kalid min. 6Il modello del linguaggio deve essere adattato al “gergo” giudiziario e i nomi propri pronunciati più di frequente devono essere resi noti al sistema

Esempio Processo Rapetti min. 4,50Talvolta il mancato riconoscimento di piccoli segmenti di audio provoca uno stravolgimento del significato del testo

Esempio Processo Rapetti min 58,35Inflessioni dialettali o straniere molto marcate provocano malfunzionamenti

Esempio Processo Kalid min. 31

Page 17: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Corpus EMOVO

Page 18: Progetti nell’ area del Trattamento Automatico della ... fileAndrea Paoloni. Incontro con Renato De Mori sul tema "Comunicazione uomo - macchina" 11 marzo 2008 Attività FUB in ambito

Incontro con Renato De Mori sul tema "Comunicazione uomo -

macchina" 11 marzo 2008

Impieghi del corpus EMOVOAnalisi spettroacustiche (analisi micro- e macroprosodiche, di voice quality ecc. eventualmente finalizzate allo sviluppo di sistemi di sintesi di parlato emotivo)Analisi di decoding (test di riconoscimento maggiormente articolati, esperimenti con mascheramento del segnale ecc. eventualmente finalizzati allo sviluppo di sistemi di riconoscimento automatico del parlato emotivo)Analisi interculturali (confronti dei dati estrapolati da EMOVO con quelli relativi ad altri database di altre lingue)Comparazioni fra materiale recitato e materiale naturale (“this would be one of the highest prioritiesin the field” Klaus Scherer”)