Tecniche di riconoscimento del parlante

38
Tecniche di Tecniche di riconoscimento del riconoscimento del parlante parlante Soriano sul Cimino 19 settembre 2007 Luciano Romito Luciano Romito Dipartimento di Linguistica Dipartimento di Linguistica Laboratorio di Fonetica Laboratorio di Fonetica Università degli Studi della Calabria Università degli Studi della Calabria L@bphon

description

L@bphon. Tecniche di riconoscimento del parlante. Luciano Romito Dipartimento di Linguistica Laboratorio di Fonetica Università degli Studi della Calabria. Soriano sul Cimino 19 settembre 2007. - PowerPoint PPT Presentation

Transcript of Tecniche di riconoscimento del parlante

Page 1: Tecniche di riconoscimento del parlante

Tecniche di riconoscimento Tecniche di riconoscimento del parlante del parlante

Soriano sul Cimino 19 settembre 2007

Luciano RomitoLuciano Romito

Dipartimento di Linguistica Dipartimento di Linguistica Laboratorio di FoneticaLaboratorio di Fonetica

Università degli Studi della CalabriaUniversità degli Studi della Calabria

L@bphon L@bphon

Page 2: Tecniche di riconoscimento del parlante

Distribuzione dei periti/consulenti Distribuzione dei periti/consulenti intervistati sul territorio nazionaleintervistati sul territorio nazionale

Valle d'AostaPiemonte

LombardiaTrentino Alto AdigeFriuli Venezia Giulia

LiguriaVeneto

Emilia RomagnaToscanaMarcheUmbria

LazioAbruzzo

MoliseCampania

PugliaBasilicata

CalabriaSicilia

Sardegna?

Intervistato Non Reperibile Si rifiuta

Page 3: Tecniche di riconoscimento del parlante

Quante perizie/consulenze vengono Quante perizie/consulenze vengono effettuate in Italia in un annoeffettuate in Italia in un anno

Ad oggi e con poco più del Ad oggi e con poco più del 50% del campione, nell’anno 50% del campione, nell’anno

scorso, tra perizie e scorso, tra perizie e consulenze, ne sono state consulenze, ne sono state

effettuate ben effettuate ben

594594

Page 4: Tecniche di riconoscimento del parlante

Con quali metodi? Con quali metodi?

Uditivo13%

Sonogrammi11%

Parametrico65%

Incerto11%

Uditivo

Sonogrammi

Parametrico

Incerto

Page 5: Tecniche di riconoscimento del parlante

Con quale statistica ?Con quale statistica ?

Nessuna statistica38%

Anova2%

Mahalanobis8%

Spread26%

Smart2%

Nessuna risposta6%

Analisi regressiva2%

Confronto di medie6%

Hotelling4% T-Student

6%

Nessuna risposta

Nessuna statistica

Confronto di medie

Anova

T-Student

Hotelling

Mahalanobis

Spread

Smart

Analisi regressiva

Page 6: Tecniche di riconoscimento del parlante

Come viene fornita la risposta al Come viene fornita la risposta al quesito?quesito?

6%

36%

9%

21%

13%

15%

Si/No

Similitudine in percentuale

Compatibilità

Giudizio in scala

rapporto di verisimiglianza

nessuna risposta

Page 7: Tecniche di riconoscimento del parlante

FForensic orensic SSpeaker peaker IIdentificationdentification

La FSI è una disciplina che rientra La FSI è una disciplina che rientra nella Fonetica Forense così come nella Fonetica Forense così come questa è una branca della Fonetica.questa è una branca della Fonetica.

La Fonetica Forense oltre al FSI La Fonetica Forense oltre al FSI include Speaker Profiling ed altro include Speaker Profiling ed altro come già dettocome già detto

Page 8: Tecniche di riconoscimento del parlante

Chi è il perito nel mondo?Chi è il perito nel mondo?

periti Fonetisti Full Time periti Fonetisti Full Time Olanda, Germania, Svezia, Austria, Olanda, Germania, Svezia, Austria,

Spagna e Svizzera (Rose 2002:21)Spagna e Svizzera (Rose 2002:21) Periti occasionali (accademici etc) Periti occasionali (accademici etc)

Australia, Gran Bretagna (Braun and Australia, Gran Bretagna (Braun and Kunzel 1998:4)Kunzel 1998:4)

Italia Italia (Romito-Galatà 2006) (Romito-Galatà 2006)

Page 9: Tecniche di riconoscimento del parlante

Titolo di studioTitolo di studio

Laurea57%

II grado33%

Conservatorio4%

I grado4%

Altro2%

Laurea

II grado

Conservatorio

I grado

Altro

Page 10: Tecniche di riconoscimento del parlante

LaureaLaurea

Ingegneria60%

Scienze letterarie13%

Medicina6%

Altro6%

Scienzedell'informazione

6%

Scienze statisticheed economiche

9%

Ingegneria

Scienze letterarie

Medicina

Altro

Scienze dell'informazione

Scienze statistiche edeconomiche

Page 11: Tecniche di riconoscimento del parlante

DiplomaDiploma

Ragioneria11%

Maturità Scientif ica11%

Industriale50%

Generico28%

Ragioneria

Maturità Scientif ica

Industriale

Generico

Page 12: Tecniche di riconoscimento del parlante

Laureati Età (in anni) Diplomati

0% <30 2%

4% da 30 a 39 7%

21% da 40 a 49 9%

17% da 50 a 59 13%

15% >60 5%

Page 13: Tecniche di riconoscimento del parlante

L’essere perito è una attività L’essere perito è una attività principaleprincipale

76%

24%

attività principale si occupa di altro

Page 14: Tecniche di riconoscimento del parlante

Automatici Semiautomatici Automatici Semiautomatici SoggettiviSoggettivi

Confronto dei Confronto dei sonogrammisonogrammi

Confronto UditivoConfronto Uditivo

Aural-Spectrografic identificationAural-Spectrografic identification

Page 15: Tecniche di riconoscimento del parlante

Aural-Spectografic (voiceprint) Aural-Spectografic (voiceprint) identificationidentification

Se parliamo di metodi soggettivi dobbiamo Se parliamo di metodi soggettivi dobbiamo ricordare che: ricordare che:

gli uomini e i computer (Ladefoged 2001:78-gli uomini e i computer (Ladefoged 2001:78-95)95)

il giudice … è un uomoil giudice … è un uomo Acoustic Theory of Speech Production: il Acoustic Theory of Speech Production: il

comportamento di alcuni parametri acustici comportamento di alcuni parametri acustici e articolatoriamente interpretabile) e articolatoriamente interpretabile)

Metodo automatico (cfr. Clermont and Metodo automatico (cfr. Clermont and Itahashi 1999)Itahashi 1999)

Page 16: Tecniche di riconoscimento del parlante

Acusticamente esistono molti parametri che Acusticamente esistono molti parametri che possono essere usati per comparare le voci possono essere usati per comparare le voci

la scelta è determinata da una approfondita la scelta è determinata da una approfondita analisi linguistica analisi linguistica

non esistono parametri ideali ma solo alcune non esistono parametri ideali ma solo alcune indicazioni: indicazioni: a) mostrare una alta variabilità interparlatare e a) mostrare una alta variabilità interparlatare e

una bassa variabilità intraparltore;una bassa variabilità intraparltore; b) essere resistente al camuffamentob) essere resistente al camuffamento c) avere una alta frequenza di occorrenzac) avere una alta frequenza di occorrenza d) essere robusto durante la trasmissioned) essere robusto durante la trasmissione e) essere relativamente facile da estrarre e e) essere relativamente facile da estrarre e

misuraremisurare

Page 17: Tecniche di riconoscimento del parlante

voiceprint identificationvoiceprint identification Tale metodo è stato sviluppato e Tale metodo è stato sviluppato e

commercializzato da Kersta 1962 commercializzato da Kersta 1962 Tosi (“... the legal application of speaker Tosi (“... the legal application of speaker

identification, which at present identification, which at present stillstill consists consists mainly in the practice of visual examination of mainly in the practice of visual examination of spectrograms...”). spectrograms...”).

successivamente negli anni ‘70 ed in seguito ad successivamente negli anni ‘70 ed in seguito ad una serie di critiche (tra cui per ultimo Romito una serie di critiche (tra cui per ultimo Romito 2000) si è deciso di utilizzare una combinazione 2000) si è deciso di utilizzare una combinazione del Metodo Uditivo e di quello Visivo. (Hollien del Metodo Uditivo e di quello Visivo. (Hollien 1990:215)1990:215)

Tale metodo viene chiamato Aural-Spectographic Tale metodo viene chiamato Aural-Spectographic Method (McDermott et al. 1996)*Method (McDermott et al. 1996)*

Page 18: Tecniche di riconoscimento del parlante

Dove viene utilizzatoDove viene utilizzato

Questo metodo è ancora usato almeno Questo metodo è ancora usato almeno fino al 2001) dall’FBI (Nakasone and fino al 2001) dall’FBI (Nakasone and Beck 2001)*Beck 2001)*

Dalla Polizia Giapponese (Osanai Dalla Polizia Giapponese (Osanai 2001)2001)

In Israele, Italia, Spagna, Columbia In Israele, Italia, Spagna, Columbia (Rose 2002) (Rose 2002)

Non viene più usato in Olanda e Non viene più usato in Olanda e Germania (Kunzel 1994:138)Germania (Kunzel 1994:138)

Page 19: Tecniche di riconoscimento del parlante

riconoscere una voce è una abilità umanariconoscere una voce è una abilità umana I fonetisti di questa abilità ne fanno il proprio lavoroI fonetisti di questa abilità ne fanno il proprio lavoro questa abilità è stata per decenni riconosciuta dai questa abilità è stata per decenni riconosciuta dai

Tribunali (Gruber and Poza 1995:section 99) Tribunali (Gruber and Poza 1995:section 99) la scienza e la letteratura è invece controversa:la scienza e la letteratura è invece controversa: il dato uditivo è sufficiente: Badwin 1979, Baldwin il dato uditivo è sufficiente: Badwin 1979, Baldwin

and French 1990:9)and French 1990:9) il dato uditivo non è necessario anzi non serve il dato uditivo non è necessario anzi non serve

(Furui 1989)(Furui 1989) Bisogna combinare le due tecniche acustico e Bisogna combinare le due tecniche acustico e

uditivo (Kunzel 1987, 1995:76-81; French uditivo (Kunzel 1987, 1995:76-81; French 1994:173-4)1994:173-4)

Page 20: Tecniche di riconoscimento del parlante

non tutti hanno la stessa abilità non tutti hanno la stessa abilità (Ladefoged and Ladefoged 1980:45; (Ladefoged and Ladefoged 1980:45; Hollien 1995:15, Foulkes and Barron Hollien 1995:15, Foulkes and Barron 2000:182)2000:182)

alcune voci sono più facilmente alcune voci sono più facilmente identificabili (Popçun et al. 1989, identificabili (Popçun et al. 1989, Rose and Duncan 1995:12,16)Rose and Duncan 1995:12,16)

altre voci sono più simili tra loro altre voci sono più simili tra loro rispetto ad altre rispetto ad altre

Page 21: Tecniche di riconoscimento del parlante

Caratteristiche associate alla Caratteristiche associate alla identificazione uditivaidentificazione uditiva

L’esposizione L’esposizione Più si ascolta una voce più questa Più si ascolta una voce più questa

diventa familiare e quindi più diventa familiare e quindi più facilmente identificabile (Ladefoged facilmente identificabile (Ladefoged and Ladefoged 1980:49)and Ladefoged 1980:49)

più una voce è familiare più è facile più una voce è familiare più è facile capirlacapirla anche in contesti rumorosi. anche in contesti rumorosi.

a volte la familiarità della voce a volte la familiarità della voce sembra facilitare il compito invece…sembra facilitare il compito invece…

Page 22: Tecniche di riconoscimento del parlante

Caratteristiche associate alla Caratteristiche associate alla identificazione uditivaidentificazione uditiva

La quantità.La quantità. esperimenti mostrano che nell’ascolto di una sola esperimenti mostrano che nell’ascolto di una sola

parola l’errore è del 69%, lo stesso scende al 34% parola l’errore è del 69%, lo stesso scende al 34% con una frase e al 17% con ascolti di 30 sec. (Rose con una frase e al 17% con ascolti di 30 sec. (Rose 2002:102)2002:102)

La distanza tra gli ascoltiLa distanza tra gli ascolti Errore del 50% dopo 10 minuti. 57% dopo un Errore del 50% dopo 10 minuti. 57% dopo un

giorno, 61% dopo 7 giorni, 68% dopo 15 gg. giorno, 61% dopo 7 giorni, 68% dopo 15 gg. Competenza della Lingua o dialetto sia nel Competenza della Lingua o dialetto sia nel

confronto sia conoscenza da parte dell’ascoltatoreconfronto sia conoscenza da parte dell’ascoltatore One is far more likely to identify a voice as a given One is far more likely to identify a voice as a given

person’s if one is expecting to hear that person’s person’s if one is expecting to hear that person’s voice>> Ladefoged 1978, Ladefoged and voice>> Ladefoged 1978, Ladefoged and Ladefoged 1980:47, Broeders 1995:155 Romito Ladefoged 1980:47, Broeders 1995:155 Romito 2000.2000.

Page 23: Tecniche di riconoscimento del parlante

Approfondimento del Approfondimento del Metodo sonograficoMetodo sonografico

Non c’è accordo Non c’è accordo (Gruber and Poza 1995:section 54-71)(Gruber and Poza 1995:section 54-71)

Esistono almeno due protocolliEsistono almeno due protocolli Il primo sviluppato da VIAAS (Voice Identification Il primo sviluppato da VIAAS (Voice Identification

and Acoustic Analysis SubCommittee, della and Acoustic Analysis SubCommittee, della International Association for Identification International Association for Identification pubblicato negli atti dell’associazione VCS 1991)pubblicato negli atti dell’associazione VCS 1991)

Il secondo protocollo è quello dell’FBI (Koenig Il secondo protocollo è quello dell’FBI (Koenig 1986:2089-90)1986:2089-90)

I protocolli sono molto simili, entrambi sono I protocolli sono molto simili, entrambi sono soggettivi e basati sull’esperienza soggettivi e basati sull’esperienza dell’espertodell’esperto

Page 24: Tecniche di riconoscimento del parlante

VCS 1991:373-9VCS 1991:373-9 Ideally, the exemplar should be spoken [by the Ideally, the exemplar should be spoken [by the

suspect] in a manner that replicates the unknown suspect] in a manner that replicates the unknown talker, to include speech rate, accent, (whether talker, to include speech rate, accent, (whether real or feigned), hoarseness, or any abnormal real or feigned), hoarseness, or any abnormal vocal effect… In general, the suspect is instructed vocal effect… In general, the suspect is instructed to talk at his or her natural speaking rate: if this is to talk at his or her natural speaking rate: if this is markedly different from the unknown sample, markedly different from the unknown sample, efforts should be made through recitation to efforts should be made through recitation to appropriately adjust the speech rate of the appropriately adjust the speech rate of the exemplar… Spoken accents or dialects, both real exemplar… Spoken accents or dialects, both real and feigned should be emulated by the known and feigned should be emulated by the known speaker… If any other unique aural or spectrally speaker… If any other unique aural or spectrally displayable speech characteristics are present in displayable speech characteristics are present in the questioned voice, then attemps should be the questioned voice, then attemps should be made to include them in the exemplars.made to include them in the exemplars.

Page 25: Tecniche di riconoscimento del parlante

AFTIAFTI

Visual comparison of spectrograms Visual comparison of spectrograms involves, in general, the examination of involves, in general, the examination of spectrograph (??) features of like spectrograph (??) features of like sounds as portrayed in spectrograms in sounds as portrayed in spectrograms in terms of time, frequency and terms of time, frequency and amplitude… Aural cues… include amplitude… Aural cues… include resonance quality, pitch, temporal resonance quality, pitch, temporal factors, inflection, dialect, articulation, factors, inflection, dialect, articulation, syllable grouping, breath pattern syllable grouping, breath pattern disguise, pathologies and other peculiar disguise, pathologies and other peculiar speech characteristicsspeech characteristics

Page 26: Tecniche di riconoscimento del parlante

CriticheCritiche Dove è la scientificità? Dove è la scientificità? Il riconoscimento della voce e il riconoscimento visivo interessano Il riconoscimento della voce e il riconoscimento visivo interessano

differenti parti del cervello (cfr. Blakemore 1977:161-4)differenti parti del cervello (cfr. Blakemore 1977:161-4) L’emisfero destro viene utilizzato per il riconoscimento dei volti e L’emisfero destro viene utilizzato per il riconoscimento dei volti e

l’emisfero sinistro per le voci.l’emisfero sinistro per le voci. Inoltre dipende anche se le voci sono familiari. Le voci familiari Inoltre dipende anche se le voci sono familiari. Le voci familiari

vengono riconosciute dall’emisfero destro come i volti.vengono riconosciute dall’emisfero destro come i volti. Al momento attuale il metodo uditivo non utilizza un metodo Al momento attuale il metodo uditivo non utilizza un metodo

analitico ma più che altro intuitivoanalitico ma più che altro intuitivo Non ci sono evidenze nell’esaminatore o caratteristiche numerabiliNon ci sono evidenze nell’esaminatore o caratteristiche numerabili Non si conoscono gli elementi minimi della comparazione (Hollien Non si conoscono gli elementi minimi della comparazione (Hollien

1990:215)1990:215) Come può la voce essere discriminata con questo metodo?Come può la voce essere discriminata con questo metodo? Utilizza parametri qualitativi o quantitativi? (Aitken 1995:14-15) Utilizza parametri qualitativi o quantitativi? (Aitken 1995:14-15) I dati di partenza sono differenti.I dati di partenza sono differenti. Non basta Non basta parlareparlare di contorni formantici. di contorni formantici. Bisogna definire una serie di passi attuabili da qualunque Bisogna definire una serie di passi attuabili da qualunque

laboratorio e che conducano allo stesso risultatolaboratorio e che conducano allo stesso risultato

Page 27: Tecniche di riconoscimento del parlante

“Foto A ‘orno’ di ‘Buongiorno’. La prima formante corrisponde alla ‘o’, quindi la ‘r’, consonante occlusiva, seguita dalla ‘n’ e successivamente di nuovo la seconda formante della ‘o’

conclusiva in quanto non seguita da consonante. […] Dopo la ‘b’ occlusiva […] segue la prima formante corrispondente alla ‘i’, quindi la inspirazione e la successiva espirazione con la ‘l’ e la successiva formante di ‘e’, sempre con la stessa ripresa di

energia tra la inspirazione e la espirazione conclusiva. [...] Nella foto 2 si evidenzia un inviluppo compresso con la prima

formante (i) e quella terminale, seconda formante della ‘e’ confermando la mancanza di armoniche proprio dalla

compressione dell’inviluppo e da esaltazioni particolari. [...] Solo in qualche occasione si è visualizzata l’esaltazione di

formanti, rimanendo per il resto piuttosto contenuta, né si è rilevata esaltazione nella fase di espirazione finale per la

tendenziale caratteristica di pronuncia veloce e ripresa rapida nella parte terminale. Infatti in alcuni oscillogramma non risulta

presente tale manifestazione poiché il soggetto riesce in un’unica espirazione a pronunciare l’intera parola, senza

necessità di recupero.

Page 28: Tecniche di riconoscimento del parlante

Approfondimento delApprofondimento delMetodo uditivoMetodo uditivo

Metodo uditivo attraverso ascoltatori Metodo uditivo attraverso ascoltatori inespertiinesperti

Metodo uditivo attraverso un campione Metodo uditivo attraverso un campione ristretto di esperti fonetisti (ristretto di esperti fonetisti (trained trained phoneticianphonetician))

Single vs multiple choiceSingle vs multiple choice Familar vs unfamilar voicesFamilar vs unfamilar voices

Page 29: Tecniche di riconoscimento del parlante

Metodo UditivoMetodo Uditivo

Nei metodi uditivi vi è il Panel approachNei metodi uditivi vi è il Panel approach comparazione di coppie di frasi e risposta comparazione di coppie di frasi e risposta

in percentuale di diversi tipi sia solo in percentuale di diversi tipi sia solo percettivi che fino alla identificazione di percettivi che fino alla identificazione di parti molto tecniche ed acustiche. parti molto tecniche ed acustiche.

il Direct processing il Direct processing dove un ascoltatore esperto ascolta un dove un ascoltatore esperto ascolta un

intero brano e identifica la voce. intero brano e identifica la voce. l’Aural-Perceptual Approach (cfr. l’Aural-Perceptual Approach (cfr.

tabella) tabella)

Page 30: Tecniche di riconoscimento del parlante
Page 31: Tecniche di riconoscimento del parlante

Uditivo sfruttando la memoria a Uditivo sfruttando la memoria a breve terminebreve termine

Voce Anonima AVoce Anonima A rumore biancorumore bianco

Voce Anonima BVoce Anonima B Rumore biancoRumore bianco

Voce Anonima AVoce Anonima A Rumore biancoRumore bianco

Voce Anonima BVoce Anonima B Rumore BiancoRumore Bianco

Voce Nota CVoce Nota C Rumore biancoRumore bianco

Voce Nota DVoce Nota D Rumore biancoRumore bianco

Voce Anonima BVoce Anonima B

Voce Anonima AVoce Anonima A

Voce Anonima AVoce Anonima A

Voce Anonima BVoce Anonima B

Voce Anonima AVoce Anonima A

Voce Anonima BVoce Anonima B

Page 32: Tecniche di riconoscimento del parlante

costruzione testcostruzione test Per questa fase possono essere utilizzati diversi programmi che Per questa fase possono essere utilizzati diversi programmi che

operano con piste separateoperano con piste separate Nella creazione di questi set di confronto particolare attenzione Nella creazione di questi set di confronto particolare attenzione

deve essere posta sul tentativo di ricreare le stesse condizioni deve essere posta sul tentativo di ricreare le stesse condizioni qualitative. qualitative.

Ciascun set deve essere composto rispettando la seguente Ciascun set deve essere composto rispettando la seguente struttura:struttura:

[set Z = voce X + silenzio + voce Y (+ rumore)] [set Z = voce X + silenzio + voce Y (+ rumore)] dove dove

a) “silenzio” inserito tra “voce X” e “voce Y” è della durata di 1,2 a) “silenzio” inserito tra “voce X” e “voce Y” è della durata di 1,2 secondi; secondi;

b) “(+ rumore)” è il rumore di fondo presente nelle conversazioni b) “(+ rumore)” è il rumore di fondo presente nelle conversazioni intercettate e che deve essere aggiunto alla porzione del saggio fonico intercettate e che deve essere aggiunto alla porzione del saggio fonico con un operazione di mixing con un operazione di mixing

c) “voce X” e “voce Y” possono essere rispettivamente, una porzione c) “voce X” e “voce Y” possono essere rispettivamente, una porzione della conversazione intercettata e una del saggio fonico (o viceversa), della conversazione intercettata e una del saggio fonico (o viceversa), sulla base, ovviamente, delle frasi precedentemente ritenute utili di sulla base, ovviamente, delle frasi precedentemente ritenute utili di durata 2,4 sec.durata 2,4 sec.

D) “rumore” è rumore bianco che resetta e prepara la memoria a breve D) “rumore” è rumore bianco che resetta e prepara la memoria a breve termine per un nuovo confronto.termine per un nuovo confronto.

Page 33: Tecniche di riconoscimento del parlante

EsempioEsempio

Page 34: Tecniche di riconoscimento del parlante

Esecuzione del TestEsecuzione del Test

Il gruppo di ascoltatoriIl gruppo di ascoltatori Il test deve essere sottoposto ad un campione di ascoltatori Il test deve essere sottoposto ad un campione di ascoltatori

di almeno 50 unità. Gli ascoltatori, di età media compresa di almeno 50 unità. Gli ascoltatori, di età media compresa tra i 18 e i 35 anni, sono provenienti dalle province sia del tra i 18 e i 35 anni, sono provenienti dalle province sia del sospettato che delle voci anonime (ovviamente questo sospettato che delle voci anonime (ovviamente questo prevede una analisi dialettologica preventiva) prevede una analisi dialettologica preventiva)

Nessuno dei soggetti su specifica richiesta soffre o ha Nessuno dei soggetti su specifica richiesta soffre o ha sofferto di disturbi di tipo uditivo tali da inficiare le risposte sofferto di disturbi di tipo uditivo tali da inficiare le risposte fornite durante il test.fornite durante il test.

Modalità e luogo di esecuzione del testModalità e luogo di esecuzione del test Il test si svolge all’interno di una Il test si svolge all’interno di una camera silentecamera silente o o anecoicaanecoica. .

Le registrazioni del test devono essere riprodotte in Le registrazioni del test devono essere riprodotte in modalità stereofonica con sorgente sonora frontale. Il test modalità stereofonica con sorgente sonora frontale. Il test viene condotto in presenza di un operatore con funzioni di viene condotto in presenza di un operatore con funzioni di supervisore e coordinatore del test stesso.supervisore e coordinatore del test stesso.

Page 35: Tecniche di riconoscimento del parlante

Premesse fatte agli ascoltatoriPremesse fatte agli ascoltatori Prima di sottoporre il test agli ascoltatori, agli Prima di sottoporre il test agli ascoltatori, agli

stessi vengono fatte alcune premesse per un stessi vengono fatte alcune premesse per un corretto svolgimento delle operazioni di corretto svolgimento delle operazioni di valutazione loro richieste. Nello specifico valutazione loro richieste. Nello specifico viene loro illustrata brevemente la prova da viene loro illustrata brevemente la prova da svolgere:svolgere:

dare una risposta secondo la tabella che dare una risposta secondo la tabella che segue soffermando l’attenzione solo ed segue soffermando l’attenzione solo ed unicamente sulla somiglianza o meno delle unicamente sulla somiglianza o meno delle voci ascoltate.voci ascoltate.

Page 36: Tecniche di riconoscimento del parlante

ETA'__________________

SESSO: M ڤ F ڤ

PROVENIENZA______________

Scala di giudizio

NO SI

Set confronto 0% 25% 50% 75% 100%

1

2

Page 37: Tecniche di riconoscimento del parlante

I risultati del TestI risultati del Test

Il test deve essere così composto:Il test deve essere così composto: 2020 set di confronto, relativi alla comparazione tra il saggio set di confronto, relativi alla comparazione tra il saggio

fonico e le voci anonime;fonico e le voci anonime; 1010 set di confronto, relativi alla comparazione tra le voci set di confronto, relativi alla comparazione tra le voci

anonime;anonime; 10 10 set di confronto, relativi alla comparazione tra le voci set di confronto, relativi alla comparazione tra le voci

note;note; 1010 set di controllo di cui con risposta “no” e con risposta “si”. set di controllo di cui con risposta “no” e con risposta “si”. Vengono accettati e utilizzati al fine della comparazione Vengono accettati e utilizzati al fine della comparazione

uditiva solo quei test che superano il set di controllo con uditiva solo quei test che superano il set di controllo con almeno 25 risposte corrette su 30.almeno 25 risposte corrette su 30.

Solo alla fine il risultato ottenuto, frutto di una analisi Solo alla fine il risultato ottenuto, frutto di una analisi soggettiva, avrà valore scientifico.soggettiva, avrà valore scientifico.

Page 38: Tecniche di riconoscimento del parlante

Domande da porsi sul proprio Domande da porsi sul proprio metodometodo

Precisely what parameters were used to Precisely what parameters were used to compare the samples?compare the samples?

How can the parameters be justified?How can the parameters be justified? In what way were the parameters quantified?In what way were the parameters quantified? What decision procedures were used? What What decision procedures were used? What

for exemple, were the threshold? for exemple, were the threshold? How can these decision procedures be How can these decision procedures be

justified?justified? What is the probability of observing the What is the probability of observing the

differences between samples assuming same differences between samples assuming same speaker origin/different speaker origin?speaker origin/different speaker origin?