Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti...

11
Implementazione su GPU di un Implementazione su GPU di un sistema per l'interazione sistema per l'interazione multimodale con ambienti multimodale con ambienti intelligenti. intelligenti. Tesi di laurea in SISTEMI OPERATIVI Relatore: Prof. Ing. Enzo MUMOLO Laureando: Simone CUMAR UNIVERSITA’ DEGLI STUDI DI TRIESTE FACOLTA’ DI INGEGNERIA Dipartimento di Ingegneria Industriale e dell'Informazione

Transcript of Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti...

Page 1: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Implementazione su GPU di un Implementazione su GPU di un sistema per l'interazione sistema per l'interazione

multimodale con ambienti multimodale con ambienti intelligenti.intelligenti.

Tesi di laurea in SISTEMI OPERATIVI

Relatore:Prof. Ing. Enzo MUMOLO

Laureando:Simone CUMAR

UNIVERSITA’ DEGLI STUDI DI TRIESTEFACOLTA’ DI INGEGNERIA

Dipartimento di Ingegneria Industriale e dell'Informazione

Page 2: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Introduzione - 1

Segnale

Logica di Alto Livello

PosizioneAmbiente

Arraymicrof.

Algoritmi di basso livello

Audio a distanza

Localizzazionesorgenti

Riconoscimento comandi

Comando

Page 3: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Introduzione – 2• Audio a distanza

Eliminare il rumore ambientale dovuto ad echi, riverberi e altre sorgenti acustiche.

• Riconoscimento comandiPossibile solo o con microfono vicino o con microfoni distanti, ma eliminando il rumore ambientale.

• LocalizzazioneL'interazione può dipendere dalla posizione dell'utente.

Page 4: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Introduzione – 3Strumenti Utilizzati

Schiera 8 microfoni

Scheda acquisizione audio

Nvidia Geforce GTX-580

S.O. Linux con kernel low-latency

Valgrind

Windows XP + Dragon Naturally Speaking

Page 5: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Piano di lavoro

CUDABeamformIt

✔ Segnale più pulito✔ Tempo di esecuzione minore✔ Tempi di ritardo localizzazione

Page 6: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

RisultatiBeamforming: Diminuzione del rumore.

Prima

Dopo

Page 7: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Risultati

CUDA: Speed up ottenuti dopo la ‘‘cura’’

10s 30s 1m 1m32s(1x) 2x 4x 8x 16x0

2

4

6

8

10

12

14

XCorrXCorr-FullReal

Quantità di dati

Sp

eed

up

Page 8: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Possibili Applicazioni

Comandi robotici

Vai avanti, torna indietro, vieni qui...

Assistenza domestica

Telefono 118, allarme...

Comandi domotici

Accendi la luce, apri la porta...

Page 9: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Comando Vocale

Step da seguire:

BeamformIt applicato sul flusso audio. Invio del risultato tramite socket. API di Dragon per la comprensione. Ricezione del risultato. Apriti

Sesamo!

Page 10: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Conclusioni

I test eseguiti hanno dato un esito soddisfacente.

È assolutamente necessario un periodo di addestramento del riconoscitore vocale.

È preferibile mirare l'addestramento verso alcuni comandi particolari.

Page 11: Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti