Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino...

12
Loudness e “livello del dialogo” Loudness e “livello del dialogo” nelle trasmissioni radiotelevisive nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria Dell’Osso, ²Anna Grazia Santoro ¹ FUB, Roma { [email protected] } ² ISCOM, Roma {[email protected] } 1 1. TITOLO 5° Convegno Nazionale AISV - Università di Zurigo, 4-6 febbraio 2009

Transcript of Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino...

Page 1: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

Loudness e “livello del dialogo” Loudness e “livello del dialogo”

nelle trasmissioni radiotelevisivenelle trasmissioni radiotelevisive¹Mauro Falcone,²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria Dell’Osso, ²Anna Grazia Santoro¹ FUB, Roma { [email protected] }² ISCOM, Roma {[email protected] }

1

1.

TIT

OLO

5° Convegno Nazionale AISV - Università di Zurigo, 4-6 febbraio 2009

Page 2: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

2

MOTIVAZIONI

L’interesse per la misura del livello del volume nei contenuti multimediali, ed in particolare nelle trasmissioni televisive, ha in questi ultimi anni visto una rinnovata attenzione. Gli enti di ricerca, gli organismi normativi, le industrie e infine i broadcaster hanno tutti mostrato un rinato impegno sull’argomento ognuno nei rispettivi ruoli.

La Fondazione Bordoni e l’Istituto Superiore delle Comunicazioni da alcuni anni stanno congiuntamente conducendo sia delle ricerche, sia delle campagne di misura. Se in passato si è trattato particolarmente dell’annoso problema livello sonoro dei segmenti pubblicitari, oggi vogliamo affrontare la questione con una visione di più ampio respiro che mira allo studio della qualità del segnale audio e alle prospettive di fruizione in scenari “full-digital”.

2.

MO

TIV

AZ

ION

I

Page 3: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

Abstract3

. A

BS

TR

AC

TIn questo lavoro si vuole verificare e discutereil problema dei livelli di volume del segnale audio, ed in particolare del parlato, nelle trasmissioni televisive. Al fine di esaminare l’attuale situazione si è proceduto ad una ampia raccolta di materiale, e ad una preliminare serie di comparazioni che vanno ad esaminare, secondo le più recenti tecniche di misura, i tre problemi principali che sono:1) il dislivello tra canali (C2C – channel to channel) 2) il dislivello tra programmi (P2P – program to program)3) il dislivello tra programma e pubblicità (P2A – program to advertising)

o alternativamente del programma versus tutto il rimanente cioè “pubblicità+promo+jingle+etc.”

3

Vengono anche affrontati alcuni aspetti della “qualità” del segnale audio (e della voce), in particolare sia per quanto riguardi i livelli assoluti del segnale vocale rispetto al segnale trasmesso, sia relativamente al fattore e alle modalità di “compressione”.

Page 4: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

Il segnale televisivoanalizzato (il database audio)

4

Una delle caratteristiche di questo lavoro è l’ampia dimensione del segnale audio analizzato. Sono state selezionate 14 emittenti, e per ciascuna di esse si è registrato il segnale trasmesso dalle ore 12 alle 24 per tutti i giorni della settimana (in maniera non contigua) per un totale di 12*7*14 = 1176 ore di segnale.Le registrazioni sono state effettuate tramiteun sintonizzatore professionale per il digitale terrestre (o suo equivalente) nel periodo da novembre 08 a gennaio 09. Tutti i segnali sono stati acquisiti in modalità “full digital” e memorizzati nel formato stereo, 48k, 16 bit, per un totale di circa 800 Gb di segnale.Per 9 di queste emittenti il segnale è stato segmentato secondo i palinsesti, dall’ inizio di un programma all’inizio del successivo, le rimanti 5 emittenti, tutte a carattere monotematico, non sono invece state segmentate.

4.

IL S

EG

NA

LE

Page 5: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

La misura di “LoudnessLoudness”secondo la normativa internazionale ITU 1770

5

scenario compatibile dal monofonico al 5.1 (nel nostro caso tutto il segnale è stereo)

un primo filtro modella l’interferenza dell’onda acustica con la testa dell’ascoltatore …

un secondo filtro opera una curva di adattamento simile alla “curva-B”, quindi si sommano i valori RMS pesandoli ….

5.

LOU

DN

ES

S

E’ stato sviluppato un software per il calcolo del loudness che opera simultaneamente diverse misure (RMS,LU) a diversi tempi (short term 1&2, long term, integration, file based, inf) e che applica anche una soglia di “gating” alle misure.

E’ stato sviluppato un software per il calcolo del loudness che opera simultaneamente diverse misure (RMS,LU) a diversi tempi (short term 1&2, long term, integration, file based, inf) e che applica anche una soglia di “gating” alle misure.

Page 6: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

6

Gating vs Dialogue Intellicencepro e contro di due tecniche (forse) antagoniste6

. G

ATIN

G v

s D

.I.

• PRO– È semplice da realizzare– È applicabile su tutti i tipi di

segnale– È facilmente modulabile– Si può variare con grande

elasticità

• CONTRO– Necessità la definizione di

una soglia– Trovare un compromesso

per la soglia può essere difficile

– Ha funzione banale per i casi estremi di soglia troppo grande o troppo piccola

– È relativo (necessita un livello di riferimento ordinario o assoluto)

• PRO– È sicuramente una delle

metriche utilizzate dagli utenti– Permette risultati ottimali nella

fase di sviluppo– È gia disponibile su molti sistemi

commerciali, che hanno mostrato eccellenti prestazioni

• CONTRO– Non può essere applicata su tutti

i segnali (e.g. musica, ecc.)– È una tecnica complessa (VAD),

e “imprecisa”– È difficile (ma non impossibile)

pensare di definire uno standard

È necessario effettuare la misura solo sui segmenti percettivamente “significativi” del segnale audio. A tal fine si utilizzano queste due “semplici” tecniche:GATING:GATING: si prende in considerazione

solo il segnale che supera una certa soglia, omettendo tutto il segnale a “basso” volume (sotto una certa soglia).

DI (Dialogue DI (Dialogue

Intelligence):Intelligence): è la soluzione scelta

da Dolby e quindi da molti broadcaster e consiste nel considerare solo il segnale in cui è presente del parlato.

Page 7: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

7

7.

CH

AN

NEL

TO

CH

AN

NEL

La variazione c2c (channel to channel)

Legenda: Per tutte le 14 emittenti si è calcolato il valore di loudness dalle ore 12 alle 24 per tutti e sette i giorni della settimana.La rappresentazione a -72dBLu (in nero nel grafico) rappresenta in pratica il loudness di tutto il segnale con la sola esclusione del silenzi “assoluti” o di “nero”. I successivi valori a -8, -6, ecc. sono calcolati in relazione al valore misurato a -72dBLu e sono quindi livelli di loudness con “gating” relativi. Ogni singolo punto rappresenta quindi la misura integrale su 12 ore di segnale, operata con una determinata soglia di gating.

Dal grafico risulta chiaramente che ogni emittente trasmette con un livello “tipico” che per alcune è molto stabile, mentre per altre ha piccole variazioni intorno al decibel. Solo per due emittenti si sono riscontrati oscillazioni intorno ai 3 dB, dovute probabilmente a problemi tecnici.

Risulta invece fortemente disallineato il livello medio delle emittenti che raggiunge, nel caso estremo, il ragguardevole valore di quasi 10 dBLu.

-30.00

-27.00

-24.00

-21.00

-18.00

-15.00

-12.00

RAI1

RAI2

RAI3

CAN

5

ITA1

RET4

LA7

RAI4

IRIS

RAIG

RAIN

RAIS

BO

IN

MTV

gate @-72dB

gate @-8dBr

gate @-6dBr

gate @-4dBr

gate @-2dBr

gate @-0dBrdBLu

Page 8: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

La variazione p2p (program to program)

8

8.

PR

OG

RA

M T

O P

RO

GR

AM

Legenda: il tratto orizzontale all’interno del box è la mediana del loudness dei programmi sull’intera settimana di registrazioneI lati orizzontali dei box riportano i percentili al 25% e 75% della distribuzione del loudness dei programmi sull’intera settimanaGli estremi dei segmenti segmenti verticali rappresentano il loudness massimo e minimo della programmazione nell’intera settimana

Per le emittenti monotematiche non segmentate secondo il palinsesto (ultimi 5 dati) si è calcolato il loudness ogni 30 minuti, e si è operata la medesima analisitutte le analisi sono state effettuate con un gating relativo a -8dBr.

La situazione ideale dovrebbe non solo avere tutte le mediane allineate ad un unico valore, ma la dimensione dei rettangoli dovrebbe essere praticamente nulla e altrettanto a distanza zero, rispetto alla mediana, dovrebbero essere i valori di minimo e massimo.

-30.00

-27.00

-24.00

-21.00

-18.00

-15.00

-12.00

RAI1 RAI2 RAI3 CAN5 ITA1 RET4 LA7_ RAI4 IRIS RAIG RAIN RAIS BOIN MTV_

Questa soluzione ideale è possibile semplicemente normalizzando ad un valore di riferimento il livello di loudness di un intero programma e mantenendo, avendo sufficiente headroom, la dinamica originale del contenuto audio.

dBLu

Page 9: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

DI vs Gating: long term

9

9.

GA

TIN

G v

s D

.I.

– EX

1

-27.00

-24.00

-21.00

-18.00

-15.00

-12.00RAI1 CANALE5 RAI4 IRIS RAINEWS24 MTV

DI (LM100)

gate @-72dB

gate @-8dBr

Nella maggior parte delle trasmissioni, il principale messaggio comunicativo è convogliato dal parlato.

È quindi ragionevole che l’utente regoli il proprio “confort level” di ascolto sulla base del volume del segnale vocale trasmesso.

L’approccio del Dialogue Intellicenge, che va ad effettuare la misura solo quando è rilevato del segnale vocale, sembrerebbe pertanto il più corretto.

Abbiamo effettuato delle misure comparative del segnale utilizzando le due tecnologie sia su lungo termine, sia su singole tipologie di programmi e/o di contenuti al fine di investigare l’ “equivalenza” dei due metodi, anche in funzione dei contenuti.

Per i contenuti selezionati si è effettuata una estrazione dai programmi del solo segnale vocale (senza presenza di rumori di fondo o musica) e anche su questo si sono operate le diverse misure di loudness.

Legenda: Si è analizzato il segnale giornaliero (12 ore) di emittenti generaliste o monotematiche (film, news, musica). Per ciascuna è misurato il loudness: la colonna in verde è il sistema di riferimento LM100 della Dolby. I punti sono i valori ottenuti con il nostro programma con soglia assoluta a -72dBLu (BLU) e con soglia relativa a -8DbLu(r) (ROSSO).Per i generalisti e per le news le tecniche sembrano equivalenti. Sui contenuti tipo film il valore di gating ha effetto (vedi separazione dei punti). In generale non vi sono differenze eclatanti su misure integrali molto lunghe.

dBLu

Page 10: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

DI vs Gating: film, fiction e talk-show

10

10

. G

ATIN

G v

s D

.I.

– EX

2

F I

L M

F I

C T

I O

NTA

LK

SH

OW

Legenda: A = programma (a sinistra nel grafico) R = pubblicità, jingle, promo,ecc. (al centro del grafico)S = parlato “pulito” estratto manualmentedel solo programma (a destra nel grafico))

Ovviamente per quanto riguarda la tipologia R (pubblicità, promo, sigle, jingle, ecc), in posizione centrale nei grafici, i risultati non cambiano né in funzione del contesto, né della emittente ed questi mostrano un’ampia compatibilità tra il DI ed il Gating.

Per quanto riguarda invece programmi di “qualità” come film e fiction la tecnica DI sembra essere mediamente compatibile con il semplice calcolo del loudness a -72dBLu sia per il programma nel suo insieme (A), sia per la parte di solo parlato (S). Essendo queste parti di maggior “qualità” rispetto alla R, ovvero essendo meno compresse, mostrano valori significativamente diversi con gating a -8dBLu(r).

Per i talk-show ancora le tecniche risultano compatibili, e la differenza tra le due soluzioni di Gating diviene, in questo caso, trascurabile. Inoltre, come è ragionevole, le misure del programma (A), e del solo parlato (S) risultano praticamente identiche.

Anche in questo caso quindi DI e Gating sembra possano trovare un punto di incontro, ed in particolare un gating “semplice” a -72dBLu può ancora essere il candidato più promettente come alternativa alla tecnica di Dialogue Intelligence.

-30.00

-27.00

-24.00

-21.00

-18.00

-15.00

A_R

AI1

_gen

A_R

ET4_pri

A_R

AI4

_fin

A_IR

IS_fig

R_R

AI1

_gen

R_R

ET4_pri

R_R

AI4

_fin

R_IR

IS_fig

S_R

AI1

_gen

S_R

ET4_pri

S_R

AI4

_fin

S_IR

IS_fig

DI (LM100)gate @-72dBgate @-8dBr

-30.00

-27.00

-24.00

-21.00

-18.00

-15.00

A_CA

N5_drh

ouse

A_CA

N5_dott

orc

low

n

A_R

AI1

_m

onta

lbano

A_CA

N5_ca

podeic

api

R_CA

N5_drh

ouse

R_CA

N5_dott

orc

low

n

R_R

AI1

_m

onta

lbano

R_CA

N5_ca

podeic

api

S_CA

N5_drh

ouse

S_CA

N5_dott

orc

low

n

S_R

AI1

_m

onta

lbano

S_CA

N5_ca

podeic

api

DI (LM100)gate @-72dBgate @-8dBr

-30.00

-27.00

-24.00

-21.00

-18.00

-15.00

A_R

AI2

_annoz

A_R

AI3

_balla

ro

A_LA

7__ott

oem

A_CA

N5_ve

riss

R_R

AI2

_annoz

R_R

AI3

_balla

ro

R_LA

7__ott

oem

R_CA

N5_ve

riss

S_R

AI2

_annoz

S_R

AI3

_balla

ro

S_LA

7__ott

oem

S_CA

N5_ve

riss

DI (LM100)gate @-72dBgate @-8dBr

dBLu

dBLu

dBLu

Page 11: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

Compressione, Qualità e Parlato

11

11

. C

OM

PR

ES

SIO

NE E

PA

RLA

TO

dub

bin

dub

bin

ggm

ixin

gm

ixin

gp

layout

pla

yout

Considerando “naturale” il segnale realizzato in fase di doppiaggio (o in presa diretta), una sua prima manipolazione avviene nella fase di post-produzione e di missaggio. In questa fase possiamo ancora considerare il parlato come “corretto” anche se questo è stato artatamente modificato per renderlo “più naturale”.

Oggi il risultato dopo il playout può invece essere fortemente alterato sia per necessità tecnologiche, sia perché il broadcaster può volere “andare incontro” ad una utenza scarsamente educata alla qualità audio.

Con il passaggio al digitale il primo problema è tecnicamente risolto. Il secondo è più grave, e la sua soluzione può essere ottenuta solo perseguendo una politica di controllo e di educazione alla qualità audio.

A mero titolo di esempio si riportano i valori dopo il playout misurati in un programma di recente produzione di un urlo (voce molto sostenuta) e di un normale dialogo. L’urlo in natura* risulta circa 15/20 dB più alto del parlato, mentre nel segnale registrato è solo di 2/3dB maggiore.

• allo stato attuale non è possibile conoscere il valore dopo il mixing

Page 12: Loudness e livello del dialogo nelle trasmissioni radiotelevisive ¹Mauro Falcone, ²Antonino Barone, ²Alessandro Bonomi, ²Alessandro Balestri, ²Maria DellOsso,

Conclusioni

Si è svolta una ampia campagna di misure sul loudness di emittenti su digitale terrestre, verificando di fatto che i problemi di disallineamento tra emittente ed emittente, tra programma e programma, tra programma e pubblicità sussistono, e a volte assumono aspetti macroscopici. Si è inoltre dimostrata una ragionevole compatibilità delle metodologie oggi più in voga per la misura del broadcast loudness.

12

I risultati tuttavia invitano ad una estrema cautela, specialmente oggi, qualora si voglia studiare le caratteristiche acustico/fonetiche del segnale vocale radio-televisivo in quanto questo non può essere considerato né naturale, né il risultato fedele della post produzione.

12

. C

ON

CLU

SIO

NI

Questa sperimentazione conferma, come precedentemente auspicato, la necessità di studio, definizione e applicazione di raccomandazioni riguardanti misure e procedure per garantire un determinato livello di qualità audio. Congiuntamente deve essere promossa una campagna di sensibilizzazione atta a migliorare la sensibilità alla qualità alle esperienze di ascolto da parte degli utenti.