Il Giornalismo di Precisione - Matematica e Statistica applicate all'informazione

GIORNALISTI A SCUOLA DI MATEMATICA E STATISTICA

IL GIORNALISMO DI PRECISIONE:

José Luis Dader

DOCENTE DI GIORNALISMO

Univ. Complutense di Madrid

SCHEDE TECNICHE: LETTURA E PRESENTAZIONE

I PROBLEMI SUI MEZZI D’INFORMAZIONE

ESEMPIO: INCROCIAMO I DATI DEL COLORE PREFERITO PER LA SCELTA DELLE AUTOMOBILI PER IL PAESE DEGLI

INTERVISTATI

VARIABILE 1: Colore preferito dell’auto (Chiaro / Scuro)

VARIABILE 2: Paese di Nascita (Italia / Spagna)

B) Variabile Independente per riga

Auto Chiare

Auto Scure

Italia

Spagna

Colocazione delle VARIABILI nelle schede statistiche

A) Variabile Independente per Colonna

Italia Spagna

Auto Chiare

Auto Scure

Variabile Independente: può produrre un cambiamento. E’ la più remota nel tempo Es. Paese di Nascita

Variabile Dipendente: può essere modificata. E’ la più recente nel tempo. Es. Acquisto dell’automobile per il colore

Paese di Nascita e Colore Preferito dell’Auto

Italia Spagna Totale

Auto Chiare

220 480 700

Auto Scure

2050 1620 3670

Totale 2270 2100 4370

B) Paese di Nascita per Colore Preferito dell’Auto


Auto Chiare

31% 69% 100%

Auto Scure

58% 42% 100%

A) Colore Preferito dell’Auto per Paese di Nascita

Italia Spagna

Auto Chiare 9% 24%

Auto Scure 91% 76%

Totale 100% 100%

Calcolo della % per Colonne o Riga / V. Ind – V. Dip ?

B) Paese di Nascita per Colore Preferito dell’Auto


Auto Chiare

31% 69% 100%

Auto Scure

58% 42% 100%

A) Colore Preferito dell’Auto per Paese di Nascita

Italia Spagna

Auto Chiare 9% 24%

Auto Scure 91% 76%

Totale 100% 100%

Lettura per Colonne o Riga / V. Ind –V. Dip?

• Se calcolato sulla verticale confrontata con l’orizzontale

• Se calcolato sulla orizzontale confrontata con la verticale

Suicidi/Morte Naturale per vedove e sesso

(Totale del Compione di Morti: 730)

Vedovi defunti maschi

Vedove defunte femmine

Totale

Suicidi 38 (43,1%)

50 (56,9%)

N= 88 (100%)

Resto delle Morti

192 (30,0%)

450 (70,0%)

N= 642 (100%)

Totale dei Vedovi defunti

N= 230 N =500 N = 730(100 %)

Esempio di problema nella presentazione: si suicidano di più i vedovi maschi o le femmine?

Suicidi/Morte Naturale per vedove e sesso

(Totale del Compione di Morti: 730)

Vedovi defunti maschi

Vedove defunte femmine

Totale Defunti

Suicidi 38 (16,5%)

50 (10,0%)

N= 88

Resto delle Morti

192 (83,5%)

450 (90,0%)

N= 642

Totale dei Vedovi defunti

N = 230(100 % )

N =500(100 % )

N = 730(100 %)

Si suicidano di più i vedovi maschi o le femmine?2ª Versione

DISEGNO GRAFICO Vs LETTURA ACCURATA

ESEMPIO - ELEZIONI USA 2004

Collocazione delle VARIABILI nei quadri statistici

A) Variabile indipendente nelle colonne (con espansione orizzontale)

Italia Spagna Francia UK RFA

Auto Chiare

Auto Scure

DISEGNO GIORNALISTICO: Che cosa fare quando la variabile indipendente ha molti gruppi?

Collocazione delle VARIABILI nei quadri statistici

DISEGNO GIORNALISTICO: Che cosa fare quando la variabile indipendente ha molti gruppi?

A) Variabile indipendente nelle colonne (con espansione verticale)

Auto Chiare

Auto Scure

Italia

España

Francia

UK

RFA

Suiza

REGOLE DI BASE PER L’ANALISI DELLE INCHIESTE E DEI SONDAGGI

ELETTORALI

Dati basIci da scrivere nella scheda tecnica

• Selezione casuale / campione probabilistico

• Quale margine di Errore hanno i dati? Es. +/- 3,0%

• Su quale porzione di popolazione sono stati estrapolati i risultati? (Coefficiente di Probabilità o Livello di Fiducia) Il più comune (95,5%).

E nelle inchieste elettorali:

• Quale margine di errore hanno i dati sui votanti (attualizzare NS/NC e l’astensione)? POCHE VOLTE SONO MENZIONATI

•Margine di errore: Il problema del ‘disegno tecnico’

Se abbiamo un margine di errore del +/- 3% e i seguenti dati in un sondaggio elettorale:

CANDIDATO A: 48% CANDIDATO B: 46%

le opzioni che si incrociano E perchè:

CANDIDATO A potrà avere 45% (-3%)

e il l CANDIDATO B: 49% (+3%)

Il perdente apparente potrebbe essere il vincitore. Quindi non è corretto il titolo "Il candidato … ha 2 punti di vantaggio ... "

COEFFICIENTE DI PROBABILITA’ / LIVELLO DI FIDUCIA:

Da quale porzione di popolazione si possono estrapolare i risultati?

La variazione massima tra i dati del campione e quelli della popolazione reale non sono mai applicabili al 100%.

Se il livello di fiducia è del 95,5% (equivalente a 2 “sigma di precisione”), c’è un 95,5% di probabilità che i risultati della popolazione totale si mantengano dentro alla forbice del margine di errore segnalato, rispetto al risultato ottenuto nel campione.

• PERO’ C’E’ un 4,5% di probabilità che i risultati complessivi siano superiori o inferiori al margine di errore.

ESEMPIO: L’OCCULTAZIONE DEI DATI

Quale margine di errore hanno i dati sui votanti? (scontato il NS/NC e l’astensione)? (1)

Le schede tecniche pubblicate sui media sono solite indicare la % di errore per la grandezza totale del campione.

-Es. 1.200 inchieste, e = +/- 2,9%

Però le intenzione di voto che sono pubblicate nella scheda tecnica hanno già scontato la cifra

dell’ astensioneastensione e di nessuna rispostanessuna risposta. Le percentuali non si calcolano mai sulla Base Iniziale.

* Dopo questa distribuzione che già non risponde alla base indicata nella scheda tecnica

(1.200), bensì la parte dei votanti che hanno deciso realmente (por ej. 800). Con ciò il

margine di errore è già salito a 3,5% (e quasi nessun mezzo di comunicazione lo chiarisce al

pubblico).

ESEMPIO

Un sondaggio con 1.000 intervistati viene ridotto a 400 elettori dichiarati. L'errore

passa da + / - 3,1% + / - 5,0%

Problema aggiuntivo del valore dei risultati per sottocategorie

In molte inchieste viene aggiunto il confronto dei risultati per sottocategorie o gruppi.

Es. Al dato generico che il Candidato A otterrà un 48% e il B un 40% si aggiunge la distribuzione per regione del dato, es:

Regione A%

Regione B%

Regione C%

Regione D%

Candidato A 46 % 50 % 45 % 47 %

Candidato B 42 % 40 % 43 % 44 %

Altri 12 % 10 % 12 % 9 %

PERO’ …

Problema aggiuntivo del valore dei risultati per sottocategorie

PERO’ … Regione A

%Regione B

%Regione C

%Regione D

%

Candidato A 46 % 50 % 45 % 47 %Candidato B 42 % 40 % 43 % 44 %

Altri 12 % 10 % 12 % 9 %

La dimensione del campione in ciascun sottogruppo è già più basso: se il campione totale era di 1.200 persone e se hanno scontato anche NS / NC, forse avranno appena 150 intervistati per regione. L'errore di rappresentatività per ciascun sottogruppo supera l'8%

In termini di significatività nel confronto fra i dati, le differenze con meno di 5 punti possono avvenire per casualità.

[email protected]

http://personales.ya.com/jldader/

Il Giornalismo di Precisione - Matematica e Statistica applicate all'informazione

Education

Transcript of Il Giornalismo di Precisione - Matematica e Statistica applicate all'informazione