Il Giornalismo di Precisione - Matematica e Statistica applicate all'informazione
-
Upload
damiano-crognali -
Category
Education
-
view
1.313 -
download
0
description
Transcript of Il Giornalismo di Precisione - Matematica e Statistica applicate all'informazione
GIORNALISTI A SCUOLA DI MATEMATICA E STATISTICA
IL GIORNALISMO DI PRECISIONE:
José Luis Dader
DOCENTE DI GIORNALISMO
Univ. Complutense di Madrid
SCHEDE TECNICHE: LETTURA E PRESENTAZIONE
I PROBLEMI SUI MEZZI D’INFORMAZIONE
ESEMPIO: INCROCIAMO I DATI DEL COLORE PREFERITO PER LA SCELTA DELLE AUTOMOBILI PER IL PAESE DEGLI
INTERVISTATI
VARIABILE 1: Colore preferito dell’auto (Chiaro / Scuro)
VARIABILE 2: Paese di Nascita (Italia / Spagna)
B) Variabile Independente per riga
Auto Chiare
Auto Scure
Italia
Spagna
Colocazione delle VARIABILI nelle schede statistiche
A) Variabile Independente per Colonna
Italia Spagna
Auto Chiare
Auto Scure
Variabile Independente: può produrre un cambiamento. E’ la più remota nel tempo Es. Paese di Nascita
Variabile Dipendente: può essere modificata. E’ la più recente nel tempo. Es. Acquisto dell’automobile per il colore
Paese di Nascita e Colore Preferito dell’Auto
Italia Spagna Totale
Auto Chiare
220 480 700
Auto Scure
2050 1620 3670
Totale 2270 2100 4370
B) Paese di Nascita per Colore Preferito dell’Auto
Italia Spagna Totale
Auto Chiare
31% 69% 100%
Auto Scure
58% 42% 100%
A) Colore Preferito dell’Auto per Paese di Nascita
Italia Spagna
Auto Chiare 9% 24%
Auto Scure 91% 76%
Totale 100% 100%
Calcolo della % per Colonne o Riga / V. Ind – V. Dip ?
B) Paese di Nascita per Colore Preferito dell’Auto
Italia Spagna Totale
Auto Chiare
31% 69% 100%
Auto Scure
58% 42% 100%
A) Colore Preferito dell’Auto per Paese di Nascita
Italia Spagna
Auto Chiare 9% 24%
Auto Scure 91% 76%
Totale 100% 100%
Lettura per Colonne o Riga / V. Ind –V. Dip?
• Se calcolato sulla verticale confrontata con l’orizzontale
• Se calcolato sulla orizzontale confrontata con la verticale
Suicidi/Morte Naturale per vedove e sesso
(Totale del Compione di Morti: 730)
Vedovi defunti maschi
Vedove defunte femmine
Totale
Suicidi 38 (43,1%)
50 (56,9%)
N= 88 (100%)
Resto delle Morti
192 (30,0%)
450 (70,0%)
N= 642 (100%)
Totale dei Vedovi defunti
N= 230 N =500 N = 730(100 %)
Esempio di problema nella presentazione: si suicidano di più i vedovi maschi o le femmine?
Suicidi/Morte Naturale per vedove e sesso
(Totale del Compione di Morti: 730)
Vedovi defunti maschi
Vedove defunte femmine
Totale Defunti
Suicidi 38 (16,5%)
50 (10,0%)
N= 88
Resto delle Morti
192 (83,5%)
450 (90,0%)
N= 642
Totale dei Vedovi defunti
N = 230(100 % )
N =500(100 % )
N = 730(100 %)
Si suicidano di più i vedovi maschi o le femmine?2ª Versione
DISEGNO GRAFICO Vs LETTURA ACCURATA
ESEMPIO - ELEZIONI USA 2004
Collocazione delle VARIABILI nei quadri statistici
A) Variabile indipendente nelle colonne (con espansione orizzontale)
Italia Spagna Francia UK RFA
Auto Chiare
Auto Scure
DISEGNO GIORNALISTICO: Che cosa fare quando la variabile indipendente ha molti gruppi?
Collocazione delle VARIABILI nei quadri statistici
DISEGNO GIORNALISTICO: Che cosa fare quando la variabile indipendente ha molti gruppi?
A) Variabile indipendente nelle colonne (con espansione verticale)
Auto Chiare
Auto Scure
Italia
España
Francia
UK
RFA
Suiza
REGOLE DI BASE PER L’ANALISI DELLE INCHIESTE E DEI SONDAGGI
ELETTORALI
Dati basIci da scrivere nella scheda tecnica
• Selezione casuale / campione probabilistico
• Quale margine di Errore hanno i dati? Es. +/- 3,0%
• Su quale porzione di popolazione sono stati estrapolati i risultati? (Coefficiente di Probabilità o Livello di Fiducia) Il più comune (95,5%).
E nelle inchieste elettorali:
• Quale margine di errore hanno i dati sui votanti (attualizzare NS/NC e l’astensione)? POCHE VOLTE SONO MENZIONATI
•Margine di errore: Il problema del ‘disegno tecnico’
Se abbiamo un margine di errore del +/- 3% e i seguenti dati in un sondaggio elettorale:
CANDIDATO A: 48% CANDIDATO B: 46%
le opzioni che si incrociano E perchè:
CANDIDATO A potrà avere 45% (-3%)
e il l CANDIDATO B: 49% (+3%)
Il perdente apparente potrebbe essere il vincitore. Quindi non è corretto il titolo "Il candidato … ha 2 punti di vantaggio ... "
COEFFICIENTE DI PROBABILITA’ / LIVELLO DI FIDUCIA:
Da quale porzione di popolazione si possono estrapolare i risultati?
La variazione massima tra i dati del campione e quelli della popolazione reale non sono mai applicabili al 100%.
Se il livello di fiducia è del 95,5% (equivalente a 2 “sigma di precisione”), c’è un 95,5% di probabilità che i risultati della popolazione totale si mantengano dentro alla forbice del margine di errore segnalato, rispetto al risultato ottenuto nel campione.
• PERO’ C’E’ un 4,5% di probabilità che i risultati complessivi siano superiori o inferiori al margine di errore.
ESEMPIO: L’OCCULTAZIONE DEI DATI
Quale margine di errore hanno i dati sui votanti? (scontato il NS/NC e l’astensione)? (1)
Le schede tecniche pubblicate sui media sono solite indicare la % di errore per la grandezza totale del campione.
-Es. 1.200 inchieste, e = +/- 2,9%
Però le intenzione di voto che sono pubblicate nella scheda tecnica hanno già scontato la cifra
dell’ astensioneastensione e di nessuna rispostanessuna risposta. Le percentuali non si calcolano mai sulla Base Iniziale.
* Dopo questa distribuzione che già non risponde alla base indicata nella scheda tecnica
(1.200), bensì la parte dei votanti che hanno deciso realmente (por ej. 800). Con ciò il
margine di errore è già salito a 3,5% (e quasi nessun mezzo di comunicazione lo chiarisce al
pubblico).
ESEMPIO
ESEMPIO
Un sondaggio con 1.000 intervistati viene ridotto a 400 elettori dichiarati. L'errore
passa da + / - 3,1% + / - 5,0%
Problema aggiuntivo del valore dei risultati per sottocategorie
In molte inchieste viene aggiunto il confronto dei risultati per sottocategorie o gruppi.
Es. Al dato generico che il Candidato A otterrà un 48% e il B un 40% si aggiunge la distribuzione per regione del dato, es:
Regione A%
Regione B%
Regione C%
Regione D%
Candidato A 46 % 50 % 45 % 47 %
Candidato B 42 % 40 % 43 % 44 %
Altri 12 % 10 % 12 % 9 %
PERO’ …
Problema aggiuntivo del valore dei risultati per sottocategorie
PERO’ … Regione A
%Regione B
%Regione C
%Regione D
%
Candidato A 46 % 50 % 45 % 47 %Candidato B 42 % 40 % 43 % 44 %
Altri 12 % 10 % 12 % 9 %
La dimensione del campione in ciascun sottogruppo è già più basso: se il campione totale era di 1.200 persone e se hanno scontato anche NS / NC, forse avranno appena 150 intervistati per regione. L'errore di rappresentatività per ciascun sottogruppo supera l'8%
In termini di significatività nel confronto fra i dati, le differenze con meno di 5 punti possono avvenire per casualità.
http://personales.ya.com/jldader/