Analisi Dell Errore Di Campionamento
Click here to load reader
-
Upload
francesca-soldi -
Category
Technology
-
view
1.354 -
download
0
description
Transcript of Analisi Dell Errore Di Campionamento
ANALISI DELL’ERRORE DI
CAMPIONAMENTO
Gli elementi che possono smentire una previsione elettorale.
Un caso pratico: le elezioni regionali 2010
2
Composizione degli errori nelle indagini campionarie e in quelle esaustive
Elementi determinanti per stabilire la precisione di una stima:
Errore di campionamento
Errore di non risposta Errore di copertura
Elementi determinanti per stabilire la precisione di una stima:
Errore di campionamento
Errore di non risposta Errore di copertura
3
Aspetti Critici di interesseCasualita’ e Rappresentativita’
Il campionamento: le sue varianti e le sue problematiche
Copertura di lista (telefono e liste nuclei familiari)
Casualita
Non Risposte: Errore di copertura
MANCATA COPERTURA Liste Nuclei Familiari
MANCATO CONTATTO Rifiuti
MANCATA RISPOSTA
Estrazione casuale degli intervistati come condizione necassaria ma non sufficiente affinche’ il campione finale sia relamente casuale
Rappresentativita
Le “Non risposte” e le “Caduta di contatti” formano un gruppo di persone non omogeneo a quello dei rispondenti. Le mancate risposte sono spesso correlate in modo significativo fra di loro.
Ulteriori Aspetti
Desiderabilita’ Sociale Copertura delle risposte Capacita’ di elaborare
un’opinione
4
Oggetto e Strumenti di Analisi
Elezioni regionali del 28 e 29 marzo 2010: Regioni con Legge Tatarella: Liguria, Piemonte, Lombardia, Veneto, Emilia-
Romagna, Umbria, Lazio, Basilicata, Campania Regioni senza LT: Toscana, Marche, Calabria e Puglia
78 sondaggi esaminati su 96 disponibili CATI Da Nov 2009 a inizio Mar 2010 Domanda posta sul voto al partito Territorio di rilevazione l’intera regione Numero campionario: da 500 a 6600 (tendenzialmente 1000) Campione stratificato e rappresentativo per eta’ e genere (a volte provincia
di residenza) 44 sondaggi su 78 indicano la % di indecisi
Strumenti di Analisi Indice di Dissimilarita’ Errore Standard Coefficiente di Variazione
5
Le Ipotesi di Ricerca
Ipotesi da verificare1. L’errore di campionamento puo’ spiegare le discrepanze fra
previsione ed elezione
2. In presenza di un voto meno “di appartenenza” l’elettore e’ piu’ soggetto ad eventi effimeri (temporary bumps) [Wlezien ed Erikson]
3. Avvicinandosi alla tornata elettorale diminuiscono le mancate risposte e le previsioni si avvicinano al risultato finale [Bon]
4. Coloro che non vogliono esprimere il proprio voto nascondono un voto estremista: I sondaggi sovrastimano I voti moderati
5. Esistono dei partiti “stigmatizzati socialmente” che non vengono citati in fase pre elettorale: I sondaggi sottostimano questi partiti
6. Esistono dei piccoli partiti non coperti dalle risposte chiuse che vengonoo automaticamente esclusi dai sondaggi e quindi sottostimati
6
La precisione della stima: calcolo dell’errore standard
Per tutti i casi analizzati (indipendentemente dalla regione, dal periodo di rilevazione e dal partito) I valori dell’ES sono molto bassi, indicano stime molto precise (linee che si sovrappongono)
Forchetta molto stretta intorno alla percentuale previstaForchetta che non comprende quasi mai il risultato finale
Pallini: Risultati finaliLinee: intervallo ES
ES: errore che si commette nel prevedere un fenomeno nella sua totalita’, in termini assoluti e con la medesima unita’ di misurazione del fenomeno di riferimanto
7
La precisione della stima: calcolo del Coefficiente di Variazione
Calcolato per ciascun partito all’interno di tutti i sondaggi: piu’ alto CdV minore la capacita’ di stima della prvisione
Nel nostro caso il CdV calcolato non risulta essere un buon indicatore della capacita’ predittiva dei sondaggi
La rilevazione della % attribuita ai partiti risulta precisa (ES molto basso), ma inefficace nel rilevare il fenomeno
Il campione (su cui e’ stato calcolato lo ES e il CdV) e’ inficiato dalle mancate risposte e dai mancati contatti
CdV o Deviazione St: indice dell’errore relativo di una stima, ne indica la precisione calcolandone l’ammontare di errore.Secondo la formula impiegata si ottengono stime piu’ puntuali con campioni maggiori e per i partiti che nei sondaggi ottengono poche preferenze, quindi percentuali basse, il CdV sara’ molto piu’ alto che per i partiti di medie o grandi dimensioni
8
Indice di dissimilarita’: evidenze empiriche
Indici molto alti indicano una grossa discrepanza fra previsioni ed elezioni (es: Campania, Puglia e Basilicata)
Andamento altalenante, senza una tendenza crescente o decrescente e senza una diminuzione dell’indice nell’arco temporale:
Durante la campagna elettorale non si sono verificati episodi con effetti duraturi (permanent bumps) ma e’ possibile la presenza di temporary bounces (voto non di appartenenza)
Non si registra un avvicinamento al risultato elettorale; gli elettori non rispondenti non aumentano la loro capacita’ di elaborare un’opinione-risposta
INDICE DI DISSIMILARITA’: rappresenta la percentuale di voti che muta (che passa da un partito all’altro) fra la previsione e la consultazione
9
Analisi dello scarto fra la previsone e il risultato finale
Spunti
A fronte delle analisi effettuate su tutte le regioni: Ad una prima lettura: si evidenzia una sovrastima dei partiti moderati
(supremazia del “Voto Espressivo” sul “Voto Strategico” durante le consultazioni)
Partiti estremisti nascosti in fase pre elettorale, mentre ricompaiono alle consultazioni
In realta’non ha importanza se un partito sia moderato o estremista, la linea di distinzione passa fra i partiti di coalizione e di ricatto
>NON ESISTE UNA SOTTOSTIMA IN FASE PREELETTORALE DEI PARTITI ESTREMISTI
“I partiti di coalizione” sono sovrastimati in fase pre elettorale (es: Io amo la Lucania, Pannella-Bonino, LdV in Calabria)
>LINEA DI DEMARCAZIONE FRA PARTITI DI COALIZIONE E DI RICATTO
Con distinzioni fra N e CS, il PDL e’ tendenzialmente sovrastimato piu’ del PD in fase preelettorale. Cade l’idea che sia un partito stigmatizzato. Lo stesso vale per la LN (sempre sottostimata in Veneto, ma non in Toscana). L’idea di partito stigmatizzato potrebbe essere attribuita al M5S
>ALTRO GENERE DI PARTITI STIGMATIZZATI Caso M5S (Nord): come partito estremista oppure espressione
dell’interferenza dell’indagine [Bourdieu]>M5S SOGGETTO NON COPERTO NELLE DOMANDE
10
Analisi dello scarto fra la previsone e il risultato finale
Conclusioni
I sondaggi analizzati non sono espressione di campioni probabilistici
Sono evidenti numerose distorsioni nella loro formazione non analizzabili (caduta contatti, % indecisi)
Percentuale di indecisi (quando indicata) non coincide con un Errore di campionamento (coefficiente di variazione) basso. [Unico caso registrato S31 in Lombardia]
Non sono state evidenziate differenze, nel compaortamento in fase pre consultazioni, dettate dal sistema elettorale
I sondaggi pur nella loro imprecisione riescono a prevedere il vincitore [Eccezioni: Piemonte (S02, S17 e S48) e Puglia (S29 e S41)]
Per quanto lo strumento di misura sondaggio sia preciso come dimostra l’ES, in realta’ non e’ efficace per esprimere la volonta’ di voto della popolazione italiana