Analisi Dell Errore Di Campionamento

10

Click here to load reader

description

Analisi dell\'errore di campionamento su un caso empirico, le elezioni regionali 2010. Gli elementi che determinano la differenza fra la previsione e le elezioni: errore di campionamenti, caduta dei contatti e le mancate risposte

Transcript of Analisi Dell Errore Di Campionamento

Page 1: Analisi Dell Errore Di Campionamento

ANALISI DELL’ERRORE DI

CAMPIONAMENTO

Gli elementi che possono smentire una previsione elettorale.

Un caso pratico: le elezioni regionali 2010

Page 2: Analisi Dell Errore Di Campionamento

2

Composizione degli errori nelle indagini campionarie e in quelle esaustive

Elementi determinanti per stabilire la precisione di una stima:

Errore di campionamento

Errore di non risposta Errore di copertura

Elementi determinanti per stabilire la precisione di una stima:

Errore di campionamento

Errore di non risposta Errore di copertura

Page 3: Analisi Dell Errore Di Campionamento

3

Aspetti Critici di interesseCasualita’ e Rappresentativita’

Il campionamento: le sue varianti e le sue problematiche

Copertura di lista (telefono e liste nuclei familiari)

Casualita

Non Risposte: Errore di copertura

MANCATA COPERTURA Liste Nuclei Familiari

MANCATO CONTATTO Rifiuti

MANCATA RISPOSTA

Estrazione casuale degli intervistati come condizione necassaria ma non sufficiente affinche’ il campione finale sia relamente casuale

Rappresentativita

Le “Non risposte” e le “Caduta di contatti” formano un gruppo di persone non omogeneo a quello dei rispondenti. Le mancate risposte sono spesso correlate in modo significativo fra di loro.

Ulteriori Aspetti

Desiderabilita’ Sociale Copertura delle risposte Capacita’ di elaborare

un’opinione

Page 4: Analisi Dell Errore Di Campionamento

4

Oggetto e Strumenti di Analisi

Elezioni regionali del 28 e 29 marzo 2010: Regioni con Legge Tatarella: Liguria, Piemonte, Lombardia, Veneto, Emilia-

Romagna, Umbria, Lazio, Basilicata, Campania Regioni senza LT: Toscana, Marche, Calabria e Puglia

78 sondaggi esaminati su 96 disponibili CATI Da Nov 2009 a inizio Mar 2010 Domanda posta sul voto al partito Territorio di rilevazione l’intera regione Numero campionario: da 500 a 6600 (tendenzialmente 1000) Campione stratificato e rappresentativo per eta’ e genere (a volte provincia

di residenza) 44 sondaggi su 78 indicano la % di indecisi

Strumenti di Analisi Indice di Dissimilarita’ Errore Standard Coefficiente di Variazione

Page 5: Analisi Dell Errore Di Campionamento

5

Le Ipotesi di Ricerca

Ipotesi da verificare1. L’errore di campionamento puo’ spiegare le discrepanze fra

previsione ed elezione

2. In presenza di un voto meno “di appartenenza” l’elettore e’ piu’ soggetto ad eventi effimeri (temporary bumps) [Wlezien ed Erikson]

3. Avvicinandosi alla tornata elettorale diminuiscono le mancate risposte e le previsioni si avvicinano al risultato finale [Bon]

4. Coloro che non vogliono esprimere il proprio voto nascondono un voto estremista: I sondaggi sovrastimano I voti moderati

5. Esistono dei partiti “stigmatizzati socialmente” che non vengono citati in fase pre elettorale: I sondaggi sottostimano questi partiti

6. Esistono dei piccoli partiti non coperti dalle risposte chiuse che vengonoo automaticamente esclusi dai sondaggi e quindi sottostimati

Page 6: Analisi Dell Errore Di Campionamento

6

La precisione della stima: calcolo dell’errore standard

Per tutti i casi analizzati (indipendentemente dalla regione, dal periodo di rilevazione e dal partito) I valori dell’ES sono molto bassi, indicano stime molto precise (linee che si sovrappongono)

Forchetta molto stretta intorno alla percentuale previstaForchetta che non comprende quasi mai il risultato finale

Pallini: Risultati finaliLinee: intervallo ES

ES: errore che si commette nel prevedere un fenomeno nella sua totalita’, in termini assoluti e con la medesima unita’ di misurazione del fenomeno di riferimanto

Page 7: Analisi Dell Errore Di Campionamento

7

La precisione della stima: calcolo del Coefficiente di Variazione

Calcolato per ciascun partito all’interno di tutti i sondaggi: piu’ alto CdV minore la capacita’ di stima della prvisione

Nel nostro caso il CdV calcolato non risulta essere un buon indicatore della capacita’ predittiva dei sondaggi

La rilevazione della % attribuita ai partiti risulta precisa (ES molto basso), ma inefficace nel rilevare il fenomeno

Il campione (su cui e’ stato calcolato lo ES e il CdV) e’ inficiato dalle mancate risposte e dai mancati contatti

CdV o Deviazione St: indice dell’errore relativo di una stima, ne indica la precisione calcolandone l’ammontare di errore.Secondo la formula impiegata si ottengono stime piu’ puntuali con campioni maggiori e per i partiti che nei sondaggi ottengono poche preferenze, quindi percentuali basse, il CdV sara’ molto piu’ alto che per i partiti di medie o grandi dimensioni

Page 8: Analisi Dell Errore Di Campionamento

8

Indice di dissimilarita’: evidenze empiriche

Indici molto alti indicano una grossa discrepanza fra previsioni ed elezioni (es: Campania, Puglia e Basilicata)

Andamento altalenante, senza una tendenza crescente o decrescente e senza una diminuzione dell’indice nell’arco temporale:

Durante la campagna elettorale non si sono verificati episodi con effetti duraturi (permanent bumps) ma e’ possibile la presenza di temporary bounces (voto non di appartenenza)

Non si registra un avvicinamento al risultato elettorale; gli elettori non rispondenti non aumentano la loro capacita’ di elaborare un’opinione-risposta

INDICE DI DISSIMILARITA’: rappresenta la percentuale di voti che muta (che passa da un partito all’altro) fra la previsione e la consultazione

Page 9: Analisi Dell Errore Di Campionamento

9

Analisi dello scarto fra la previsone e il risultato finale

Spunti

A fronte delle analisi effettuate su tutte le regioni: Ad una prima lettura: si evidenzia una sovrastima dei partiti moderati

(supremazia del “Voto Espressivo” sul “Voto Strategico” durante le consultazioni)

Partiti estremisti nascosti in fase pre elettorale, mentre ricompaiono alle consultazioni

In realta’non ha importanza se un partito sia moderato o estremista, la linea di distinzione passa fra i partiti di coalizione e di ricatto

>NON ESISTE UNA SOTTOSTIMA IN FASE PREELETTORALE DEI PARTITI ESTREMISTI

“I partiti di coalizione” sono sovrastimati in fase pre elettorale (es: Io amo la Lucania, Pannella-Bonino, LdV in Calabria)

>LINEA DI DEMARCAZIONE FRA PARTITI DI COALIZIONE E DI RICATTO

Con distinzioni fra N e CS, il PDL e’ tendenzialmente sovrastimato piu’ del PD in fase preelettorale. Cade l’idea che sia un partito stigmatizzato. Lo stesso vale per la LN (sempre sottostimata in Veneto, ma non in Toscana). L’idea di partito stigmatizzato potrebbe essere attribuita al M5S

>ALTRO GENERE DI PARTITI STIGMATIZZATI Caso M5S (Nord): come partito estremista oppure espressione

dell’interferenza dell’indagine [Bourdieu]>M5S SOGGETTO NON COPERTO NELLE DOMANDE

Page 10: Analisi Dell Errore Di Campionamento

10

Analisi dello scarto fra la previsone e il risultato finale

Conclusioni

I sondaggi analizzati non sono espressione di campioni probabilistici

Sono evidenti numerose distorsioni nella loro formazione non analizzabili (caduta contatti, % indecisi)

Percentuale di indecisi (quando indicata) non coincide con un Errore di campionamento (coefficiente di variazione) basso. [Unico caso registrato S31 in Lombardia]

Non sono state evidenziate differenze, nel compaortamento in fase pre consultazioni, dettate dal sistema elettorale

I sondaggi pur nella loro imprecisione riescono a prevedere il vincitore [Eccezioni: Piemonte (S02, S17 e S48) e Puglia (S29 e S41)]

Per quanto lo strumento di misura sondaggio sia preciso come dimostra l’ES, in realta’ non e’ efficace per esprimere la volonta’ di voto della popolazione italiana