Piani di campionamento - Lezione 14

11

Click here to load reader

description

Corso di StatisticaLezione: 14 di 15Argomento: Piani di campionamento

Transcript of Piani di campionamento - Lezione 14

Page 1: Piani di campionamento - Lezione 14

1

Piani di Campionamento

Indagine Statistica

i. progettazioneii. rilevazioneiii. registrazioneiv. revisione e codificav. elaborazionevi. validazionevii. diffusione

Page 2: Piani di campionamento - Lezione 14

2

Popolazioni Finite

• Population of inference (PI). Popolazione sotto inferenza

• Target population (PO). Popolazione obiettivo • Frame population (PC). Popolazione base per il

campionamento.• Survey population (PE). Popolazione effettivamente

indagata.

Error Profile

Errori Campionari•Errore di stima

Errori non Campionari •Copertura

•Mancate risposte

•Errori di misura

Page 3: Piani di campionamento - Lezione 14

3

Piani di campionamentoCampionamenti non probabilistici

• a scelta ragionata (bilanciato, semi probabilistico, troncato)

• campionamento per quota

• campionamento tramite testimoni privilegiati

Campionamenti probabilistici

• semplice con ripetizione (SCR)

• semplice senza ripetizione (SSR)

• sistematico (SM)

• stratificato (ST)

• a grappoli (GR)

• a più stadi (DS)

Campionamento a scelta ragionata

• Consiste nella scelta delle aree di analisi o delle unità campionarie in funzione della peculiarità del fenomeno da studiare e della sua presenza ritenuta dal ricercatore fortemente concentrata in tali aree o su tali unità.

• Tra i più usati campionamenti a scelta ragionata si hanno il campionamento bilanciato, quello semi probabilistico, e quello troncato

Page 4: Piani di campionamento - Lezione 14

4

Campionamento per quota

• Consiste nel suddividere la popolazione oggetto di analisi in gruppi o strati sulla base di alcune variabili caratteristiche (età, sesso,..). Vengono quindi definite le quote, cioè il numero di interviste che dovranno essere effettuate in ciascuno strato da ogni intervistatore al quale viene delegata una totale arbitrarietàdi scelta delle unità da intervistare, purchè rientrino nello strato definito.

• Di fatto il campionamento per quote è simile al campionamento stratificato, ma la scelta delle unità, in ciascuno strato non èprobabilistica è ciò comporta l’assenza di stime corrette e causa una sottostima della varianza complessiva. D’altro canto riduce le mancate risposte e ha costi molto più contenuti.

Campionamento tramite testimoni privilegiati

Consiste nel ricorso a persone che, per la particolare attività che svolgono, sono a conoscenza di informazioni e notizie su specifici fenomeni; pertanto il loro coinvolgimento risulta indispensabile per stimare la dimensione e le caratteristiche del fenomeno stesso.

Appare evidente quali e quante problematiche di natura statistica sono connesse ad indagini effettuate tramite testimoni privilegiati senza i quali, tuttavia, risulterebbe quasi impossibile dimensionare alcuni fenomeni peculiari.

Page 5: Piani di campionamento - Lezione 14

5

Campionamento semplice con ripetizione

Questo piano di campionamento prevede che le N unità della popolazione siano considerate tutte nelle stesse condizioni di fronte all’operazione di scelta. L’operazione di scelta consiste nell’estrarre la prima unità del campione con lo stesso procedimento con cui vengono estratte le successive, sempre tra le N unità. Il che equivale a dire che ciascuna unità estratta è rimessa nelle popolazione prima di estrarre la successiva. La probabilità associata a ogni estrazione èquindi costante e uguale a 1/N. Lo spazio campionario risulta costituito da tutti i campioni ordinati con ripetizione, cioè le disposizioni con ripetizione di N elementi presi n alla volta.

Campionamento semplice senza ripetizione

•Lo spazio campionario risulta costituito da tutti i campioni nonordinati e formati da unità tutte tra loro distinte. tra loro, cioè le combinazioni di N elementi presi n a n. •Lo schema di campionamento è molto semplice e si realizza nell’estrazione da un urna di n palline numerate da i a N una alla volta senza rimessa.•il campionamento SSR è notoriamente più efficiente del campionamento SCR•quando il rapporto f = n / N, chiamato frazione di sondaggio, èmolto piccolo il campionamento SCR si identifica, in termini diefficienza, con SSR. •Inoltre, se si tiene conto che SCR è di più facile definizione e che, con f piccolo, la probabilità di estrarre due volte la stessa unitàstatistica è molto piccola, l’impiego di tale piano di campionamento può essere conveniente.

Page 6: Piani di campionamento - Lezione 14

6

Campionamento semplice

Campionamento sistematico •Il campionamento sistematico è di fatto un campione semplice (non prevede variabili di strato né variabili di raggruppamento) con la differenza che le unitànon vengono selezionate estraendo n numeri casuali. Si estrae un solo numero casuale r compreso tra 1 e k con k=N/n che costituisce la prima unità, le altre saranno le r+ik con i=1, ..n-1.

•Tale procedura campionaria ha la stessa efficienza del campionamento semplice se l’ordinamento delle unità è indipendente dalla variabile oggetto di studio. Risulta però operativamente più veloce, perchè consente le selezioni automatiche delle unità.

•Risulta più efficiente del campionamento semplice se le unità hanno un ordinamento lineare rispetto alla variabile oggetto di studio. In tal caso si ottiene una sorta di campionamento stratificato.

•Risulta meno efficiente del campionamento semplice se le unità presentano un ordinamento ciclico e il passo di campionamento coincide con il ciclo. La procedura sistematica produce in tal caso campioni distorti.

Page 7: Piani di campionamento - Lezione 14

7

Campionamento stratificato• La stratificazione è il procedimento più diretto che permette di

aumentare l’efficienza di un piano di campionamento in quanto consente di diminuire l’ordine di grandezza dell’errore di campionamento senza aumentare la numerosità campionaria.

• La stratificazione si rende possibile con l’ausilio di informazioni supplementari circa uno o più caratteri della popolazione, cioè circa la struttura della stessa.

• La popolazione viene suddivisa in strati il più possibile omogenei al loro interno ed eterogenei tra loro. In altre parole la popolazione viene suddivisa in H sottopopolazioni, da ogni strato si estrae poi un campione casuale semplice; si hanno perciò tanti campioni quantisono gli strati.

• Tali campioni sono indipendenti tra loro e possono avere la stessa dimensione o dimensioni differenti

Campionamento stratificato

Page 8: Piani di campionamento - Lezione 14

8

Campionamento stratificato

• La scelta delle numerosità dei campioni di strato può essere fatta secondo due criteri:– allocazione proporzionale, la numerosità degli strati deve rispettare le proporzione degli

strati nella popolazione– allocazione ottima, la numerosità degli strati è una funzione delle varianze di strato

(devono essere note nella popolazione), per cui gli sttrati con maggiore variabilità al loro interno avranno un numero di unità campionate maggiore.

• In generale il campionamento stratificato con allocazione proporzionale è piùefficiente del campionamento semplice e il campionamento stratificato con allocazione ottima è più efficiente di quello con allocazione proporzionale.

• Se le varianze di strato sono uguali il campionamento stratificato con allocazione ottima è del tutto simile al campionamento stratificato con allocazione proporzionale

• Se le medie di strato sono tutte uguali il campionamento stratificato con allocazione proporzionale è del tutto simile al campionamento semplice

Campionamento a grappoli

• La caratteristica fondamentale del campionamento a grappoli che lo differenzia dai piani considerati fino ad ora è che non vengono estratte le unità elementari me vengono estratte delle unitàaggregate. All’interno delle unità aggregate vengono poi esaminate tutte le unità elementari presenti.

• In genere le unità aggregate sono già presenti nella popolazione. Per esempio comuni, scuole, regioni, ecc. Il grappolo è di fatto una popolazione in miniatura, che ne rispetta tutte le caratteristiche fondamentali.

• La condizioni per cui abbia senso effettuare un piano di campionamento a grappoli è che ci sia molta eterogeneitàall’interno dei grappoli e molta omogeneità tra loro. Basta prenderne quindi solo alcuni per rappresentare le caratteristiche dell’intera popolazione.

Page 9: Piani di campionamento - Lezione 14

9

Campionamento a grappoli

• Tale piano di campionamento risulta generalmente meno efficientedi quello semplice ma ha dei costi e dei tempi di realizzazione alla lunga inferiore. Si pensi ad esempio all’ipotesi di dover effettuare un sondaggio sull’opinione degli studenti sulla riforma universitaria. Per ottenere un campione complessivo di 1000 studenti si potrebbe avere il caso in cui gli studenti distribuiti per esempio in diverse 500 scuole in italia (campione casuale semplice), oppure in due soli grappoli, due scuole rappresentative.

• Nel campionamento a grappoli si indica in generale con N il numero di grappoli presenti nella popolazione, con n il numero di grappoli estratti con Mi il numero di unità elementari presenti in ogni grappolo e con M0 il numero totale di unità elementari presenti nella popolazione (non sempre noto)

Campionamento a grappoli

Page 10: Piani di campionamento - Lezione 14

10

Campionamento a più stadi

• Il campionamento a due o più stadi è di fatto un campionamento a grappoli in cui però all’interno dei grappoli estratti non vengono esaminate tutte le unità elementari presenti ma solo una parte di esse estratte casualmente (normalmente un campione casuale semplice).

• Nel campionamento a due stadi, come in quello a grappoli, si indica in generale con N il numero di grappoli presenti nella popolazione, con n il numero di grappoli estratti con Mi il numero di unità elementari presenti in ogni grappolo i-esimo, con M0 il numero totale di unità elementari presenti nella popolazione (non sempre noto) e con mi il numero di unitàelementari estratte nel grappoli i-esimo.

Campionamento a due stadi

Page 11: Piani di campionamento - Lezione 14

11

Effetto del disegno

0

ˆ( )ˆ( )

V YD e ffV Y

=

Deff>1 il paino di campionamento utilizzato è meno efficiente di quello del campionamento sempliceDeff=1 ha la stessa efficienzaDeff<1 è più efficiente.