PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI...
Transcript of PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI...
PIANI DI CAMPIONAMENTO NON PROBABILISTICI
Il campionamento per scelta ragionata
= > test market = > proiezioni elettorali Il campionamento per quote
1. Si stabilisce il carico di lavoro per gli intervistatori, e il numero degli intervistatori L
2. A ciascun intervistatore si assegna il compito di realizzare una frazione 1/L delle interviste da effettuare in ciascuno strato
QUOTE = > nWh/L
PREGI : Economia, Velocità di realizzazione SVANTAGGI : Distorsioni (selezione dell'intervistatore, autoselezione dei
rispondenti)
Stima della Varianza ( )v yf
nsW
h h hH=
!="
1 2
1
Esempio di campionamento per quote
Provincia di Ancona – 332 interviste telefoniche ripartite proporzionalmente tra i comuni con almeno 5000 abitanti, con quote per sesso ed età all’interno di tre strati di comuni omogenei per dimensione demografica
Popolazione totale: 366.618
STRATO 1 (27,6% della popolazione totale => 92 interviste)
totale maschi femmine interviste AN Ancona
101.285 48.160 53.125 92 Ripartizione delle interviste
classe d'età 15-24 25-44 45-64 65+ totale maschi 7 14 13 10 44 femmine 7 16 14 19 48
STRATO 2 (45,8% della popolazione totale => 152 interviste)
totale maschi femmine interviste AN
Senigaglia
41.144
19.654
21.490 AN
Jesi
40.156
19.221
20.935 AN
Falconara Marittima
30.105
14.668
15.437 AN
Fabriano
28.721
13.874
14.847 AN
Osimo
27.938 14.204
13.734 168.064 81.621 86.443 152
Ripartizione delle interviste
classe d'età
15-24
25-44
45-64
65+
totale 74 78
maschi femmine
11 12
24 26
22 23
17 19
74 78
STRATO 3 (26,5% della popolazione totale => 88 interviste) totale maschi femmine interviste
AN
Caslelfidardo
15.321
7.473
7.848
AN
Chiaravalle
13.813
6.868
6.945
AN
Loreto
10.780
5.051
5.729
AN
Filottrano 9.008
4.396
4.612
AN
Montemarciano
7.660
3.739
3.921
AN
Sassoferrato
7.094
3.409
3.685
AN
Camerano
6.618
3.224
3.39*
AN
Ostra
5.847
2.833
3.014
AN
Arcevia
5.830
2.788
3.042
AN
Corinaldo
5.236
2.612
2.624
AN
Maiolati Spontini
5.194
2.529
2.665
AN
Cupramontana
4.868
2.338
2.530
97.269 97.269
47.260
50.009
88
Ripartizione delle interviste classe d'età 15-24 25-44 45-64 65+ totale
maschi femmine
6 6
14 15
12 13
11 11
43 45
LA STIMA PER INTERVALLO
Se $! ~asint
N [θ ; V( $! )] = > intervallo di confidenza approx $! ± z α /2 v( )$!
Uso della t di Student $Y ± tα /2,g v( )$Y Gradi di libertà g - Campionamento casuale semplice: g = n-1 - Campionamento stratificato: g = n-H - Campionamento a più stadi stratificato: g = n-H
IL DIMENSIONAMENTO DEL CAMPIONE
Funzione di costo C = CF + nCu
Funzione di varianza V( y ) = 1! f
nS 2
Precisione delle stime In termini di errore standard V( )$! < ε In termini di intervallo di confidenza 2 z α /2 V( )$! < ε
= > condizione sulla varianza
Precisione delle stime e dimensione del campione
C( y ) = 1001! f
n
S
Y C( y ) ≈
n
Cy,
Valori del coefficiente di variazione della media del campione corrispondenti ad un coefficiente di variazione del carattere del 100%, in funzione della dimensione del campione.
n 50 100 250 500 1000 2500 5000
C( y ) 14,1% 10,0% 6,3% 4,5% 3,2% 2% 1,4%
La prestima dei parametri
1. Precedenti studi, indagini o dati di natura censuaria o amministrativa 2. L'indagine pilota. 3. Modelli matematici a. distrib. uniforme tra a e b => σ y2 = (b-a)2/12
b. distrib. triangolare asim. pos. = > σ y2 = (b-a)2/16 c. popolazioni dicotomiche = > σ y2 = Y (1-Y )
ESEMPIO
2⋅1,96 Y Y
n
(1 )!≤ 0,02 = > n ≥
4 1962! ", Y Y(1 )
0,022
Y = 0,50 = > n ≥ 9604 Y = 0,15 = > n ≥ 4898 Y = 0,05 => n ≥ 1824
Il dimensionamento del campione stratificato
Funzione di varianza V( $
Y ) = ! =H
i 1 Wh2 1! fn
h
hSh2 => Incognite: nh
Funzione di costo C = CF + ! =
H
h 1 nhCuh
Funzione da minimizzare F = ! =H
i 1 Wh2 1 1
n Nh h
!"#$ %
&' Sh2 -λ (C - CF - h
H
=! 1 nh Cuh )
SOLUZIONE : nh = W S
C
h h
uh! = > allocazione ottima
n
n
h = ! =H
h uhhh
uhhh
CSW
CSW
1/
/
n
N
h
h=
n
N ! =H
h uhhh
uhh
CSW
CS
1/
/
L’allocazione di Neyman
Se Cuh = Cu
n
n
h = ! =Hh hh
hh
SW
SW
1
n
N
h
h=
n
N
S
S
h
Comparazione tra allocazione proporzionale e ottima
V ( )
V ( )
prop
Neym
$
$
Y
Y≅ 1 + C(S) 2 < = C(S) = ! =
Hh hW1 (Sh - S ) 2/ S 2
Il caso dei domini stratificati V( $
Y h - $Y h’) = V( $
Y h) + V( $Y h’ ) = > allocazione eguale
Il dimensionamento del campione a due stadi stratificato
Funzione di varianza V( $Y )=
1
n! =Hh 1 ! =
hN
i hiW1 ( Yhio - Yh ) 2 + 1
nm! =Hh 1 ! =
hN
i 1 Whi Shi2
Incognite n e m oppure m= nm = > V( $Y ) =
A
n
B
m+
Funzione di costo C = CF + nCG + mCu
Funzione da min. F = A
n
B
m+ - λ (C - CF - nCG - mCu )
SOLUZIONE n = A
CG! , m=
B
Cu!
= > m = B
A
C
C
G
u
= > prestime di A / B
Alcune considerazioni conclusive
- Confronto tra strategie - Raccordo modalità di somministrazione del questionario rete di rilevazione - Contesto multivariato