PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI...

13
PIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni elettorali Il campionamento per quote 1. Si stabilisce il carico di lavoro per gli intervistatori, e il numero degli intervistatori L 2. A ciascun intervistatore si assegna il compito di realizzare una frazione 1/ L delle interviste da effettuare in ciascuno strato QUOTE = > nW h / L PREGI : Economia, Velocità di realizzazione SVANTAGGI : Distorsioni (selezione dell'intervistatore, autoselezione dei rispondenti) Stima della Varianza () v y f n s W h h h H = ! = " 1 2 1

Transcript of PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI...

Page 1: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

PIANI DI CAMPIONAMENTO NON PROBABILISTICI

Il campionamento per scelta ragionata

= > test market = > proiezioni elettorali Il campionamento per quote

1. Si stabilisce il carico di lavoro per gli intervistatori, e il numero degli intervistatori L

2. A ciascun intervistatore si assegna il compito di realizzare una frazione 1/L delle interviste da effettuare in ciascuno strato

QUOTE = > nWh/L

PREGI : Economia, Velocità di realizzazione SVANTAGGI : Distorsioni (selezione dell'intervistatore, autoselezione dei

rispondenti)

Stima della Varianza ( )v yf

nsW

h h hH=

!="

1 2

1

Page 2: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

Esempio di campionamento per quote

Provincia di Ancona – 332 interviste telefoniche ripartite proporzionalmente tra i comuni con almeno 5000 abitanti, con quote per sesso ed età all’interno di tre strati di comuni omogenei per dimensione demografica

Popolazione totale: 366.618

STRATO 1 (27,6% della popolazione totale => 92 interviste)

totale maschi femmine interviste AN Ancona

101.285 48.160 53.125 92 Ripartizione delle interviste

classe d'età 15-24 25-44 45-64 65+ totale maschi 7 14 13 10 44 femmine 7 16 14 19 48

Page 3: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

STRATO 2 (45,8% della popolazione totale => 152 interviste)

totale maschi femmine interviste AN

Senigaglia

41.144

19.654

21.490 AN

Jesi

40.156

19.221

20.935 AN

Falconara Marittima

30.105

14.668

15.437 AN

Fabriano

28.721

13.874

14.847 AN

Osimo

27.938 14.204

13.734 168.064 81.621 86.443 152

Ripartizione delle interviste

classe d'età

15-24

25-44

45-64

65+

totale 74 78

maschi femmine

11 12

24 26

22 23

17 19

74 78

Page 4: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

STRATO 3 (26,5% della popolazione totale => 88 interviste) totale maschi femmine interviste

AN

Caslelfidardo

15.321

7.473

7.848

AN

Chiaravalle

13.813

6.868

6.945

AN

Loreto

10.780

5.051

5.729

AN

Filottrano 9.008

4.396

4.612

AN

Montemarciano

7.660

3.739

3.921

AN

Sassoferrato

7.094

3.409

3.685

AN

Camerano

6.618

3.224

3.39*

AN

Ostra

5.847

2.833

3.014

AN

Arcevia

5.830

2.788

3.042

AN

Corinaldo

5.236

2.612

2.624

AN

Maiolati Spontini

5.194

2.529

2.665

AN

Cupramontana

4.868

2.338

2.530

97.269 97.269

47.260

50.009

88

Ripartizione delle interviste classe d'età 15-24 25-44 45-64 65+ totale

maschi femmine

6 6

14 15

12 13

11 11

43 45

Page 5: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

LA STIMA PER INTERVALLO

Se $! ~asint

N [θ ; V( $! )] = > intervallo di confidenza approx $! ± z α /2 v( )$!

Uso della t di Student $Y ± tα /2,g v( )$Y Gradi di libertà g - Campionamento casuale semplice: g = n-1 - Campionamento stratificato: g = n-H - Campionamento a più stadi stratificato: g = n-H

Page 6: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

IL DIMENSIONAMENTO DEL CAMPIONE

Funzione di costo C = CF + nCu

Funzione di varianza V( y ) = 1! f

nS 2

Precisione delle stime In termini di errore standard V( )$! < ε In termini di intervallo di confidenza 2 z α /2 V( )$! < ε

= > condizione sulla varianza

Page 7: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

Precisione delle stime e dimensione del campione

C( y ) = 1001! f

n

S

Y C( y ) ≈

n

Cy,

Valori del coefficiente di variazione della media del campione corrispondenti ad un coefficiente di variazione del carattere del 100%, in funzione della dimensione del campione.

n 50 100 250 500 1000 2500 5000

C( y ) 14,1% 10,0% 6,3% 4,5% 3,2% 2% 1,4%

Page 8: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni
Page 9: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

La prestima dei parametri

1. Precedenti studi, indagini o dati di natura censuaria o amministrativa 2. L'indagine pilota. 3. Modelli matematici a. distrib. uniforme tra a e b => σ y2 = (b-a)2/12

b. distrib. triangolare asim. pos. = > σ y2 = (b-a)2/16 c. popolazioni dicotomiche = > σ y2 = Y (1-Y )

ESEMPIO

2⋅1,96 Y Y

n

(1 )!≤ 0,02 = > n ≥

4 1962! ", Y Y(1 )

0,022

Y = 0,50 = > n ≥ 9604 Y = 0,15 = > n ≥ 4898 Y = 0,05 => n ≥ 1824

Page 10: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

Il dimensionamento del campione stratificato

Funzione di varianza V( $

Y ) = ! =H

i 1 Wh2 1! fn

h

hSh2 => Incognite: nh

Funzione di costo C = CF + ! =

H

h 1 nhCuh

Funzione da minimizzare F = ! =H

i 1 Wh2 1 1

n Nh h

!"#$ %

&' Sh2 -λ (C - CF - h

H

=! 1 nh Cuh )

SOLUZIONE : nh = W S

C

h h

uh! = > allocazione ottima

n

n

h = ! =H

h uhhh

uhhh

CSW

CSW

1/

/

n

N

h

h=

n

N ! =H

h uhhh

uhh

CSW

CS

1/

/

Page 11: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

L’allocazione di Neyman

Se Cuh = Cu

n

n

h = ! =Hh hh

hh

SW

SW

1

n

N

h

h=

n

N

S

S

h

Comparazione tra allocazione proporzionale e ottima

V ( )

V ( )

prop

Neym

$

$

Y

Y≅ 1 + C(S) 2 < = C(S) = ! =

Hh hW1 (Sh - S ) 2/ S 2

Il caso dei domini stratificati V( $

Y h - $Y h’) = V( $

Y h) + V( $Y h’ ) = > allocazione eguale

Page 12: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

Il dimensionamento del campione a due stadi stratificato

Funzione di varianza V( $Y )=

1

n! =Hh 1 ! =

hN

i hiW1 ( Yhio - Yh ) 2 + 1

nm! =Hh 1 ! =

hN

i 1 Whi Shi2

Incognite n e m oppure m= nm = > V( $Y ) =

A

n

B

m+

Funzione di costo C = CF + nCG + mCu

Funzione da min. F = A

n

B

m+ - λ (C - CF - nCG - mCu )

SOLUZIONE n = A

CG! , m=

B

Cu!

= > m = B

A

C

C

G

u

= > prestime di A / B

Page 13: PIANI DI CAMPIONAMENTO NON PROBABILISTICIgiovanna/didattica/teo/nonprob_dim.pdfPIANI DI CAMPIONAMENTO NON PROBABILISTICI Il campionamento per scelta ragionata = > test market = > proiezioni

Alcune considerazioni conclusive

- Confronto tra strategie - Raccordo modalità di somministrazione del questionario rete di rilevazione - Contesto multivariato