LE TECNICHE CHE VEDREMO OGGI
description
Transcript of LE TECNICHE CHE VEDREMO OGGI
1
2
3
LE TECNICHE CHE VEDREMO OGGI
4
5
6
7
8
Pi<1/2
9
10
11
12
La variabile ausiliaria usata per definire le probabilità variabili potrebbe essere, non la dimensione dei grappoli, M, ma una generica X, positivamente correlata con la Y.
13
14
15
Identità tra devianze
i
ii j
iiji j
ij yyMyyyy222
Devianza totale=devianza within+devianza beetween
11
1
)1()1(
1
11
1
2222
2222
2222
NSyyMyyMN
S
MNSyyyyMN
S
NMSyyyyNM
S
Bi j
ii j
iB
wi j
iiji j
iijw
i jij
i jij
Mi=M, PER OGNI i
16
S12=MSB
2
Mi=M, PER OGNI i
17
STIMA PROPORZIONE IN GR
Mi=M, per ogni i Mi diverso per ogni i
c
grigr
c
iigr
c i
ici
gr
n
pp
n
fpv
N
Pp
n
fpV
correttoM
a
nn
pp
1
ˆ1ˆ
1
1ˆ
1ˆ
2
2
ci
c
griigr
c
iigr
ci
ci
gr
Mn
Mn
pMa
Mn
fpv
N
MM
N
PMa
Mn
fpV
distortom
ap
1ˆ,1
ˆˆ
1ˆ
,1
1ˆ
ˆ
2
2
02
2
ci
c
griigr
c
iigr
ci
ci
gr
Mn
Mn
pMa
Mn
fpv
N
MM
N
PMa
Mn
fpV
distortom
ap
1ˆ,1
ˆˆ
1ˆ
,1
1ˆ
ˆ
2
2
02
2
18
19
SOLUZIONE ES. 1
20
SOLUZIONE ES. 1
21
Calcolare le probabilità di inclusione del primo e del
secondo ordine.
22
SOLUZIONE ES. 2
CAMPIONE ESTRATTO: C=(2,9)
9,2
9
2
0,219
0,274
0,035
23
ESERCIZIO 3
In una strada del centro storico di una certa città ci sono 8 palazzi costruiti prima del 1920. Allo scopo di valutare le condizioni di stabilità dei palazzi ne vengono scelti 2 a caso con probabilità variabili, impiegando come variabile ausiliaria il numero di famiglie residenti in ciascun palazzo.
a)Si estragga il campione con il metodo di Yates-Grundy.b)Si definiscano le probabilità di inclusione del primo e
secondo ordine e si calcolino tali probabilità per il campione estratto in a).
Palazzi 1 2 3 4 5 6 7 8 Famiglie residenti
25 15 40 12 50 28 16 20
24
SOLUZIONE ES. 3
a)Le probabilità di estrazione per la prima unità (palazzo), definite in base alla variabile ausiliaria "numero di famiglie residenti"; quindi sono
Palazzi 1 2 3 4 5 6 7 8 Famiglie res. 25 15 40 12 50 28 16 20 Pi 0,121 0,073 0,194 0,058 0,243 0,136 0,078 0,097
Ipotizzando di estrarre la i-esima unità occorre ricalcolare le misure di ampiezza normalizzate per l’estrazione della seconda unità:
ii P1P b)Definire le probabilità di inclusione (par.2.6). Per le probabilità di inclusione del primo e secondo ordine, utilizzando il metodo di Yates-Grundy, vedi libro (par. 3.4.2.1). Le probabilità di inclusione del primo ordine risultano
Palazzi 1 2 3 4 5 6 7 8 i 0,249 0,154 0,378 0,124 0,454 0,276 0,163 0,202
25
( , )
ESERCIZIO 4
ospedaliospedali 1 2 3 4 5 6 7 8 9 10
n_posti n_posti lettoletto 470 210 350 960 235 550 125 210 425 232
26
SOLUZIONE ES. 4
P'j=Pj/(1-Pi) Tj'
0,16747182 0,1674720,074745035 0,242217
0,12466452 0,366881
0,08373591 0,4506170,195920558 0,6465380,044551798 0,691090,074745035 0,765835
0,15136876 0,9172030,082662373 0,999866
27
SOLUZIONE ES. 4
28
SOLUZIONE ES. 4
29
SOLUZIONE ES. 4
30
( , , )
ESERCIZIO 5
31
SOLUZIONE ES. 5
,
32
SOLUZIONE ES. 5
=
=
^
^
33
ESERCIZIO 6
Si consideri una popolazione di N=4 catene di supermercati di una città italiana; ognuna di esse è presente nella città con tre negozi.
L'entrata mensile di ogni negozio è indicata in milioni di euro nella tabella che segue:
a) Verificare l’identità sulle devianze e calcolare il coefficiente di omogeneità nei grappoli.b) Verificare l’espressione di S1
2 in funzione del coefficiente di omogeneità nei grappoli.c) Si estragga un campione di 2 catene , si stimino il ricavo mensile totale per negozio e per catena con le relative varianze.
catena1 catena2 catena3 catena4
3 2,7 5,3 4,7
2,5 4 3,6 3,9
3,8 7 2,8 5,8
ESERCIZIO 6
34
a)
catena1 catena2 catena3 catena4 3 2,7 5,3 4,7 2,5 4 3,6 3,9 3,8 7 2,8 5,8 _ Yi 9,3 13,7 11,7 14,4 Yi 3,1 4,566667 3,9 4,8 Si
2 0,43 4,863333 1,63 0,91
_ Y= 12,275 Y= 4,091666667 S1
2=5,2425 SB
2=1,748 Sw
2=1,958333333 S2=1,9008333
20,909167=15,66666667+5,2425000000=20,9091666667
=
SOLUZIONE ES. 6
35
SOLUZIONE ES. 6
=5,2425
1-S2w/S2= -0,03024989
b)
c)
^ ^
S12=0,245
2 4Ricavo totale mensile
(mil. Euro)
13,7 14,4
catene
c
igr
gr yMn
N
M
YY .
00 *
ˆˆ
2
120
2
0
)1()ˆ1(
ˆsf
nM
NY
MvYv grgr
4,683333
c
igr
gr yNn
N
N
YY .*
ˆˆ 2
12
2
)1()ˆ1(ˆ sf
nN
NY
NvYv grgr14,05 0,06125
0,007
36
Una impresa con 10 unità locali (U.L.) distribuite nella regione vuole introdurrel'orario flessibile. Allo scopo effettua un sondaggio scegliendo casualmente n=3 U.Ltenendo conto del numero di addetti per U.L..
U.L. 1 2 3 4 5 6 7 8 9 10addetti 8 12 23 15 50 75 115 43 19 25
Supponendo che, per le tre U.L. scelte, la proporzione di favorevoli all'orarioflessibile sia rispettivamente pari a p1=0,4, p2=0,6, p3=0,2
1. si estragga il campione di n=3 U.L., impiegando il "cumulative total method"ed indicando come sono state scelte le U.L. dalle tavole dei numeri casuali;2. si stimi la proporzione di addetti che sono favorevoli all'orario flessibile3. si stimi la varianza dello stimatore e si definiscano le proprietà dello stimatoreimpiegato.
ESERCIZIO 7
37
SOLUZIONE ES. 7
Per utilizzare il metodo dei totali cumulati si considerano i seguenti valori cumulati: 8-20-43-58-108-183-298-341-360-385.Seleziono i numeri casuali126-367-213 compresi nell'intervallo [1;385], cui corrispondono rispettivamente le U.L. 6-10-7.Poiché i grappoli hanno dimensioni differenti si considera lo stimatore
Lo stimatore impiegato è asintoticamente corretto.
c
ic
griigr M
nM
n
pMa
Mn
fpv
1ˆ,1
ˆˆ
1ˆ
2
2
u.l. addetti Ti pi ai=pi*mi (ai-Mi*p^gr)^21 8 82 12 203 23 434 15 585 50 1086 75 183 0,4 30 39,426717147 115 298 0,2 23 178,81287188 43 3419 19 360
10 25 385 0,6 15 50,31097891385 268,5505679
0,31627971,66667 0,006100121v(p^gr
)=
38
Si vuole condurre un’indagine campionaria sulle ore di assenza dal lavoro da parte degliaddetti nelle 870 imprese manifatturiere di un dato settore della regione Lombardia.Supponiamo che venga estratto in blocco un campione di 10 imprese e si consideranotutti gli addetti di ciascuna impresa giungendo ai dati esposti nella seguente tabella,relativi ad una settimana lavorativa.
Imprese 1 2 3 4 5 6 7 8 9 10 N. addetti 7 29 64 52 85 12 47 34 72 21 Tot ore assenza 8 24 49 32 48 16 51 24 56 16
A) Che tipo di campionamento è stato utilizzato?B) Si stimi il totale delle ore di assenza degli addetti nelle 870 aziende e ilcorrispondente scarto quadratico medioC) Si dica, motivando la risposta, se i dati a disposizione avrebbero consentito la stimadella media delle ore di assenza.D) Se non fossero stati considerati tutti gli addetti di ciascuna impresa ma solo 6 perognuna estratti casualmente, che tipo di campionamento sarebbe stato utilizzato?
ESERCIZIO 8
39
SOLUZIONE ES. 8
A) Che tipo di campionamento è stato utilizzato? Si è utilizzato un campionamento a grappoli, in quanto si ha una popolazione“addetti nelle imprese manifatturiere di un dato settore della RegioneLombardia” suddivisa in 870 grappoli “le aziende”. Si sono estratti in blocco 10grappoli e si sono esaminati completamente.Dunque:•è noto N=870 numero totale di grappoli•è noto n=10 numero grappoli costituenti il campione•sono note le Mi=numero di unità elementari che formano il grappolo i•sono note le yi=ore di assenza per ciascun grappolo i•non è noto M0=numero di unità elementari che formano la popolazione (totaleaddetti nelle imprese manifatturiere di un dato settore nella Regione Lombardia)
Imprese 1 2 3 4 5 6 7 8 9 10 N. addetti 7 29 64 52 85 12 47 34 72 21 Tot ore assenza y8 24 49 32 48 16 51 24 56 16
40
SOLUZIONE ES. 8