Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

32
Num 01 - 1 / 36 Lezione 9 Numerosità del campione

Transcript of Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Page 1: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 1 / 36

Lezione 9Numerosità del campione

Page 2: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 2 / 36

parte 1la numerosità minima del campione

Page 3: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 3 / 36

• come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che viene quantificata attraverso l’intervallo di confidenza:

• Dato un campione con immagini { X1, X2, …, Xn } proveniente da una

popolazione su cui è definita una variabile casuale X avente densità f (x)

qualsiasi con media e varianza 2 si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri della popolazione.

gli strumenti di inferenza

mnX vsnvin SS 222

n

j

jn Xn

X1

1

n

j

njn XXn

S1

22

1

1

vnS 22

Page 4: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 4 / 36

la numerosità minima del campione nella stima della media

Page 5: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 5 / 36

distribuzione della media campionaria

• dato un campione con immagini { X1, X2, …, Xn } proveniente

da una popolazione infinita su cui è definita una variabile

casuale X con densità f (x) qualsiasi, media e varianza 2, la media campionaria

fornisce una variabile casuale che, per n sufficientemente

grande, risulta distribuita in modo normale, con media

e con varianza 2 / n

n

jjn X

nX

1

1

Page 6: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 6 / 36

• dato che la media campionaria segue una distribuzione normale

con media e varianza 2 / nè possibile costruire una variabile casualecon distribuzione normale standard, cioè con media nulla e varianza unitaria n

XZ n

dalla media campionaria alla media campionaria standardizzata

• tramite la variabile Z è agevole individuare l’intervallo di confidenza della media campionaria, che può essere visto come l’incertezza dello strumento inferenziale

Page 7: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 7 / 36

intervallo di confidenza a “1 - ” per la media

da cui, per la simmetria della f ( Z ) , si ottiene:

12/12/ a

na z

n

XzP

Page 8: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 8 / 36

intervallo di confidenza a “1 - ” per la media

da cui:

12/12/1 anan z

nXz

nXP

12/12/1 a

na z

n

XzP

Page 9: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 9 / 36

intervallo di confidenza a “1 - ” per la media

possiamo quindi sostenere che:

estraendo a caso un campione con immagini { X1, X2, …, Xn },

con n sufficientemente grande, da una popolazione infinita su cui è definita una variabile casuale X con distribuzione qualsiasi,

media e varianza 2, c’è una probabilità pari a 1 - che l’intervallo casuale

con Z variabile normale standard e con z1-/2 il valore del suo

quantile (1 - /2) contenga il valore della media della X per l’intera popolazione.

I1- è chiamato intervallo di confidenza allo 1 - per la media

2/12/11 , anana z

nXz

nXI

Page 10: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 10 / 36

da cui si ottiene:

ampiezza dell’intervallo di confidenzae numerosità del campione

2/12/11 , anan z

nXz

nXI

2/11 2 azn

A

2

1

2/124

A

zn a

possiamo quindi affermare che:

indicando con A1- l’ampiezza di I1-, intervallo di confidenza

allo 1 - per la media, si ha:

Page 11: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 11 / 36

Se si è prefissato un valore massimo accettabile per l’ampiezza

dell’intervallo di confidenza, valore che indichiamo con A1-max ,

allora è possibile esplicitare il corrispondente valore minimo per

la numerosità del campione nmin :

ampiezza dell’intervallo di confidenzae numerosità del campione

2

1

2/124

A

zn a

30

4

min

2

max,1

2/12min

n

A

zn a

Page 12: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 12 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

Qualora la varianza della X per l’intera popolazione non sia conosciuta si può condurre il calcolo della numerosità richiesta al campione mediante lo stimatore “varianza campionaria corretta”:

n

S

XT

n

n

2

n

j

njn XXn

S1

22

1

1

Sappiamo che se n è sufficientemente grande la variabile casuale

segue una distribuzione “ t di Student con n-1 g.d.l ”.

Page 13: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 13 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

Possiamo quindi affermare che, se n è sufficientemente grande:

estraendo a caso un campione con immagini { X1, X2, …, Xn }

da una popolazione infinita su cui è definita una variabile casuale

X con distribuzione qualsiasi, media e varianza campionaria

Sn2, c’è una probabilità pari a 1 - che l’intervallo casuale

con T variabile “t di Student con n-1 g.d.l “

e con t1-/2 il valore del suo quantile (1 - /2)contenga il valore della media della popolazione.

2/12/11 , a

nna

nn t

n

SXt

n

SXI

Page 14: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 14 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

Sviluppando in modo analogo ai passaggi già visti nel caso di varianza della popolazione conosciuta, se si è prefissato un valore massimo accettabile per l’ampiezza dell’intervallo di

confidenza, valore che indichiamo con A1-max , allora è

possibile esplicitare il corrispondente valore minimo nmin per la numerosità del campione:

2

max,1

2/12min 4

A

tSn a

n

Un problema da considerare è rappresentato dal fatto che il

valore critico t1- /2 della t di Student dipende da n

Page 15: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 15 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

Un problema da considerare è rappresentato dal fatto che il

valore critico t1- /2 della t di Student dipende da n

Page 16: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 16 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

Un primo calcolo approssimato può essere condotto sostituendo al quantile della T il corrispondente quantile di una variabile Z normale standard.

2

max,1

2/12min 4'

A

zSn a

n

Se n’min > 30 sappiamo che la distribuzione t di Student non

differisce in maniera evidente dalla distribuzione normale standard.

Individuato così un primo valore approssimato si può

proseguire cercando il valore corretto di nmin mediante un procedimento iterativo:

Page 17: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 17 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

partendo da una prima valutazione del quantile della

t di Student calcolato per un numero di g.d.l. pari a n’min - 1

si calcola:

Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.

2

max,1

2/12min 4

A

tSn a

n

Page 18: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 18 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

Se pensiamo di dover operare con un campione di numerosità

ridotta n < 30 dobbiamo ricordare che la distribuzione della media campionaria può essere considerata normale

solamente se anche la X segue la distribuzione normale!!!

Se ciò si verifica possiamo individuare il valore della numerosità

richiesta nmin con un procedimento uguale a quello già

mostrato per n > 30.

Page 19: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 19 / 36

ampiezza dell’intervallo di confidenzae numerosità del campione

Partiamo da una prima valutazione condotta con la:

per poi ricalcolare iterativamente il valore di nmin partendo da una

prima valutazione del quantile della t di Student calcolato per un

numero di g.d.l. pari a n’min - 1

Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.

2

max,1

2/12min 4

A

tSn a

n

2

max,1

2/12min 4'

A

zSn a

n

Page 20: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 20 / 36

intervallo di confidenza per la media se n ≈ N

Se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione:

1112/12/1 anan z

nN

nN

Xzn

N

nN

XP

la:

deve essere sostituita dalla:

12/12/1 anan z

nXz

nXP

Page 21: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 21 / 36

intervallo di confidenza per la media se n ≈ Npossiamo quindi sostenere che:

estraendo a caso un campione da una popolazione finita

composta da N elementi su cui è definita una variabile casuale X

con distribuzione qualsiasi, media e varianza 2, c’è una

probabilità pari a 1 - che l’intervallo casuale

con Z variabile normale standard e con z1-/2 il valore del suo

quantile (1 - /2) contenga il valore della media della X per l’intera popolazione.

2/12/111,1

anan zn

N

nN

Xzn

N

nN

XI

Page 22: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 22 / 36

di conseguenza possiamo affermare che:

indicando con A1- l’ampiezza di I1- , intervallo di confidenza

allo 1 - per la media, si ha:

da cui si ottiene:

numerosità del campione ed ampiezza dell’intervallo di confidenza per la media

2/12/11 1212 aa z

Nn

nNz

nN

nN

A

2

2/1

1

211

az

AN

Nn

Page 23: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 26 / 36

Se si è prefissato un valore massimo accettabile per l’ampiezza

dell’intervallo di confidenza, valore che indichiamo con A1-max ,

allora è possibile esplicitare il corrispondente valore minimo per la numerosità del campione:

numerosità del campione ed ampiezza dell’intervallo di confidenza per la media

2

2/1

max,1

min

211

az

AN

Nn

2

2/1

1

211

az

AN

Nn

Page 24: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 28 / 36

la numerosità minima del campione nella stima della varianza

Page 25: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 29 / 36

distribuzione della varianza campionaria corretta

• dato un campione con immagini { X1, X2, …, Xn } proveniente

da una popolazione infinita su cui è definita una variabile

casuale X con distribuzione normale, media e varianza 2,

la varianza campionaria corretta divisa per 2

fornisce una variabile casuale che segue una

distribuzione C 2 con n - 1 gradi di libertà

11

1

1

2

2

2

nXX

n

S n

j

njn

Page 26: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 30 / 36

Intervalli di confidenza per la varianza campionaria corretta

12/1

22

2

2/2

an

a cS

cP

/ 2 / 2

Page 27: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 31 / 36

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza

considerando l’evento si nota che :

12/1

22

2

2/2

an

a cS

cP

2/2

22

2/12

2

2/12

2

2

2/2

a

n

a

na

na

c

S

c

Sc

Sc

da cui:

1

2/2

22

2/12

2

a

n

a

n

c

S

c

SP

Page 28: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 32 / 36

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza

indicando con A1- l’ampiezza di I1- , intervallo di confidenza

allo 1 - per la varianza:

2/12

2/2

2

2/12

2

2/2

2

1

11

aan

a

n

a

n

ccS

c

S

c

SA

2/2

2

2/12

2

1 ,a

n

a

n

c

S

c

SI

si ottiene:

1

2/2

22

2/12

2

a

n

a

n

c

S

c

SP

Page 29: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 33 / 36

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza

2/12

2/2

2

2/12

2

2/2

2

1

11

aan

a

n

a

n

ccS

c

S

c

SA

Sappiamo che Sn2 è uno stimatore

corretto e consistente della varianza

quindi, al crescere della numerosità n del campione, il suo valore si distribuisce in modo sempre più “concentrato in prossimità” di 2

Page 30: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 34 / 36

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza

E’ pertanto possibile ipotizzare che, per valori di n sufficientemente elevati, la casualità con cui viene estratto il campione non faccia variare in modo

significativo il valore della varianza campionaria Sn2.

Con queste premesse, dopo aver fissato il valore massimo accettabile per la ampiezza dell’intervallo di confidenza, si può scrivere:

2/12

2/2

2

2/12

2

2/2

2

1

11

aan

a

n

a

n

ccS

c

S

c

SA

max,12/1

22/

22

1

11

A

ccSA

aan

Page 31: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 35 / 36

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza

da cui si ottiene la:

max,12/1

22/

22

1

11

A

ccSA

aan

2

max,1

2/12

2/2

11

naa S

A

cc

2

max,1

2/2

2/12

11

naa S

A

cc

Page 32: Num 01 - 1 / 36 Lezione 9 Numerosità del campione.

Num 01 - 36 / 36

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza

il più basso valore dei gradi di libertà per cui i valori

critici della C 2 soddisfano la:

è pari a nmin - 1

2

max,1

2/2

2/12

11

naa S

A

cc

il valore di nmin non compare in modo esplicito,

ma deve essere individuato attraverso i gradi di

libertà della C 2