Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

39
Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori

Transcript of Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Page 1: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 1 / 40

Lezione 5Strumenti statistici:

campioni e stimatori

Page 2: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 2 / 40

Nella parte 1 ...

gli stimatoricampionari V = v ( X1, X2, …, Xn )

correttezza: VE

consistenza: 1lim

V-Vn

EP

efficienza:

2

11

2

22

21 /V-V

V-VVVEff

E

E

E

E

le strategie di campionamento:- sistematico,- stratificato,- per quote,- a grappolo

Page 3: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 3 / 40

parte 2 gli stimatori:

- “media campionaria”

Page 4: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 4 / 40

Richiami: statistiche e stimatori

• Si definisce “statistica” g ( X1, X2, X3, …, Xn ) una funzione di variabili casuali che non contiene parametri.

– Una statistica è a sua volta una variabile casuale.

• Si definiscono “stimatori” quelle statistiche che vengono usate per stimare un parametro o una sua funzione.

– I valori ottenuti mediante gli stimatori si dicono “stime” del parametro.

Page 5: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 5 / 40

Principali statistiche:momento campionario di ordine 1

n

j

nj

n

j

pjp

XXn

M

p

Xn

M

1

11 1

1

1

• Fra i momenti campionari riveste particolare interesse quello di

ordine 1 ( p = 1 ). E’ chiamato “media campionaria” e coincide

con la media della X per il campione: per questo motivo lo

indicheremo con per richiamare il suo significato.nX

Page 6: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 6 / 40

Proprietà della media campionaria

teorema 5.1:• estraendo da una popolazione per cui è definita la variabile

casuale X diversi campioni di n elementi a ciascuno dei quali

corrisponde un insieme di variabili casuali { X1, X2, …, Xn }

• posto:

si ha:

qualunque sia l’andamento della f (x)

e qualunque sia la distribuzione della media campionaria

n

XX nn

2

var;

E

nX

n

j

jn Xn

X1

1

Page 7: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 7 / 40

Teorema limite centrale

teorema 5.2:

• Siano X1, X2, …, Xn variabili casuali indipendenti con la

medesima distribuzione con media e varianza 2 finite.

• Detta Sn = X1 + X2 + … + Xn la variabile casuale costituita

dalla loro somma,

• allora la corrispondente variabile standardizzata

• è asintoticamente normale dato che:

n

nSn

uu

bn

nSa

b

a

n

nd

2exp

2

1lim

2

P

Page 8: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 8 / 40

Variabile standardizzata

• da una variabile casuale X con media e varianza 2 finita si ricava la corrispondente variabile standardizzata

Xstandardizzata

– sottraendo ad X la sua media – dividendo la differenza X - per il valore della

“deviazione standard” ( radice quadrata positiva della varianza )

X

X zatastandardiz

Page 9: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 9 / 40

Teorema limite centrale

teorema 5.2:

• Siano X1, X2, …, Xn variabili casuali indipendenti con la

medesima distribuzione con media e varianza 2 finite.

• Detta Sn = X1 + X2 + … + Xn la variabile casuale costituita

dalla loro somma,

• allora la corrispondente variabile standardizzata

• è asintoticamente normale dato che:

n

nSn

uu

bn

nSa

b

a

n

nd

2exp

2

1lim

2

P

Page 10: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 10 / 40

Proprietà della media campionaria

• Se dividiamo sia il numeratore sia il denominatore

della

per n otteniamo:

n

nSn

ricordando poi che:

Sn = X1 + X2 + … + Xn

otteniamo:

nn

nS

n

nSn

n

Page 11: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 11 / 40

Proprietà della media campionaria

n

Xn

n

nn

S

n

nS

n

j

jn

n

1

1

Sn = X1 + X2 + … + Xn

n

Xn

n

jj

1

1Con cui si può affermare che

è asintoticamente normale.

Page 12: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 12 / 40

Proprietà della media campionaria

• se X1, X2, …, Xn anziché variabili casuali indipendenti

definite per popolazioni diverse, ancorché con la medesima distribuzione e con

media e varianza 2 finite,sono variabili casuali indipendenti definite per la stessa popolazione (con media

e varianza 2 finita) che corrispondono ad un campione di n elementi

• allora possiamo scrivere anche:

n

X

n

Xn

n

nS n

n

j

j

n

1

1

Page 13: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 13 / 40

Proprietà della media campionaria

• questo ci permette di affermare che anche la variabile (standardizzata)

è asintoticamente normale dato che è possibile scrivere:

n

X n

u

ub

n

nSa

n

nS

n

X

b

a

n

n

nn

d2

exp2

1lim

2

P

Page 14: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 14 / 40

Proprietà della media campionaria

Variabile standardizzata:si era scritto che:

• da una variabile casuale X con media e varianza 2 finita si ricava la corrispondente variabile standardizzata

Xstandardizzata

– sottraendo ad X la media – dividendo la differenza X - per il valore della

“deviazione standard” , ( radice quadrata positiva della varianza )

X

X zatastandardiz

Page 15: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 15 / 40

Proprietà della media campionaria

dato che la variabile standardizzata

è asintoticamente normale si può affermare che, per n che tende all’infinito, la variabile casuale

ha distribuzione normale,

X

X zatastandardiz

n

X n

n

j

jn Xn

X1

1

n

XX nn

2

var;

E

Page 16: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 16 / 40

Distribuzione della media campionaria

teorema 5.3:• Sia data una popolazione infinita per cui è stata definita la

variabile casuale X avente densità f (x) , media finita e varianza 2 finita.

• Detta: la media della X per un campione casuale di

dimensione n estratto da essa,

• allora, al tendere di n ad infinito,

la media campionaria

- segue una distribuzione normale

- con media e varianza 2 / n .

nX

n

j

jn Xn

X1

1

Page 17: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 17 / 40

considerazioni

• Il teorema 5.3 non fa alcuna considerazione sulla distribuzione

della X, ma richiede solamente che media e varianza 2 siano finite.

• La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che:– quanto più il campione è numeroso,– tanto meglio la distribuzione della media campionaria

approssima una distribuzione normale con media e

varianza 2 / n.

Page 18: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 18 / 40

Distribuzione della media campionaria

n

j

jn Xn

X1

1

)(xf

Page 19: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 19 / 40

Proprietà della media campionaria

conseguenze 1) e 2) del teorema 5.3 enunciato:

1) la distribuzione della media campionaria ha media coincidente

con la media della X relativa alla popolazione da cui proviene il campione

pertanto

la media campionaria è uno stimatore corretto

della media della X per l’intera popolazione.

nXE

Page 20: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 20 / 40

Proprietà della media campionaria

conseguenze 1) e 2) del teorema 5.3 enunciato:

2) nel caso di popolazioni infinite o di campionamento con ripetizione la distribuzione della media campionaria ha una varianza che, risultando inversamente proporzionale al numero degli elementi che costituiscono il campione,

tende a 0 per n che tende all’infinito

pertanto

la media campionaria è uno stimatore consistente

della media della X per l’intera popolazione.

n

X n

2

var

Page 21: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 21 / 40

Proprietà della media campionaria

corollario:

la distribuzione della media campionaria presenta una dispersione attorno al proprio valore medio che, espressa in termini di “deviazione standard ”, risulta inversamente proporzionale alla radice quadrata del numero degli elementi che costituiscono il campione.

Possiamo anche notare che ad un aumento di quattro volte della dimensione del campione corrisponde solamente un dimezzamento della deviazione standard della nuova distribuzione della media campionaria.

n

X n

2

var

Page 22: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 22 / 40

Proprietà della media campionaria

teorema 5.4:• dato un campione di n elementi prelevato senza ripetizione da una

popolazione composta da N elementi per cui è definita la variabile casuale X, posto:

• si ha:

1

var2

N

nN

nX n

n

j

jn Xn

X1

1

80,01100

500;99,0

1100

10000

N

nNn

N

N

nNn

N

Page 23: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 23 / 40

Distribuzione della media campionaria

Avevamo affermato che:• estraendo da una popolazione per cui è definita la variabile

casuale X diversi campioni di n elementi a ciascuno dei quali corrisponde un insieme di variabili casuali { X1, X2, …, Xn }

posto:

al tendere di n ad infinito si ha:

qualunque sia l’andamento della f (x) e qualunque sia la distribuzione della media campionaria .

• Ma qual è la distribuzione della media campionaria ?

n

XX nn

2

var;

E

nX

n

j

jn Xn

X1

1

Page 24: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 24 / 40

Distribuzione della media campionaria

“… allora, al tendere di n ad infinito, la media campionaria segue una distribuzione normale

con media e varianza 2 / n …” :

2

σ

μ

2

1exp

σπ2

1

X

X

X

X

xxf

2

2

1exp

2

1

n

X

n

Xf nn

distribuzione normale

Page 25: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 25 / 40

gli stimatori:- “varianza campionaria”

Page 26: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 26 / 40

Principali statistiche: momento campionario rispetto a .nX

2

1

2

2

1SXX

nM

n

j

nj

nX

• Il momento campionario di ordine 2 rispetto a definisce la varianza campionaria S

2,

il cui valore coincide con la varianza della X nel campione:

definizione 5.3:• estraendo da una popolazione per cui è definita la variabile

casuale X un campione di n elementi a cui corrisponde

l’insieme di variabili casuali { X1, X2, …, Xn } si chiama

“momento campionario di ordine p rispetto a ” la statistica:

nX

n

j

p

njp XXn

M1

1

Page 27: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 27 / 40

Varianza campionaria S 2

La varianza campionaria S 2 può essere usata come stimatore

della varianza 2 della X relativa all’intera popolazione?

n

j

nj XXn

S1

22 1

N

j

XjxN

1

22 1?correttezza degli

stimatori campionari VE

consistenza degli stimatori campionari

1lim

V-Vn

EP

Page 28: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 28 / 40

La dimostrazione di tale affermazione ci consentirà di individuare

uno stimatore campionario corretto della varianza 2.

Varianza campionaria S 2

E’ possibile dimostrare che

pertanto la varianza campionaria S 2 non è uno stimatore corretto

della varianza della X relativa all’intera popolazione!!!

22 SE

Page 29: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 29 / 40

2222 nnjjnj XXXXXX

Varianza campionaria S 2

dimostrazione:

22 SE

2222 njnjnj XXXXXX

μμμμ

1

1

22

njnjnj

n

jnj

XXXXXX

XXn

S

se scriviamo:

allora:

Page 30: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 30 / 40

da cui si ricava, passando alle sommatorie:

Varianza campionaria S 2

2222 njnjnj XXXXXX

n

j

n

j

njn

n

j

j

n

j

nj

XXX

XXX

1 1

2

1

2

1

2

2

Page 31: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 31 / 40

Varianza campionaria S 2

n

j

n

jnjn

n

jj

n

jnj

XXX

XXX

1 1

2

1

2

1

2

2

n

jnn

n

jj

n

jnj

XXn

XXX

1

22

1

2

1

2

2

da cui:

n

n

j

j XnX1

notiamo che:

Page 32: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 32 / 40

Varianza campionaria S 2

2

1

2

n

n

jn XnX

notiamo poi che:

n

jnn

n

jj

n

jnj

XXn

XXX

1

22

1

2

1

2

2

da cui:

2

1

2

1

2

n

n

j

j

n

j

nj XnXXX

Page 33: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 33 / 40

Dividendo ambo i membri per n si può scrivere:

Varianza campionaria S 2

2

1

2

1

2

n

n

j

j

n

j

nj XnXXX

2

1

2

1

2 11

n

n

jj

n

jnj X

n

nX

nXX

n

e, passando ai valori medi in ambo i membri:

2

1

2

1

2 11

n

n

jj

n

jnj XX

nXX

nEEE

Page 34: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 34 / 40

Varianza campionaria S 2

2

1

2

1

2 11

n

n

jj

n

jnj XX

nXX

nEEE

la variabile casuale X ha media e varianza 2 pertanto, per n che tende all’infinito, si può scrivere:

2

1

2 var1

XXn

n

jj

2

1

21

n

jjX

nE

da cui:

22

1

21

n

n

jnj XXX

nEE

Page 35: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 35 / 40

Varianza campionaria S 2

22

1

21

n

n

jnj XXX

nEE

per n che tende all’infinito, la variabile casuale media campionaria

ha distribuzione normale,

n

j

jn Xn

X1

1

nXX nn

2

var;

E

pertanto:

n

Xn

Xn

jnn

2

1

22 1

E

nXX

n

n

jnj

22

1

21E

Page 36: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 36 / 40

Varianza campionaria S 2

raccogliendo al secondo membro, si ottiene:

nXX

n

n

jnj

22

1

21E

2

1

2 11

n

nXX

n

n

jnjE

da cui si conclude che:

2

1

21

n

jnj XX

nE

Page 37: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 37 / 40

Varianza campionaria S 2

E’ stato possibile dimostrare che

pertanto la varianza campionaria S 2 non è uno stimatore corretto

della varianza 2 !!!

22 SE

Come stimatore della varianza 2 si può usare la “varianza campionaria corretta” Sn

2

che, come ora è facile mostrare, è uno stimatore corretto.

22

2

11S

n

nM

n

nSn

Page 38: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 38 / 40

Nel caso della varianza campionaria S 2 si era concluso che:

Varianza campionaria corretta Sn 2

è sufficiente moltiplicare ambo i membri per n / ( n -1 ) per ottenere:

2

1

2 11

n

nXX

n

n

j

njE

2

1

2 1

1

1

1

n

n

n

nXX

nn

n n

j

njE

22

1

2

1

1

n

n

j

nj SXXn

EE

da cui:

Page 39: Stat 02 - 1 / 40 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 02 - 39 / 40

La prossima volta…

Lo stimatore “varianza campionaria corretta” e la sua distribuzione