Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

42
Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori

Transcript of Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Page 1: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 1 / 43

Lezione 5Strumenti statistici:

campioni e stimatori

Page 2: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 2 / 43

dalla caratteristica comune di una popolazioneal suo modello probabilistico …

1,61m < h < 1,63m X = 162

1,59m < h < 1,61m X = 160

1,57m < h < 1,59m X = 158

una popolazione (distribuita in modo) normale

su cui viene definita una variabile casuale continua X

con media e varianza 2 può essere modellata mediante una

funzione di densità di probabilità fX ( x ) espressa nella forma:

2

2

1exp

2

1 xxf X

Page 3: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 3 / 43

dalla caratteristica comune di una popolazioneal suo modello probabilistico …

Page 4: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 4 / 43

Nella parte 1 ...

gli stimatoricampionari V = v ( X1, X2, …, Xn )

correttezza: VE

consistenza: 1lim

V-Vn

EP

efficienza:

2

11

2

22

21 /V-V

V-VVVEff

E

E

E

E

le strategie di campionamento:- sistematico,- stratificato,- per quote,- a grappolo

Page 5: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 5 / 43

Nella parte 2 ...

consistente: 1lim

nnn

X-X EP

La media campionaria:

n

jjn X

nX

1

1

corretto: nXE

)(xf

Page 6: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 6 / 43

22 σSE

Nella parte 2 ...

La varianza campionaria:

n

jnj XX

nS

1

22 1

corretto: 22 σnSE

La varianza campionaria corretta:

n

jnjn XX

nS

1

22

1

1

Consistente: ? 1lim 22

nnn

S-S EP ?

Page 7: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 7 / 43

parte 3 gli stimatori: “varianza campionaria corretta”

Page 8: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 8 / 43

Principali stimatori:varianza campionaria corretta Sn 2

definizione 5.8:• estraendo da una popolazione per cui è definita la variabile

casuale X un campione di n elementi a cui corrisponde

l’insieme di variabili casuali { X1, X2, …, Xn } si definisce

“varianza campionaria corretta” la quantità:

con numerosità n del campione maggiore di 1.

n

j

njn XXn

S1

22

1

1

Page 9: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 9 / 43

Principali stimatori:varianza campionaria corretta Sn 2

la “varianza campionaria corretta”

di un campione proveniente da una popolazione su cui è stata

definita la variabile casuale X è uno stimatore corretto della

varianza 2 della X per l’intera popolazione dato che:

n

j

njn XXn

S1

22

1

1

2

1

22

1

1

n

jnjn XX

nS EE

Page 10: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 10 / 43

Principali stimatori:varianza campionaria corretta Sn

2

Per verificare se la varianza campionaria corretta

possa essere considerata uno stimatore consistente della

varianza della X relativa all’intera popolazione si dovrà individuare la sua distribuzione, in modo da poter individuare il

limite per n che tende all’infinito della sua varianza.

Ricordiamo infatti che si era scritto:

11

1

1

22

nXXn

Sn

j

njn

consistenza degli stimatori campionari

1lim

V-Vn

EP

Page 11: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 11 / 43

Principali stimatori:varianza campionaria corretta Sn

2

Per ricavare la distribuzione della varianza campionaria corretta

si dovranno introdurre tre nuove distribuzioni:

- la distribuzione “Gamma”,

- la distribuzione “Chi - quadro”,

- la distribuzione “C2 modificata”.

11

1

1

22

nXXn

Sn

j

njn

Page 12: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 13 / 43

la distribuzione Gamma ( )

Page 13: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 14 / 43

Distribuzione Gamma ( )

Costruiamo una funzione della variabile X in cui compaiono

due parametri p e a cui è possibile assegnare arbitrariamente

valori reali positivi:

R,con

0se0

0seexp,,

1

p

x

xxxppxfxf

pp

XX

0

1 exp dxxxp p

in cui è stata indicata con ( p) la funzione:

Page 14: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 15 / 43

Distribuzione Gamma ( )

Page 15: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 16 / 43

Distribuzione Gamma ( )

Page 16: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 17 / 43

Distribuzione Gamma ( )

La funzione :

0

1

0

1exp0,, xdxxp

xdxdpxf pp

X

può essere presa come funzione di densità di probabilità dato che:– ha dominio in R e codominio in R + ;

– il suo integrale è unitario;

– rispetta gli assiomi di Kolmogoroff.

R,con

0se0

0seexp,,

1

p

x

xxxppxfxf

pp

XX

Page 17: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 18 / 43

Distribuzione Gamma ( )

come funzione di densità di probabilità viene chiamata

“distribuzione Gamma con parametri p e ”

R,con

0se0

0seexp,,

1

p

x

xxxppxfxf

pp

XX

0

1 exp dxxxp p

Una distribuzione per cui si possa adottare la

Page 18: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 19 / 43

Media e varianza della distribuzione Gamma

Se X è una variabile casuale che ha distribuzione Gamma con

parametri p e :

R

,con

0se0

0seexp,,

1

p

x

xxxppxfxf

pp

XX

2

vare

p

Xp

XE

si ha :

Page 19: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 20 / 43

la distribuzione “chi-quadro”

o

“distribuzione di Pearson”

Karl Pearson (1857-1936)

Page 20: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 21 / 43

0

exp,,

1 xxppxfxf

pp

XX

Distribuzione chi-quadro

La distribuzione Gamma con parametri p = n / 2 e = 1 / 2 assume un particolare interesse:

0

2exp

2

21,,

12

2 xx

npxfxf

nn

XX

0

12 exp2 dxxxnn

avendo indicato con ( n / 2 ) la funzione definita da:

R,con

0se

0se

p

x

x

Page 21: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 22 / 43

Distribuzione chi-quadro

0se0

0se2

exp2

21,

12

2

x

xx

xnnxf

nn

X

0

12 exp2 dxxxnn

come funzione di densità di probabilità viene chiamata:

distribuzione chi - quadro con n gradi di libertà

Una distribuzione per cui si possa adottare la

Page 22: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 23 / 43

0se

2exp

2

21,

12

2

x

xx

nnxf

nn

X

Distribuzione chi-quadro

Page 23: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 24 / 43

Media e varianza della distribuzione chi-quadro

Dato che la distribuzione chi-quadro con n gradi di libertà è un caso particolare della distribuzione Gamma con parametri

p = n / 2 e = 1 / 2 la sua media e la sua varianza possono essere dedotte introducendo tali valori nella espressione di media e varianza della generica Gamma :

ottenendo:

2

vare

p

Xp

XE

nn

Xnn

X 221

2vare

21

22 E

Page 24: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 25 / 43

Proprietà della distribuzione chi-quadro

teorema 5.5:

Se le variabili casuali X1, X2 … , Xn, sono indipendenti

e ciascuna ha distribuzione normale con media j e

varianza 2j con j = 1, 2, … , n, allora la variabile casuale:

2

1

2

n

j j

jjX

segue una distribuzione chi-quadro con n gradi di libertà

Page 25: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 26 / 43

2

2

11

2

n

j j

jj

n

j

j

XZ

la somma dei quadrati di n variabili casuali indipendenti, ciascuna distribuita in modo normale

standard, segue una distribuzione chi-quadro con n gradi di libertà !

Proprietà della distribuzione chi-quadro

corollario al teorema 5.5:

Se le variabili casuali X1, X2 … , Xn, sono indipendenti

e ciascuna ha una distribuzione normale

con media j e varianza 2j con j = 1, 2, … , n,

allora le variabili casuali Z1, Z2 … , Zn definite come :

j

jjj

XZ

sono indipendenti e seguono una distribuzione normale standard.

Ma allora si può anche affermare che:

Page 26: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 27 / 43

la distribuzione della variabile C2 modificata

Page 27: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 28 / 43

Distribuzione chi-quadro

Page 28: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 29 / 43

Media e varianza della distribuzione chi-quadro

Dato che la distribuzione chi-quadro con n gradi di libertà è un caso particolare della distribuzione Gamma con parametri

p = n / 2 e = 1 / 2 la sua media e la sua varianza possono essere dedotte introducendo tali valori nella espressione di media e varianza della generica Gamma :

ottenendo:

2

vare

p

Xp

XE

nn

Xnn

X 221

2vare

21

22 E

La distribuzione chi-quadro ha

media e varianza che aumentano all’aumentare di n

Page 29: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 30 / 43

La variabile C 2

Partendo da una variabile casuale 2 che segue una

distribuzione chi-quadro con n gradi di libertà, definiamo

una nuova variabile che indichiamo C 2 :

nC

χ 22

che prende il nome di

“variabile modificata di chi-quadro con n g.d.l.”

La “variabile modificata di chi-quadro” è quindi una variabile casuale che si ottiene dividendo una variabile casuale distribuita secondo una chi-quadro per il numero dei suoi gradi di libertà.

Page 30: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 31 / 43

La distribuzione della variabile C 2

Dato che la C 2, “variabile modificata di chi-quadro”, si ottiene dividendo una variabile distribuita secondo una chi-quadro per il numero dei suoi gradi di libertà, il suo valore medio e la sua varianza si possono facilmente ricavare da quelli della

corrispondente 2 :

ottenendo:

nn χχ 2vare 22 E

111 2

22

n

nnnC χχ EEE

n

nnnn

C χχ 22

1var

1varvar

22

2

22

Page 31: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 32 / 43

La distribuzione della variabile C 2

Page 32: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 33 / 43

La distribuzione della variabile C 2

La distribuzione della varianza campionaria corretta

Page 33: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 34 / 43

Distribuzione della varianza campionaria corretta

Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media e varianza 2 , un campione di n elementi a cui corrisponde

l’insieme di variabili casuali { X1, X2, …, Xn }

è facile vedere che la variabile casuale:

segue una distribuzione normale con media nulla.

nj XX

Se definiamo una nuova variabile Z :

possiamo affermare che essa segue una distribuzione normale standard.

njj

XXZ

Page 34: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 35 / 43

possiamo affermare che W segue una distribuzione

chi-quadro con n - 1 gradi di libertà in quanto

somma dei quadrati

di n -1 variabili indipendenti normali standard

( la media introduce un vincolo fra le n variabili Xi )

n

j

njn

jj

XXZW

1

2

1

2

Se ora sommiamo i quadrati delle Z1 , Z2 , … , Zn :

Distribuzione della varianza campionaria corretta

Page 35: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 36 / 43

2

2

1

nSnV

Definiamo ora una nuova variabile V :

n

j

nj

n

jnj XX

XXn

nV1

2

21

2

1

1

1

che, esplicitando Sn2, possiamo anche scrivere come:

Distribuzione della varianza campionaria corretta

Page 36: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 37 / 43

Se ricordiamo che :

possiamo notare che :

e, ricordando che W segue una distribuzione chi-quadro

possiamo affermare che anche

V segue una distribuzione chi-quadro con n - 1 gradi di libertà.

WXXS

nVn

j

njn

1

2

2

2

1

n

j

njn

jj

XXZW

1

2

1

2

Distribuzione della varianza campionaria corretta

Page 37: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 38 / 43

Definiamo infine una nuova variabile che indichiamo C 2 :

12

n

VC

che risulta essere una

“variabile modificata di chi-quadro con n - 1 gradi di libertà”

2

22

2

2

2

2

2

1

1

1

1

n

nn

S

n

Sn

C

n

VC

SnV

Distribuzione della varianza campionaria corretta

Page 38: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 39 / 43

La varianza campionaria corretta e la C 2

22

2

22 1

n

n

S

SC

E

EE

Page 39: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 40 / 43

La varianza campionaria corretta e la C 2

0varlim

1

2var

1

2varvar

2

42

2

22

nn

n

n

S

nS

n

SC

Page 40: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 41 / 43

Lo stimatore varianza campionaria corretta

• Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media e varianza 2 , un campione di n elementi a cui corrisponde

l’insieme di variabili casuali { X1, X2, …, Xn }

posto:

si ha che la varianza campionaria corretta:

– è uno stimatore corretto in quanto

– è uno stimatore consistente in quanto :

11

1

1

22

nXXn

Sn

j

njn

0varlim

1

2

22

nn

n

S

nSE

Page 41: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 42 / 43

Lo stimatore varianza campionaria corretta

• Estraendo casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in modo normale con media e varianza 2 , un campione di n elementi a cui corrisponde

l’insieme di variabili casuali { X1, X2, …, Xn }

posto:

si ha che :

– segue una distribuzione C 2 con n-1 gradi di libertà.

11

1

1

22

nXXn

Sn

j

njn

11

1

1

2

2

2

nXX

n

S n

j

njn

Page 42: Stat 03 - 1 / 43 Lezione 5 Strumenti statistici: campioni e stimatori.

Stat 03 - 43 / 43

Lo stimatore varianza campionaria corretta

• Il rapporto fra la varianza campionaria corretta dei campioni estratti casualmente da una popolazione per cui è definita la variabile casuale X, distribuita in

modo normale con media e varianza 2 , e la stessa

varianza 2 della X è una variabile casuale che

segue una distribuzione C 2 con n-1 gradi di libertà.

22

2

22 1

n

n

S

SC

E

EE

42

2

22

1

2var

1

2varvar

nS

n

SC

n

n