TEST D’IPOTESI SULLA MEDIA -...

49
TEST D’IPOTESI SULLA MEDIA 1 / 26

Transcript of TEST D’IPOTESI SULLA MEDIA -...

TEST D’IPOTESI SULLA MEDIA

1 / 26

Test: media

2 / 26

Test: media

3 / 26

Test: mediaCostruiamo ora il test d’ipotesi per la media di una popolazione.

• Consideriamo una variabile quantitativa;

• I dati sono ottenuti con un’estrazione casuale;

• La distribuzione nella popolazione è approssimativamentenormale. Questo assunto è particolarmente importantequando n è piccolo e l’ipotesi alternativa Ha èunidirezionale.

Le ipotesi considerate per la media saranno unilaterali o bilater-ali, ossia{

H0 : µ = µ0

Ha : µ 6= µ0oppure

{H0 : µ = µ0

Ha : µ > µ0 o µ < µ0

dove µ0 indica il particolare valore ipotizzato.

4 / 26

Test: mediaCostruiamo ora il test d’ipotesi per la media di una popolazione.

• Consideriamo una variabile quantitativa;

• I dati sono ottenuti con un’estrazione casuale;

• La distribuzione nella popolazione è approssimativamentenormale. Questo assunto è particolarmente importantequando n è piccolo e l’ipotesi alternativa Ha èunidirezionale.

Le ipotesi considerate per la media saranno unilaterali o bilater-ali, ossia{

H0 : µ = µ0

Ha : µ 6= µ0oppure

{H0 : µ = µ0

Ha : µ > µ0 o µ < µ0

dove µ0 indica il particolare valore ipotizzato.

4 / 26

Test: mediaCostruiamo ora il test d’ipotesi per la media di una popolazione.

• Consideriamo una variabile quantitativa;

• I dati sono ottenuti con un’estrazione casuale;

• La distribuzione nella popolazione è approssimativamentenormale. Questo assunto è particolarmente importantequando n è piccolo e l’ipotesi alternativa Ha èunidirezionale.

Le ipotesi considerate per la media saranno unilaterali o bilater-ali, ossia{

H0 : µ = µ0

Ha : µ 6= µ0oppure

{H0 : µ = µ0

Ha : µ > µ0 o µ < µ0

dove µ0 indica il particolare valore ipotizzato.

4 / 26

Test: mediaCostruiamo ora il test d’ipotesi per la media di una popolazione.

• Consideriamo una variabile quantitativa;

• I dati sono ottenuti con un’estrazione casuale;

• La distribuzione nella popolazione è approssimativamentenormale. Questo assunto è particolarmente importantequando n è piccolo e l’ipotesi alternativa Ha èunidirezionale.

Le ipotesi considerate per la media saranno unilaterali o bilater-ali, ossia{

H0 : µ = µ0

Ha : µ 6= µ0oppure

{H0 : µ = µ0

Ha : µ > µ0 o µ < µ0

dove µ0 indica il particolare valore ipotizzato.

4 / 26

Test: mediaCostruiamo ora il test d’ipotesi per la media di una popolazione.

• Consideriamo una variabile quantitativa;

• I dati sono ottenuti con un’estrazione casuale;

• La distribuzione nella popolazione è approssimativamentenormale. Questo assunto è particolarmente importantequando n è piccolo e l’ipotesi alternativa Ha èunidirezionale.

Le ipotesi considerate per la media saranno unilaterali o bilater-ali, ossia{

H0 : µ = µ0

Ha : µ 6= µ0oppure

{H0 : µ = µ0

Ha : µ > µ0 o µ < µ0

dove µ0 indica il particolare valore ipotizzato.4 / 26

Test: medie

La statistica test misura quanto lontano la media campionaria x̄cade rispetto al valore µ0 specificato nell’ipotesi nulla.

Nello specificare la statistica dobbiamo considerare le due situ-azioni seguenti:

σ noto;

σ incognito.

5 / 26

Test: medie

La statistica test misura quanto lontano la media campionaria x̄cade rispetto al valore µ0 specificato nell’ipotesi nulla.

Nello specificare la statistica dobbiamo considerare le due situ-azioni seguenti:

σ noto;

σ incognito.

5 / 26

Test: medie

La statistica test misura quanto lontano la media campionaria x̄cade rispetto al valore µ0 specificato nell’ipotesi nulla.

Nello specificare la statistica dobbiamo considerare le due situ-azioni seguenti:

σ noto;

σ incognito.

5 / 26

Test: medie

La statistica test misura quanto lontano la media campionaria x̄cade rispetto al valore µ0 specificato nell’ipotesi nulla.

Nello specificare la statistica dobbiamo considerare le due situ-azioni seguenti:

σ noto;

σ incognito.

5 / 26

Test: medie σ noto

Se σ è noto allora la statistica utilizzata è quella definita apartire dall’approssimazione normale della distribuzione diX̄:

Z =X̄−µ0

σ√n

6 / 26

Test: media σ noto

Considerata la statistica

Z =X̄−µ0

σ√n

definiamo che per il test sulle medie bilaterale:{H0 : µ = µ0

Ha : µ 6= µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se z =x̄−µ0

σ√n

<−z α

2o z =

x̄−µ0σ√

n> z α

2

7 / 26

Test: media σ noto

Considerata la statistica

Z =X̄−µ0

σ√n

definiamo che per il test sulle medie bilaterale:{H0 : µ = µ0

Ha : µ 6= µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se z =x̄−µ0

σ√n

<−z α

2o z =

x̄−µ0σ√

n> z α

2

7 / 26

Test: media σ noto

Considerata la statistica

Z =X̄−µ0

σ√n

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ = µ0

Ha : µ > µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se z =x̄−µ0

σ√n

> zα

8 / 26

Test: media σ noto

Considerata la statistica

Z =X̄−µ0

σ√n

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ = µ0

Ha : µ > µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se z =x̄−µ0

σ√n

> zα

8 / 26

Test: media σ noto

Considerata la statistica

Z =X̄−µ0

σ√n

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ = µ0

Ha : µ < µ0

fissato un livellodi significatività α, la regola di decisione è:

Rifiutare H0 se z =x̄−µ0

σ√n

<−zα

9 / 26

Test: media σ noto

Considerata la statistica

Z =X̄−µ0

σ√n

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ = µ0

Ha : µ < µ0

fissato un livellodi significatività α, la regola di decisione è:

Rifiutare H0 se z =x̄−µ0

σ√n

<−zα

9 / 26

Test: media

Verificare l’ipotesi che in un lotto della valle di Lanaitto il numeromedio di fichi d’india che arrivano a fioritura sia 3 con σ = 0.8ad un livello di significatività del 5%. Supponiamo che si fac-ciano delle rilevazioni su un campione di 100 alberi e che si siaosservato x̄ = 2.84.

Specifichiamo le ipotesi:{H0 : µ = µ0 = 3Ha : µ 6= 3

10 / 26

Test: media

Verificare l’ipotesi che in un lotto della valle di Lanaitto il numeromedio di fichi d’india che arrivano a fioritura sia 3 con σ = 0.8ad un livello di significatività del 5%. Supponiamo che si fac-ciano delle rilevazioni su un campione di 100 alberi e che si siaosservato x̄ = 2.84.

Specifichiamo le ipotesi:{H0 : µ = µ0 = 3Ha : µ 6= 3

10 / 26

Test: media

11 / 26

Test: media

Siccome z = −2 < −1.96, rifiutiamo l’ipotesi nulla e concludi-amo che ci sono sufficienze evidenti che il numero medio di fichid’india che possono fiorire non sia uguale a 3.

12 / 26

Test: media

13 / 26

Test: media

14 / 26

Test: medie σ incognito

Se σ è incognito allora la statistica utilizzata è quella definitaa partire dall’approssimazione della distribuzione di unavariabile normale con deviazione standard incognita :

T =X̄−µ0

sedove se =

S√n

sappiamo che T segue allora una distribuzione t di Studentcon n−1 gradi di liberta.

15 / 26

Test: media σ incognito

Considerata la statistica

T =X̄−µ0

S√n

definiamo che per il test sulle medie bilaterale:{H0 : µ = µ0

Ha : µ 6= µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se t =x̄−µ0

s√n

<−t( α

2 ,n−1) o t =x̄−µ0

s√n

> t( α

2 ,n−1)

16 / 26

Test: media σ incognito

Considerata la statistica

T =X̄−µ0

S√n

definiamo che per il test sulle medie bilaterale:{H0 : µ = µ0

Ha : µ 6= µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se t =x̄−µ0

s√n

<−t( α

2 ,n−1) o t =x̄−µ0

s√n

> t( α

2 ,n−1)

16 / 26

Test: media σ incognito

Considerata la statistica

T =X̄−µ0

S√n

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ = µ0

Ha : µ > µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se t =x̄−µ0

σ√n

> t(α,n−1)

17 / 26

Test: media σ incognito

Considerata la statistica

T =X̄−µ0

S√n

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ = µ0

Ha : µ > µ0

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se t =x̄−µ0

σ√n

> t(α,n−1)

17 / 26

Test: media σ incognito

Considerata la statistica

T =X̄−µ0

S√n

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ = µ0

Ha : µ < µ0

fissato un livellodi significatività α, la regola di decisione é:

Rifiutare H0 se t =x̄−µ0

s√n

<−t(α,n−1)

18 / 26

Test: media

Il test per la media con σ incognito è più comunemente notocome t test.

Se le assunzioni di normalità sono violate esistono dei test alter-nativi, non parametrici, che non presuppongono alcuna assun-zione sulla distribuzione dei dati.

In generale per piccoli campioni anche se la normalità non èrispettata il test è abbastanza robusto quando si verificano ipotesibilaterali .Quando le ipotesi sono unilaterali, ossia il test é a una sola coda,il test non funziona bene per campioni piccoli.

E’ buona abitudine controllare in tutti casi la forma della dis-tribuzione del campione.

19 / 26

Test: media

Il test per la media con σ incognito è più comunemente notocome t test.

Se le assunzioni di normalità sono violate esistono dei test alter-nativi, non parametrici, che non presuppongono alcuna assun-zione sulla distribuzione dei dati.

In generale per piccoli campioni anche se la normalità non èrispettata il test è abbastanza robusto quando si verificano ipotesibilaterali .Quando le ipotesi sono unilaterali, ossia il test é a una sola coda,il test non funziona bene per campioni piccoli.

E’ buona abitudine controllare in tutti casi la forma della dis-tribuzione del campione.

19 / 26

Test: media

Il test per la media con σ incognito è più comunemente notocome t test.

Se le assunzioni di normalità sono violate esistono dei test alter-nativi, non parametrici, che non presuppongono alcuna assun-zione sulla distribuzione dei dati.

In generale per piccoli campioni anche se la normalità non èrispettata il test è abbastanza robusto quando si verificano ipotesibilaterali .

Quando le ipotesi sono unilaterali, ossia il test é a una sola coda,il test non funziona bene per campioni piccoli.

E’ buona abitudine controllare in tutti casi la forma della dis-tribuzione del campione.

19 / 26

Test: media

Il test per la media con σ incognito è più comunemente notocome t test.

Se le assunzioni di normalità sono violate esistono dei test alter-nativi, non parametrici, che non presuppongono alcuna assun-zione sulla distribuzione dei dati.

In generale per piccoli campioni anche se la normalità non èrispettata il test è abbastanza robusto quando si verificano ipotesibilaterali .Quando le ipotesi sono unilaterali, ossia il test é a una sola coda,il test non funziona bene per campioni piccoli.

E’ buona abitudine controllare in tutti casi la forma della dis-tribuzione del campione.

19 / 26

Test: media

Il test per la media con σ incognito è più comunemente notocome t test.

Se le assunzioni di normalità sono violate esistono dei test alter-nativi, non parametrici, che non presuppongono alcuna assun-zione sulla distribuzione dei dati.

In generale per piccoli campioni anche se la normalità non èrispettata il test è abbastanza robusto quando si verificano ipotesibilaterali .Quando le ipotesi sono unilaterali, ossia il test é a una sola coda,il test non funziona bene per campioni piccoli.

E’ buona abitudine controllare in tutti casi la forma della dis-tribuzione del campione.

19 / 26

Test: media

Si vuole verificare se il costo medio di una camera di hotel per2 nel parco di Yellowstone sia pari a 168 $. Per un campionecasuale di 25 hotel è stato determinato che x̄ = 172.50 $ e s =15.40 $. Verificare l’ipotesi ad un livelloα = 0.05. Assumiamoche la popolazione abbia distribuzione normale.

Le ipotesi del test sono:{H0 : µ = µ0 = 168Ha : µ 6= 168

20 / 26

Test: media

Si vuole verificare se il costo medio di una camera di hotel per2 nel parco di Yellowstone sia pari a 168 $. Per un campionecasuale di 25 hotel è stato determinato che x̄ = 172.50 $ e s =15.40 $. Verificare l’ipotesi ad un livelloα = 0.05. Assumiamoche la popolazione abbia distribuzione normale.

Le ipotesi del test sono:{H0 : µ = µ0 = 168Ha : µ 6= 168

20 / 26

Test: media

21 / 26

Test: media

Proviamo a calcolare il p-value. Dobbiamo considerare le dueprobabilità sulle code esterne al valore critico calcolato con 24gradi di libertà preso con entrambi i segni

P(t <−1.46)+P(t > 1.46) = 0.078+0.078 = 0.15

ma 0.15 > α = 0.05 e quindi concludiamo che non possiamo rifi-utare l’ipotesi nulla.

22 / 26

Test: mediaSupponiamo che, in un lotto, le misure del diametro (dbh) dellepiante siano distribuite normalmente con deviazione standard1.6 cm. Si può assumere che il valoro medio del diametro perla popolazione di piante sia 14 cm, se la media campionaria suun campione di 16 misurazioni risulta pari a 12.6 cm? Usareα = 0.01.

Specifichiamo le ipotesi del test:{H0 : µ = µ0 = 14Ha : µ 6= 14

Poichè conosciamo σ della popolazione possiamo usare la sta-tistica Z con distribuzione normale standard.Dal testo sappiamo

n = 16, x̄ = 12.6, σ = 1.6,σ√

n=

1.6√16

= 0.4

23 / 26

Test: mediaSupponiamo che, in un lotto, le misure del diametro (dbh) dellepiante siano distribuite normalmente con deviazione standard1.6 cm. Si può assumere che il valoro medio del diametro perla popolazione di piante sia 14 cm, se la media campionaria suun campione di 16 misurazioni risulta pari a 12.6 cm? Usareα = 0.01.Specifichiamo le ipotesi del test:{

H0 : µ = µ0 = 14Ha : µ 6= 14

Poichè conosciamo σ della popolazione possiamo usare la sta-tistica Z con distribuzione normale standard.Dal testo sappiamo

n = 16, x̄ = 12.6, σ = 1.6,σ√

n=

1.6√16

= 0.4

23 / 26

Test: mediaSupponiamo che, in un lotto, le misure del diametro (dbh) dellepiante siano distribuite normalmente con deviazione standard1.6 cm. Si può assumere che il valoro medio del diametro perla popolazione di piante sia 14 cm, se la media campionaria suun campione di 16 misurazioni risulta pari a 12.6 cm? Usareα = 0.01.Specifichiamo le ipotesi del test:{

H0 : µ = µ0 = 14Ha : µ 6= 14

Poichè conosciamo σ della popolazione possiamo usare la sta-tistica Z con distribuzione normale standard.Dal testo sappiamo

n = 16, x̄ = 12.6, σ = 1.6,σ√

n=

1.6√16

= 0.4

23 / 26

Test: media

Calcoliamo il valore della statistica sui dati:

z =x̄−µ0

σ√n

=12.6−14

0.4=−3.5

dobbiamo ora confrontarci col valore critico del test z calcolatoper α = 0.01 con ipotesi bilaterali. Sappiamo che in questo casoz α

2= z0.005 = 2.58.

Applicando la regola di decisione osserviamo che: z = −3.5 <−2.58=−z0.005, rifiutiamo allora H0 con una significatività dell’1%.Concludiamo che ci sono sufficienze evidenti che il diametrodelle piante del lotto non sia uguale a 14 cm.

24 / 26

Test: media

Calcoliamo il valore della statistica sui dati:

z =x̄−µ0

σ√n

=12.6−14

0.4=−3.5

dobbiamo ora confrontarci col valore critico del test z calcolatoper α = 0.01 con ipotesi bilaterali. Sappiamo che in questo casoz α

2= z0.005 = 2.58.

Applicando la regola di decisione osserviamo che: z = −3.5 <−2.58=−z0.005, rifiutiamo allora H0 con una significatività dell’1%.Concludiamo che ci sono sufficienze evidenti che il diametrodelle piante del lotto non sia uguale a 14 cm.

24 / 26

Test: mediaSupponiamo che nell’esempio precedente la deviazione stan-dard non fosse nota ma stimata pari a 2.09 dal campione di 16piante osservate. Si può assumere che il valor medio del di-ametro per la popolazione di piante sia 14 cm, se la media cam-pionaria su un campione di 16 misurazioni risulta pari a 12.6cm? Usare α = 0.01.

Specifichiamo le ipotesi del test:{H0 : µ = µ0 = 14Ha : µ 6= 14

Poichè stavolta non conosciamo σ della popolazione dobbiamousare la statistica T con distribuzione t-Student.Dal testo sappiamo

n = 16, x̄ = 12.6, s = 2.09,s√n=

2.09√16

= 0.5225

25 / 26

Test: mediaSupponiamo che nell’esempio precedente la deviazione stan-dard non fosse nota ma stimata pari a 2.09 dal campione di 16piante osservate. Si può assumere che il valor medio del di-ametro per la popolazione di piante sia 14 cm, se la media cam-pionaria su un campione di 16 misurazioni risulta pari a 12.6cm? Usare α = 0.01.Specifichiamo le ipotesi del test:{

H0 : µ = µ0 = 14Ha : µ 6= 14

Poichè stavolta non conosciamo σ della popolazione dobbiamousare la statistica T con distribuzione t-Student.Dal testo sappiamo

n = 16, x̄ = 12.6, s = 2.09,s√n=

2.09√16

= 0.5225

25 / 26

Test: media

Calcoliamo il valore della statistica sui dati:

t =x̄−µ0

s√n

=12.6−14

0.5225=−2.68

dobbiamo ora confrontarci col valore critico del test t calcolatoper α = 0.01 con ipotesi bilaterali. Ricordiamo che la distribuzionet-Student ha come parametro i gradi di libertà. In questo casopoichè n= 16 allora df = 16−1= 15. Dalle tabelle della t-Studentricaviamo che t( α

2 ,15) = t(0.005,15) = 2.947.

Applicando la regola di decisione osserviamo che: t = −2.68 <−2.947=−t0.005,15, rifiutiamo allora H0 con una significatività dell’1%.Concludiamo che ci sono sufficienze evidenti che il diametrodelle piante del lotto non sia uguale a 14 cm anche in questocaso.

26 / 26

Test: media

Calcoliamo il valore della statistica sui dati:

t =x̄−µ0

s√n

=12.6−14

0.5225=−2.68

dobbiamo ora confrontarci col valore critico del test t calcolatoper α = 0.01 con ipotesi bilaterali. Ricordiamo che la distribuzionet-Student ha come parametro i gradi di libertà. In questo casopoichè n= 16 allora df = 16−1= 15. Dalle tabelle della t-Studentricaviamo che t( α

2 ,15) = t(0.005,15) = 2.947.

Applicando la regola di decisione osserviamo che: t = −2.68 <−2.947=−t0.005,15, rifiutiamo allora H0 con una significatività dell’1%.Concludiamo che ci sono sufficienze evidenti che il diametrodelle piante del lotto non sia uguale a 14 cm anche in questocaso.

26 / 26