Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a...

Il test consiste nel formulare una ipotesi (ipotesi

nulla) e nel verificare se con i dati a disposizione è

possibile rifiutarla o no.

L’ipotesi che viene formulata è l’ipotesi nulla (Ho) e

rappresenta di solito lo stato di fatto

Se il campione fornisce risultati fortemente in

contrasto con Ho, questa viene rifiutata a favore

dell’ipotesi alternativa (H1).

Test delle ipotesi

Test della media di una popolazione

Eseguiamo il test H0:=0

Ipotesi nulla (H0): la media della popolazione da cui abbiamo

estratto il campione è = 0

Ipotesi alternativa (H1): la media della popolazione è 0

Verifichiamo quindi se la deviazione della media campionaria

da 0 è compatibile con l’ipotesi nulla.

Confrontando la media del campione con 0

Test delle ipotesi

Usando una distribuzione campionaria identifichiamo un range di valori che hanno bassa probabilità di accadere se l’ipotesi nulla è vera.

Questo range di valori costituisce la cosiddetta regione critica o regione di rifiuto dell’ipotesi nulla.

Dalla distribuzione campionaria della statistica posso conoscere le probabilità di ottenere determinati valori, e sulla base di queste definire la regione di rifiuto.

Ho: = o

H1: o

ESEMPIO test media di una popolazione

);( 0 xN

);( 0n

N

Popolazione: );( 0 N

Medie campionarie:

x

Distribuzione delle medie campionarie

Verifico l’ipotesi che o= 10 in una popolazione con = 6

estraendo a caso un campione di n = 9.

nx

Con:

);10( xN

10


Popolazione: );10( N

Medie campionarie:

La regione di rifiuto ha probabilità (livello di significatività)

È la probabilità di rifiutare H0 quando H0 è vera

);10( xN

Ho: =10

H1: 10

Se = 0,05

Rifiuto H0 se la media campionaria è al di fuori dei limiti 0 1.96 (/n)

x

10


)2;10(N

Ho: = 10

H1: 10 )2;10(N

Popolazione: )6;10(N

Medie campionarie:

Distribuzione delle medie campionarie

(sono noti =6 e n=9)

x

Ho: =10

H1: 10

10


Se = 0,05

Rifiuto H0 se la media campionaria è al di fuori dei limiti 0 1.96 (/n)

Quindi:

10 1.96·2

)2;10(N

6,08

13,92

6,08 13,92 x

1. Specificare Ho, H1 ed un livello

2. Definire una statistica per il test (statistica di cui sia definibile la distribuzione campionaria) e la zona di rifiuto per Ho (valori della statistica di probabilità< quando Ho è vera).

3. Eseguire il campionamento (o l’esperimento) e calcolare la statistica.

4. Se la statistica calcolata cade nella zona di rifiuto decido di rifiutare Ho, altrimenti decido di non rifiutare Ho.

Esempio di fasi da seguire per un test delle ipotesi

4. Rifiuto l’ipotesi nulla se z >1.96. In questo modo si ha una probabilità di rifiuto di 0.05 quando H0 è vera (e quindi una probabilità di errore di 0,05).

1. Esempio. Ho: = 10 ; H1: 10; livello = 0,05

2. La statistica è z. Poiché P(z >1.96)=0,05, la zona di rifiuto è z< -1,96 o z>1,96 ovvero z >1.96 (test a 2 code)

3. Calcolo la media campionaria e la converto nella variabile standardizzata:

x

xz

Test della media di una popolazione

3. Calcolo la probabilità p di ottenere il valore di z calcolato: P(Z< -z) + P(Z>z) ovvero P(Z > z ) (test a 2 code)

In alternativa si può riportare direttamente il valore della probabilità p di commettere l’errore di I specie (livello di significatività osservato).

Il p value è una misura di quanto i dati sono in disaccordo con Ho.

Posso procedere come segue:

1. Definisco Ho: = 10 ; H1: 10

2.Calcolo la media campionaria e la converto nella variabile standardizzata:

x

xz

Test della media di una popolazione con p value

Significatività e potenza del test

H0 vera H0 falsa

H0 veraGIUSTO P = 1-

livello di protezione

ERRORE II specie P =

H0 falsa

ERRORE di I specie P =

livello di significatività

GIUSTO P= 1-

potenzaco

nc

lus

ion

e

verità

10

Ho: =10

H1: 10

SIGNIFICATIVITÀ E POTENZA DEL TEST

);( 0n

N

1-

/2 /2

1-

A parità di n (numerosità campionaria) se diminuisco la probabilità dell’errore di I specie () aumento la probabilità dell’errore di II specie (). Diminuisce la potenza del test (1-).

Test a una o due code

Se siamo interessati a rifiutare Ho solo se la differenza è in un senso o nell’altro, eseguiamo il test ad una coda, o test unilaterale.

L’ipotesi alternativa sarà H1: > o ovvero H1: < o

Il vantaggio è che la potenza del test aumenta andando verso H1 ma è praticamente 0 dall’altra parte.

1- 1-

Se non è noto si utilizza la sua stima s e la relativa stima dell’errore standard:

La statistica da usare per il test è t con (n-1) gradi di libertà (GL).

n

ssx

Test della media di una popolazione ( ignoto)

xs

xt

- Rifiuto l’ipotesi nulla se t > t, (n-1)

- Ovvero calcolo la probabilità p di trovare t

Test della media di una popolazione ( ignoto)

- Rifiuto l’ipotesi nulla se t > t, (n-1)

- Ovvero calcolo la probabilità p di trovare il t calcolato sotto ipotesi nulla

L’ipotesi è sempre Ho: = o contro H1: o

xs

xt

Calcolo t:

In pratica per il test al livello di significatività del 5%:

Esempio test della media di una popolazione ( ignoto)

Si afferma che con l’applicazione di una certa dieta

dimagrante si perdono 3 kg in un mese.

Vengono sottoposte a dieta 64 persone e dopo un mese

si verificano i risultati:

perdita di peso media = 2,6 kg

deviazione standard del campione: 1,2 kg

Al livello = 0.05, il campione è significativamente

diverso dall’atteso?

SoluzioneLe ipotesi sono:H0: = 3H1: 3

667,215,0

36,2

xs

xt

6,2x 15,0n

ssx

998,163;05,0 t

- P(t >2,667) = 0,0097

Rifiuto l’ipotesi nulla. Il metodo non funziona come promesso

(test a due code)

- Rifiuto Ho se t >

Esempio test della media di una popolazione ( ignoto)

Un acquirente è interessato all’acquisto di grosse partite di formaggio provenienti dagli alpeggi, ma richiede che le forme siano di peso mediamente superiore ai 2.5 kg

Viene scelto casualmente un campione di 12 forme che vengono pesate

Media campionaria: m=2.758

Stima deviazione standard s=0.3942

Al livello di = 0.1, il campione è significativamente superiore (test a una coda) a 2.5 Kg?

267,20.1138

5,2758,2

xs

xt

758,2x 0.1138n

ssx

363,111;2,0 t

P(t >2,267)=0,022

L’ipotesi nulla è rifiutata.

SoluzioneLe ipotesi sono:H0: = 2,5H1: > 2,5

(test a una coda)

- Rifiuto Ho se t >

Test di una proporzione

Una distribuzione binomiale, se ci si riferisce alle proporzioni di successi, è caratterizzata da:

Media (valore atteso): =p

Varianza: 2= p(1-p)

La proporzione di successi del campione, se n è sufficiente, è una variabile casuale con distribuzione approssimativamente normale e:

Media = p

Varianza = p(1-p)/n

Posso definire le ipotesi: Ho:p=po e H1:ppo

La statistica per il test sarà:

npp

ppz o

)1(

ˆ

00

p̂Dove è la proporzione campionaria di successi, trovata con un campione di numerosità n.

Se n è sufficientemente grande la distribuzione è proprio quella della normale standardizzata.

Posso quindi calcolare i valori critici di z (per significatività prefissate) da confrontare con lo z trovato oppure il p value.

Test di una proporzione

Esempio test di una proporzione

Ho:p=0,8 e H1:p0,8

25,1100)8,01(8,0

8,075,0

)1(

ˆ

00

npp

ppz o

In un campione di 100 osservazioni i successi risultano 75. Posso rifiutare l’ipotesi nulla a livello =0,05?

- P(Z > z )=P(Z>1,25) = 0,0528

- Rifiuto l’ipotesi nulla se z >1.96.

L’ipotesi nulla non è rifiutata

Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a...

Documents

Transcript of Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a...