Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a...
-
Upload
ambrogino-spada -
Category
Documents
-
view
214 -
download
0
Transcript of Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a...
Il test consiste nel formulare una ipotesi (ipotesi
nulla) e nel verificare se con i dati a disposizione è
possibile rifiutarla o no.
L’ipotesi che viene formulata è l’ipotesi nulla (Ho) e
rappresenta di solito lo stato di fatto
Se il campione fornisce risultati fortemente in
contrasto con Ho, questa viene rifiutata a favore
dell’ipotesi alternativa (H1).
Test delle ipotesi
Test della media di una popolazione
Eseguiamo il test H0:=0
Ipotesi nulla (H0): la media della popolazione da cui abbiamo
estratto il campione è = 0
Ipotesi alternativa (H1): la media della popolazione è 0
Verifichiamo quindi se la deviazione della media campionaria
da 0 è compatibile con l’ipotesi nulla.
Confrontando la media del campione con 0
Test delle ipotesi
Usando una distribuzione campionaria identifichiamo un range di valori che hanno bassa probabilità di accadere se l’ipotesi nulla è vera.
Questo range di valori costituisce la cosiddetta regione critica o regione di rifiuto dell’ipotesi nulla.
Dalla distribuzione campionaria della statistica posso conoscere le probabilità di ottenere determinati valori, e sulla base di queste definire la regione di rifiuto.
Ho: = o
H1: o
ESEMPIO test media di una popolazione
);( 0 xN
);( 0n
N
Popolazione: );( 0 N
Medie campionarie:
x
Distribuzione delle medie campionarie
Verifico l’ipotesi che o= 10 in una popolazione con = 6
estraendo a caso un campione di n = 9.
nx
Con:
);10( xN
10
ESEMPIO test media di una popolazione
Popolazione: );10( N
Medie campionarie:
La regione di rifiuto ha probabilità (livello di significatività)
È la probabilità di rifiutare H0 quando H0 è vera
);10( xN
Ho: =10
H1: 10
Se = 0,05
Rifiuto H0 se la media campionaria è al di fuori dei limiti 0 1.96 (/n)
x
10
ESEMPIO test media di una popolazione
)2;10(N
Ho: = 10
H1: 10 )2;10(N
Popolazione: )6;10(N
Medie campionarie:
Distribuzione delle medie campionarie
(sono noti =6 e n=9)
x
Ho: =10
H1: 10
10
ESEMPIO test media di una popolazione
Se = 0,05
Rifiuto H0 se la media campionaria è al di fuori dei limiti 0 1.96 (/n)
Quindi:
10 1.96·2
)2;10(N
6,08
13,92
6,08 13,92 x
1. Specificare Ho, H1 ed un livello
2. Definire una statistica per il test (statistica di cui sia definibile la distribuzione campionaria) e la zona di rifiuto per Ho (valori della statistica di probabilità< quando Ho è vera).
3. Eseguire il campionamento (o l’esperimento) e calcolare la statistica.
4. Se la statistica calcolata cade nella zona di rifiuto decido di rifiutare Ho, altrimenti decido di non rifiutare Ho.
Esempio di fasi da seguire per un test delle ipotesi
4. Rifiuto l’ipotesi nulla se z >1.96. In questo modo si ha una probabilità di rifiuto di 0.05 quando H0 è vera (e quindi una probabilità di errore di 0,05).
1. Esempio. Ho: = 10 ; H1: 10; livello = 0,05
2. La statistica è z. Poiché P(z >1.96)=0,05, la zona di rifiuto è z< -1,96 o z>1,96 ovvero z >1.96 (test a 2 code)
3. Calcolo la media campionaria e la converto nella variabile standardizzata:
x
xz
Test della media di una popolazione
3. Calcolo la probabilità p di ottenere il valore di z calcolato: P(Z< -z) + P(Z>z) ovvero P(Z > z ) (test a 2 code)
In alternativa si può riportare direttamente il valore della probabilità p di commettere l’errore di I specie (livello di significatività osservato).
Il p value è una misura di quanto i dati sono in disaccordo con Ho.
Posso procedere come segue:
1. Definisco Ho: = 10 ; H1: 10
2.Calcolo la media campionaria e la converto nella variabile standardizzata:
x
xz
Test della media di una popolazione con p value
Significatività e potenza del test
H0 vera H0 falsa
H0 veraGIUSTO P = 1-
livello di protezione
ERRORE II specie P =
H0 falsa
ERRORE di I specie P =
livello di significatività
GIUSTO P= 1-
potenzaco
nc
lus
ion
e
verità
10
Ho: =10
H1: 10
SIGNIFICATIVITÀ E POTENZA DEL TEST
);( 0n
N
1-
/2 /2
1-
A parità di n (numerosità campionaria) se diminuisco la probabilità dell’errore di I specie () aumento la probabilità dell’errore di II specie (). Diminuisce la potenza del test (1-).
Test a una o due code
Se siamo interessati a rifiutare Ho solo se la differenza è in un senso o nell’altro, eseguiamo il test ad una coda, o test unilaterale.
L’ipotesi alternativa sarà H1: > o ovvero H1: < o
Il vantaggio è che la potenza del test aumenta andando verso H1 ma è praticamente 0 dall’altra parte.
1- 1-
Se non è noto si utilizza la sua stima s e la relativa stima dell’errore standard:
La statistica da usare per il test è t con (n-1) gradi di libertà (GL).
n
ssx
Test della media di una popolazione ( ignoto)
xs
xt
- Rifiuto l’ipotesi nulla se t > t, (n-1)
- Ovvero calcolo la probabilità p di trovare t
Test della media di una popolazione ( ignoto)
- Rifiuto l’ipotesi nulla se t > t, (n-1)
- Ovvero calcolo la probabilità p di trovare il t calcolato sotto ipotesi nulla
L’ipotesi è sempre Ho: = o contro H1: o
xs
xt
Calcolo t:
In pratica per il test al livello di significatività del 5%:
Esempio test della media di una popolazione ( ignoto)
Si afferma che con l’applicazione di una certa dieta
dimagrante si perdono 3 kg in un mese.
Vengono sottoposte a dieta 64 persone e dopo un mese
si verificano i risultati:
perdita di peso media = 2,6 kg
deviazione standard del campione: 1,2 kg
Al livello = 0.05, il campione è significativamente
diverso dall’atteso?
SoluzioneLe ipotesi sono:H0: = 3H1: 3
667,215,0
36,2
xs
xt
6,2x 15,0n
ssx
998,163;05,0 t
- P(t >2,667) = 0,0097
Rifiuto l’ipotesi nulla. Il metodo non funziona come promesso
(test a due code)
- Rifiuto Ho se t >
Esempio test della media di una popolazione ( ignoto)
Un acquirente è interessato all’acquisto di grosse partite di formaggio provenienti dagli alpeggi, ma richiede che le forme siano di peso mediamente superiore ai 2.5 kg
Viene scelto casualmente un campione di 12 forme che vengono pesate
Media campionaria: m=2.758
Stima deviazione standard s=0.3942
Al livello di = 0.1, il campione è significativamente superiore (test a una coda) a 2.5 Kg?
267,20.1138
5,2758,2
xs
xt
758,2x 0.1138n
ssx
363,111;2,0 t
P(t >2,267)=0,022
L’ipotesi nulla è rifiutata.
SoluzioneLe ipotesi sono:H0: = 2,5H1: > 2,5
(test a una coda)
- Rifiuto Ho se t >
Test di una proporzione
Una distribuzione binomiale, se ci si riferisce alle proporzioni di successi, è caratterizzata da:
Media (valore atteso): =p
Varianza: 2= p(1-p)
La proporzione di successi del campione, se n è sufficiente, è una variabile casuale con distribuzione approssimativamente normale e:
Media = p
Varianza = p(1-p)/n
Posso definire le ipotesi: Ho:p=po e H1:ppo
La statistica per il test sarà:
npp
ppz o
)1(
ˆ
00
p̂Dove è la proporzione campionaria di successi, trovata con un campione di numerosità n.
Se n è sufficientemente grande la distribuzione è proprio quella della normale standardizzata.
Posso quindi calcolare i valori critici di z (per significatività prefissate) da confrontare con lo z trovato oppure il p value.
Test di una proporzione
Esempio test di una proporzione
Ho:p=0,8 e H1:p0,8
25,1100)8,01(8,0
8,075,0
)1(
ˆ
00
npp
ppz o
In un campione di 100 osservazioni i successi risultano 75. Posso rifiutare l’ipotesi nulla a livello =0,05?
- P(Z > z )=P(Z>1,25) = 0,0528
- Rifiuto l’ipotesi nulla se z >1.96.
L’ipotesi nulla non è rifiutata