Verifica delle ipotesi - Lezione 9

6
Verifica d’Ipotesi

description

Corso di StatisticaLezione: 9 di 15Argomento: Verifica delle ipotesi

Transcript of Verifica delle ipotesi - Lezione 9

Page 1: Verifica delle ipotesi - Lezione 9

1

Verifica d’Ipotesi

Un’IPOTESI STATISTICAè un assunto circa un parametro

della funzione di distribuzione di una variabile casuale

Il saggio di un’ipotesi statistica (ipotesi nulla H0) si basa sulla dimostrazione per contraddizione

Si parte da un assunto (Ipotesi Nulla) si fanno delle argomentazioni logiche (applicazione di un test), se le argomentazioni non confermano l’assunto di

partenza (risultato poco probabile), allora si contraddice (Rifiuto dell’Ipotesi Nulla)

Si parte da un assunto (Ipotesi Nulla) si fanno delle argomentazioni logiche (applicazione di un test), se le argomentazioni non confermano l’assunto di

partenza (risultato poco probabile), allora si contraddice (Rifiuto dell’Ipotesi Nulla)

Se invece che chiederci quale è il valore di una media in una popolazione (stima puntuale e intervallo di confidenza) avessimo un’idea su quello che potrebbe essere il valore incognito di una media? Come potremmo verificare se la nostra idea é vera

o falsa?

Se invece che chiederci quale è il valore di una media in una popolazione (stima puntuale e intervallo di confidenza) avessimo un’idea su quello che potrebbe essere il valore incognito di una media? Come potremmo verificare se la nostra idea é vera

o falsa?

Page 2: Verifica delle ipotesi - Lezione 9

2

Procedimento:

- Definizione di un’ipotesi nulla e di un’alternativa (unilaterale o bilaterale)- Individuazione della statistica test e calcolo del valore numerico della stessa sui dati del campione- Riferimento della statistica test a una distribuzione nota quando l’ipotesi nulla è vera- Determinazione della probabilità di verificarsi (livello soglia)- Confronto del valore empirico verso quello teorico e conclusioni

Alla fine della procedura un test conduce sempre a due sole alternative: o si rifiuta l’ipotesi nulla H0, oppure si accetta (non si rifiuta)

Se si rifiuta l’ipotesi nulla quando è falsa e se non si rifiuta quando è vera, non si commettono errori. Dal momento che le decisioni sono prese sulla base di un

campione può accadere di commettere errori: rifiutare l’ipotesi nulla quando èvera (I° tipo), non rifiutare l’ipotesi nulla quando è falsa (II° tipo)

Se si rifiuta l’ipotesi nulla quando è falsa e se non si rifiuta quando è vera, non si commettono errori. Dal momento che le decisioni sono prese sulla base di un

campione può accadere di commettere errori: rifiutare l’ipotesi nulla quando èvera (I° tipo), non rifiutare l’ipotesi nulla quando è falsa (II° tipo)

Come ogni volta che si ha a che fare con l’incertezza, si definiscono delle probabilità di commettere l’errore di I° e di II° tipo, a e b

Nessun errorePotenza=1-β

Errore di II° tipo (b)H0 falsa

Errore di I° tipo (α)Nessun erroreconfidenza=1-α

H0 vera

Rifiuto H0Non rifiuto H0

0 0 0 0

0 0 0 0

( rifiu tare | è vera) ; 1 - (non rifiu tare | è vera)(non rifiu tare | è fa lsa); 1 - ( rifiu tare | è fa lsa)P H H P H HP H H P H H

α α

β β

= =

= =

Page 3: Verifica delle ipotesi - Lezione 9

3

( )2Se , ~X N µ σ Caso σ2 notaTest d’ipotesi sulla media

0 0

0 0

::

HH

µ µµ µ=

Dato un campione estratto si calcola la statistica media campionaria e ci si chiede se la distanza è troppo elevata, se la distanza è > di un valore k si rifiuta l’ipotesi nulla a favore dell’alternativa

Dato un campione estratto si calcola la statistica media campionaria e ci si chiede se la distanza è troppo elevata, se la distanza è > di un valore k si rifiuta l’ipotesi nulla a favore dell’alternativa0x µ−

0 0:H =µ µ

Specificando l’alternativa è possibile fissare l’errore di I°tipo αSpecificando l’alternativa è possibile fissare l’errore di I°tipo α

( )0 0 0 0

00 0

(rifiutare | è vera) |

| |

e

P H H P X k H

X k kP H P Z Hn n n

k kP Z Zn n

= = − > =

−= > = >

< − > =

α µ

µσ σ σ

ασ σ

Se è vera H0,Se è vera H0,

2

0 ,~X Nn

σµ

α/2 α/2

zα/2 z1-α/2

Per la simmetria della Variabile Casuale Normale si ottiene

Per la simmetria della Variabile Casuale Normale si ottiene

1 2k zn −= ⋅ ασ

Si rifiuta H0 seSi rifiuta H0 se 0

1 2 dove xz z zn−

−> =α

µσ

( )2Se , ~X N µ σ Caso σ2 notaTest d’ipotesi sulla media

0 0

0 0

::

HH

µ µµ µ=

>

( )0 0 0 0

00 0

(rifiutare | è vera) |

| |

P H H P X k H

X k k kP H P Z H P Zn n n n

= = − > =

−= > = > = >

α µ

µσ σ σ σ

α

z1-α

Si rifiuta H0 seSi rifiuta H0 se 0

1 dove xz z zn−

−> =α

µσ

α

0 0

0 0

::

HH

µ µµ µ=

<

( )0 0 0 0

00 0

(rifiutare | è vera) |

| |

P H H P X k H

X k k kP H P Z H P Zn n n n

= = − < =

−= < = < = <

α µ

µσ σ σ σ

Si rifiuta H0 seSi rifiuta H0 se 0 dove xz z z

n−

< =αµ

σ

Page 4: Verifica delle ipotesi - Lezione 9

4

( )2Se , ~X N µ σ Caso σ2 ignotaTest d’ipotesi sulla media

0 0

0 0

::

HH

µ µµ µ=

> Si rifiuta H0 seSi rifiuta H0 se 0

1 dove xt t ts n−−

> =αµ

0 0

0 0

::

HH

µ µµ µ=

< Si rifiuta H0 seSi rifiuta H0 se 0 dove xt t t

s n−

< =αµ

0 0

0 0

::

HH

µ µµ µ=

≠ Si rifiuta H0 seSi rifiuta H0 se 0

1 2 dove xt t ts n−−

> =αµ

( ) ( )2

2

1

1varianza campionaria 1

n

ii

s x xn =

⇒ = −− ∑

Test d’ipotesi sulla proporzione

0 0

0 0

::

H p pH p p

= >

Si rifiuta H0 seSi rifiuta H0 se

0 0

0 0

::

H p pH p p

= < Si rifiuta H0 se

Si rifiuta H0 se

0 0

0 0

::

H p pH p p

= ≠

Si rifiuta H0 seSi rifiuta H0 se

( )0

1 20 0

ˆ dove

1p pz z zp p

n

−−

> =−

α

( ) ( ) ( ) ( )1Se allora e ~

p pX Ber p E X p V X

n−

= =

Se è vera H0, (per n>30)Se è vera H0, (per n>30) ( )

0

0 0

ˆ(0,1)

1p p Np p

n

−≈

−1

1 n° di successiˆn

ii

X p Xn n=

= = =∑

( )0

10 0

ˆ dove

1p pz z zp p

n

−−

> =−

α

( )0

0 0

ˆ dove

1p pz z zp p

n

−< =

−α

Page 5: Verifica delle ipotesi - Lezione 9

5

Test d’ipotesi per il confronto tra medie

Si rifiuta H0 seSi rifiuta H0 se

Si rifiuta H0 seSi rifiuta H0 se

0 1 2

0 1 2

::

HH

= ≠

µ µµ µ Si rifiuta H0 se

Si rifiuta H0 se 1 2gt t α−>

( ) ( )2 21 1 2 2

1 2

1 12

n s n ss

n n− + −

=+ −

21 1 1

22 2 2

e media e varianza campionaria di un campione di numersità

e media e varianza campionaria di un campione di numersità

x s n

x s n

1gt t α−>

gt t α<

1 2

1 2

1 1x xt

sn n

−=

+

0 1 2

0 1 2

::

HH

= >

µ µµ µ

0 1 2

0 1 2

::

HH

= <

µ µµ µ

1 2 2g n n= + −

1 2 2g n n= + −

1 2 2g n n= + −

Test d’ipotesi per il confronto tra proporzioni

Si rifiuta H0 seSi rifiuta H0 se

Si rifiuta H0 seSi rifiuta H0 se

0 1 2

0 1 2

::

H p pH p p

= ≠ Si rifiuta H0 se

Si rifiuta H0 se 1 2z z α−>

1 2

1 2ˆ x xp

n n+

=+

1 1

2 2

ˆ proporzione di favorevoli in un campione di numersità ˆ proporzione di favorevoli in un campione di numersità p np n

1z z α−>

z zα<

( )

1 2

1 2

ˆ ˆ

1 1ˆ ˆ1

p pz

p pn n

−=

− +

0 1 2

0 1 2

::

H p pH p p

= >

0 1 2

0 1 2

::

H p pH p p

= <

Page 6: Verifica delle ipotesi - Lezione 9

6

Test d’ipotesi per verificare l’indipendenza

20

20

: 0

: 0

H

H

=

>

χ

χ Si rifiuta H0 seSi rifiuta H0 se ( ) ( )2

1 dove 1 1g g h kαχ χ −> = − ⋅ −

( )2*2

*1 1

h kij ij

i j ij

n nn

χ= =

−=∑∑0

0

: X e Y sono stocasticamente indipendenti: X e Y sono associate o connesse

HH

X e Y sono fenomeni statistici rilevati congiuntamente: numero di modalità di X: numero di modalità di Yhk

P-valueTutti i software statistici non forniscono i livelli di significatività del test ma

solo il valore del p-value

Il p-value è il massimo livello di α che avremmo potuto fissare che ci avrebbe permesso di rifiutare

l’ipotesi nulla alla luce dei dati campionari

( )p P Z z= >

0

0

Si accetta H Si rifiuta H

pp

>

αα