Test di ipotesi - old · 26/05/2015 1 Test di ipotesi E’ una metodologia statistica che consente...

20
26/05/2015 1 Test di ipotesi E’ una metodologia statistica che consente di prendere una decisione. Test Esempio: Un supermercato riceve dal proprio fornitore l’assicurazione che non più del 5% delle mele di tipo A dell’ultima fornitura ha un peso inferiore a 150 gr. In un controllo basato su un campione casuale di 80 esemplari, si trova che la frazione di mele sottopeso (cioè con un peso inferiore a 150gr) è 0,06. L’affermazione del fornitore è vera? Popolazione generatrice: forniture di mele Parametro di interesse: frazione di mele con peso inferiore o uguale a 150 gr. Esempio: Si consideri la sperimentazione di un nuovo fertilizzante A, del quale si intende con- frontarel’efficacia rispetto ad un fertilizzante tradizionale B. Lo sperimen- tatorestudierà l’effetto di A su un insieme di lotti di terreno e da queste osservazioni trarrà evidenze per concludere se l’efficacia di A è equivalente a quella di B o superiore. Se 85 è la resa media (in quintali per ettaro) di un terreno, con l’uso del fertilizzante B, e da campionamenti effettuati su terre- ni coltivati con il fertilizzante A, la resa media campionaria è risultata pari a 84,3, cosa si può concludere circa l’efficacia del nuovo fertilizzante? Popolazione generatrice: raccolta cereali Parametro di interesse: resa del terreno uguale o superiore a 85

Transcript of Test di ipotesi - old · 26/05/2015 1 Test di ipotesi E’ una metodologia statistica che consente...

26/05/2015

1

Test di ipotesi

E’ una metodologia statistica che consente di prendere una decisione.

Test

Esempio: Un supermercato riceve dal proprio fornitore l’assicurazione che non più del 5%

delle mele di tipo A dell’ultima fornitura ha un peso inferiore a 150 gr.

In un controllo basato su un campione casuale di 80 esemplari, si trova

che la frazione di mele sottopeso (cioè con un peso inferiore a 150gr)

è 0,06. L’affermazione del fornitore è vera?

Popolazione generatrice: forniture di mele

Parametro di interesse: frazione di mele con peso inferiore o uguale a 150 gr.

Esempio: Si consideri la sperimentazione di un nuovo fertilizzante A, del quale si intende con-

frontare l’efficacia rispetto ad un fertilizzante tradizionale B. Lo sperimen-

tatore studierà l’effetto di A su un insieme di lotti di terreno e da queste

osservazioni trarrà evidenze per concludere se l’efficacia di A è equivalente

a quella di B o superiore. Se 85 è la resa media (in quintali per ettaro) di un

terreno, con l’uso del fertilizzante B, e da campionamenti effettuati su terre-

ni coltivati con il fertilizzante A, la resa media campionaria è risultata pari

a 84,3, cosa si può concludere circa l’efficacia del nuovo fertilizzante?

Popolazione generatrice: raccolta cereali

Parametro di interesse: resa del terreno uguale o superiore a 85

26/05/2015

2

Ipotesi

Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati

indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazio-

ne standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bot-

tiglie, trovando una media campionaria di 32,87cc.

Il processo è in controllo statistico?

Una ipotesi statistica è una proposizione circa uno o più parametri di una popolazione o circa

la distribuzione di probabilità della variabile aleatoria � che descrive la popolazione

Ipotesi nulla:

Ipotesi alternativa:

��: � = �� = 33�: � ≠ �� = 33

Nelle applicazioni, si cerca di provare che l’ipotesi alternativa è sostenuta dalle osservazioni.

L’ipotesi nulla ha valore strumentale.

��: � = 85 ��: � = 33Ipotesi semplici �: � ≠ 85 �: � > 0,05

Ipotesi composte

��: � > 85 ��: � ≠ 33Ipotesi composte

il contenuto medio delle bottiglie di Coca-Cola è 33cc.

il contenuto medio delle bottiglie di Coca-Cola è diverso da 33cc.

A 2 code A 1 coda

Si chiama test di ipotesi una procedura che consente di prendere una decisione cir-ca una particolare ipotesi (nulla) a partire dalle informazioni contenute in un campio-ne casuale estratto dalla popolazione in esame.

Test di Ipotesi

Se questa informazione è

consistente con l’ipotesi nulla

�����è�����������Se questa informazione non è

consistente con l’ipotesi nulla

��è�����������Una ipotesi non potrà mai essere accettata con certezza, ma il risultato del test sarà sempre

accompagnato da una valutazione della possibilità di commettere un errore accettando o

rigettando l’ipotesi.

Procedura del test

� Formulare l’ipotesi che si vuole sottoporre a verifica

� Selezionare un campione casuale

� Calcolare il valore di una statistica del campione utile alla verifica

dell’ipotesi

� Usare il valore calcolato per prendere una decisione sulla validità

dell’ipotesi.

26/05/2015

3

Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati

indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazio-

ne standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bot-

tiglie, trovando una media campionaria di 32,87cc.

Il processo è in controllo statistico?

� Formulare l’ipotesi che si vuole sottoporre a verifica ��: � = �� = 33� Selezionare un campione casuale

Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie…

� Calcolare il valore di una statistica del campione utile alla verifica�̅ = 32,87� Usare il valore calcolato per prendere una decisione sulla validità

dell’ipotesi.

Procedura per il test

Come?

Usando la stima puntuale? Usando gli intervalli di confidenza?

La regione critica di un test di ipotesi è quel sottoinsieme (di numeri reali) tale che

� si rigetta l’ipotesi nulla ��, se il valore calcolato della statistica test appartiene a tale regione

Si chiama regione di accettazione �, �! , il complementare della regione critica.

Per evitare che la scelta della regione sia soggettiva, è necessario

� valutare quali tipi di errori vengono indotti da questa procedura

Regione di accettazione

Stabilire la distanza massima tale che il valore calcolato per la media campionaria è ritenuto «sufficientemente vicino» al valore teorico assegnato al parametro media.

Il valore trovato di 32,87cc è sufficientemente vicino a 33cc per stabilire che il processo è in

controllo statistico?

�� = 3332,87 ?

32 34

� si accetta ��, se il valore calcolato della statistica test non appartiene a tale sottoinsieme.

Esempio: (32,34) è la regione di accettazione#∞, 32 ⋃ 34,∞ è la regione critica

� scegliere la regione critica che minimizzi tali errori

26/05/2015

4

&' vera &' falsa

Test rigetta �� Errore I tipo Nessun errore

Test non rigetta �� Nessun errore Errore di II tipo

Un test di ipotesi può condurre a due tipi di errori

��Errore di I tipo �̅

Errore di II tipo �̅� �!

�� � �!

Errori

&' vera &' falsa

Test rigetta �� ( =P(Errore I tipo) Nessun errore

Test non rigetta �� Nessun errore ) =P(Errore di II tipo)

In termini di probabilità:

Errore di I tipo

( = * �����������+,��-���è.���

Lo sperimentatore rigetta l’ipotesi nulla (a posteriori e sulla base dei dati)

A priori, l’ipotesi nulla è vera

( = * "�����������"|"��è.���"= * "��������������"|"��è.���"1 # (

La probabilità di non rigettare l’ipotesi nulla, quando è vera,

rappresenta la probabilità di prendere una decisione corretta.

26/05/2015

5

Errore di II tipo

) = * ��������������+,��-���è2��3�

Lo sperimentatore non rigetta l’ipotesi nulla (a posteriori e sulla base dei dati)

A priori, l’ipotesi nulla è falsa

) = * "��������������"|"��è2��3�"

La probabilità di rigettare l’ipotesi nulla, quando è falsa, rappresenta la

probabilità di prendere una decisione corretta.

) = * "��������������"|"�è.���"1 # ) = * "�����������"|"��è2��3�"

Se l’ipotesi nulla è falsa, allora è vera l’ipotesi alternativa

) = * "��������������"|"�è.���"= * "��������������"|"��è.���"1 # (Quale errore?

Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati

indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazio-

ne standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bot-

tiglie, trovando una media campionaria di 32,87cc.

Il processo è in controllo statistico?

Regione di accettazione: (32;34)

Quale dei due errori è possibile calcolare?

* "��������������"|"��è.���"

��: � = �� = 33

= * �4 ∈ 632; 348|� = 33 = * 32 9 �4 9 34|� = 33= * 32 # � 9 �4 # � 9 34 # �|� = 33 = * 32 # 33 9 �4 # 33 9 34 # 33= * 32 # 331,5/ 16 9 �4 # 331,5/ 16 9 34 # 331,5/ 16 = * 32 # 331,5/ 16 9 < 9 34 # 331,5/ 16

= * #2,67 9 < 9 2,67Se … ( ≅ 1%

Errore II tipo

Errore I tipo

= 0,9962-0,0038=0,9898

26/05/2015

6

* 32 9 �4 9 34|� = 33 =98,9%

�4~@ 33; 1,516In base ai dati dell’esempio:

La regione di accettazione:

� Modificando la regione di accettazione, cambia P(errore di I tipo).

* 32 9 �4 9 34|� = 33 =98,9%

�4~@ 33; 1,516

Se si sceglie una regione di accettazione diversa, cosa cambia?* 32,5 9 �4 9 33,5|� = 33

In base ai dati dell’esempio:

La regione di accettazione:

* #1,33 9 < 9 1,33Standardizzando ed usando l’ipotesi � = 33=0,9082 – 0,0918≅82%

� Modificando la regione di accettazione, cambia P(errore di I tipo).

26/05/2015

7

* 32 9 �4 9 34|� = 33 =98,9%

�4~@ 33; 1,516

Se si sceglie una regione di accettazione diversa, cosa cambia?* 32,5 9 �4 9 33,5|� = 33

* 31,5 9 �4 9 34,5|� = 33

In base ai dati dell’esempio:

La regione di accettazione:

* #1,33 9 < 9 1,33Standardizzando ed usando l’ipotesi � = 33=0,9082 – 0,0918=81%

= * #4 9 < 9 4 = 100%

Se la regione di accettazione viene ulteriormente ampliata:

per la legge dei 3 sigma.

� Modificando la regione di accettazione, cambia P(errore di I tipo).

A parità di regione di accettazione cosa accade al crescere della taglia?

� Modificando la taglia campionaria, cambia P(errore di I tipo).

* 32 9 �4 9 34|� = 33�4~@ 33; 1,516In base ai dati dell’esempio:

La regione di accettazione:

* 32 9 �4 9 34|� = 33 � = 30La precisione della media campionaria decre-

menta da 0,375 a 0,273. Standardizzando:

* #3,65 9 < 9 3,65 =0,9999-0,0001=99%

Per taglia 16 è 98,9%

26/05/2015

8

A parità di regione di accettazione cosa accade al crescere della taglia?

* 32,5 9 �4 9 33,5|� = 33

P(errore di I tipo) decrementa al crescere della taglia campionaria.

Per fissare un criterio oggettivo, è possibile fissare la probabilità di commettere l’errore

di I tipo e determinare la regione di accettazione associata a a quella probabilità.

� = 30

� Modificando la taglia campionaria, cambia P(errore di I tipo).

* 32 9 �4 9 34|� = 33�4~@ 33; 1,516In base ai dati dell’esempio:

La regione di accettazione:

La precisione della media campionaria decre-

menta da 0,375 a 0,273. Standardizzando:

* #1,83 9 < 9 1,83 =0,9664-0,0336=93%

Per taglia 16 è 81%

Significatività

La probabilità P(errore di I tipo) viene denominata significatività del test.

� Assegnare un valore al livello di significatività del test equivale ad assegnare un valore alla

probabilità di commettere un errore di I tipo.

(=0,05 1 # (=0,95

� Assegnare un valore alla probabilità di commettere un errore di I tipo equivale a determinare

gli estremi della regione di accettazione del test.

* #1,96 9 < 9 1,96 = 0,95

* #1,96 9 B4CD,E/ F 9 1,96 = 0,95 * #1,96 ,EF 9 �4 # � 9 1,96 ,EF = 0,95

* � # 1,96 ,EF 9 �4 9 � + 1,96 ,EF = 0,95 * �4 # 1,96 ,EF 9 � 9 �4 + 1,96 ,EF = 0,95

��: � = �� = 33Se l’ipotesi è veraIntervallo di confidenza

* 33 # 1,96 ,EF 9 �4 9 33 + 1,96 ,EF = 0,95 La regione di accettazione è(32,27; 33,74)

Come?

26/05/2015

9

La regione di accettazione è (32,27; 33,74)

Osservato un valore per la media campionaria�̅, si può avere: °�̅ ∈ 632,27; 33,748

�̅

L’ipotesi che la media della popolazione è 33cc si

rigetta.

� Se l’ipotesi nulla è falsa non si commette alcun

errore.

� Se l’ipotesi nulla è vera, si commette un errore di I tipo.

Nel concludere che la popolazione non ha media 33cc, si commette un errore solo nel 5%

dei casi, ossia 5 volte su 100 tale conclusione è errata.

Come concludere il test: errore di I tipo

* 32,27 9 �4 9 33,74|� = 33 = 0,95

La regione di accettazione è (32,27; 33,74)

Osservato un valore per la media campionaria�̅, si può avere:

°�̅ ∈ 632,27; 33,748

�̅

L’ipotesi che la media della popolazione è 33 non

si rigetta.

� Se l’ipotesi nulla è vera non si commette alcun

errore.

� Se l’ipotesi nulla è falsa, si commette un errore di II tipo.

Quanto vale la probabilità di commettere un errore di II tipo? Ossia con quale probabilità

si prende una decisione errata?

) = * "��������������"|"�è.���"Quali sono i valori del parametro � nell’ipotesi alternativa?

Come concludere il test: errore di II tipo

26/05/2015

10

Errore di II tipo

* 32,27 9 �4 9 33,74|� = 33 = 0,95

* 32,27 9 �4 9 33,74|� = 33,5 =

Probabilità di commettere

un errore di I tipo

Regione criticaProbabilità di commettere

un errore di II tipo

�4~@ 33; 1,516�4~@ 33,5; 1,516

* 32,27 9 �4 9 33,74|� = 33,5 = ?

* I!,!JCD,E/ F 9 B4CD,E/ F 9 II,JKCD,E/ F |� = 33,5 =

* I!,!JCII,E,E/ F 9 B4CD,E/ F 9 II,JKCII,E,E/ F =

* #3,28 9 < 9 0,64 =

Bisogna calcolare l’area in blu

0,7422-0,0005 = 74%

In generale, l’ipotesi alternativa è unaipotesi composta. Quale valore scegliere?

26/05/2015

11

Regione di accettazione Taglia L M: N = OO, P M: N = OQ32,27 9 �4 9 33,74 16 1-0,95=0,05 0,729 0,23632,5 9 �4 9 33,5 16 1-0,81=0,19 0,497 0,09132,27 9 �4 9 33,74 30 1-0,99=0,01 0,8 0,16932,5 9 �4 9 33,5 30 1-0,93=0,07 0,5 0,033

� La probabilità P(errore di I tipo) è in relazione con la probabilità P(errore di II tipo). Se una

aumenta l’altra diminuisce e viceversa.

� Al crescere della taglia del campione casuale, la probabilità P(errore di II tipo) diminuisce,

mentre per la probabilità P(errore di II tipo) questo non è sempre vero.

� La probabilità P(errore di II tipo) diminuisce se il valore assegnato al parametro si allontana

da quello assegnato nell’ipotesi nulla.

Lo statistico seleziona l’errore di I tipo e quindi la regione critica.

Rigettare ��: � = �� = 33L’errore di II tipo dipende dal vero valore del parametro in esame, che in genere è incognito.

Pertanto si procede per tentativi.

Accettare ��: � = �� = 33

Esempio: Si ipotizza che l’età media dei frequentatori di una biblioteca

sia 39 anni con una varianza di 10,2 anni. Per verificare tale ipotesi ven-

gono campionati 100 frequentatori e la loro età media risulta essere 38

anni. Si verifichi l’ipotesi iniziale assumendo che la popolazione genera-

trice è normale.

� Identificare il parametro di interesse: il parametro media �� Formulare l’ipotesi nulla ��: � = �� = 39.� Formulare l’ipotesi alternativa�: � ≠ �� = 39.� Scegliere un opportuno errore di I tipo: ( = 0,05.� Scegliere un’opportuna statistica test: �4.� Costruire la regione di accettazione:

* � 9 �4 9 �!|� = 39 * � # �10,2 100S 9 < 9 �! # �10,2 100S T � = 39

* � # 3910,2 100S 9 < 9 �! # 3910,2 100S� # 3910,2 100S = #UCV/!� �! # 3910,2 100S = UCV/!

26/05/2015

12

� # 3910,2 100S = #UCV/!= #1,96�! # 3910,2 100S = UCV/! = 1,96

� = 39 # 1,96 10,2100 = 38,37�! = 39 + 1,96 10,2100 = 39,62

� Determinare un campione casuale e valutare una stima puntuale della statisticatest: �̅ = 38.� Decidere se rigettare o meno l'ipotesi nulla, verificando se tale stima puntale appartiene o meno alla regione di accettazione: 38 ∈ 638,37; 39,628.Poiché 38 non appartiene alla regione di accettazione, l’ipotesi nulla si rigetta. La decisione

comporta un errore di I tipo con livello di significatività del 5%, ossia nel 5% dei casi la deci-

sione presa è errata.

� Non si può ritenere pari a 39 il numero medio di anni dei frequentatori della biblioteca.

� E’ possibile effettuare un secondo test, scegliendo tra le due ipotesi: � 9 39�� > 39.Quale?

Poiché la media campionaria è 38, è verosimile che � 9 39.��: � > �� = 39. L’obbiettivo è rigettare

l’ipotesi nulla.

Esempio: Si ipotizza che l’età media dei frequentatori di una biblioteca

sia 39 anni con una varianza di 10,2 anni. Per verificare tale ipotesi ven-

gono campionati 100 frequentatori e la loro età media risulta essere 38

anni. Si verifichi l’ipotesi iniziale assumendo che la popolazione genera-

trice è normale.

� Identificare il parametro di interesse: il parametro media �� Formulare l’ipotesi nulla ��: � > �� = 39.� Formulare l’ipotesi alternativa�: � W �� = 39.� Scegliere un opportuno errore di I tipo: ( = 0,05.� Scegliere un’opportuna statistica test: �4.� Costruire la regione di accettazione:

��� �!Regione critica a due code

Regione critica a una coda

Quale eliminiamo?

Se si osserva un valore della media campionaria �̅ minore di � allora è verosimile ritene-

re l’ipotesi nulla falsa. Quindi la regione di accettazione ha la forma �, ∞ .Come calcolare il valore di �?

Ipotesi nulla composta

26/05/2015

13

* �4 > �|� X 39 = 0,95 doveIl valore di � è tale che

La linea blu rappresenta la pdf di

�4~@ 39; 10,2100

� L’area blue è minore dell’area sottesa dalla II curva* �4 > �|� = 39 W * �4 > �|� = 39,3P(errore di I tipo con � = 39) X P(errore di I tipo con � = 39,3)

La regione di accettazione calcolata con � = 39 corrisponde al massimo errore di I tipo

richiesto per il test, cioè 0,05.

� =? �4~@ 39,3; 10,2100

* �4 > �|� = 39 = 0,95 Il valore di � è tale che

* < > � # �10,2 100S T � = 39 � # 3910,2 100S = U�,�EStandardizzando si ha:

* < > � # 3910,2 100S=

� = 39 # 1,64 Z 10,2100 = 38,48

= -1,64

� Per ritenere vera l’ipotesi nulla��: � > �� = 39 è necessario osservare un valore per la

media campionaria superiore a 38,48.

� Poiché il valore osservato 38 ∈ 38,48;∞ ,l’ipotesi nulla viene rigettata in favore di quella

alternativa.

� L’età media dei frequentatori della biblioteca è inferiore a 39 anni con una significatività

del 5%.

Come calcolare il valore � ?

26/05/2015

14

P-value

Il p-value rappresenta l’area a destra per il valore osservato della statistica test, assumendo

vera l’ipotesi nulla. (NB: Il suo calcolo dipende però dall’ipotesi alternativa).

Esempio: Si ipotizza che l’età media dei frequentatori di una biblioteca

sia 39 anni con una varianza di 10,2 anni. Per verificare tale ipotesi ven-

gono campionati 100 frequentatori e la loro età media risulta essere 38

anni. Si verifichi l’ipotesi iniziale assumendo che la popolazione genera-

trice è normale.

�4~@ 39; 10,2100Se l’ipotesi nulla ��: � = �� = 39 è vera, allora

Un valore osservato appartenente al range

di �̂è 38.

Il p-value è l’area in rosso nel grafico.

L’area in rosso è inferiore alla somma dell’area

in rosso e dell’area blu, poiché 38 non appartiene

alla regione di accettazione.

E’ un altro modo per verificare se l’ipotesi nulla va rigettata.

�4~@ 39; 10,2100 Se è vera l’ipotesi nulla, allora

P-value=* �4938|� = 39 + * �4>40|� = 39* < 9 38 # �10,2 100S T � = 39 + * < > 40 # �10,2 100S T � = 39* < 9 38 # 3910,2 100S + * < > 40 # 3910,2 100S

=

=* < 9 #3,13 + * < > 3,13 ==

Impossibile v isualizzare l'immagine.

Impossibile v isualizzare l'immagine.

0,0008+(1-0,9992)=2*0,0008=0,0016

Poiché p-value < (=0,05→ 38`������������ → �a�����3��,���3��������

Si noti l’uguaglianza

delle due probabilità

Impossibile v isualizzare l'immagine.

26/05/2015

15

Se il valore osservato per la media campionaria è ad esempio 40, il calcolo del p-value

resta immutato.

Se �̅ > �� → � # .��,� = 2* �4 > �̅|� = ��� # .��,� 9 ( → 3����������: � = ��� # .��,� > ( → ���3����������: � = ��Se �̅ 9 �� → � # .��,� = 2* �4 9 �̅|� = ��� # .��,� 9 ( → 3����������: � = ��� # .��,� > ( → ���3����������: � = ��

Cosa accade se si effettua un test a una coda?��: � > �� = 39.Regione di accettazione nel caso

Poichè �̅ = 38 9 �� = 39p#.��,� = * �4 9 �̅|� = ��

P-value=* �4938|� = 39 = 0,0008<0,05

Potenza del test� Per migliorare la performance di un test di ipotesi, l’altro parametro su cui è possibile fare

leva è la taglia campionaria.

1 # ) = * "�����������"|"��è2��3�"� Visto che il livello di significatività di un test è fissato dallo sperimentatore, è possibile

scegliere una taglia campionaria che diminuisca la probabilità di commettere un errore

di II tipo, ossia aumenti il suo complementare, anche detto potenza di un test.

n Errore

campionario

Regione

accettazione

N = Ob, O N = Ob, c N = Ob, d30 0,58 (37,86;40,14) 0,23 0,11 0,05

60 0,41 (38,19;39,81) 0,40 0,16 0,06

100 0,32 (38,37;39,63) 0,59 0,24 0,06

150 0,26 (38,49;39,51) 0,76 0,34 0,07

170 0,24 (38,52;39,48) 0,81 0,37 0,07

200 0,23 (38,56;39,44) 0,87 0,43 0,07

Se si rigetta l’ipotesi nulla Calcolo della potenza del test

Se non si rigetta l’ipotesi nulla Calcolo dell’errore di II tipo del test

26/05/2015

16

Sul formulario

Test sulla media, popolazione gaussiana, varianza nota

��: � = ���: � ≠ ��Regione di accettazione

�� #UCV! e�; �� +UCV! e���: � > ���: � W �� �� #UCV e� ;∞��: � 9 ���: � X �� #∞; �� +UCV e�

Test sulla media, popolazione gaussiana, varianza incognita

Quale dei parametri presenti nella regione di accettazione va modificato?

� Scegliere un’opportuna statistica test: �4.� Costruire la regione di accettazione:

In questa costruzione….

* � 9 �4 9 �!|� = �� * � # �e! �S 9 < 9 �! # �

e! �S T � = ��Mentre con la varianza nota, la standardizzazione comporta l’uso di una gaussiana standard

con la varianza incognita, la standardizzazione comporta l’uso di una v.a. T-Student

* � 9 �4 9 �!|� = �� * � # �f! �S 9 �4 # �

f! �S 9 �! # �f! �S T � = ��

��: � = ���: � ≠ ��Regione di accettazione

�� #�CV!;gC f�; �� +�CV!;gC f���: � > ���: � W �� �� #�CV;g f�∞��: � 9 ���: � X �� #∞; �� +�CV;g f�

NB: Intervallo di confidenza

�4 #�CV!;gC f�; �4 +�CV!;gC f�

La regione di accettazione

può essere costruita a partire

dall’intervallo di confidenza

In che modo?

26/05/2015

17

Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati

indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc. Oggi, alle

8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media

campionaria di 32,87cc e una deviazione standard campionaria di 1,5 cc .

Stabilire se il contenuto medio delle bottiglie è variato al livello di significatività del 5%.

� Identificare il parametro di interesse: il parametro media �� Formulare l’ipotesi nulla ��: � = �� = 33.� Formulare l’ipotesi alternativa�: � ≠ �� = 33.� Scegliere un opportuno errore di I tipo: ( = 0,05.� Scegliere un’opportuna statistica test: �4.� Costruire la regione di accettazione (formulario):

�� #�CV!;gC f�; �� +�CV!;gC f�33 # 2,1314 Z 1,516; 33 + 2,1314 Z 1,516

(=0,05 1 # (/2=0,975

��,hJE;E = 2,1314 f=1,5

� = 16

32,21; 33,8

� Prendere una decisione circa l’ipotesi nulla: 32,87∈ 32,21; 33,8

� Decidere se rigettare o meno l'ipotesi nulla, verificando se 32,87 appartiene o meno alla regione di accettazione: 32,21; 33,8

Poiché 32,87 appartiene alla regione di accettazione, l’ipotesi nulla non si rigetta.

= * "��������������"|"��è.���"0,95* "��������������"|"��è2��3�" =? Errore II tipo

� Calcolare l’errore di II tipo per vari valori di �* "��������������"|� = 32,5 =

* 32,21 9 �4 9 33,8|� = 32,5 = * 32,21 # �1,5 16i 9 jE 9 33,8 # �1,5 16i k � = 32,5

* 32,21 # 32,51,5 16i 9 jE 9 33,8 # 32,51,5 16i = * #0,77 9 jE 9 3,46 ≅ 0,99 #0,25=0,74

26/05/2015

18

Sul formulario

#∞;�� +UCV e�

Test sulla media, popolazione non gaussiana, varianza nota

Regione di accettazione

Test sulla media, popolazione non gaussiana, varianza incognita

��: � = ���: � ≠ �� �� #UCV/! e�; �� +UCV/! e���: � > ���: � W �� �� #UCV e� ;∞ ��: � 9 ���: � X ��

Per il teorema dellimite centrale

#∞; �� +UCV f�

Regione di accettazione ��: � = ���: � ≠ �� �� #UCV/! f�; �� +UCV/ f���: � > ���: � W �� �� #UCV f� ;∞ ��: � 9 ���: � X ��

Per il teorema del limitecentrale + approssimazione con una v.a. T-student

Esempio: Alle ultime elezioni politiche, in un certo seggio hanno votato 1000 persone. Si sa che

nelle precedenti elezioni, il partito A aveva ricevuto il 51% delle preferenze. A 100 cittadini all’

uscita dal seggio elettorale viene chiesto per quale partito hanno votato. Risulta che il partito A

ha ricevuto il 52,3% delle preferenze. E’ possibile ritenere che anche nelle ultime elezioni le

preferenze per il partito A prevalgano su quelle agli altri partiti?

� Identificare il parametro di interesse: il parametro percentuale�� Formulare l’ipotesi nulla ��: � 9 �� = 0,51.� Formulare l’ipotesi alternativa�: � X �� = 0,51.� Scegliere un opportuno errore di I tipo: ( = 0,05.� Scegliere un’opportuna statistica test: �46-�,��������U���������,������8� Costruire la regione di accettazione: Se si considera l’intervallo di confidenza

la regione di accettazione (a due code) si ottiene da � e �! sostituendo al posto di �̂ il valore

del parametro �� = 0,51. La regione di accettazione a una coda per il test proposto è dunque: #∞,�! con �! = 0,51 + 1,64 Z �,EZ6C�,E8�� = 0,5919

Test sulle percentuali

*6< 9 1,648 = 0,95 →

26/05/2015

19

� Decidere se rigettare o meno l'ipotesi nulla, verificando se 0,523 appartiene o meno alla regione di accettazione: #∞;0,5919Poiché 0,523 appartiene alla regione di accettazione, l’ipotesi nulla non si rigetta. = * "��������������"|"��è.���"0,95* "��������������"|"��è2��3�" =? Errore II tipo

� Per quale valore di n l’ipotesi nulla verrebbe rigettata?

�! = 0,51 + 1,64 Z 0,51 Z 61 # 0,518� 9 0,523 0,51 Z 61 # 0,518� 9 0,523 # 0,511,640,2499� 9 0,523 # 0,511,64! � >0,2499/ 0,0131,64

!=3978

Test sulla percentuale Regione di accettazione

��: � = ���: � ≠ �� �� # UCV/! Z �� Z ��61 # ��8� ; �̂ + UCV/! Z �� Z ��61 # ��8���: � > ���: � W �� �� # UCV Z �� Z ��61 # ��8� ; ∞

Esempio: L’osservazione della durata (in ore) della batteria per cellulare di una data marca

in 24 esemplari di prodotto ha dato luogo ai seguenti risultati:

58,7 64,9 76,9 67,8 41,7 56,7 64,5 69,7 82,1 82,5 40,8 74,9

71,5 75,4 67,3 73,0 70,4 104 82,3 90,4 86,8 72,8 71,8 54,5

La varianza campionaria risulta 203,45. E’ possibile ritenere valida l’ipotesi che

la variabilità della durata delle batterie sia 200?

Test sulla varianza

� Identificare il parametro di interesse: lavarianzae!� Formulare l’ipotesi nulla ��: e! = e!� = 200� Formulare l’ipotesi alternativa�: e! ≠ e!� = 200.� Scegliere un opportuno errore di I tipo: ( = 0,05.� Scegliere un’opportuna statistica test:f!.� Costruire la regione di accettazione: Poichè

26/05/2015

20

� Decidere se rigettare o meno l'ipotesi nulla, verificando se 203,47 appartiene o meno alla regione di accettazione: 101,56; 331,04

Poiché 203,47 appartiene alla regione di accettazione, l’ipotesi nulla non si rigetta.

= * "��������������"|"��è.���"0,95* "��������������"|"��è2��3�" =? Errore II tipo

=11,68 =38,07 � ← 24, f! ← 203,45

Test sulla varianza Regione di accettazione

��: e! = e!��: e! ≠ e!���: e! > e!��: e! W e!�

��: e! 9 e!��: e! X e!�