INTERVALLI DI CONFIDENZA e TEST D’IPOTESI › silviacolumbu › files › 2017 › 12 › ... ·...

Post on 26-Jun-2020

1 views 0 download

Transcript of INTERVALLI DI CONFIDENZA e TEST D’IPOTESI › silviacolumbu › files › 2017 › 12 › ... ·...

INTERVALLI DI CONFIDENZA e TESTD’IPOTESI

1 / 30

Intervallo di confidenza: media

Supponiamo di considerare la media campionaria X̄ e assumi-amo che

• la popolazione X ha una distribuzione normale, oppureconsideriamo un campione grande con n≥ 30

• la varianza della popolazione σ2 è nota.

Allora costruiamo un intervallo di confidenza per la media cam-pionaria come:

x̄− z α

2

σ√n< µ < x̄+ z α

2

σ√n

dove z α

2è il valore critico della distribuzione normale standard

che lascia nella coda destra una probabilità pari ad α

2 .

2 / 30

Intervallo di confidenza: media

Supponiamo di considerare la media campionaria X̄ e assumi-amo che

• la popolazione X ha una distribuzione normale, oppureconsideriamo un campione grande con n≥ 30

• la varianza della popolazione σ2 è nota.

Allora costruiamo un intervallo di confidenza per la media cam-pionaria come:

x̄− z α

2

σ√n< µ < x̄+ z α

2

σ√n

dove z α

2è il valore critico della distribuzione normale standard

che lascia nella coda destra una probabilità pari ad α

2 .

2 / 30

Intervallo di confidenza: media

Supponiamo di considerare la media campionaria X̄ e assumi-amo che

• la popolazione X ha una distribuzione normale, oppureconsideriamo un campione grande con n≥ 30

• la varianza della popolazione σ2 è nota.

Allora costruiamo un intervallo di confidenza per la media cam-pionaria come:

x̄− z α

2

σ√n< µ < x̄+ z α

2

σ√n

dove z α

2è il valore critico della distribuzione normale standard

che lascia nella coda destra una probabilità pari ad α

2 .

2 / 30

Intervallo di confidenza: media

Supponiamo di considerare la media campionaria X̄ e assumi-amo che

• la popolazione X ha una distribuzione normale, oppureconsideriamo un campione grande con n≥ 30

• la varianza della popolazione σ2 è nota.

Allora costruiamo un intervallo di confidenza per la media cam-pionaria come:

x̄− z α

2

σ√n< µ < x̄+ z α

2

σ√n

dove z α

2è il valore critico della distribuzione normale standard

che lascia nella coda destra una probabilità pari ad α

2 .

2 / 30

Intervallo di confidenza: media

L’intervallo di confidenza è costruito aggiungendo e sottraendoalla media campionaria un margine d’errore

z α

2

σ√n.

L’intervallo per la media campionaria è simmetrico e la sua ampiezzaè il doppio del margine d’errore.

Il margine d’errore può essere ridotto se:

• la dimensione del campione aumenta;

• il livello di confidenza (1−α) diminuisce.

3 / 30

Intervallo di confidenza: media

L’intervallo di confidenza è costruito aggiungendo e sottraendoalla media campionaria un margine d’errore

z α

2

σ√n.

L’intervallo per la media campionaria è simmetrico e la sua ampiezzaè il doppio del margine d’errore.

Il margine d’errore può essere ridotto se:

• la dimensione del campione aumenta;

• il livello di confidenza (1−α) diminuisce.

3 / 30

Intervallo di confidenza: media

L’intervallo di confidenza è costruito aggiungendo e sottraendoalla media campionaria un margine d’errore

z α

2

σ√n.

L’intervallo per la media campionaria è simmetrico e la sua ampiezzaè il doppio del margine d’errore.

Il margine d’errore può essere ridotto se:

• la dimensione del campione aumenta;

• il livello di confidenza (1−α) diminuisce.

3 / 30

Intervallo di confidenza: media

L’intervallo di confidenza è costruito aggiungendo e sottraendoalla media campionaria un margine d’errore

z α

2

σ√n.

L’intervallo per la media campionaria è simmetrico e la sua ampiezzaè il doppio del margine d’errore.

Il margine d’errore può essere ridotto se:

• la dimensione del campione aumenta;

• il livello di confidenza (1−α) diminuisce.

3 / 30

Distribuzione campionaria: mediaAd esempio se (1−α) = 0.95 allora:

Dove 1.96 viene ricavato dalla tavola normale standard. Si hache se (1−α) = 0.95 allora α

2 = 0.025 e z0.025 = 1.96.Come per la proporzione, i livelli di confidenza comunementeusati sono: 90%, 95% e 99%.

4 / 30

Distribuzione campionaria: mediaAd esempio se (1−α) = 0.95 allora:

Dove 1.96 viene ricavato dalla tavola normale standard. Si hache se (1−α) = 0.95 allora α

2 = 0.025 e z0.025 = 1.96.

Come per la proporzione, i livelli di confidenza comunementeusati sono: 90%, 95% e 99%.

4 / 30

Distribuzione campionaria: mediaAd esempio se (1−α) = 0.95 allora:

Dove 1.96 viene ricavato dalla tavola normale standard. Si hache se (1−α) = 0.95 allora α

2 = 0.025 e z0.025 = 1.96.Come per la proporzione, i livelli di confidenza comunementeusati sono: 90%, 95% e 99%.

4 / 30

Intervallo di confidenza: media

Costruiamo l’intervallo di confienza per la media, allora, consid-erata la distribuzione della media campionaria si ha:

5 / 30

Intervallo di confidenza: esempioIn una piantagione si sa che le misure del diametro (dbh) dellepiante sono distribuite normalmente con σ = 1.6. Viene se-lezionato all’interno della stessa piantagione un campione di 16alberi. La misura media del diametro per il campione era x̄= 12.6cm. Calcolare l’intervallo di confidenza al 95% e al 99% per lamedia sconosciuta della popolazione.

Calcoliamo la deviazione standard:

σX̄ =σ√

n=

1.6√16

= 0.4

Se (1−α) = 0.95 allora z α

2= 1.96 e

12.6−1.96 ·0.4 < µ < 12.6+1.96 ·0.4

11.82 < µ < 13.38

6 / 30

Intervallo di confidenza: esempioIn una piantagione si sa che le misure del diametro (dbh) dellepiante sono distribuite normalmente con σ = 1.6. Viene se-lezionato all’interno della stessa piantagione un campione di 16alberi. La misura media del diametro per il campione era x̄= 12.6cm. Calcolare l’intervallo di confidenza al 95% e al 99% per lamedia sconosciuta della popolazione.Calcoliamo la deviazione standard:

σX̄ =σ√

n=

1.6√16

= 0.4

Se (1−α) = 0.95 allora z α

2= 1.96 e

12.6−1.96 ·0.4 < µ < 12.6+1.96 ·0.4

11.82 < µ < 13.38

6 / 30

Intervallo di confidenza: esempioIn una piantagione si sa che le misure del diametro (dbh) dellepiante sono distribuite normalmente con σ = 1.6. Viene se-lezionato all’interno della stessa piantagione un campione di 16alberi. La misura media del diametro per il campione era x̄= 12.6cm. Calcolare l’intervallo di confidenza al 95% e al 99% per lamedia sconosciuta della popolazione.Calcoliamo la deviazione standard:

σX̄ =σ√

n=

1.6√16

= 0.4

Se (1−α) = 0.95 allora z α

2= 1.96 e

12.6−1.96 ·0.4 < µ < 12.6+1.96 ·0.4

11.82 < µ < 13.38

6 / 30

Intervallo di confidenza: esempioIn una piantagione si sa che le misure del diametro (dbh) dellepiante sono distribuite normalmente con σ = 1.6. Viene se-lezionato all’interno della stessa piantagione un campione di 16alberi. La misura media del diametro per il campione era x̄= 12.6cm. Calcolare l’intervallo di confidenza al 95% e al 99% per lamedia sconosciuta della popolazione.Calcoliamo la deviazione standard:

σX̄ =σ√

n=

1.6√16

= 0.4

Se (1−α) = 0.95 allora z α

2= 1.96 e

12.6−1.96 ·0.4 < µ < 12.6+1.96 ·0.4

11.82 < µ < 13.38

6 / 30

Intervallo di confidenza: esempioIn una piantagione si sa che le misure del diametro (dbh) dellepiante sono distribuite normalmente con σ = 1.6. Viene se-lezionato all’interno della stessa piantagione un campione di 16alberi. La misura media del diametro per il campione era x̄= 12.6cm. Calcolare l’intervallo di confidenza al 95% e al 99% per lamedia sconosciuta della popolazione.Calcoliamo la deviazione standard:

σX̄ =σ√

n=

1.6√16

= 0.4

Se (1−α) = 0.95 allora z α

2= 1.96 e

12.6−1.96 ·0.4 < µ < 12.6+1.96 ·0.4

11.82 < µ < 13.38

6 / 30

Intervallo di confidenza: esempio

Se (1−α) = 0.99 allora z α

2= 2.58 e

12.6−2.58 ·0.4 < µ < 12.6+2.58 ·0.4

11.57 < µ < 13.63.

Concludiamo che:

• Siamo confidenti al 95% che il vero diametro medio sia com-preso tra 11.82 e 13.38 cm. Sebbene la vera media possa omeno essere inclusa in questo intervallo, il 95% degli intervallicostruiti con questo metodo conterrà il vero valor medio.

• Siamo confidenti al 99% che il vero diametro medio sia com-preso tra 11.57 e 13.63 cm.

7 / 30

Intervallo di confidenza: esempio

Se (1−α) = 0.99 allora z α

2= 2.58 e

12.6−2.58 ·0.4 < µ < 12.6+2.58 ·0.4

11.57 < µ < 13.63.

Concludiamo che:

• Siamo confidenti al 95% che il vero diametro medio sia com-preso tra 11.82 e 13.38 cm. Sebbene la vera media possa omeno essere inclusa in questo intervallo, il 95% degli intervallicostruiti con questo metodo conterrà il vero valor medio.

• Siamo confidenti al 99% che il vero diametro medio sia com-preso tra 11.57 e 13.63 cm.

7 / 30

Intervallo di confidenza: esempio

Se (1−α) = 0.99 allora z α

2= 2.58 e

12.6−2.58 ·0.4 < µ < 12.6+2.58 ·0.4

11.57 < µ < 13.63.

Concludiamo che:

• Siamo confidenti al 95% che il vero diametro medio sia com-preso tra 11.82 e 13.38 cm. Sebbene la vera media possa omeno essere inclusa in questo intervallo, il 95% degli intervallicostruiti con questo metodo conterrà il vero valor medio.

• Siamo confidenti al 99% che il vero diametro medio sia com-preso tra 11.57 e 13.63 cm.

7 / 30

Intervallo di confidenza: esempio

Se (1−α) = 0.99 allora z α

2= 2.58 e

12.6−2.58 ·0.4 < µ < 12.6+2.58 ·0.4

11.57 < µ < 13.63.

Concludiamo che:

• Siamo confidenti al 95% che il vero diametro medio sia com-preso tra 11.82 e 13.38 cm. Sebbene la vera media possa omeno essere inclusa in questo intervallo, il 95% degli intervallicostruiti con questo metodo conterrà il vero valor medio.

• Siamo confidenti al 99% che il vero diametro medio sia com-preso tra 11.57 e 13.63 cm.

7 / 30

Intervallo di confidenza: esempio

Se (1−α) = 0.99 allora z α

2= 2.58 e

12.6−2.58 ·0.4 < µ < 12.6+2.58 ·0.4

11.57 < µ < 13.63.

Concludiamo che:

• Siamo confidenti al 95% che il vero diametro medio sia com-preso tra 11.82 e 13.38 cm. Sebbene la vera media possa omeno essere inclusa in questo intervallo, il 95% degli intervallicostruiti con questo metodo conterrà il vero valor medio.

• Siamo confidenti al 99% che il vero diametro medio sia com-preso tra 11.57 e 13.63 cm.

7 / 30

Intervallo di confidenza: media

Come ci si comporta se la varianza σ2 non è nota ma va stimatadai dati?

In quel caso costruiamo l’errore standard a partire dalla varianzacampionaria, ossia:

se =s√n

Anche il margine d’errore sarà allora costruito a partire da questaquantità. Bisogna stabilire come vanno calcolati i valori critici damoltiplicare allo standard error in questo caso.L’aver introdotto un’ulteriore stima nello standard error aumentala possibilità d’errore e l’approssimazione con la normale non èpiù sufficiente.

8 / 30

Intervallo di confidenza: media

Come ci si comporta se la varianza σ2 non è nota ma va stimatadai dati?

In quel caso costruiamo l’errore standard a partire dalla varianzacampionaria, ossia:

se =s√n

Anche il margine d’errore sarà allora costruito a partire da questaquantità. Bisogna stabilire come vanno calcolati i valori critici damoltiplicare allo standard error in questo caso.L’aver introdotto un’ulteriore stima nello standard error aumentala possibilità d’errore e l’approssimazione con la normale non èpiù sufficiente.

8 / 30

Intervallo di confidenza: media

Come ci si comporta se la varianza σ2 non è nota ma va stimatadai dati?

In quel caso costruiamo l’errore standard a partire dalla varianzacampionaria, ossia:

se =s√n

Anche il margine d’errore sarà allora costruito a partire da questaquantità. Bisogna stabilire come vanno calcolati i valori critici damoltiplicare allo standard error in questo caso.

L’aver introdotto un’ulteriore stima nello standard error aumentala possibilità d’errore e l’approssimazione con la normale non èpiù sufficiente.

8 / 30

Intervallo di confidenza: media

Come ci si comporta se la varianza σ2 non è nota ma va stimatadai dati?

In quel caso costruiamo l’errore standard a partire dalla varianzacampionaria, ossia:

se =s√n

Anche il margine d’errore sarà allora costruito a partire da questaquantità. Bisogna stabilire come vanno calcolati i valori critici damoltiplicare allo standard error in questo caso.L’aver introdotto un’ulteriore stima nello standard error aumentala possibilità d’errore e l’approssimazione con la normale non èpiù sufficiente.

8 / 30

Intervallo di confidenza: media

Consideriamo un campione aleatorio di n osservazione• con media X̄ e deviazione standard S

• estratto da una distribuzione normale con media µ.Allora la variabile

T =X−µ

S/√

n

ha una distribuzione t di Student con n− 1 gradi di libertà(df).

9 / 30

Intervallo di confidenza: media

Consideriamo un campione aleatorio di n osservazione• con media X̄ e deviazione standard S• estratto da una distribuzione normale con media µ.

Allora la variabile

T =X−µ

S/√

n

ha una distribuzione t di Student con n− 1 gradi di libertà(df).

9 / 30

Distribuzione t

La distribuzione t assomiglia alla distribuzione normale stan-dard. Ha una forma a campana ed è centrata sullo 0.

La sua deviazione standard è un po’ più grande di 1, e il suovalore preciso dipende da una quantità detta gradi di libertà,indicata con df.

Quando vogliamo eseguire un’inferenza sulla media di una popo-lazione, i gradi di libertà sono df = n−1, vale a dire un valore parialla dimensione del campione meno uno.

La distribuzione t ha le code più pesanti e una maggiore variabil-ità rispetto alla normale standard. Tuttavia al crescere dei gradidi libertà df , la sua forma si avvicina sempre di più a quella dellanormale standard. Quando df è 30 o più, le due distribuzionisono quasi identiche.

10 / 30

Distribuzione t

La distribuzione t assomiglia alla distribuzione normale stan-dard. Ha una forma a campana ed è centrata sullo 0.

La sua deviazione standard è un po’ più grande di 1, e il suovalore preciso dipende da una quantità detta gradi di libertà,indicata con df.

Quando vogliamo eseguire un’inferenza sulla media di una popo-lazione, i gradi di libertà sono df = n−1, vale a dire un valore parialla dimensione del campione meno uno.

La distribuzione t ha le code più pesanti e una maggiore variabil-ità rispetto alla normale standard. Tuttavia al crescere dei gradidi libertà df , la sua forma si avvicina sempre di più a quella dellanormale standard. Quando df è 30 o più, le due distribuzionisono quasi identiche.

10 / 30

Distribuzione t

La distribuzione t assomiglia alla distribuzione normale stan-dard. Ha una forma a campana ed è centrata sullo 0.

La sua deviazione standard è un po’ più grande di 1, e il suovalore preciso dipende da una quantità detta gradi di libertà,indicata con df.

Quando vogliamo eseguire un’inferenza sulla media di una popo-lazione, i gradi di libertà sono df = n−1, vale a dire un valore parialla dimensione del campione meno uno.

La distribuzione t ha le code più pesanti e una maggiore variabil-ità rispetto alla normale standard. Tuttavia al crescere dei gradidi libertà df , la sua forma si avvicina sempre di più a quella dellanormale standard. Quando df è 30 o più, le due distribuzionisono quasi identiche.

10 / 30

Distribuzione t

La distribuzione t assomiglia alla distribuzione normale stan-dard. Ha una forma a campana ed è centrata sullo 0.

La sua deviazione standard è un po’ più grande di 1, e il suovalore preciso dipende da una quantità detta gradi di libertà,indicata con df.

Quando vogliamo eseguire un’inferenza sulla media di una popo-lazione, i gradi di libertà sono df = n−1, vale a dire un valore parialla dimensione del campione meno uno.

La distribuzione t ha le code più pesanti e una maggiore variabil-ità rispetto alla normale standard. Tuttavia al crescere dei gradidi libertà df , la sua forma si avvicina sempre di più a quella dellanormale standard. Quando df è 30 o più, le due distribuzionisono quasi identiche.

10 / 30

Distribuzione t

11 / 30

Intervallo di confidenza: media (σ 2 non nota

Assunzioni:

• Deviazione standard della popolazione non nota

• Popolazione distribuita normalmente

• Se la popolazione non è distribuita normalmente siutilizzano grandi campioni

In queste situazioni si fa ricorso alla distribuzione t di Student, ecalcoliamo l’intervallo di confidenza come:

x̄− t( α

2 ,n−1)s√n< µ < x̄+ t( α

2 ,n−1)s√n

Dove t( α

2 ,n−1) è il valore critico della distribuzione t con n−1 gradidi libertà che lascia nella coda destra una probabilità pari a α

2 .

12 / 30

Intervallo di confidenza: media (σ 2 non nota

Assunzioni:

• Deviazione standard della popolazione non nota

• Popolazione distribuita normalmente

• Se la popolazione non è distribuita normalmente siutilizzano grandi campioni

In queste situazioni si fa ricorso alla distribuzione t di Student, ecalcoliamo l’intervallo di confidenza come:

x̄− t( α

2 ,n−1)s√n< µ < x̄+ t( α

2 ,n−1)s√n

Dove t( α

2 ,n−1) è il valore critico della distribuzione t con n−1 gradidi libertà che lascia nella coda destra una probabilità pari a α

2 .

12 / 30

Intervallo di confidenza: media (σ 2 non nota

Assunzioni:

• Deviazione standard della popolazione non nota

• Popolazione distribuita normalmente

• Se la popolazione non è distribuita normalmente siutilizzano grandi campioni

In queste situazioni si fa ricorso alla distribuzione t di Student, ecalcoliamo l’intervallo di confidenza come:

x̄− t( α

2 ,n−1)s√n< µ < x̄+ t( α

2 ,n−1)s√n

Dove t( α

2 ,n−1) è il valore critico della distribuzione t con n−1 gradidi libertà che lascia nella coda destra una probabilità pari a α

2 .

12 / 30

Intervallo di confidenza: media (σ 2 non nota

Assunzioni:

• Deviazione standard della popolazione non nota

• Popolazione distribuita normalmente

• Se la popolazione non è distribuita normalmente siutilizzano grandi campioni

In queste situazioni si fa ricorso alla distribuzione t di Student, ecalcoliamo l’intervallo di confidenza come:

x̄− t( α

2 ,n−1)s√n< µ < x̄+ t( α

2 ,n−1)s√n

Dove t( α

2 ,n−1) è il valore critico della distribuzione t con n−1 gradidi libertà che lascia nella coda destra una probabilità pari a α

2 .

12 / 30

Intervallo di confidenza: media (σ 2 non nota

Assunzioni:

• Deviazione standard della popolazione non nota

• Popolazione distribuita normalmente

• Se la popolazione non è distribuita normalmente siutilizzano grandi campioni

In queste situazioni si fa ricorso alla distribuzione t di Student, ecalcoliamo l’intervallo di confidenza come:

x̄− t( α

2 ,n−1)s√n< µ < x̄+ t( α

2 ,n−1)s√n

Dove t( α

2 ,n−1) è il valore critico della distribuzione t con n−1 gradidi libertà che lascia nella coda destra una probabilità pari a α

2 .

12 / 30

Disribuzione tt( α

2 ,n−1) è tale che

P(

t(n−1) > t( α

2 ,n−1)

)=

α

2.

Ad esempio, se α

2 = 0.025 e abbiamo un campione con n = 10allora t( α

2 ,n−1) = t(0.025,9) = 2.262

La tavola contiene all’interno i valori t e non le probabilità.13 / 30

Intervallo di confidenza: esempio

14 / 30

Intervallo confidenza: esempio 2

Supponiamo che nell’esempio sulla piantagione visto sopra, ladeviazione standard per dbh non sia nota ma stimata dal cam-pione come s = 2.09 cm. Ricordiamo che la misura media deldiametro per il campione era x̄ = 12.6 cm. Calcolare l’intervallodi confidenza al 95% e al 99% per la media sconosciuta dellapopolazione.

seX̄ =S√n=

2.09√16

= 0.5225

Se (1−α) = 0.95 allora t( α

2 ,n−1) = t(0.025,15) = 2.13 e

12.6−2.13 ·0.5225 < µ < 12.6+2.13 ·0.5225

11.49 < µ < 13.71

15 / 30

Intervallo confidenza: esempio 2

Supponiamo che nell’esempio sulla piantagione visto sopra, ladeviazione standard per dbh non sia nota ma stimata dal cam-pione come s = 2.09 cm. Ricordiamo che la misura media deldiametro per il campione era x̄ = 12.6 cm. Calcolare l’intervallodi confidenza al 95% e al 99% per la media sconosciuta dellapopolazione.

seX̄ =S√n=

2.09√16

= 0.5225

Se (1−α) = 0.95 allora t( α

2 ,n−1) = t(0.025,15) = 2.13 e

12.6−2.13 ·0.5225 < µ < 12.6+2.13 ·0.5225

11.49 < µ < 13.71

15 / 30

Intervallo confidenza: esempio 2

Supponiamo che nell’esempio sulla piantagione visto sopra, ladeviazione standard per dbh non sia nota ma stimata dal cam-pione come s = 2.09 cm. Ricordiamo che la misura media deldiametro per il campione era x̄ = 12.6 cm. Calcolare l’intervallodi confidenza al 95% e al 99% per la media sconosciuta dellapopolazione.

seX̄ =S√n=

2.09√16

= 0.5225

Se (1−α) = 0.95 allora t( α

2 ,n−1) = t(0.025,15) = 2.13 e

12.6−2.13 ·0.5225 < µ < 12.6+2.13 ·0.5225

11.49 < µ < 13.71

15 / 30

Intervallo confidenza: esempio 2

Supponiamo che nell’esempio sulla piantagione visto sopra, ladeviazione standard per dbh non sia nota ma stimata dal cam-pione come s = 2.09 cm. Ricordiamo che la misura media deldiametro per il campione era x̄ = 12.6 cm. Calcolare l’intervallodi confidenza al 95% e al 99% per la media sconosciuta dellapopolazione.

seX̄ =S√n=

2.09√16

= 0.5225

Se (1−α) = 0.95 allora t( α

2 ,n−1) = t(0.025,15) = 2.13 e

12.6−2.13 ·0.5225 < µ < 12.6+2.13 ·0.5225

11.49 < µ < 13.71

15 / 30

Intervallo confidenza: esempio 2

Supponiamo che nell’esempio sulla piantagione visto sopra, ladeviazione standard per dbh non sia nota ma stimata dal cam-pione come s = 2.09 cm. Ricordiamo che la misura media deldiametro per il campione era x̄ = 12.6 cm. Calcolare l’intervallodi confidenza al 95% e al 99% per la media sconosciuta dellapopolazione.

seX̄ =S√n=

2.09√16

= 0.5225

Se (1−α) = 0.95 allora t( α

2 ,n−1) = t(0.025,15) = 2.13 e

12.6−2.13 ·0.5225 < µ < 12.6+2.13 ·0.5225

11.49 < µ < 13.71

15 / 30

Intervallo confidenza: esempio 2

Se (1−α) = 0.99 allora t( α

2 ,n−1) = t(0.005,15) = 2.95 e

12.6−2.95 ·0.5225 < µ < 12.6+2.95 ·0.5225

11.06 < µ < 14.14

16 / 30

Intervallo confidenza: esempio 2

Se (1−α) = 0.99 allora t( α

2 ,n−1) = t(0.005,15) = 2.95 e

12.6−2.95 ·0.5225 < µ < 12.6+2.95 ·0.5225

11.06 < µ < 14.14

16 / 30

Intervallo confidenza: esempio 2

Se (1−α) = 0.99 allora t( α

2 ,n−1) = t(0.005,15) = 2.95 e

12.6−2.95 ·0.5225 < µ < 12.6+2.95 ·0.5225

11.06 < µ < 14.14

16 / 30

Test d’ipotesi

Il test d’ipotesi o test di significatività è il secondo grande metodoper eseguire inferenze statistiche relative a una popolazione.

Come un intervallo di confidenza per stimare un parametro, iltest d’ipotesi impiega la probabilità per trovare un modo di quan-tificare quanto sia plausibile il valore di un parametro, control-lando al tempo stesso la probabilità di eseguire una inferenzanon corretta.

17 / 30

Test d’ipotesi

Il test d’ipotesi o test di significatività è il secondo grande metodoper eseguire inferenze statistiche relative a una popolazione.

Come un intervallo di confidenza per stimare un parametro, iltest d’ipotesi impiega la probabilità per trovare un modo di quan-tificare quanto sia plausibile il valore di un parametro, control-lando al tempo stesso la probabilità di eseguire una inferenzanon corretta.

17 / 30

Ipotesi statisticaUn’ipotesi è una affermazione (assunzione) circa un parametrodella popolazione. In genere nell’affermazione si dichiara cheun parametro assume un particolare valore numerico, oppureche è compreso in un certo intervallo di valori:

• media della popolazione

Esempio: Il tempo di vita medio di una tartaruga marinaCaretta Caretta è di 40 anni, oppure il tempo di vita mediodi una Caretta Caretta è compreso fra i 30 e i 60 anni..

• proporzione della popolazione

Esempio: Nel Mediterraneo la proporzione di tartarughemarine tartarughe che muoiono dopo essere statecatturate da attrezzi di pesca risulta p = 0.26.

L’ipotesi si riferisce sempre al parametro della popolazione e maialla statistica campionaria.

18 / 30

Ipotesi statisticaUn’ipotesi è una affermazione (assunzione) circa un parametrodella popolazione. In genere nell’affermazione si dichiara cheun parametro assume un particolare valore numerico, oppureche è compreso in un certo intervallo di valori:

• media della popolazione

Esempio: Il tempo di vita medio di una tartaruga marinaCaretta Caretta è di 40 anni, oppure il tempo di vita mediodi una Caretta Caretta è compreso fra i 30 e i 60 anni..

• proporzione della popolazione

Esempio: Nel Mediterraneo la proporzione di tartarughemarine tartarughe che muoiono dopo essere statecatturate da attrezzi di pesca risulta p = 0.26.

L’ipotesi si riferisce sempre al parametro della popolazione e maialla statistica campionaria.

18 / 30

Ipotesi statisticaUn’ipotesi è una affermazione (assunzione) circa un parametrodella popolazione. In genere nell’affermazione si dichiara cheun parametro assume un particolare valore numerico, oppureche è compreso in un certo intervallo di valori:

• media della popolazione

Esempio: Il tempo di vita medio di una tartaruga marinaCaretta Caretta è di 40 anni, oppure il tempo di vita mediodi una Caretta Caretta è compreso fra i 30 e i 60 anni..

• proporzione della popolazione

Esempio: Nel Mediterraneo la proporzione di tartarughemarine tartarughe che muoiono dopo essere statecatturate da attrezzi di pesca risulta p = 0.26.

L’ipotesi si riferisce sempre al parametro della popolazione e maialla statistica campionaria.

18 / 30

Ipotesi statisticaUn’ipotesi è una affermazione (assunzione) circa un parametrodella popolazione. In genere nell’affermazione si dichiara cheun parametro assume un particolare valore numerico, oppureche è compreso in un certo intervallo di valori:

• media della popolazione

Esempio: Il tempo di vita medio di una tartaruga marinaCaretta Caretta è di 40 anni, oppure il tempo di vita mediodi una Caretta Caretta è compreso fra i 30 e i 60 anni..

• proporzione della popolazione

Esempio: Nel Mediterraneo la proporzione di tartarughemarine tartarughe che muoiono dopo essere statecatturate da attrezzi di pesca risulta p = 0.26.

L’ipotesi si riferisce sempre al parametro della popolazione e maialla statistica campionaria.

18 / 30

Test d’ipotesi: esempio

Si vuole verificare se le lattine di caffè confezionate automati-camente da una ditta contengono in media il peso dichiaratoµ = 250 g. A tale scopo si estrae un campione di 30 lattine, sene pesa il contenuto e si calcola il peso medio, per stabilire se ilpeso medio differisce da 250g

19 / 30

Test d’ipotesi

La verifica delle ipotesi statistiche inizia con la definizione delproblema in termini di ipotesi sul parametro oggetto di studio.

Per prima cosa si stabilisce l’ipotesi da sottoporre a test, dettaipotesi nulla, indicata con H0. Con l’ipotesi nulla si afferma cheil parametro assume un particolare valore.

Oltre all’ipotesi nulla occorre specificare anche un’adeguata ipotesialternativa, indicata con Ha, ossia un’affermazione che contrad-dice l’ipotesi nulla. Si afferma che il valore del parametro è unotra quelli presenti in un certo intervallo di valori alternativi.

20 / 30

Test d’ipotesi

La verifica delle ipotesi statistiche inizia con la definizione delproblema in termini di ipotesi sul parametro oggetto di studio.

Per prima cosa si stabilisce l’ipotesi da sottoporre a test, dettaipotesi nulla, indicata con H0. Con l’ipotesi nulla si afferma cheil parametro assume un particolare valore.

Oltre all’ipotesi nulla occorre specificare anche un’adeguata ipotesialternativa, indicata con Ha, ossia un’affermazione che contrad-dice l’ipotesi nulla. Si afferma che il valore del parametro è unotra quelli presenti in un certo intervallo di valori alternativi.

20 / 30

Test d’ipotesi

La verifica delle ipotesi statistiche inizia con la definizione delproblema in termini di ipotesi sul parametro oggetto di studio.

Per prima cosa si stabilisce l’ipotesi da sottoporre a test, dettaipotesi nulla, indicata con H0. Con l’ipotesi nulla si afferma cheil parametro assume un particolare valore.

Oltre all’ipotesi nulla occorre specificare anche un’adeguata ipotesialternativa, indicata con Ha, ossia un’affermazione che contrad-dice l’ipotesi nulla. Si afferma che il valore del parametro è unotra quelli presenti in un certo intervallo di valori alternativi.

20 / 30

Test d’ipotesi: esempio

Si vuole verificare se le lattine di caffè confezionate automati-camente da una ditta contengono in media il peso dichiaratoµ = 250 g. A tale scopo si estrae un campione di 30 lattine, sene pesa il contenuto e si calcola il peso medio, per stabilire se ilpeso medio differisce da 250g.

Il tutto viene tradotto come:{H0 : µ = 250Ha : µ 6= 250

21 / 30

Test d’ipotesi: esempio

Si vuole verificare se le lattine di caffè confezionate automati-camente da una ditta contengono in media il peso dichiaratoµ = 250 g. A tale scopo si estrae un campione di 30 lattine, sene pesa il contenuto e si calcola il peso medio, per stabilire se ilpeso medio differisce da 250g.

Il tutto viene tradotto come:{H0 : µ = 250Ha : µ 6= 250

21 / 30

Test d’ipotesi

• In un test d’ipotesi, si presume che l’ipotesi nulla sia vera ameno che i dati non producano forti evidenze contro di essa.

L’ipotesi nulla è posta con lo scopo di essere screditata, quindiciò che si oppone alla conclusione che il ricercatore cerca diraggiungere rappresenta l’ipotesi nulla.• Il ricercatore afferma che a essere vera è l’ipotesi alterna-tiva. Nell’ipotesi alternativa viene messo ciò che si spera o ci siaspetta di poter concludere come risultato del test.• Nell’ipotesi nulla deve sempre comparire un segno di uguaglianza(=,≥,≤).• Le due ipotesi sono complementari, ossia considerate in-sieme esauriscono tutte le possibilità riguardanti il valore chepuò assumere il parametro in esame.

22 / 30

Test d’ipotesi

• In un test d’ipotesi, si presume che l’ipotesi nulla sia vera ameno che i dati non producano forti evidenze contro di essa.L’ipotesi nulla è posta con lo scopo di essere screditata, quindiciò che si oppone alla conclusione che il ricercatore cerca diraggiungere rappresenta l’ipotesi nulla.

• Il ricercatore afferma che a essere vera è l’ipotesi alterna-tiva. Nell’ipotesi alternativa viene messo ciò che si spera o ci siaspetta di poter concludere come risultato del test.• Nell’ipotesi nulla deve sempre comparire un segno di uguaglianza(=,≥,≤).• Le due ipotesi sono complementari, ossia considerate in-sieme esauriscono tutte le possibilità riguardanti il valore chepuò assumere il parametro in esame.

22 / 30

Test d’ipotesi

• In un test d’ipotesi, si presume che l’ipotesi nulla sia vera ameno che i dati non producano forti evidenze contro di essa.L’ipotesi nulla è posta con lo scopo di essere screditata, quindiciò che si oppone alla conclusione che il ricercatore cerca diraggiungere rappresenta l’ipotesi nulla.• Il ricercatore afferma che a essere vera è l’ipotesi alterna-tiva.

Nell’ipotesi alternativa viene messo ciò che si spera o ci siaspetta di poter concludere come risultato del test.• Nell’ipotesi nulla deve sempre comparire un segno di uguaglianza(=,≥,≤).• Le due ipotesi sono complementari, ossia considerate in-sieme esauriscono tutte le possibilità riguardanti il valore chepuò assumere il parametro in esame.

22 / 30

Test d’ipotesi

• In un test d’ipotesi, si presume che l’ipotesi nulla sia vera ameno che i dati non producano forti evidenze contro di essa.L’ipotesi nulla è posta con lo scopo di essere screditata, quindiciò che si oppone alla conclusione che il ricercatore cerca diraggiungere rappresenta l’ipotesi nulla.• Il ricercatore afferma che a essere vera è l’ipotesi alterna-tiva. Nell’ipotesi alternativa viene messo ciò che si spera o ci siaspetta di poter concludere come risultato del test.

• Nell’ipotesi nulla deve sempre comparire un segno di uguaglianza(=,≥,≤).• Le due ipotesi sono complementari, ossia considerate in-sieme esauriscono tutte le possibilità riguardanti il valore chepuò assumere il parametro in esame.

22 / 30

Test d’ipotesi

• In un test d’ipotesi, si presume che l’ipotesi nulla sia vera ameno che i dati non producano forti evidenze contro di essa.L’ipotesi nulla è posta con lo scopo di essere screditata, quindiciò che si oppone alla conclusione che il ricercatore cerca diraggiungere rappresenta l’ipotesi nulla.• Il ricercatore afferma che a essere vera è l’ipotesi alterna-tiva. Nell’ipotesi alternativa viene messo ciò che si spera o ci siaspetta di poter concludere come risultato del test.• Nell’ipotesi nulla deve sempre comparire un segno di uguaglianza(=,≥,≤).

• Le due ipotesi sono complementari, ossia considerate in-sieme esauriscono tutte le possibilità riguardanti il valore chepuò assumere il parametro in esame.

22 / 30

Test d’ipotesi

• In un test d’ipotesi, si presume che l’ipotesi nulla sia vera ameno che i dati non producano forti evidenze contro di essa.L’ipotesi nulla è posta con lo scopo di essere screditata, quindiciò che si oppone alla conclusione che il ricercatore cerca diraggiungere rappresenta l’ipotesi nulla.• Il ricercatore afferma che a essere vera è l’ipotesi alterna-tiva. Nell’ipotesi alternativa viene messo ciò che si spera o ci siaspetta di poter concludere come risultato del test.• Nell’ipotesi nulla deve sempre comparire un segno di uguaglianza(=,≥,≤).• Le due ipotesi sono complementari, ossia considerate in-sieme esauriscono tutte le possibilità riguardanti il valore chepuò assumere il parametro in esame.

22 / 30

Test d’ipotesi

Si può fare un’analogia con quanto avviene in un’auladi tribunale,quando una giuria deve decidere sulla colpevolezza o sull’innocenzadi un imputato.

L’ipotesi nulla, che corrisponde all’assenza di un effetto, è chel’imputato sia innocente.

L’ipotesi alternativa è che l’imputato sia colpevole.

La giuria considera l’imputato innocente a meno che chi l’accusanon produca una forte evidenza a favore della sua colpevolezza.L’accusatore deve convincere la giuria che l’imputato sia colpev-ole.

23 / 30

Test d’ipotesi

Si può fare un’analogia con quanto avviene in un’auladi tribunale,quando una giuria deve decidere sulla colpevolezza o sull’innocenzadi un imputato.

L’ipotesi nulla, che corrisponde all’assenza di un effetto, è chel’imputato sia innocente.

L’ipotesi alternativa è che l’imputato sia colpevole.

La giuria considera l’imputato innocente a meno che chi l’accusanon produca una forte evidenza a favore della sua colpevolezza.L’accusatore deve convincere la giuria che l’imputato sia colpev-ole.

23 / 30

Test d’ipotesi

Si può fare un’analogia con quanto avviene in un’auladi tribunale,quando una giuria deve decidere sulla colpevolezza o sull’innocenzadi un imputato.

L’ipotesi nulla, che corrisponde all’assenza di un effetto, è chel’imputato sia innocente.

L’ipotesi alternativa è che l’imputato sia colpevole.

La giuria considera l’imputato innocente a meno che chi l’accusanon produca una forte evidenza a favore della sua colpevolezza.L’accusatore deve convincere la giuria che l’imputato sia colpev-ole.

23 / 30

Test d’ipotesi

Si può fare un’analogia con quanto avviene in un’auladi tribunale,quando una giuria deve decidere sulla colpevolezza o sull’innocenzadi un imputato.

L’ipotesi nulla, che corrisponde all’assenza di un effetto, è chel’imputato sia innocente.

L’ipotesi alternativa è che l’imputato sia colpevole.

La giuria considera l’imputato innocente a meno che chi l’accusanon produca una forte evidenza a favore della sua colpevolezza.L’accusatore deve convincere la giuria che l’imputato sia colpev-ole.

23 / 30

Test d’ipotesi

Il contenuto dichiarato dal produttore delle bottiglie di acqua min-erale di una certa marca è 920ml. Un’associazione di consuma-tori sostiene che in realtà le bottiglie contengono in media unaquantità inferiore di acqua.

In questo caso le ipotesi sono{H0 : µ ≥ 920Ha : µ < 920

24 / 30

Test d’ipotesi

Il contenuto dichiarato dal produttore delle bottiglie di acqua min-erale di una certa marca è 920ml. Un’associazione di consuma-tori sostiene che in realtà le bottiglie contengono in media unaquantità inferiore di acqua.

In questo caso le ipotesi sono{H0 : µ ≥ 920Ha : µ < 920

24 / 30

Test d’ipotesi

Le possibili conclusioni per un test di ipotesi sono:

1) se l’ipotesi nulla H0 è rifiutata, si conclude che l’ipotesialternativa Ha è probabilmente vera;

2) se l’ipotesi nulla non è rifiutata si conclude che i dati nonforniscono una sufficiente evidenza per sostenere l’ipotesialternativa.

E’ importante sottolineare che con la verifica delle ipotesi, e ingenerale con l’inferenza statistica, non si arriva alla dimostrazionedi un’ipotesi; si ha solo un’indicazione del fatto che l’ipotesi siao meno avvalorata dai dati disponibili.

25 / 30

Test d’ipotesi

Le possibili conclusioni per un test di ipotesi sono:

1) se l’ipotesi nulla H0 è rifiutata, si conclude che l’ipotesialternativa Ha è probabilmente vera;

2) se l’ipotesi nulla non è rifiutata si conclude che i dati nonforniscono una sufficiente evidenza per sostenere l’ipotesialternativa.

E’ importante sottolineare che con la verifica delle ipotesi, e ingenerale con l’inferenza statistica, non si arriva alla dimostrazionedi un’ipotesi; si ha solo un’indicazione del fatto che l’ipotesi siao meno avvalorata dai dati disponibili.

25 / 30

Test d’ipotesi

Le possibili conclusioni per un test di ipotesi sono:

1) se l’ipotesi nulla H0 è rifiutata, si conclude che l’ipotesialternativa Ha è probabilmente vera;

2) se l’ipotesi nulla non è rifiutata si conclude che i dati nonforniscono una sufficiente evidenza per sostenere l’ipotesialternativa.

E’ importante sottolineare che con la verifica delle ipotesi, e ingenerale con l’inferenza statistica, non si arriva alla dimostrazionedi un’ipotesi; si ha solo un’indicazione del fatto che l’ipotesi siao meno avvalorata dai dati disponibili.

25 / 30

Statistica test

Dopo aver formulato le ipotesi, occorre specificare quale risul-tato del campione porterà al rifiuto dell’ipotesi nulla.

Per poterlo fare si definisce una statistica test.

Il parametro al quale le ipotesi fanno riferimento, viene stimatopuntualmente a partire dai dati. Una statistica test descrivequanto la stima puntuale si colloca lontano dal valore del parametrospecificato nell’ipotesi nulla. Può assumere tanti valori quantisono i possibili campioni estraibili dalla popolazione.

In generale la distanza descritta dalla statistica test è misuratacome numero di errori standard intercorrenti tra la stima pun-tuale e il parametro.

26 / 30

Statistica test

Dopo aver formulato le ipotesi, occorre specificare quale risul-tato del campione porterà al rifiuto dell’ipotesi nulla.

Per poterlo fare si definisce una statistica test.

Il parametro al quale le ipotesi fanno riferimento, viene stimatopuntualmente a partire dai dati. Una statistica test descrivequanto la stima puntuale si colloca lontano dal valore del parametrospecificato nell’ipotesi nulla. Può assumere tanti valori quantisono i possibili campioni estraibili dalla popolazione.

In generale la distanza descritta dalla statistica test è misuratacome numero di errori standard intercorrenti tra la stima pun-tuale e il parametro.

26 / 30

Statistica test

Dopo aver formulato le ipotesi, occorre specificare quale risul-tato del campione porterà al rifiuto dell’ipotesi nulla.

Per poterlo fare si definisce una statistica test.

Il parametro al quale le ipotesi fanno riferimento, viene stimatopuntualmente a partire dai dati. Una statistica test descrivequanto la stima puntuale si colloca lontano dal valore del parametrospecificato nell’ipotesi nulla. Può assumere tanti valori quantisono i possibili campioni estraibili dalla popolazione.

In generale la distanza descritta dalla statistica test è misuratacome numero di errori standard intercorrenti tra la stima pun-tuale e il parametro.

26 / 30

Statistica test

La distribuzione di campionamento della statistica test ,̀ di solito,una distribuzione nota, come la distribuzione normale o la dis-tribuzione t, e ricorriamo a queste distribuzioni per sottoporre averifica un’ipotesi nulla.

Utilizzando le proprietà della distribuzione di campionamentodella statistica soggetta a test, si può identificare un intervallodi valori di quella statistica che verosimilmente non si presen-tano se l’ipotesi nulla è vera.

27 / 30

Statistica test

La distribuzione di campionamento della statistica test ,̀ di solito,una distribuzione nota, come la distribuzione normale o la dis-tribuzione t, e ricorriamo a queste distribuzioni per sottoporre averifica un’ipotesi nulla.

Utilizzando le proprietà della distribuzione di campionamentodella statistica soggetta a test, si può identificare un intervallodi valori di quella statistica che verosimilmente non si presen-tano se l’ipotesi nulla è vera.

27 / 30

Statistica test

La distribuzione di campionamento della statistica test ,̀ di solito,una distribuzione nota, come la distribuzione normale o la dis-tribuzione t, e ricorriamo a queste distribuzioni per sottoporre averifica un’ipotesi nulla.

Utilizzando le proprietà della distribuzione di campionamentodella statistica soggetta a test, si può identificare un intervallodi valori di quella statistica che verosimilmente non si presen-tano se l’ipotesi nulla è vera.

27 / 30

Statistica test

La distribuzione di campionamento della statistica test è divisain due regioni:

1) una regione di rifiuto che corrisponde all’insieme deivalori di una statistica test che conducono al rifiutodell’ipotesi nulla;

2) una regione di accettazione che corrisponde all’insiemedei valori di una statistica testche portano inveceall’accettazione dell’ipotesi nulla.

Le due regioni sono, delimitate da uno o più valori, detti valoricritici.Se la statistica test, in base ai dati del campione, assume unvalore che cade nella regione di rifiuto, l’ipotesi nulla deve es-sere rifiutata; se al contrario il valore cade nella regione di ac-cettazione, l’ipotesi nulla non può essere rifiutata.

28 / 30

Statistica test

La distribuzione di campionamento della statistica test è divisain due regioni:

1) una regione di rifiuto che corrisponde all’insieme deivalori di una statistica test che conducono al rifiutodell’ipotesi nulla;

2) una regione di accettazione che corrisponde all’insiemedei valori di una statistica testche portano inveceall’accettazione dell’ipotesi nulla.

Le due regioni sono, delimitate da uno o più valori, detti valoricritici.Se la statistica test, in base ai dati del campione, assume unvalore che cade nella regione di rifiuto, l’ipotesi nulla deve es-sere rifiutata; se al contrario il valore cade nella regione di ac-cettazione, l’ipotesi nulla non può essere rifiutata.

28 / 30

Statistica test

La distribuzione di campionamento della statistica test è divisain due regioni:

1) una regione di rifiuto che corrisponde all’insieme deivalori di una statistica test che conducono al rifiutodell’ipotesi nulla;

2) una regione di accettazione che corrisponde all’insiemedei valori di una statistica testche portano inveceall’accettazione dell’ipotesi nulla.

Le due regioni sono, delimitate da uno o più valori, detti valoricritici.

Se la statistica test, in base ai dati del campione, assume unvalore che cade nella regione di rifiuto, l’ipotesi nulla deve es-sere rifiutata; se al contrario il valore cade nella regione di ac-cettazione, l’ipotesi nulla non può essere rifiutata.

28 / 30

Statistica test

La distribuzione di campionamento della statistica test è divisain due regioni:

1) una regione di rifiuto che corrisponde all’insieme deivalori di una statistica test che conducono al rifiutodell’ipotesi nulla;

2) una regione di accettazione che corrisponde all’insiemedei valori di una statistica testche portano inveceall’accettazione dell’ipotesi nulla.

Le due regioni sono, delimitate da uno o più valori, detti valoricritici.Se la statistica test, in base ai dati del campione, assume unvalore che cade nella regione di rifiuto, l’ipotesi nulla deve es-sere rifiutata; se al contrario il valore cade nella regione di ac-cettazione, l’ipotesi nulla non può essere rifiutata.

28 / 30

Statistica test

I test di ipotesi possono essere classificati in due gruppi:1) test a una coda (o test unilaterale): la regione di

rifiuto è costituita da un intervallo. per un test a unacoda nell’ipotesi alternativa compare uno dei segni >oppure <.

2) test a due code (o test bilaterale): la regione dirifiuto è costituita da due intervalli, ossia da due codedella distribuzione. Per un test a due code nell’ipotesialternativa compare il segno 6=.

29 / 30

Statistica test

I test di ipotesi possono essere classificati in due gruppi:1) test a una coda (o test unilaterale): la regione di

rifiuto è costituita da un intervallo. per un test a unacoda nell’ipotesi alternativa compare uno dei segni >oppure <.

2) test a due code (o test bilaterale): la regione dirifiuto è costituita da due intervalli, ossia da due codedella distribuzione. Per un test a due code nell’ipotesialternativa compare il segno 6=.

29 / 30

SignificativitàI valori della statistica test che definiscono la regione di rifiutosono definiti a partire dal livello di significatività α del test.

I livelli di significatività usualmente considerati sono α = 0.1, α =0.05 o α = 0.01.

30 / 30

SignificativitàI valori della statistica test che definiscono la regione di rifiutosono definiti a partire dal livello di significatività α del test.I livelli di significatività usualmente considerati sono α = 0.1, α =0.05 o α = 0.01.

30 / 30

SignificativitàI valori della statistica test che definiscono la regione di rifiutosono definiti a partire dal livello di significatività α del test.I livelli di significatività usualmente considerati sono α = 0.1, α =0.05 o α = 0.01.

30 / 30