CONFRONTO DI GRUPPI - people.unica.itpeople.unica.it/silviacolumbu/files/2017/12/lezione20.pdf ·...

70
CONFRONTO DI GRUPPI 1 / 28

Transcript of CONFRONTO DI GRUPPI - people.unica.itpeople.unica.it/silviacolumbu/files/2017/12/lezione20.pdf ·...

CONFRONTO DI GRUPPI

1 / 28

Confronto di due gruppi

Molto spesso in una ricerca si è interessati a due popolazioni;in particolare si vuole studiare la differenza fra le medie di duepopolazioni: in un’indagine, per esempio, si può cercare di sta-bilire se le medie di due popolazioni sono diverse oppure sivuole stimare la grandezza della differenza fra le medie di duepopolazioni.

La maggior parte degli studi in cui si confrontano due gruppiimpiegano campioni indipendenti estratti da due popolazioni di-verse. Le osservazioni in un campione sono indipendenti daquelle nell’altro campione.In ricerche di questo genere è necessario conoscere le propri-età della distribuzione di campionamento della differenza fra duemedie.

2 / 28

Confronto di due gruppi

Molto spesso in una ricerca si è interessati a due popolazioni;in particolare si vuole studiare la differenza fra le medie di duepopolazioni: in un’indagine, per esempio, si può cercare di sta-bilire se le medie di due popolazioni sono diverse oppure sivuole stimare la grandezza della differenza fra le medie di duepopolazioni.La maggior parte degli studi in cui si confrontano due gruppiimpiegano campioni indipendenti estratti da due popolazioni di-verse. Le osservazioni in un campione sono indipendenti daquelle nell’altro campione.

In ricerche di questo genere è necessario conoscere le propri-età della distribuzione di campionamento della differenza fra duemedie.

2 / 28

Confronto di due gruppi

Molto spesso in una ricerca si è interessati a due popolazioni;in particolare si vuole studiare la differenza fra le medie di duepopolazioni: in un’indagine, per esempio, si può cercare di sta-bilire se le medie di due popolazioni sono diverse oppure sivuole stimare la grandezza della differenza fra le medie di duepopolazioni.La maggior parte degli studi in cui si confrontano due gruppiimpiegano campioni indipendenti estratti da due popolazioni di-verse. Le osservazioni in un campione sono indipendenti daquelle nell’altro campione.In ricerche di questo genere è necessario conoscere le propri-età della distribuzione di campionamento della differenza fra duemedie.

2 / 28

Confronto di due gruppi

Molto spesso in una ricerca si è interessati a due popolazioni;in particolare si vuole studiare la differenza fra le medie di duepopolazioni: in un’indagine, per esempio, si può cercare di sta-bilire se le medie di due popolazioni sono diverse oppure sivuole stimare la grandezza della differenza fra le medie di duepopolazioni.La maggior parte degli studi in cui si confrontano due gruppiimpiegano campioni indipendenti estratti da due popolazioni di-verse. Le osservazioni in un campione sono indipendenti daquelle nell’altro campione.In ricerche di questo genere è necessario conoscere le propri-età della distribuzione di campionamento della differenza fra duemedie.

2 / 28

Confronto di due gruppi

Date due distribuzioni vale la seguente proprietà:

se le distribuzioni di due variabili casuali indipendenti hanno lemedie µ1 e µ2 e varianze σ2

1 e σ22 , allora la distribuzione della

loro differenza ha la media µ1−µ2 e la varianza σ21 +σ2

2 .

3 / 28

Confronto di due gruppi

Date due distribuzioni vale la seguente proprietà:

se le distribuzioni di due variabili casuali indipendenti hanno lemedie µ1 e µ2 e varianze σ2

1 e σ22 , allora la distribuzione della

loro differenza ha la media µ1−µ2 e la varianza σ21 +σ2

2 .

3 / 28

Confronto di due gruppi

Date due popolazioni aventi distribuzioni normale, si estragganoda esse campioni di ampiezza rispettivamente n1 e n2; indicandocon X̄1 e X̄2 le due medie campionarie, in base alle proprietàdella media campionaria possiamo affermare che X̄1 e X̄2 hannoentrambe distribuzione normale con medie rispettivamente µ1 eµ2 e varianze σ2

1n1

e σ22

n2; lo stesso risultato vale, almeno approssi-

mativamente, per grandi campioni estratti da popolazioni nonaventi la distribuzione normale.

In entrambi i casi, la differenza X̄1− X̄2 ha, almeno approssima-tivamente, distribuzione normale, con media µ1− µ2 e varianzaσ2

1n1

+σ2

2n2

.

4 / 28

Confronto di due gruppi

Date due popolazioni aventi distribuzioni normale, si estragganoda esse campioni di ampiezza rispettivamente n1 e n2; indicandocon X̄1 e X̄2 le due medie campionarie, in base alle proprietàdella media campionaria possiamo affermare che X̄1 e X̄2 hannoentrambe distribuzione normale con medie rispettivamente µ1 eµ2 e varianze σ2

1n1

e σ22

n2; lo stesso risultato vale, almeno approssi-

mativamente, per grandi campioni estratti da popolazioni nonaventi la distribuzione normale.

In entrambi i casi, la differenza X̄1− X̄2 ha, almeno approssima-tivamente, distribuzione normale, con media µ1− µ2 e varianzaσ2

1n1

+σ2

2n2

.

4 / 28

Confronto di due gruppi: varianze note

Date due popolazioni le cui varianze σ21 e σ2

2 sono note possi-amo considerare la seguente statistica Z per costruire intervallodi confidenza e test di significatività nel confronto delle medie:

Z =(X̄1− X̄2)− (µ1−µ2)√

σ21

n1+

σ22

n2

∼ N(0,1)

5 / 28

Intervallo di confidenza varianze note

Considerati due campioni di ampiezza rispettivamente n1 e n2ecalcolati i valori delle medie dei due campioni, si ottiene il seguenteintervallo di confidenza per la differenza delle medie µ1−µ2 conlivello di confidenza (1−α):

(x̄1− x̄2)−z α

2

√σ21

n1+

σ22

n2

< µ1−µ2 < (x̄1− x̄2)+z α

2

√σ21

n1+

σ22

n2

6 / 28

Intervallo di confidenza varianze note

Come interpretare l’intervallo di confidenza per la differenza tradue medie:

7 / 28

Intervallo di confidenza varianze noteCome interpretare l’intervallo di confidenza per la differenza tra duemedie:

• se l’intervallo di confidenza contiene lo zero (ossia l’estremoinferiore risulta negativo mentre quello superiore positivo) alloraè plausibile che la differenza tra le due medie sia nulla, ossiache µ1 = µ2 con una confidenza del (1−α)%;

• se l’intervallo di confidenza è positivo (ossia l’estremo inferiore equello superiore sono entrambi positivi) allora è plausibile che lamedia nel gruppo denotato con 1 sia maggiore rispetto a quelladel gruppo 2, ossia che µ1 > µ2 con una confidenza del(1−α)%;

• se l’intervallo di confidenza è negativo (ossia l’estremo inferioree quello superiore sono entrambi negativi) allora è plausibileche la media nel gruppo denotato con 1 sia minore rispetto aquella del gruppo 2, ossia che µ1 < µ2 con una confidenza del(1−α)%.

8 / 28

Intervallo di confidenza varianze noteCome interpretare l’intervallo di confidenza per la differenza tra duemedie:

• se l’intervallo di confidenza contiene lo zero (ossia l’estremoinferiore risulta negativo mentre quello superiore positivo) alloraè plausibile che la differenza tra le due medie sia nulla, ossiache µ1 = µ2 con una confidenza del (1−α)%;

• se l’intervallo di confidenza è positivo (ossia l’estremo inferiore equello superiore sono entrambi positivi) allora è plausibile che lamedia nel gruppo denotato con 1 sia maggiore rispetto a quelladel gruppo 2, ossia che µ1 > µ2 con una confidenza del(1−α)%;

• se l’intervallo di confidenza è negativo (ossia l’estremo inferioree quello superiore sono entrambi negativi) allora è plausibileche la media nel gruppo denotato con 1 sia minore rispetto aquella del gruppo 2, ossia che µ1 < µ2 con una confidenza del(1−α)%.

8 / 28

Intervallo di confidenza varianze noteCome interpretare l’intervallo di confidenza per la differenza tra duemedie:

• se l’intervallo di confidenza contiene lo zero (ossia l’estremoinferiore risulta negativo mentre quello superiore positivo) alloraè plausibile che la differenza tra le due medie sia nulla, ossiache µ1 = µ2 con una confidenza del (1−α)%;

• se l’intervallo di confidenza è positivo (ossia l’estremo inferiore equello superiore sono entrambi positivi) allora è plausibile che lamedia nel gruppo denotato con 1 sia maggiore rispetto a quelladel gruppo 2, ossia che µ1 > µ2 con una confidenza del(1−α)%;

• se l’intervallo di confidenza è negativo (ossia l’estremo inferioree quello superiore sono entrambi negativi) allora è plausibileche la media nel gruppo denotato con 1 sia minore rispetto aquella del gruppo 2, ossia che µ1 < µ2 con una confidenza del(1−α)%.

8 / 28

Test d’ipotesi varianze note

Per confrontare le medie di due popolazioni si può anche farericorso a un test di significatività per l’ipotesi nulla di uguaglianzadelle medie nei due gruppi:

H0 : µ1 = µ2

che alternativamente possiamo anche scrivere come

H0 : µ1−µ2 = 0

9 / 28

Test d’ipotesi varianza nota

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Nota la varianza della distribuzione nelle due popolazioni;

allora la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

10 / 28

Test d’ipotesi varianza nota

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Nota la varianza della distribuzione nelle due popolazioni;

allora la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

10 / 28

Test d’ipotesi varianza nota

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Nota la varianza della distribuzione nelle due popolazioni;

allora la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

10 / 28

Test d’ipotesi varianza nota

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Nota la varianza della distribuzione nelle due popolazioni;

allora la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

10 / 28

Test d’ipotesi varianza nota

Data la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

definiamo che per il test sull’uguaglianza delle medie bilaterale:{H0 : µ1 = µ2

Ha : µ1 6= µ2

fissato un livellodi significatività α ,la regola di decisione é:

Rifiutare H0 se z =(x̄1− x̄2)−0√

σ21

n1+

σ22

n2

<−z α

2o z =

(x̄1− x̄2)−0√σ2

1n1

+σ2

2n2

> z α

2

11 / 28

Test d’ipotesi varianza nota

Data la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

definiamo che per il test sull’uguaglianza delle medie bilaterale:{H0 : µ1 = µ2

Ha : µ1 6= µ2

fissato un livellodi significatività α ,la regola di decisione é:

Rifiutare H0 se z =(x̄1− x̄2)−0√

σ21

n1+

σ22

n2

<−z α

2o z =

(x̄1− x̄2)−0√σ2

1n1

+σ2

2n2

> z α

2

11 / 28

Test d’ipotesi varianza nota

Data la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ1 = µ2

Ha : µ1 > µ2

fissato un livellodi significatività α, la regola di decisione é:

Rifiutare H0 se z =(x̄1− x̄2)−0√

σ21

n1+

σ22

n2

> zα

12 / 28

Test d’ipotesi varianza nota

Data la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ1 = µ2

Ha : µ1 > µ2

fissato un livellodi significatività α, la regola di decisione é:

Rifiutare H0 se z =(x̄1− x̄2)−0√

σ21

n1+

σ22

n2

> zα

12 / 28

Test d’ipotesi varianza nota

Data la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ1 = µ2

Ha : µ1 < µ2

fissato un livellodi significatività α, la regola di decisione è:

Rifiutare H0 se z =(x̄1− x̄2)−0√

σ21

n1+

σ22

n2

<−zα

13 / 28

Test d’ipotesi varianza nota

Data la statistica

Z =(X̄1− X̄2)−0√

σ21

n1+

σ22

n2

definiamo che per il test sulle medie unilaterale del tipo:{H0 : µ1 = µ2

Ha : µ1 < µ2

fissato un livellodi significatività α, la regola di decisione è:

Rifiutare H0 se z =(x̄1− x̄2)−0√

σ21

n1+

σ22

n2

<−zα

13 / 28

Test d’ipotesi varianza nota

Il p-value del test è determinato come la probabilità di osservare,se è vera l’ipotesi nulla, valori della statistica z ancora più estremidi quello osservato.Sarà calcolato come:

a) l’area sottesa alle due code della distribuzione Z delimitatadai valori con segno della statistica calcolata sui dati peripotesi alternativa bilaterale

b) l’area sottesa alla coda destra della distribuzione Zdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di maggiorazione

b) l’area sottesa alla coda sinistra della distribuzione Zdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di minorazione.

14 / 28

Test d’ipotesi varianza nota

Il p-value del test è determinato come la probabilità di osservare,se è vera l’ipotesi nulla, valori della statistica z ancora più estremidi quello osservato.Sarà calcolato come:

a) l’area sottesa alle due code della distribuzione Z delimitatadai valori con segno della statistica calcolata sui dati peripotesi alternativa bilaterale

b) l’area sottesa alla coda destra della distribuzione Zdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di maggiorazione

b) l’area sottesa alla coda sinistra della distribuzione Zdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di minorazione.

14 / 28

Test d’ipotesi varianza nota

Il p-value del test è determinato come la probabilità di osservare,se è vera l’ipotesi nulla, valori della statistica z ancora più estremidi quello osservato.Sarà calcolato come:

a) l’area sottesa alle due code della distribuzione Z delimitatadai valori con segno della statistica calcolata sui dati peripotesi alternativa bilaterale

b) l’area sottesa alla coda destra della distribuzione Zdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di maggiorazione

b) l’area sottesa alla coda sinistra della distribuzione Zdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di minorazione.

14 / 28

Confronto di due gruppi: varianze incognite

Se le varianze delle due popolazioni non sono note possiamoconsiderarne una stima: s1 per σ1 e s2 per σ2. L’incertezza in-trodotta dall’utilizzo delle deviazioni standard campionarie richiedeche si consideri la statistica con distribuzione t-Student. Bisognainoltre distinguere due casi:

a) varianze delle popolazioni diverse s21 6= s2

2;

b) varianze delle popolazioni uguali s21 = s2

2.

15 / 28

Confronto di due gruppi: varianze incognite

Se le varianze delle due popolazioni non sono note possiamoconsiderarne una stima: s1 per σ1 e s2 per σ2. L’incertezza in-trodotta dall’utilizzo delle deviazioni standard campionarie richiedeche si consideri la statistica con distribuzione t-Student. Bisognainoltre distinguere due casi:

a) varianze delle popolazioni diverse s21 6= s2

2;

b) varianze delle popolazioni uguali s21 = s2

2.

15 / 28

Confronto di due gruppi: varianze incognite

Se le varianze delle due popolazioni non sono note possiamoconsiderarne una stima: s1 per σ1 e s2 per σ2. L’incertezza in-trodotta dall’utilizzo delle deviazioni standard campionarie richiedeche si consideri la statistica con distribuzione t-Student. Bisognainoltre distinguere due casi:

a) varianze delle popolazioni diverse s21 6= s2

2;

b) varianze delle popolazioni uguali s21 = s2

2.

15 / 28

Confronto di due gruppi: varianze incognite

Nel caso di varianze diverse nelle due popolazioni (s21 6= s2

2) si ha:

T =(X̄1− X̄2)− (µ1−µ2)√

S21

n1+

S22

n2

dove i gradi di libertà vanno calcolati considerando:

df = ν =

(s2

1n1+

s22

n2

)2

1n1−1

(s2

1n1

)2+ 1

n2−1

(s2

2n2

)2

alternativamente si possono approssimare i gradi di libertà scegliendoil più piccolo tra i valori n1−1 e n2−1.

16 / 28

Confronto di due gruppi: varianze incognite

Nel caso di varianze diverse nelle due popolazioni (s21 6= s2

2) si ha:

T =(X̄1− X̄2)− (µ1−µ2)√

S21

n1+

S22

n2

dove i gradi di libertà vanno calcolati considerando:

df = ν =

(s2

1n1+

s22

n2

)2

1n1−1

(s2

1n1

)2+ 1

n2−1

(s2

2n2

)2

alternativamente si possono approssimare i gradi di libertà scegliendoil più piccolo tra i valori n1−1 e n2−1.

16 / 28

Confronto di due gruppi: varianze incognite

Nel caso di varianze diverse nelle due popolazioni (s21 6= s2

2) si ha:

T =(X̄1− X̄2)− (µ1−µ2)√

S21

n1+

S22

n2

dove i gradi di libertà vanno calcolati considerando:

df = ν =

(s2

1n1+

s22

n2

)2

1n1−1

(s2

1n1

)2+ 1

n2−1

(s2

2n2

)2

alternativamente si possono approssimare i gradi di libertà scegliendoil più piccolo tra i valori n1−1 e n2−1.

16 / 28

Intervallo di confidenza varianze incognite

Considerati due campioni di ampiezza rispettivamente n1 e n2e calcolati i valori delle medie dei due campioni, si ottiene, nelcaso in cui le varianze delle popolazioni non siano note e sianodiverse tra loro (s2

1 6= s22), il seguente intervallo di confidenza per

la differenza delle medie µ1−µ2 con livello di confidenza (1−α):

(x̄1− x̄2)− t( α

2 ,ν)se < µ1−µ2 < (x̄1− x̄2)+ t( α

2 ,ν)se

dove se =

√s2

1n1+

s22

n2e ν rappresenta i gradi di libertà calcolati

come sopra.

17 / 28

Intervallo di confidenza varianze incognite

Considerati due campioni di ampiezza rispettivamente n1 e n2e calcolati i valori delle medie dei due campioni, si ottiene, nelcaso in cui le varianze delle popolazioni non siano note e sianodiverse tra loro (s2

1 6= s22), il seguente intervallo di confidenza per

la differenza delle medie µ1−µ2 con livello di confidenza (1−α):

(x̄1− x̄2)− t( α

2 ,ν)se < µ1−µ2 < (x̄1− x̄2)+ t( α

2 ,ν)se

dove se =

√s2

1n1+

s22

n2e ν rappresenta i gradi di libertà calcolati

come sopra.

17 / 28

Intervallo di confidenza varianze incognite

Considerati due campioni di ampiezza rispettivamente n1 e n2e calcolati i valori delle medie dei due campioni, si ottiene, nelcaso in cui le varianze delle popolazioni non siano note e sianodiverse tra loro (s2

1 6= s22), il seguente intervallo di confidenza per

la differenza delle medie µ1−µ2 con livello di confidenza (1−α):

(x̄1− x̄2)− t( α

2 ,ν)se < µ1−µ2 < (x̄1− x̄2)+ t( α

2 ,ν)se

dove se =

√s2

1n1+

s22

n2e ν rappresenta i gradi di libertà calcolati

come sopra.

17 / 28

Intervallo di confidenza varianze incognite

I manager di una grossa segheria sono interessati a conoscerele dimensioni dei tronchi che gli vengono consegnati. In partico-lar modo vorrebbero conoscere il diametro nella parte superioree inferiore deltronco. Viene effettuato uno studio sul diametrosuperiore dei tronchi e si osservano le misurazioni medie su uncampione di 42 tronchi estratti a caso dal primo carico e uno di36 dal secondo carico. I dati sono riportati sotto.

Calcolare l’intervallo di confidenza al 95% per la differenza tra ledue medie sconosciute.

n Media sCarico 1 42 15.9 2.8Carico 2 36 18.6 3.4

18 / 28

Intervallo di confidenza varianze incognite

I manager di una grossa segheria sono interessati a conoscerele dimensioni dei tronchi che gli vengono consegnati. In partico-lar modo vorrebbero conoscere il diametro nella parte superioree inferiore deltronco. Viene effettuato uno studio sul diametrosuperiore dei tronchi e si osservano le misurazioni medie su uncampione di 42 tronchi estratti a caso dal primo carico e uno di36 dal secondo carico. I dati sono riportati sotto.Calcolare l’intervallo di confidenza al 95% per la differenza tra ledue medie sconosciute.

n Media sCarico 1 42 15.9 2.8Carico 2 36 18.6 3.4

18 / 28

Intervallo di confidenza varianze incogniteOsserviamo che s1 = 2.8 6= 3.4 = s2. Per determinare i gradi di libertàosserviamo che n1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, pren-diamo come gradi di libertà il più piccolo tra i due numeri: 35.

Per calcolare l’intervallo di confidenza osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03e quindi l’intervallo è

−2.7−2.03 ·0.7126 < µ1−µ2 <−2.7+2.03 ·0.7126

−4.15 < µ1−µ2 <−1.25Dato che lo zero non è incluso nell’intervallo concludiamo che µ1 6= µ2con una fiducia del 95%. Inoltre, poichè l’intervallo ha estremi entrambinegativi possiamo anche dire che con una confidenza del 95% la me-dia dei diametri nelcarico 1 è inferiore rispetto a quella del carico 2.

19 / 28

Intervallo di confidenza varianze incogniteOsserviamo che s1 = 2.8 6= 3.4 = s2. Per determinare i gradi di libertàosserviamo che n1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, pren-diamo come gradi di libertà il più piccolo tra i due numeri: 35.Per calcolare l’intervallo di confidenza osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03e quindi l’intervallo è

−2.7−2.03 ·0.7126 < µ1−µ2 <−2.7+2.03 ·0.7126

−4.15 < µ1−µ2 <−1.25Dato che lo zero non è incluso nell’intervallo concludiamo che µ1 6= µ2con una fiducia del 95%. Inoltre, poichè l’intervallo ha estremi entrambinegativi possiamo anche dire che con una confidenza del 95% la me-dia dei diametri nelcarico 1 è inferiore rispetto a quella del carico 2.

19 / 28

Intervallo di confidenza varianze incogniteOsserviamo che s1 = 2.8 6= 3.4 = s2. Per determinare i gradi di libertàosserviamo che n1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, pren-diamo come gradi di libertà il più piccolo tra i due numeri: 35.Per calcolare l’intervallo di confidenza osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03e quindi l’intervallo è

−2.7−2.03 ·0.7126 < µ1−µ2 <−2.7+2.03 ·0.7126

−4.15 < µ1−µ2 <−1.25Dato che lo zero non è incluso nell’intervallo concludiamo che µ1 6= µ2con una fiducia del 95%. Inoltre, poichè l’intervallo ha estremi entrambinegativi possiamo anche dire che con una confidenza del 95% la me-dia dei diametri nelcarico 1 è inferiore rispetto a quella del carico 2.

19 / 28

Intervallo di confidenza varianze incogniteOsserviamo che s1 = 2.8 6= 3.4 = s2. Per determinare i gradi di libertàosserviamo che n1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, pren-diamo come gradi di libertà il più piccolo tra i due numeri: 35.Per calcolare l’intervallo di confidenza osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03

e quindi l’intervallo è

−2.7−2.03 ·0.7126 < µ1−µ2 <−2.7+2.03 ·0.7126

−4.15 < µ1−µ2 <−1.25Dato che lo zero non è incluso nell’intervallo concludiamo che µ1 6= µ2con una fiducia del 95%. Inoltre, poichè l’intervallo ha estremi entrambinegativi possiamo anche dire che con una confidenza del 95% la me-dia dei diametri nelcarico 1 è inferiore rispetto a quella del carico 2.

19 / 28

Intervallo di confidenza varianze incogniteOsserviamo che s1 = 2.8 6= 3.4 = s2. Per determinare i gradi di libertàosserviamo che n1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, pren-diamo come gradi di libertà il più piccolo tra i due numeri: 35.Per calcolare l’intervallo di confidenza osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03e quindi l’intervallo è

−2.7−2.03 ·0.7126 < µ1−µ2 <−2.7+2.03 ·0.7126

−4.15 < µ1−µ2 <−1.25

Dato che lo zero non è incluso nell’intervallo concludiamo che µ1 6= µ2con una fiducia del 95%. Inoltre, poichè l’intervallo ha estremi entrambinegativi possiamo anche dire che con una confidenza del 95% la me-dia dei diametri nelcarico 1 è inferiore rispetto a quella del carico 2.

19 / 28

Intervallo di confidenza varianze incogniteOsserviamo che s1 = 2.8 6= 3.4 = s2. Per determinare i gradi di libertàosserviamo che n1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, pren-diamo come gradi di libertà il più piccolo tra i due numeri: 35.Per calcolare l’intervallo di confidenza osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03e quindi l’intervallo è

−2.7−2.03 ·0.7126 < µ1−µ2 <−2.7+2.03 ·0.7126

−4.15 < µ1−µ2 <−1.25Dato che lo zero non è incluso nell’intervallo concludiamo che µ1 6= µ2con una fiducia del 95%. Inoltre, poichè l’intervallo ha estremi entrambinegativi possiamo anche dire che con una confidenza del 95% la me-dia dei diametri nelcarico 1 è inferiore rispetto a quella del carico 2.

19 / 28

Test d’ipotesi varianze incognite

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Se la varianza della distribuzione nelle due popolazionirisulta incognita;

allora la statistica

T =(X̄1− X̄2)−0

secon se =

√s2

1n1

+s2

2n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

20 / 28

Test d’ipotesi varianze incognite

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Se la varianza della distribuzione nelle due popolazionirisulta incognita;

allora la statistica

T =(X̄1− X̄2)−0

secon se =

√s2

1n1

+s2

2n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

20 / 28

Test d’ipotesi varianze incognite

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Se la varianza della distribuzione nelle due popolazionirisulta incognita;

allora la statistica

T =(X̄1− X̄2)−0

secon se =

√s2

1n1

+s2

2n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

20 / 28

Test d’ipotesi varianze incognite

• Considerati due campioni indipendenti di numerosità n1 en2 rispettivamente provenienti da due popolazioni;

• Nota la distribuzione approssimativamente normale delledue popolazioni, oppure n1 ed n2 sono superiori a 30 cosìche valga il teorema limite centrale;

• Se la varianza della distribuzione nelle due popolazionirisulta incognita;

allora la statistica

T =(X̄1− X̄2)−0

secon se =

√s2

1n1

+s2

2n2

può essere utilizzata per saggiare l’ipotesi di uguaglianza delledue medie una volta che è stato fissato un errore di I tipo α.

20 / 28

Test d’ipotesi varianze incogniteData la statistica

T =(X̄1− X̄2)−0

sedefiniamo che per il test sull’uguaglianza delle medie bilaterale:{

H0 : µ1 = µ2

Ha : µ1 6= µ2

fissato un livello di significatività α ,la regola di decisione é:

Rifiutare H0 se t=(x̄1− x̄2)−0√

s21

n1+

s22

n2

<−t( α

2 ,ν)o t=

(x̄1− x̄2)−0√s2

1n1+

s22

n2

> t( α

2 ,ν)

dove indichiamo i gradi di libertà con ν e prendiamo il più piccolofra i valori n1− 1 e n2− 1 in analogia con quanto visto per gliintervalli di confidenza.

21 / 28

Test d’ipotesi varianze incogniteData la statistica

T =(X̄1− X̄2)−0

sedefiniamo che per il test sull’uguaglianza delle medie bilaterale:{

H0 : µ1 = µ2

Ha : µ1 6= µ2

fissato un livello di significatività α ,la regola di decisione é:

Rifiutare H0 se t=(x̄1− x̄2)−0√

s21

n1+

s22

n2

<−t( α

2 ,ν)o t=

(x̄1− x̄2)−0√s2

1n1+

s22

n2

> t( α

2 ,ν)

dove indichiamo i gradi di libertà con ν e prendiamo il più piccolofra i valori n1− 1 e n2− 1 in analogia con quanto visto per gliintervalli di confidenza.

21 / 28

Test d’ipotesi varianze incognite

Data la statistica

T =(X̄1− X̄2)−0

sedefiniamo che per il test sulle medie unilaterale del tipo:{

H0 : µ1 = µ2

Ha : µ1 > µ2

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se t =(x̄1− x̄2)−0√

s21

n1+

s22

n2

> z(α,ν)

22 / 28

Test d’ipotesi varianze incognite

Data la statistica

T =(X̄1− X̄2)−0

sedefiniamo che per il test sulle medie unilaterale del tipo:{

H0 : µ1 = µ2

Ha : µ1 > µ2

fissato un livello di significatività α, la regola di decisione é:

Rifiutare H0 se t =(x̄1− x̄2)−0√

s21

n1+

s22

n2

> z(α,ν)

22 / 28

Test d’ipotesi varianze incognite

Data la statistica

T =(X̄1− X̄2)−0

sedefiniamo che per il test sulle medie unilaterale del tipo:{

H0 : µ1 = µ2

Ha : µ1 < µ2

fissato un livellodi significatività α, la regola di decisione è:

Rifiutare H0 se z =(x̄1− x̄2)−0√

s21

n1+

s22

n2

<−t(α,ν)

23 / 28

Test d’ipotesi varianze incognite

Data la statistica

T =(X̄1− X̄2)−0

sedefiniamo che per il test sulle medie unilaterale del tipo:{

H0 : µ1 = µ2

Ha : µ1 < µ2

fissato un livellodi significatività α, la regola di decisione è:

Rifiutare H0 se z =(x̄1− x̄2)−0√

s21

n1+

s22

n2

<−t(α,ν)

23 / 28

Test d’ipotesi varianze incognite

Il p-value del test è determinato come la probabilità di osservare,se è vera l’ipotesi nulla, valori della statistica t ancora più estremidi quello osservato.Sarà calcolato come:

a) l’area sottesa alle due code della distribuzione T delimitatadai valori con segno della statistica calcolata sui dati peripotesi alternativa bilaterale

b) l’area sottesa alla coda destra della distribuzione Tdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di maggiorazione

b) l’area sottesa alla coda sinistra della distribuzione Tdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di minorazione.

24 / 28

Test d’ipotesi varianze incognite

Il p-value del test è determinato come la probabilità di osservare,se è vera l’ipotesi nulla, valori della statistica t ancora più estremidi quello osservato.Sarà calcolato come:

a) l’area sottesa alle due code della distribuzione T delimitatadai valori con segno della statistica calcolata sui dati peripotesi alternativa bilaterale

b) l’area sottesa alla coda destra della distribuzione Tdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di maggiorazione

b) l’area sottesa alla coda sinistra della distribuzione Tdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di minorazione.

24 / 28

Test d’ipotesi varianze incognite

Il p-value del test è determinato come la probabilità di osservare,se è vera l’ipotesi nulla, valori della statistica t ancora più estremidi quello osservato.Sarà calcolato come:

a) l’area sottesa alle due code della distribuzione T delimitatadai valori con segno della statistica calcolata sui dati peripotesi alternativa bilaterale

b) l’area sottesa alla coda destra della distribuzione Tdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di maggiorazione

b) l’area sottesa alla coda sinistra della distribuzione Tdelimitata dal valore della statistica calcolata sui dati peripotesi alternativa di minorazione.

24 / 28

Test d’ipotesi varianze incognite

I manager di una grossa segheria sono interessati a conoscerele dimensioni dei tronchi che gli vengono consegnati. In partico-lar modo vorrebbero conoscere il diametro nella parte superioree inferiore deltronco. Viene effettuato uno studio sul diametrosuperiore dei tronchi e si osservano le misurazioni medie su uncampione di 42 tronchi estratti a caso dal primo carico e uno di36 dal secondo carico. I dati sono riportati sotto.

Fissato α = 0.05, possiamo assumere che i valori delle due me-die sconosciute nelle popolazioni siano uguali tra loro?

n Media sCarico 1 42 15.9 2.8Carico 2 36 18.6 3.4

25 / 28

Test d’ipotesi varianze incognite

I manager di una grossa segheria sono interessati a conoscerele dimensioni dei tronchi che gli vengono consegnati. In partico-lar modo vorrebbero conoscere il diametro nella parte superioree inferiore deltronco. Viene effettuato uno studio sul diametrosuperiore dei tronchi e si osservano le misurazioni medie su uncampione di 42 tronchi estratti a caso dal primo carico e uno di36 dal secondo carico. I dati sono riportati sotto.Fissato α = 0.05, possiamo assumere che i valori delle due me-die sconosciute nelle popolazioni siano uguali tra loro?

n Media sCarico 1 42 15.9 2.8Carico 2 36 18.6 3.4

25 / 28

Test d’ipotesi varianze incogniteLe ipotesi del test sono:{

H0 : µ1 = µ2

Ha : µ1 6= µ2o equivalentemente

{H0 : µ1−µ0 = 0Ha : µ1−µ0 6= 0

Osserviamo che s1 = 2.8 6= 3.4= s2, abbiamo le statistiche campionariee usiamo il test t. Per determinare i gradi di libertà osserviamo chen1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, prendiamo come gradidi libertà il più piccolo tra i due numeri: 35.

Per calcolare la statistica test osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03

26 / 28

Test d’ipotesi varianze incogniteLe ipotesi del test sono:{

H0 : µ1 = µ2

Ha : µ1 6= µ2o equivalentemente

{H0 : µ1−µ0 = 0Ha : µ1−µ0 6= 0

Osserviamo che s1 = 2.8 6= 3.4= s2, abbiamo le statistiche campionariee usiamo il test t. Per determinare i gradi di libertà osserviamo chen1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, prendiamo come gradidi libertà il più piccolo tra i due numeri: 35.Per calcolare la statistica test osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03

26 / 28

Test d’ipotesi varianze incogniteLe ipotesi del test sono:{

H0 : µ1 = µ2

Ha : µ1 6= µ2o equivalentemente

{H0 : µ1−µ0 = 0Ha : µ1−µ0 6= 0

Osserviamo che s1 = 2.8 6= 3.4= s2, abbiamo le statistiche campionariee usiamo il test t. Per determinare i gradi di libertà osserviamo chen1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, prendiamo come gradidi libertà il più piccolo tra i due numeri: 35.Per calcolare la statistica test osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03

26 / 28

Test d’ipotesi varianze incogniteLe ipotesi del test sono:{

H0 : µ1 = µ2

Ha : µ1 6= µ2o equivalentemente

{H0 : µ1−µ0 = 0Ha : µ1−µ0 6= 0

Osserviamo che s1 = 2.8 6= 3.4= s2, abbiamo le statistiche campionariee usiamo il test t. Per determinare i gradi di libertà osserviamo chen1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, prendiamo come gradidi libertà il più piccolo tra i due numeri: 35.Per calcolare la statistica test osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03

26 / 28

Test d’ipotesi varianze incogniteLe ipotesi del test sono:{

H0 : µ1 = µ2

Ha : µ1 6= µ2o equivalentemente

{H0 : µ1−µ0 = 0Ha : µ1−µ0 6= 0

Osserviamo che s1 = 2.8 6= 3.4= s2, abbiamo le statistiche campionariee usiamo il test t. Per determinare i gradi di libertà osserviamo chen1−1 = 42−1 = 41 mentre n2−1 = 36−1 = 35, prendiamo come gradidi libertà il più piccolo tra i due numeri: 35.Per calcolare la statistica test osserviamo che

x̄1− x̄2 = 15.9−18.6 =−2.7

se =

√2.82

42+

3.42

36= 0.7126

t(0.025,35) ≈ 2.03

26 / 28

Test d’ipotesi varianze incognite

La statistica calcolata sui dati sarà dunque

t =(x̄1− x̄2)−0

se=−2.7−00.7126

=−3.79

a cui dobbiamo applicare la regola di decisione. Osserviamo che

t =−3.79 <−2.03

ossia t =−3.79 <−t( α

2 ,ν)=−2.03, per cui al livello di significatività del

5% rifiutiamo l’ipotesi di uguaglianza nei due lotti. Abbiamo sufficienteevidenza per poter rifiutare H0 con quel livello di significativitá.Osserviamo che, per calcolare il p-value dovremmo considerare l’areasulle code delimitate dal valore t critico con i segni e quindi

p−value=P(t<−3.79)+P(t> 3.79)= 0.0003+0.0003= 0.0006<α = 0.05

confermiamo il risultato precedente.

27 / 28

Esempio ricapitolativo

Si consideri uno studio in cui è stata misurata la produzione di biomassadi due gruppi di piantine sottoposte a luce naturale o artificiale. Si sup-ponga che le distribuzioni delle popolazioni siano normali. Le osser-vazioni dello studio vengono riportate qua sotto.

1) Calcolare l’intervallo di confidenza al 95% e al 90% per ladifferenza tra le medie.

2) Fissato un livello di significatività dell’1% possiamo assumereche le differenze tra le medie nei due gruppi siano diverse?

3) Come concluderesti sapendo che p− value = 0.0004, è inaccordo col risultato trovato sopra?

n x̄ sLuce Normale 12 4.65 1.20Luce Artificiale 10 2.57 0.50

28 / 28

Esempio ricapitolativo

Si consideri uno studio in cui è stata misurata la produzione di biomassadi due gruppi di piantine sottoposte a luce naturale o artificiale. Si sup-ponga che le distribuzioni delle popolazioni siano normali. Le osser-vazioni dello studio vengono riportate qua sotto.

1) Calcolare l’intervallo di confidenza al 95% e al 90% per ladifferenza tra le medie.

2) Fissato un livello di significatività dell’1% possiamo assumereche le differenze tra le medie nei due gruppi siano diverse?

3) Come concluderesti sapendo che p− value = 0.0004, è inaccordo col risultato trovato sopra?

n x̄ sLuce Normale 12 4.65 1.20Luce Artificiale 10 2.57 0.50

28 / 28

Esempio ricapitolativo

Si consideri uno studio in cui è stata misurata la produzione di biomassadi due gruppi di piantine sottoposte a luce naturale o artificiale. Si sup-ponga che le distribuzioni delle popolazioni siano normali. Le osser-vazioni dello studio vengono riportate qua sotto.

1) Calcolare l’intervallo di confidenza al 95% e al 90% per ladifferenza tra le medie.

2) Fissato un livello di significatività dell’1% possiamo assumereche le differenze tra le medie nei due gruppi siano diverse?

3) Come concluderesti sapendo che p− value = 0.0004, è inaccordo col risultato trovato sopra?

n x̄ sLuce Normale 12 4.65 1.20Luce Artificiale 10 2.57 0.50

28 / 28