TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca...

42
OD 50 TEST DI IPOTESI

Transcript of TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca...

Page 1: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

50

TEST DI IPOTESI

Page 2: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

51

TEST D'IPOTESI

• È possibile ipotizzare che la durata media del ricovero ospedaliero al Policlinico San Matteo, negli ultimi 3 anni, è stata di 3 giorni? • È possibile ipotizzare che un dato farmaco induce il miglioramento del 50% dei pazienti trattati?

In generale un test d’ipotesi permette di stabilire se ipotesi come queste sono compatibili con i dati campionari; un test d’ipotesi permette di giungere a conclusioni sulla popolazione, in base alle informazioni contenute nel campione estratto dalla popolazione.

Page 3: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

52

TEST D’IPOTESI

IPOTESI DI RICERCA Ipotesi, supposizioni suggerite dall’esperienza e che motivano l’indagine

IPOTESI STATISTICHE Traduzioni delle ipotesi di ricerca in linguaggio formale, in una proposizione logica che possa essere testata.

TEST STATISTICI Permettono di testare le ipotesi statistiche, confermando o confutando le ipotesi di ricerca.

Page 4: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

53

DALL’IPOTESI DI RICERCA ALL’IPOTESI STATISTICA

Esempio Si estrae un campione di 50 cartelle ospedaliere per calcolare la durata media di un ricovero. Dai dati campionari si ottiene una durata media di 3,2 giorni.

IPOTESI DI RICERCA “La durata media di un ricovero ospedaliero nella popolazione è minore di 4 giorni.” Il valore campionario ci permette di formulare un’ipotesi di ricerca di questo genere?

Page 5: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

54

IPOTESI STATISTICHE Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H0 e l’ipotesi alternativa H1. Ipotesi alternativa H1 É l'ipotesi di interesse, l’ipotesi che guida la ricerca e che si spera di confermare Ipotesi nulla H0 È l’ipotesi che si spera di rifiutare sulla base dell’esito del test cui verrà sottoposta. È complementare all'ipotesi alternativa H1. Nel nostro esempio: Ipotesi nulla: H0≥4 Ipotesi alternativa: H1<4 Altri esempi: Ipotesi di ricerca:”È possibile concludere che la media della popolazione è diversa da 80 kg?” Ipotesi statistiche: H0 = 80 kg H1 ≠ 80 kg Ipotesi di ricerca:”È possibile concludere che la media della popolazione è minore di 2000 cal/die?” Ipotesi statistiche: H0 ≥ 2000 cal/die H1 < 2000 cal/die

Page 6: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

55

LA STATISTICA TEST* Formulate le ipotesi H0 e H1, in base alle assunzioni (normalità della popolazione, indipendenza dei campioni, uguaglianza delle varianze), si decide quale test usare.

Nel caso di un'ipotesi sulla media µ di una popolazione (assunta distribuita normalmente e con varianza nota) il test è:

Dove x = media campionaria µ0 = media ipotizzata della popolazione

nσ = errore standard della media campionaria z può assumere valori diversi al variare dei dati campionari e segue la distribuzione normale standardizzata, se H0 è vera. statistica di interesse - parametro ipotizzato statistica test* = errore standard della statistica di interesse

n

xz

σµ0−=

Page 7: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

56

LA REGIONE DI ACCETTAZIONE E DI RIFIUTO DI H 0

Tutti i possibili valori del test z (che variano al variare del

campione estratto) sono tutti i punti dell’asse x, divisi in regione di accettazione e regione di rifiuto.

Regione di rifiuto Regione di accettazione Regione di rifiuto • Regione di rifiuto: comprende i valori con minor probabilità di verificarsi, se H0 è vera. • Regione di accettazione: comprende i valori con maggior probabilità di verificarsi, se H0 è vera.

0 z

Page 8: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

57

IL LIVELLO DI SIGNIFICATIVITÀ Come decidere i limiti delle regioni di accettazione e di rifiuto? È necessario stabilire, prima di calcolare z, il livello di significatività α.

È una probabilità: la probabilità di commettere l’errore di rifiutare l’ipotesi nulla H0 quando essa è vera (errore di I specie). Per ridurre la probabilità di questo errore si sceglie per α un valore piccolo Valori di α più usati: 0.01, 0.05 e 0.10 Ad ogni valore di α corrisponde un valore di z* (z critico) che consente di individuare le zone di accettazione e di rifiuto. * Vedi tavole

Page 9: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

58

IL CALCOLO DELLA STA TISTICA TEST Fissati il livello di significatività α, il valore di z critico e le regioni di accettazione e di rifiuto di H0, si procede al calcolo della statistica test:

DECISIONE STATISTICA • Il valore della statistica test cade nella regione di rifiuto di H0 → rifiuto H 0 e concludo che H1 è vera. • Il valore della statistica test cade nella regione di accettazione di H0 → non rifiuto H 0 e concludo che H0 può essere vera.

n

xz

σµ0−=

Page 10: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

59

CONCLUSIONE • Rifiutando H0, si vuole significare che essa ci appare improbabile sulla base dei dati campionari. Si conclude che H0 è falsa, perché i nostri dati non sono compatibili con essa, ma supportano l’ipotesi alternativa H1. • Non rifiutando H0, si vuole significare che essa ci appare probabile sulla base dei dati campionari. Si conclude che H0 può essere vera, perché i dati non ci forniscono sufficiente evidenza contro di essa.

Page 11: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

60

ERRORI DI 1 a E 2a SPECIE Esiste sempre il rischio di commettere un errore accettando o rifiutando l’ipotesi nulla. L’errore α o di 1a specie è la probabilità di rifiutare l’ipotesi nulla quando essa è vera. L’errore β o di 2a specie è la probabilità di non rifiutare l’ipotesi nulla quando essa è falsa. La probabilità di commettere un errore di I tipo α è la probabilità che il valore di z cada nella regione di rifiuto della distribuzione del test z. H0 vera H0 falsa Non rifiutare H0 Scelta corretta Errore di 2a specie Rifiutare H0 Errore di 1a specie Scelta corretta

Page 12: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

61

RIASSUMENDO 1. Formulare chiaramente le ipotesi statistiche H0 e

H1; 2. decidere il test statistico appropriato, sulla base

delle assunzioni, 3. decidere il livello di significatività α e, di

conseguenza, le regioni di accettazione e di rifiuto di H0;

4. calcolare la statistica test dai dati campionari; 5. decidere se accettare o no H0 e giungere ad una

conclusione rispetto all’ipotesi di ricerca.

Page 13: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

62

a. POPOLAZIONE NORMALE CON σ NOTA

Il test per saggiare H0 è:

Esercizio Daniel pag. 200 7.2.2

Alcuni ricercatori sono interessati ad ottenere una risposta alla seguente domanda: “È possibile concludere che l’età media della popolazione d’interesse è diversa da 30 anni?”

Dati x = 27 anni (età media campionaria) n = 10 (numerosità campionaria)

Assunzioni • Campione casuale; • nella popolazione l’età è distribuita normalmente; • σ2 = 20 anni2.

TEST D’IPOTESI SU UNA MEDIA

n

xz

σµ0−=

Page 14: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

63

Ipotesi H0 : µ =30 H1 : µ ≠30

Test Test z

Livello di significatività α = 0.05

α = 0.05 → area compresa in entrambe le code della distribuzione

I valori della statistica test che portano al rifiuto di H0 sono valori estremi (decisamente minori o decisamente maggiori di 30), posti nelle code destra e sinistra della distribuzione; pertanto:

α/2 = 0.025 → area compresa in ciascuna delle due code della distribuzione

I valori critici di z sono ± 1.96 Vedi tavole

La regione di rifiuto è formata da tutti i valori della statistica test ≥ 1.96 o ≤ -1.96.

0

α/2=0.025 α/2=0.025

z -1.96 +1.96

0.95

Page 15: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

64

Calcolo della statistica test Decisione statistica e conclusione –2.12 < -1.96 → cade nella regione di rifiuto di H0. Posso rifiutare H0 e concludere che i dati campionari ci consentono di supportare l’ipotesi alternativa H1: la media della popolazione è diversa da 30 ad un livello di significatività uguale a 0.05.

12.24142.1

3

1020

30270 −=−=−=−=n

xz

σµ

Page 16: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

65

LA VERIFICA DELL’IPO TESI H0 CON UN INTERVALLO DI CONFID ENZA

Nell’esercizio precedente: Ipotesi: H0 : µ =30 H1 : µ ≠30

Decisione statistica: Rifiuto di H0

Conclusione: La media µ della popolazione è diversa da 30.

Come pervenire alle stesse conclusioni usando un intervallo di confidenza al (1-α)100 per cento? I.C. al 95% per µ è:

7718.29 ; 2282.24

7718.2274142.196.127102096.127; 21

=

=±=⋅±=±=LL

Page 17: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

66

L'intervallo 24.2282;29.7718 non contiene 30: 30 non rappresenta un buon candidato per la media che si desidera stimare. Decisione statistica: Rifiuto H0

Conclusione: µ ≠ 30

In generale Quando si saggia un’ipotesi nulla con un intervallo di confidenza bidirezionale e centrato, - se il parametro ipotizzato non è contenuto nell’intervallo al (1-α)100 per cento è possibile rifiutare H0 al livello α di significatività; - se il parametro ipotizzato è contenuto nell’intervallo al (1-α)100 per cento non è possibile rifiutare H0 al livello α di significatività.

Page 18: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

67

TEST BIDIREZIONALE E UNIDIREZIONALE Test bidirezionale L’esercizio precedente è un esempio di test bidirezionale.

In un test bidirezionale: • si è interessati a scostamenti dalla media ipotizzata in entrambe le direzioni; • valori estremi in entrambe le direzioni porteranno a rifiutare H0; • nell’ipotesi nulla H0 compare il segno di uguaglianza (=); nell’ipotesi alternativa H1 compare il segno di disuguaglianza (≠);

H0: µ µ µ µ = µµµµ0 H1: µ µ µ µ ≠ µµµµ0

• il valore di α è suddiviso equamente tra le due code della distribuzione. Esempio Quantità di un dato farmaco in una capsula: valori del farmaco in eccesso o in difetto sono entrambi critici.

Page 19: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

68

Test unidirezionale In un test unidirezionale • si è interessati a scostamenti dalla media ipotizzata in una sola direzione; • valori estremi in una sola direzione porteranno a rifiutare H0; • nell’ipotesi nulla H0 compaiono i segni di disuguaglianza ≤ oppure ≥; • nell’ipotesi alternativa H1 compaiono i segni di disuguaglianza > oppure <:

H0: µ µ µ µ ≤ µµµµ0 H1: µ µ µ µ > µµµµ0 oppure

H0: µ µ µ µ ≥ µµµµ0 H1: µ µ µ µ < µµµµ0

• la regione di rifiuto è data dalla coda di destra quando H1 è di tipo µ > µ0 ed è data dalla coda di sinistra quando H1 è di tipo µ <µ0; • il valore di α è interamente attribuito ad una sola coda della distribuzione.

Page 20: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

69

Esercizio Daniel pag. 200 7.2.2

Con riferimento all’esercizio precedente, supponiamo che i ricercatori si pongano questa domanda: “È possibile concludere che l’età media della popolazione d’interesse µ è minore di 30 anni?” Dati x = 27 anni (età media campionaria) n=10 (numerosità campionaria) Assunzioni • Campione casuale; • nella popolazione l’età è distribuita normalmente; • σ2 =20 anni2. Ipotesi H0 : µ ≥ 30 H1 : µ <30 Test Test z

Page 21: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

70

Livello di significatività α = 0.05 I valori della statistica test che portano al rifiuto di H0 sono valori sufficientemente piccoli, mentre valori grandi rinforzano H0. La regione di rifiuto deve essere in corrispondenza dei valori più piccoli della distribuzione, posti nella coda sinistra della distribuzione.

α = 0.05 → area compresa nella sola coda di sinistra.

Il valore critico di z è -1.645 Vedi tavole

La regione di rifiuto è formata da tutti i valori della statistica test < -1.645.

0

α=0.05

x -1.645

0.95

Page 22: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

71

Calcolo della statistica test Decisione statistica e conclusione –2.12 < -1.645 → cade nella regione di rifiuto di H0. Posso rifiutare H0 e concludere che i dati campionari ci consentono di supportare l’ipotesi alternativa H1: la media della popolazione è minore di 30 ad un livello di significatività uguale a 0.05.

12.24142.1

3

1020

30270 −=−=−=−=n

xz

σµ

Page 23: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

72

b. POPOLAZIONE NORMALE CON σ INCOGNITA

Il procedimento di verifica di ipotesi non cambia se non nella statistica test per saggiare H0: Esercizio Daniel pag. 202 7.2.3

Ipotesi di ricerca: “La media dell’indice di massa corporea (BMI) nella popolazione è diversa da 35.”

Dati x = 30.5 (BMI medio nel campione) s = 10.6392 n=14 (numerosità campionaria)

Assunzioni • Campione casuale; • nella popolazione le misure BMI sono distribuita normalmente.

ns

xt 0µ−=

Page 24: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

73

Ipotesi H0 : µ =35 H1 : µ ≠35

Test Test t bidirezionale

Livello di significatività α = 0.05

α = 0.05 → area compresa in entrambe le code della distribuzione α/2 = 0.025 → area compresa in ciascuna delle due code della distribuzione

t1-a/2;(n-1)gdl = ±2.1604 La regione di rifiuto è formata da tutti i valori della statistica test ≥ 2.1604 o ≤ -2.1604.

0

α/2=0.025 α/2=0.025

t -2.1604 +2.1604

0.95

Page 25: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

74

Calcolo della statistica test Decisione statistica e conclusione –1.58 > -2.1604 → cade nella regione di non rifiuto di H0. Non posso rifiutare H0. Concludo che, sulla base di questi dati, la media della popolazione da cui il campione è stato estratto può essere uguale a 35.

58.18434.2

5.4

146392.10

355.300 −=−=−=−=ns

xt

µ

Page 26: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

75

CAMPIONAMENTO DA POPOLAZIONE NON DISTRIBUITA NORM ALMENTE

• Quando la variabile non ha una distribuzione normale, se il campione è sufficientemente grande, in virtù del Teorema del Limite Centrale, è possibile usare il test z • Se la varianza della popolazione non è nota, nel calcolo della statistica test è possibile usare la varianza campionaria s al posto della varianza della popolazione σ. Essendo n grande, s può essere considerata una buona approssimazione di σ.

Page 27: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

76

Spesso si ha l’esigenza di confrontare due gruppi di dati: • un insegnante può voler confrontare la media

delle votazioni finali degli studenti di questo anno scolastico con quella degli studenti dell’anno scolastico scorso;

• un medico deve confrontare le condizioni presenti di un paziente con quelle di ieri o della settimana scorsa.

Queste valutazioni vengono normalmente fatte in modo intuitivo. I test di ipotesi sulla differenza tra due medie sono tecniche che permettono di valutare in modo oggettivo e statisticamente corretto se è ragionevole o meno affermare che le medie di due popolazioni sono diverse.

TEST D’IPOTESI SULLA DIFFERENZA TRA DUE M EDIE

Page 28: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

77

È possibile saggiare le ipotesi che la differenza tra le medie delle due popolazioni sia: 1. uguale a zero; 2. maggiore o uguale a zero; 3. minore o uguale a zero. Ipotesi nulla H0 Ipotesi alternativa H1

1 µ1 - µ2 = 0 → µ1 = µ2 µ1 - µ2 ≠ 0 → µ1 ≠ µ2 2 µ1 - µ2 ≥ 0 → µ1 ≥ µ2 µ1 - µ2 < 0 → µ1 < µ2 3 µ1 - µ2 ≤ 0 → µ1 ≤ µ2 µ1 - µ2 > 0 → µ1 > µ2

N.B.

Parametri della popolazione Statistiche campionarie Popolazione Dimensione Media Varianza Dimensione Media Varianza Uno N1 µ1 σ1

2 n1 x1

s12

Due N2 µ2 σ12 n2 x

2 s1

2

Page 29: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

78

1. CAMPIONI INDIPENDENTI Due campioni si dicono indipendenti se non esiste legame tra di essi. Esempio Si vuole stabilire se esiste una differenza significativa tra la media delle votazioni d’esame degli studenti che hanno seguito un certo corso nell’a.a. 2002 e la media delle votazioni degli studenti che hanno seguito lo stesso corso nell’a.a. corrente. I campioni sono indipendenti perché non esiste legame tra i due gruppi di studenti.

Page 30: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

79

a. LE VARIANZE DELLE POPOLAZIONI SONO NOTE

Popolazione 1: N (µ1, σ12); n1, x 1

Popolazione 2: N (µ2, σ22); n2, x 2

Test z

( ) ( )

2

22

1

21

121

nn

xxz

σσµµ

+

−−= 2−

Page 31: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

80

b. LE VARIANZE DELLE POPOLAZIONI NON SONO NOTE

• Se le varianze delle popolazioni non sono note e le dimensioni campionarie sono ≥ 30 si può ricorrere alla distribuzione z (utilizzando s al posto di σ) o alla distribuzione t;

• se le varianze delle popolazioni non sono note e le dimensioni campionarie sono < 30 si deve ricorrere alla distribuzione t.

Formula valida nel caso si possa assumere l’uguaglianza delle varianze delle due popolazioni. Le varianze campionarie sono impiegate per stimare la varianza comune come media ponderata (rispetto ai rispettivi gradi di libertà) delle due varianze campionarie.

( ) ( )2

1121

2

222

112

−+⋅−+⋅−=

nn

snsns pond

( ) ( )

2

2

1

2

2121

n

s

n

s

xxt

pondpond +

−−−= µµ

Page 32: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

81

Se le varianze nelle due popolazioni non sono note e non si possono assumere uguali ( ad esempio a seguito di un test F rapporto varianze campionarie s1/s2 significativo)

La formula per il calcolo di t risulta la seguente

( ) ( )

2

22

1

21

2121

n

s

n

s

xxt

+

−−−= µµ

Ed il t critico necessario per il calcolo della

decisione statistica si calcola in maniera seguente:

t critico = 21

2211

ww

twtw

++

dove w1 = s21 /n1

w2 = s22 /n2

t1= t di 1-alfa per n1-1 gradi di libertà t2= t di 1-alfa per n2-1 gradi di libertà

Page 33: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

82

È un test sulla differenza tra medie, in cui i dati sono in qualche modo legati tra loro e provengono da due campioni non indipendenti. Esempi • Medesimi soggetti possono essere sottoposti a test due

volte, prima e dopo un particolare trattamento, così che i risultati del primo e del secondo test possano essere confrontati. È quanto accade negli esperimenti “before-and-after” .

• Cavie dello stesso sesso e/o delle stessa nidiata possono essere casualmente assegnate alla somministrazione di un farmaco o di un placebo.

• Coppie di gemelli possono essere assegnati a due trattamenti, in modo che membri di una stessa coppia ricevano trattamenti diversi.

L’impiego di coppie di soggetti “simili” rispetto a fattori (sesso, età, razza, condizioni socio-economiche, …) che possono interferire con l’esperimento, riduce il numero di fonti di variazione estranee → le eventuali differenze tra coppie potrebbero essere dovute alla variabile d’interesse.

TEST per CONFRONTI APPAIATI o per DATI APPAIATI

Page 34: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

83

Quando si lavora con dati appaiati, si focalizza l’attenzione sulla differenza tra ciascuna coppia di osservazioni: l’analisi statistica viene condotta non sulle osservazioni singole, ma sulle differenze tra coppie di osservazioni. Esempio 1 Daniel pag. 222 7.4.1 Nella tabelle seguente sono riportati i pesi di 9 donne prima e dopo dodici settimane di trattamento con una dieta a basse calorie. Si vuole sapere se sulla base di questi dati è possibile affermare che il trattamento è risultato determinante nella riduzione del peso delle donne obese. Porre alfa= 0.05

Soggetti Prima P Dopo D Differenza D-P 1 117.3 83.3 -34.0 2 111.4 85.9 -25.5 3 98.6 75.8 -22.8 4 104.3 82.9 -21.4 5 105.4 82.3 -23.1 6 100.4 77.7 -22.7 7 81.7 62.7 -19.0 8 89.5 69.0 -20.5 9 78.2 63.9 -14.3

Page 35: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

84

Assunzioni Le differenze calcolate costituiscono un campione casuale semplice proveniente da una popolazione di differenze distribuita normalmente. Ipotesi La formulazione delle ipotesi deve essere coerente con il modo in cui sono state ottenute le differenze. Nel caso specifico, se il trattamento ha determinato una riduzione del peso, ci attendiamo che, nella popolazione, le differenze tra i pesi prima e quelli dopo (D-P) siano negative: negativa sarà anche la differenza media nella popolazione. Ciò è quanto stabilito dall’ipotesi alternativa H1. L’ipotesi nulla H0 è, come sempre, complementare a H1:

H0: µd≥0 H1: µd<0 Se le differenze fossero state calcolate sottraendo i pesi dopo da quelli prima (P-D), le ipotesi sarebbero state:

H0: µd≤0 H1: µd>0

Se il problema avesse richiesto un test bidirezionale, le ipotesi sarebbero state:

H0: µd=0 H1: µd≠0

Page 36: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

85

Test Il test statistico opportuno, quando sono valide le assunzioni stabilite, è dato da:

d

d

s

dt

0µ−=

dove: d è la differenza media campionaria;

0dµ è la differenza media ipotizzata della popolazione;

nss dd = è l’errore standard

sd = deviazione standard delle differenze campionarie; n = numero delle differenze campionarie.

Quando H0 è vera, la statistica test è distribuita come una t di Student con n-1 gradi di libertà.

Page 37: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

86

Regola di decisione Per alfa = 0.05 e 8 g.d.l., il valore critico di t è –1.8595 (regione di rifiuto nella coda di sinistra).

Rifiutiamo H0 se il valore calcolato di t è minore o uguale al valore critico.

Calcolo di t

5889.229

3.203

9

)3.14(...)5.25()0.34( −=−=−++−+−== ∑n

dd

i

2961.281

)( 2

2 =−

= ∑−

n

dds

i

d

7395.1277314.1

5889.22

92961.28

05889.22 −=−=−−=t

Decisione statistica e conclusione Poiché –12.7395 cade nella regione di rifiuto, posso rifiutare H0 e concludere, sulla base di questi dati, che la dieta ha determinato una significativa diminuzione del peso.

0

α=0.05

-1.8595

Page 38: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

87

Esempio 2 12 soggetti partecipano ad un esperimento per studiare l’efficacia di una certa dieta combinata con un programma di esercizi nel ridurre il livello di colesterolo. Vengono registrati i livelli di colesterolo ematico (mg/dl) prima e dopo il trattamento. α = 0.05 I dati forniscono sufficiente evidenza per concludere che il programma dieta-esercizio è efficace nel ridurre i livelli di colesterolo?

+8 209 201 12 -74 210 284 11 -20 247 267 10 -33 207 240 9 -40 195 235 8 -30 296 326 7 -21 216 237 6 -4 224 228 5 -27 233 260 4 -5 216 221 3 +5 236 231 2 -1 200 201 1

D - P Dopo D Prima P Id.

Page 39: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

88

Assunzioni Le differenze costituiscono un campione casuale semplice, proveniente da una popolazione di differenze normalmente distribuite.

Ipotesi H0: µd ≥ 0 H1: µd < 0

Test t unidirezionale con regione di rifiuto di H0 nella coda di sinistra. t critico = t0.95; 11 gdl = -1,7959

17.2012

242 −=−=d

02.3

1213.23

017.200 −=−−=

−=

ns

dt

d

Decisione statistica e conclusione Poiché -3.02 cade nella regione di rifiuto,.posso rifiutare H0 e concludere che, sulla base di questi dati, il programma dieta-esercizio ha avuto effetto positivo sulla diminuzione del colesterolo ematico.

ns

dt

d

d0µ−

=

( )13.23

112

)]17.20(8[...)]17.20(1[

1

222

=−

−−++−−−=

−−

= ∑n

dds

id

Page 40: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

89

Se i dati provengono da un campione sufficientemente grande da consentire il ricorso al Teorema del Limite Centrale, il test statistico è: che, quando H0 è vera, si distribuisce approssimativamente come una normale standardizzata. p̂ = proporzione campionaria p0 = proporzione ipotizzata nella popolazione

TEST D’IPOTESI SU UNA PROPORZIONE

n

qp

ppz

00

0ˆ −=

Page 41: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

90

Il test più frequentemente usato si basa sull’ipotesi nulla che la differenza tra le proporzioni delle due popolazioni sia nulla, cioè che le due proporzioni siano uguali: H0: p1 –p2 =0 Il test statistico è: dove:

1p̂ e 2p̂ = proporzioni campionarie (p1 e p2)0 = proporzioni ipotizzate nella popolazione

21 ˆˆ pps − = errore standard

TEST DI IPOTESI SULLA

DIFFERENZA TRA DUE PROPORZIONI

21 ˆˆ

02121 )()ˆˆ(

pps

ppppz

−−−=

Page 42: TEST DI IPOTESI - laboratoriostatistica.files.wordpress.com · Sulla base dell’ipotesi di ricerca si formulano due ipotesi opposte: l’ipotesi nulla H 0 e l’ipotesi alternativa

OD

91

L’errore standard stimato 21 ˆˆ pps − è calcolato come segue:

21ˆˆ

)1()1(21 n

pp

n

pps pp

−+−=−

p è la stima della proporzione, ipotizzata comune, nelle due popolazioni, calcolata con la seguente formula:

21

21

nn

xxp

++=