14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di...

24
269 14. TEORIA DEI TEST STATISTICI 14.1 Generalità sui test di significatività I dati campionari possono essere utilizzati, oltre che per costruire l’intervallo di confidenza di un parametro ignoto , anche per verificare se una certa congettura su una caratteristica della popolazione può essere ritenuta verosimile o meno, alla luce dei risultati ottenuti sul campione casuale estratto. Con il termine ipotesi statistica si indica una supposizione su una qualche caratteristica ignota di una popolazione: per esempio, si può voler verificare se un macchinario produce una proporzione adeguata di pezzi che rispettano caratteristiche prestabilite, se un dado o una moneta sono equilibrati, se un farmaco è efficace nella cura di una determinata malattia, se esiste o meno una qualche dipendenza fra due variabili o se la distribuzione di una certa variabile può essere approssimata da un determinato modello teorico. Le ipotesi sono sottoposte a verifica sulla base del campione estratto e la procedura utilizzata per la verifica di queste ipotesi costituisce il cosiddetto test statistico. Per esempio, per verificare se una moneta è equilibrata si potrebbe lanciare più volte la moneta e registrare il numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se il numero di teste e di croci ottenute in un numero sufficientemente elevato di lanci non risultano molto diversi fra loro, ma non si può stabilire con certezza se un'ipotesi è vera o falsa, dato che uno stesso risultato può derivare da monete diverse. Se si lanciasse una moneta equilibrata 100 volte, il numero di teste ottenute potrebbe comunque variare da un risultato minimo pari a 0 fino ad un massimo pari a 100, anche se ovviamente i risultati più probabili sono quelli in cui il numero di teste e di croci non sono troppo diversi fra di loro. È però possibile ottenere un numero di teste pari a 0 o pari a 100, anche se la probabilità di questi risultati è piccolissima (in entrambi i casi è 0.5 100 ). Un qualsiasi criterio di decisione circa l’accettazione o il rifiuto di un’ipotesi comporta il rischio di commettere due diversi tipi di errore che consistono: - nel rifiutare l’ipotesi quando è vera - nell’accettarla quando è falsa. Nel caso della moneta, il risultato campionario potrebbe indicare che la moneta è equilibrata anche se non lo è realmente, oppure potrebbe indicare che la faccia “testa” ha una probabilità molto maggiore di “croce” anche se la moneta fosse equilibrata o, addirittura, se la faccia “croce” avesse in realtà una probabilità maggiore della faccia “testa”. Per semplicità nelle pagine successiva si prenderà in considerazione solo il primo tipo di errore, ossia la probabilità di rifiutare un'ipotesi quando è vera, per cui i test che verranno descritti in seguito vengono più correttamente chiamati test di significatività.

Transcript of 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di...

Page 1: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

269

14. TEORIA DEI TEST STATISTICI

14.1 Generalità sui test di significatività

I dati campionari possono essere utilizzati, oltre che per costruire l’intervallo di confidenza di un parametro

ignoto , anche per verificare se una certa congettura su una caratteristica della popolazione può essere

ritenuta verosimile o meno, alla luce dei risultati ottenuti sul campione casuale estratto.

Con il termine ipotesi statistica si indica una supposizione su una qualche caratteristica ignota di una

popolazione: per esempio, si può voler verificare se un macchinario produce una proporzione adeguata di

pezzi che rispettano caratteristiche prestabilite, se un dado o una moneta sono equilibrati, se un farmaco è

efficace nella cura di una determinata malattia, se esiste o meno una qualche dipendenza fra due variabili o

se la distribuzione di una certa variabile può essere approssimata da un determinato modello teorico.

Le ipotesi sono sottoposte a verifica sulla base del campione estratto e la procedura utilizzata per la verifica

di queste ipotesi costituisce il cosiddetto test statistico.

Per esempio, per verificare se una moneta è equilibrata si potrebbe lanciare più volte la moneta e registrare il

numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se il numero di teste e di

croci ottenute in un numero sufficientemente elevato di lanci non risultano molto diversi fra loro, ma non si

può stabilire con certezza se un'ipotesi è vera o falsa, dato che uno stesso risultato può derivare da monete

diverse. Se si lanciasse una moneta equilibrata 100 volte, il numero di teste ottenute potrebbe comunque

variare da un risultato minimo pari a 0 fino ad un massimo pari a 100, anche se ovviamente i risultati più

probabili sono quelli in cui il numero di teste e di croci non sono troppo diversi fra di loro. È però possibile

ottenere un numero di teste pari a 0 o pari a 100, anche se la probabilità di questi risultati è piccolissima (in

entrambi i casi è 0.5100).

Un qualsiasi criterio di decisione circa l’accettazione o il rifiuto di un’ipotesi comporta il rischio di

commettere due diversi tipi di errore che consistono:

- nel rifiutare l’ipotesi quando è vera

- nell’accettarla quando è falsa.

Nel caso della moneta, il risultato campionario potrebbe indicare che la moneta è equilibrata anche se non lo

è realmente, oppure potrebbe indicare che la faccia “testa” ha una probabilità molto maggiore di “croce”

anche se la moneta fosse equilibrata o, addirittura, se la faccia “croce” avesse in realtà una probabilità

maggiore della faccia “testa”.

Per semplicità nelle pagine successiva si prenderà in considerazione solo il primo tipo di errore, ossia la

probabilità di rifiutare un'ipotesi quando è vera, per cui i test che verranno descritti in seguito vengono più

correttamente chiamati test di significatività.

Page 2: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

270

In generale, l’ipotesi che si vuole verificare è detta ipotesi nulla ed è indicata con la notazione

H0:

seguita dal suo enunciato formale, dove H è l’iniziale del termine inglese Hypothesis.

Nel caso della moneta, se indica la probabilità associata alla faccia testa, l’ipotesi che la moneta sia

bilanciata corrisponde a

H0 : =0.5.

In generale l’ipotesi che un parametro assuma uno specifico valore 0 viene indicata mediante la notazione

H0: = 0. 14.1.1

Un’ipotesi H0 su è ovviamente considerata tanto più verosimile quanto più la stima campionaria risulta

probabile sotto H0, per cui la regola di decisione consiste nell’accettare H0 se la stima campionaria rientra

nell’insieme dei risultati più probabili sotto H0 e nel rifiutarla in caso contrario.

Nell’esempio relativo alla moneta si sarà portati a ritenere che la moneta sia equilibrata se, lanciandola un

adeguato numero di volte, si ottiene un numero di teste pressoché uguale al numero di croci, ossia se la

frequenza relativa delle teste si avvicina a 0.5 mentre, al crescere della differenza fra il risultato campionario

ottenuto e 0.5, si sarà sempre più portati a ritenere che la moneta è sbilanciata.

In generale, un’ipotesi sul valore del parametro è considerata tanto più verosimile quanto più il valore t0

assunto dallo stimatore T di sul campione estratto risulta probabile se si assume come vera l’ipotesi H0.

In altri termini, la regola di decisione su cui si basano i test di significatività consiste nell’accettare l’ipotesi

H0 se il valore t0 della stima campionaria di rientra nell’insieme dei risultati più probabili sotto H0 e nel

rifiutarla in caso contrario.

In generale, per verificare un’ipotesi 14.1.1, si sceglie uno stimatore T di e si fa riferimento alla sua

distribuzione di probabilità determinata come se 0 fosse il vero valore di . Questa è la cosiddetta

distribuzione dello stimatore sotto ipotesi nulla.

L’insieme dei possibili risultati campionari viene quindi suddiviso nella regione di accettazione di H0 (che

comprende i risultati più probabili sotto H0) e in una regione di rifiuto o regione critica (che comprende i

risultati che sono invece poco probabili sotto la stessa ipotesi).

Una volta scelto il livello di probabilità , gli estremi dell’intervallo di accettazione dell’ipotesi nulla, detti

Page 3: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

271

valori critici (o valori soglia), spesso corrispondono ai due quantili che in questa distribuzione isolano il

primo sulla sua sinistra ed il secondo sulla sua destra una probabilità pari ad /2.

Come abbiamo visto, la regola di decisione consiste nel rifiutare l’ipotesi nulla quando il risultato

campionario t di T risulta compreso nella regione critica. In questo caso si dice che il valore della statistica è

significativo.

Nell’esempio della moneta, ipotizzando l’indipendenza dei lanci e supponendo che n sia abbastanza elevato

da poter utilizzare il teorema limite centrale, la distribuzione dello stimatore P̂ "proporzione di teste

ottenute nei lanci" può essere approssimata da una normale di valore atteso 0.5 e varianza

nn

5.015.01

, per cui i risultati più probabili di P̂ sotto H0 sono compresi in un intervallo centrato

su 0.5.

La regola di decisione consiste nel ritenere verosimile l’ipotesi nulla se la stima campionaria p̂ è compresa

nell’intervallo dei risultati più probabili e nel rifiutarla se p̂ cade all’esterno, anche se esiste una probabilità

non nulla di rifiutare H0 quando è vera, perché si può ottenere un risultato campionario che rientra fra quelli

poco probabili sotto tale ipotesi.

La probabilità dell’errore che consiste nel rifiutare l’ipotesi nulla quando è vera viene indicata con e viene

detta errore di prima specie o livello di significatività. Il valore corrisponde quindi alla probabilità di

ottenere, quando è vera H0, un risultato compreso nella regione di rifiuto dell’ipotesi.

Questo significa che la regola di decisione utilizzata porterà necessariamente al rifiuto di un’ipotesi vera con

una probabilità pari ad , per cui il valore di viene fissato in modo da essere “quasi sicuri” di non

respingere H0 quando è vera. Nelle situazioni reali si tengono presenti le conseguenze che derivano

dall’eventuale rifiuto di un'ipotesi vera per cui, se si ha interesse a tutelarsi contro questo rischio, è

necessario ridurre questa probabilità.

D’altra parte è evidente che al diminuire di aumenta di conseguenza l’ampiezza dell’intervallo di

accettazione per cui, fissando un valore estremamente basso, si finisce per non respingere H0 anche in

presenza di risultati che sono molto improbabili sotto quell’ipotesi e per i quali, quindi, l’ipotesi stessa risulta

poco verosimile. I valori di più comunemente utilizzati sono 0.10, 0.05 e 0.01.

Nel caso della verifica di ipotesi sulla moneta, se il numero n di lanci è abbastanza elevato da poter utilizzare

il teorema limite centrale, la regione di accettazione dell’ipotesi nulla =0.5 sarà interna ai due quantili di

ordine /2 e 1/2 che isolano, rispettivamente, un’area pari ad /2 sulla sinistra e sulla destra della

distribuzione dello stimatore P̂ sotto H0. Le due regioni di rifiuto saranno invece posizionate lungo le code

di questa distribuzione.

Va infine notato che quando la stima campionaria t0 assunta dallo stimatore T sul campione estratto è

compresa nell’intervallo di accettazione dell’ipotesi nulla, questo non implica che H0 sia effettivamente vera.

Se, per esempio, si fosse ottenuto un numero di teste pari a 501 su 1000 lanci non si rifiuterebbe l’ipotesi che

Page 4: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

272

la moneta sia equilibrata, ma non si rifiuterebbe neppure l’ipotesi che il parametro ignoto sia uguale a

0.501 oppure a 0.502.

Per questo motivo, quando la stima campionaria è compresa nell’intervallo di accettazione dell’ipotesi nulla,

si conclude l’analisi affermando che “non si ha motivo di rifiutare H0 al livello prefissato”. Ogni stima t di

T rientra infatti anche nell’insieme dei risultati più probabili sotto altre ipotesi, diverse da H0, ed è quindi

compreso nell’intervallo di accettazione associato a tutte queste ipotesi.

Page 5: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

273

14.2 Verifica di ipotesi su

Quando l’ipotesi nulla riguarda il parametro di una variabile Z l’ipotesi 14.1.1 assume la forma seguente

H0: 0 14.2.1

e la sua verifica viene effettuata in modo diverso a seconda del grado di conoscenza sulla distribuzione della

variabile Z nella popolazione

- Primo caso

Se è noto che la variabile Z ha una distribuzione normale di varianza nota

noto ,Z 2σμ~N

assumendo come vera l’ipotesi nulla 14.2.1, la distribuzione della media campionaria risulta

n

σμN~X

2

0 , .

L’intervallo di accettazione di H0 sarà quindi centrato su 0 e, una volta scelto il livello di significatività ,

risulterà delimitato dai due quantili che isolano rispettivamente a sinistra e a destra della distribuzione

un’area pari ad /2.

Considerata infatti la distribuzione dello stimatore “media campionaria” sotto l’ipotesi nulla 14.2.1, ossia

assumendo vera l’ipotesi 0, e scelto il livello di probabilità , gli estremi dell’intervallo di accettazione

corrispondono ai due quantili che in questa distribuzione isolano il primo sulla sua sinistra ed il secondo sulla

sua destra una probabilità pari ad /2. Questi due valori critici delimitano al loro interno la regione di

accettazione dell’ipotesi nulla, data dall’insieme dei risultati campionari più probabili sotto l’ipotesi H0: se la

media campionaria cade nella regione di accettazione si conclude l’analisi affermando che non si ha motivo

di rifiutare H0 o che l’ipotesi è compatibile con il risultato campionario. Gli intervalli a sinistra del valore

critico inferiore e a destra del valore critico superiore costituiscono invece la regione di rifiuto dell'ipotesi.

Pertanto, se la media campionaria cade nella regione critica, il valore della statistica è significativo e l’ipotesi

va rifiutata al livello di significatività

La verifica dell'ipotesi nulla può essere effettuata in modo più semplice, facendo riferimento alla normale

standardizzata. Si considera quindi la statistica test

μX 0 1,0N~ 14.2.2

Page 6: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

274

e la regione di accettazione dell’ipotesi è in questo caso costituita dai valori compresi fra i quantili di ordine

/2 e 1/2 della N(0, 1), perché sono questi i valori della statistica 14.2.2 che risultano più probabili sotto

ipotesi nulla.

Data la simmetria della distribuzione rispetto allo zero è però sufficiente confrontare il risultato della

statistica test 14.2.2 presa in valore assoluto

μX 0 14.2.3

con il quantile positivo z1/2 della normale standardizzata.

Se risulta

μX 0> z1-/2

il valore della statistica test è significativo e l'ipotesi nulla viene rifiutata al livello di significatività ; in caso

contrario l'ipotesi è compatibile con i risultati campionari e non c’è motivo di rifiutarla.

Un test di significatività può essere effettuato in modo più accurato mediante il calcolo del p-valore (in

inglese p-value) associato al valore assunto dalla statistica test 14.2.3. Questo p-valore rappresenta la

probabilità che la statistica test assuma un valore più estremo di quello osservato, sempre assumendo

l’ipotesi che H0 sia vera, per cui quanto più il p-valore è piccolo, tanto meno verosimile appare l’ipotesi

nulla.

In generale, considerato il valore |t| assunto dalla statistica test T che si distribuisce come una N(0, 1), il

p-valore corrispondente è pari alla somma dell’area isolata alla destra di |t| più l’area alla sinistra dello stesso

valore preso con segno negativo -|t|.

Posto per semplicità t > 0, il p-valore corrispondente è pari a

ttttt 12111

Esempio 14.2.1

Su un campione di 10 elementi estratto da una popolazione normale di varianza nota pari a 160 si è ottenuta una media

campionaria pari a 20. Si vuole verificare l’ipotesi che la media nella popolazione sia 25 al livello =0.1.

L’ipotesi nulla assume la forma

H0: = 25

per cui la statistica test 14.2.3 risulta uguale a

Page 7: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

275

25.110/160

25200

μX

Il risultato ottenuto va confrontato con il quantile z0.95=1.645, per cui 1.25 cade nella regione di accettazione e non si ha

quindi motivo di rifiutare l’ipotesi al livello di significatività del 10%.

Esempio 14.2.2

Sulla base dei dati dell’esempio precedente, si calcoli il p-valore associato alla statistica test.

Il p-valore associato a 1.25 è uguale all’area isolata alla destra di tale valore più l’area alla sinistra dello stesso valore

preso con segno negativo, ossia

2112.08944.01225.112

Si può quindi concludere che il risultato della statistica test non porta al rifiuto dell’ipotesi nulla per nessun livello di

significatività minore di 0.2112 e, quindi, per nessuno dei valori di più comunemente usati.

- Secondo Caso

Se è noto che la Z si distribuisce in modo normale ma la sua varianza è ignota e il campione è piccolo, con

una numerosità fino a 30 elementi, per la verifica dell’ipotesi 14.2.1 si utilizza la seguente statistica test

nS

μX

c

01nt~ 14.2.4

che si distribuisce come una t di Student con n1 gradi di libertà.

I risultati più probabili sotto ipotesi nulla sono quindi concentrati intorno allo zero e i due valori critici

corrispondono ai due quantili che nella distribuzione tn1 isolano rispettivamente a sinistra e a destra un’area

di probabilità pari ad /2.

La regione di accettazione dell’ipotesi è quindi costituita dall’intervallo 21,121,1 ; α/nα/n tt per cui, data

la simmetria della distribuzione rispetto allo 0, la verifica dell’ipotesi può essere effettuata confrontando

nS

μX

c

0 14.2.5

con il quantile 21,1 α/nt .

Se risulta

21,10

α/nc

tnS

μX

l’ipotesi nulla viene rifiutata al livello , mentre in caso contrario risulta compatibile con il risultato

Page 8: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

276

campionario.

Esempio 14.2.3

Su un campione casuale di 8 elementi estratto da una popolazione normale sono stati rilevati i seguenti valori della

variabile oggetto di studio

1.1 3.1 4.2 4.6 5.0 5.2 5.3 6.5

Verificare l’ipotesi che la media della popolazione sia pari a 5 al livello di significatività=0.01.

Dai dati campionari risulta

696427

8359375.25213754 2222 .SSS.XE.XE c

Per la verifica dell’ipotesi

H0: = 5

si utilizza la statistica 14.2.5 che nel caso in esame assume il valore

499.30770.18/6964.2

5375.4995.0,7

t

per cui non si ha motivo di rifiutare l’ipotesi nulla al livello di significatività prefissato.

- Terzo Caso

Se la Z si distribuisce in modo normale con varianza ignota e il campione è grande, con una numerosità

superiore a 30 elementi, la verifica di ipotesi 14.2.1 si basa sempre sulla statistica test 14.2.4 la cui

distribuzione però, per il teorema limite centrale, tende a una distribuzione normale.

Pertanto il procedimento approssimato consiste nel calcolare la statistica test 14.2.5 e di confrontare il

risultato ottenuto con il quantile della distribuzione N(0,1) che isola alla sua destra un’area pari ad /2.

Pertanto, se risulta

2/10

znS

μX

c

14.2.6

l’ipotesi nulla viene rifiutata al livello , mentre in caso contrario è da ritenersi compatibile con il risultato

campionario.

Esempio 14.2.4

Su un campione casuale di 65 uova è stato rilevato lo "spessore del guscio” (in millimetri) ottenendo 320.x e

080.Sc . In base a queste informazioni e sapendo che la variabile ha una distribuzione normale, si vuole verificare

l'ipotesi che lo spessore medio del guscio sia pari a 0.3 millimetri al livello di significatività = 0.05.

La verifica dell’ipotesi

3.0:H0

va effettuata controllando se è verificata la disuguaglianza 14.2.6. Dato che si ottiene

96102265080

3003209750 .z.

,

,,.

,

l'ipotesi viene rifiutata al livello di significatività = 0.05.

Page 9: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

277

Esempio 14.2.5

Sulla base dei dati dell’esempio precedente si verifichi l’ipotesi

3.0:H0

mediante il calcolo del p-valore.

Il p-valore risulta uguale a

0434.09783.01202.212

per cui l’ipotesi nulla deve essere rifiutata per un livello = 0.05, ma sarebbe compatibile con il risultato campionario

ottenuto se si decidesse di lavorare ad un livello = 0.01.

- Quarto caso

Se non si ha nessuna informazione circa la distribuzione della variabile Z nella popolazione ma il campione è

grande, con una numerosità superiore a 50 elementi (anche se spesso viene considerata sufficiente una

numerosità campionaria superiore a 30), la verifica di ipotesi 14.2.1 si basa sempre sulla statistica test 14.2.5

e il valore ottenuto va confrontato con il quantile di ordine 1/2 della normale standard.

Pertanto il procedimento risulta il medesimo descritto nel caso precedente e l’ipotesi nulla viene rifiutata se è

verificata la disuguaglianza 14.2.6.

Page 10: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

278

14.3 Verifica di ipotesi su

Data una popolazione in cui la variabile Z ha una distribuzione Zero-Uno caratterizzata dal parametro , la

verifica di ipotesi sul valore del parametro assume la forma

H0 : = 0. 14.3.1

Se il campione è sufficientemente numeroso, lo stimatore proporzione campionaria P̂ ha una distribuzione

asintoticamente normale, in base al teorema limite centrale.

Assumendo come vera l’ipotesi nulla, la distribuzione di P̂ ha valore atteso 0 e varianza

n

ππ 00 1, per

cui la statistica test

n

P

)(1

ˆ

00

0

tende a distribuirsi come una N(0, 1).

Di conseguenza, tenendo presente quanto descritto a proposito della verifica di ipotesi su e seguendo il

medesimo procedimento, l’ipotesi nulla 14.3.1 verrà rifiutata se risulta

2/1

00

0

)(1

ˆ

z

n

P 14.3.2

mentre sarà ritenuta compatibile con il risultato campionario in caso contrario.

Esempio 14.3.1

Si vuole verificare al livello di significatività dell’1% l’ipotesi che il tasso di disoccupazione dei laureati con una

votazione finale superiore o uguale a 100 sia pari al 5% sapendo che dalla popolazione è stato estratto un campione

casuale di 5000 studenti sui quali 300 sono risultati disoccupati.

H0 : = 0.05

La proporzione di studenti disoccupati nel campione estratto è pari al 6% per cui la statistica test assume il valore

seguente

5762243

5000

950050

0500609950 .z.

..

...

e l’ipotesi viene quindi rifiutata al livello = 0.01.

Page 11: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

279

Esempio 14.3.2

Sulla base dei dati dell’esempio precedente calcolare il p-valore associato alla statistica test.

Si ottiene

0012.09994.01224.312

Page 12: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

280

14.4 Verifica dell’uguaglianza fra due valori medi

In molte situazioni reali lo scopo di un’indagine statistica consiste nel confronto fra due o più popolazioni

considerate in tempi o in situazioni diverse anche se di seguito, per semplicità, verrà considerato solo il caso

in cui le popolazioni esaminate sono solo due. In questi casi si ha generalmente interesse a confrontare i

valori medi di una determinata variabile nelle due popolazioni oppure le proporzioni di unità che presentano

una determinata caratteristica nelle due popolazioni.

In entrambi i casi si estrae un campione da ciascuna popolazione e sui due insiemi di dati si calcola la media

campionaria o la proporzione campionaria per verificare se la differenza fra le stime ottenute è così piccola

da poter essere imputata solo all’effetto di fattori casuali o se invece è così elevata da portare al rifiuto

dell’ipotesi nulla di uguaglianza dei valori dei parametri che caratterizzano le due popolazioni.

I campioni considerati sono ovviamente indipendenti fra di loro, in quanto estratti da due popolazioni

diverse.

In questo paragrafo è considerata la verifica dell’ipotesi di uguaglianza dei valori attesi di Z nella prima e

nella seconda popolazione

H0 : 1 = 2 14.4.1

così come accade, per esempio, quando si vuole confrontare l’effetto di due diversi fertilizzanti sul

rendimento per ettaro di una coltura o l’effetto di due medicinali nella cura di una malattia: se la differenza

fra le due medie campionarie è così grande da non poter essere imputata ai soli fattori casuali, si è portati a

concludere che un fertilizzante è migliore rispetto all’altro o che il tempo di guarigione con un medicinale è

sensibilmente minore rispetto all’altro.

Altri esempi comuni del confronto fra i valori medi di una variabile esaminata in due popolazioni distinte si

hanno quando si esamina il rendimento di due diversi titoli, i risultati ottenuti all’esame da studenti che

hanno utilizzato due testi differenti, la durata di funzionamento di prodotti ottenuti con due macchinari

diversi.

La verifica di una ipotesi 14.4.1 viene effettuata in modi diversi a seconda del grado di conoscenza sulla

distribuzione della Z nelle due popolazioni e a seconda della numerosità n1 e n2 dei campioni casuali estratti.

Indicata con X1 la v.c. “valore di Z sull’unità estratta dalla prima popolazione” e con X2 la v.c. “valore di Z

sull’unità estratta dalla seconda popolazione”, la verifica dell’ipotesi 14.4.1 viene effettuata sulla base del

valore assunto dalla differenza delle due medie campionarie 1X e 2X . Tanto più questa differenza è piccola

in valore assoluto, tanto più l’ipotesi nulla sembra verosimile, mentre diventa via via più improbabile al

crescere del suo valore.

Se la numerosità dei due campioni è sufficientemente elevata da poter utilizzare il teorema limite centrale, la

distribuzione di probabilità delle due medie campionarie può essere approssimata da

1

21

11 ,n

σμN~X

Page 13: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

281

2

22

22 ,n

σμN~X

dove 21σ e 2

2σ sono le varianze della Z nelle due popolazioni.

Dato che i due campioni provengono da due differenti popolazioni, le v.c. 1X e 2X risultano indipendenti

fra loro, per cui la distribuzione approssimata della loro differenza risulta

2

22

1

21

2121 ,n

σ

n

σμμN~XX

ed effettuando la standardizzazione, si ha quindi

1,0

2

22

1

21

2121 N~

n

σ

n

σ

μμXX

. 14.4.2

Di solito le varianze delle popolazioni non sono note, ma possono essere stimate in modo corretto e coerente

mediante le varianze campionarie corrette per cui, al posto della 14.4.2, si utilizza la seguente statistica test

1,0

2

22

1

21

2121 N~

n

S

n

S

μμXX

cc

che, sotto l’ipotesi nulla 14.4.1 assume la forma

1,0

2

22

1

21

21 N~

n

S

n

S

XX

cc

. 14.4.3

Per effettuare la verifica dell’ipotesi 14.4.1 al livello di significatività si può quindi confrontare il valore

assoluto della statistica test 14.4.3 con il quantile z1/2 della normale standardizzata.

Se risulta

Page 14: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

282

2

22

1

21

21

n

S

n

S

XX

cc

> z1-/2 14.4.4

il valore della statistica è significativo e l'ipotesi nulla viene rifiutata al livello di significatività , mentre in

caso contrario l'ipotesi è compatibile con il risultato campionario e non vi sono motivi per rifiutarla.

Esempio 14.4.1

Due diversi metodi di coltura sono stati utilizzati su due campioni di piante di numerosità n1=40 e n2=60 ottenendo i

seguenti risultati:

1620.94

526.97

222

211

c

c

sx

sx

Si vuole verificare l’ipotesi che i due diversi metodi di coltura non diano risultati significativamente diversi fra loro al

livello di significatività =0.05.

La statistica test 14.4.4 assume il valore

96.18.1

60

162

40

52

946.97975.0

z

per cui non si ha motivo di rifiutare l’ipotesi.

Esempio 14.4.2

Sulla base dei dati dell’esercizio precedente, si calcoli il p-valore associato alla statistica test.

Risulta

0718.09641.0128.112

per cui l’ipotesi di uguaglianza fra valori attesi va rifiutata per qualsiasi valore di superiore a 0.0718.

Nel caso in cui si possa assumere la cosiddetta ipotesi di omoschedasticità, ossia l’ipotesi che le varianze

delle due popolazioni siano uguali fra loro e uguali a 2, la statistica 14.4.2 assume la forma seguente

1,0

21

21

2121

21

212

2121

2

2

1

2

2121 N~

nn

nnσ

μμXX

nn

nnσ

μμXX

n

σ

n

σ

μμXX

14.4.5

Anche in questo caso, in genere, il valore del parametro 2 è ignoto, ma può essere stimato in modo

corretto mediante la cosiddetta varianza campionaria pooled che assume la forma seguente

2

11

21

221

2112

nn

SnSnS cc

p

Page 15: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

283

e corrisponde quindi alla media delle due varianze campionarie corrette ponderate con le rispettive

numerosità campionarie diminuite di 1.

Al posto della 14.4.5, si utilizza quindi la seguente statistica test

2

21

21

212121

nn

p

t~

nn

nnS

μμXX

che si distribuisce come una t con n1+n22 gradi di libertà.

Sotto l’ipotesi nulla 14.4.1 questa statistica assume la forma

2

21

21

2121

nn

p

t~

nn

nnS

XX. 14.4.6

Per cui, per effettuare la verifica dell’ipotesi 14.4.1 al livello di significatività , si confronta il valore

assoluto della statistica test 14.4.6 con il quantile 2/1,221 nnt .

Se risulta

2/1,2

21

21

2121

nn

p

t

nn

nnS

XX 14.4.7

il valore della statistica è significativo e l'ipotesi nulla si rifiuta al livello di significatività , mentre in caso

contrario non va rifiutata.

Esempio 14.4.3

È stato effettuato un esperimento per confrontare gli effetti di due diverse miscele (A e B) aggiunte al mangime dei polli

che dovrebbero favorire l’accrescimento degli animali. Sapendo che dopo un periodo di 2 settimane sono stati rilevati

gli incrementi di peso (espressi in grammi) riportati nella tabella successiva, verificare se le due miscele hanno un

effetto significativamente diverso al livello di significatività 0.05 ipotizzando che l’accrescimento di peso si distribuisca

in modo normale e che sia valida l’ipotesi di omoschedasticità.

A 639 646 650 641 641 637 659 650 640 635

B 650 633 631 637 642 638 640 634 626 636 640

I due campioni, di numerosità n1=10 e n

2=11, hanno media e varianza corretta rispettivamente pari a

8.6431 x , 4.5421 cs

Page 16: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

284

6372 x , 6.3922 cs

La varianza pooled è pari a

6105.4619

6.39104.5492

ps

e la statistica test per la verifica dell’ipotesi nulla è pari a

2796.2

110

11106105.46

6378.643

Dato che il quantile di riferimento è 093.2975.0,19 t si rifiuta H0 al livello di significatività 0.05.

Va ricordato che se il numero dei gradi di libertà della t è superiore a 30, il valore dei suoi quantili può essere

approssimato dal valore dei quantili dello stesso ordine della normale standard.

Page 17: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

285

14.5 Verifica dell’uguaglianza fra due proporzioni

Quando si ipotizza che la variabile di interesse Z ha una distribuzione Zero-Uno e si vuole effettuare il

confronto fra il valore del parametro che la caratterizza in due diverse popolazioni, l’ipotesi nulla assume

la forma

H0 : 1 = 2 = 0 14.5.1

dove 0 indica il valore ignoto della proporzione comune. Dato che la distribuzione di Z è caratterizzata da

un solo parametro, la 14.5.1 equivale in realtà a verificare l’uguaglianza della distribuzione di Z nelle due

popolazioni.

Se le numerosità campionarie n1 e n2 sono sufficientemente elevate, le due proporzioni campionarie 1P̂ e 2P̂

hanno una distribuzione che può essere approssimata da due distribuzioni normali, rispettivamente di

parametri

1

1111

1,ˆ

nN~P

2

2222

1,ˆ

nN~P

Anche in questo caso le due v.c. sono indipendenti fra loro, per cui la differenza 21ˆˆ PP ha la seguente

distribuzione asintotica

2

22

1

112121

11,ˆˆ

nnN~PP

.

Effettuando la standardizzazione, risulta quindi

1,011

ˆˆ

2

22

1

11

2121 N~

nn

PP

14.5.2

Sotto l’ipotesi 14.5.1 la 14.5.2 assume la forma seguente

1,011

1

ˆˆ

11

ˆˆ

2100

21

2

0

1

00

21 N~

nn

PP

nn

PP

14.5.3

Page 18: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

286

in cui compare il parametro ignoto 0 che deve essere stimato in qualche modo. Dato che si dispone di due

diverse stime 1p̂ e 2p̂ di 0 si utilizza la media aritmetica delle due proporzioni campionarie ponderata con

le numerosità n1 e n2, per cui lo stimatore di 0 assume la forma seguente

21

221100

ˆˆˆˆ

nn

PnPnP

.

Questo stimatore corrisponde a quello che si ottiene considerando un unico campione costituito dagli n1

elementi appartenenti al primo campione e dagli n2 elementi appartenenti al secondo campione.

La statistica test per la verifica dell’ipotesi 14.5.1 corrisponde quindi a

1,0

11ˆ1ˆ

ˆˆ

2100

21 N~

nnPP

PP

per cui, scelto il livello di significatività , si confrontar il valore assoluto della statistica test precedente con

il quantile z1/2 della normale standardizzata.

Se risulta

2100

21

11ˆ1ˆ

ˆˆ

nnPP

PP> z1-/2 14.5.4

il valore della statistica è significativo e l'ipotesi nulla viene rifiutata al livello di significatività , mentre in

caso contrario l'ipotesi è compatibile con il risultato campionario e non vi sono motivi per rifiutarla.

Esempio 14.5.1

Anni fa venne condotto uno studio per analizzare gli effetti positivi dell’uso di aspirina sulla prevenzione degli attacchi

cardiaci. Su un insieme di 22071 individui vennero formati due gruppi: il gruppo di trattamento e quello di controllo.

Gli individui del gruppo di trattamento ricevettero una dose quotidiana di aspirina mentre quelli di controllo un farmaco

placebo. Lo studio venne condotto per un periodo di 5 anni osservando il numero di decessi per infarto. Si ottennero i

seguenti risultati

Farmaco\Esito Infartuati Non infartuati

Placebo 239 10795 11034

Aspirina 139 10898 11037

378 21693 22071

Page 19: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

287

La proporzione dei colpiti da infarto nel gruppo di controllo è 021654.011034

239ˆ1 p , mentre la stessa proporzione nel

gruppo sottoposto a trattamento è 012597.011037

139ˆ2 p . Pertanto risulta 017127.0

22071

139239ˆ0

p

E la statistica test 14.5.4 è pari a

185.5

11037

1

11034

1017127.01017127.0

012597.0021654.0

.

Dato che il p-valore associato a tale risultato è praticamente nullo, l’ipotesi di uguaglianza fra le due proporzioni va

rifiutata per qualunque livello di significatività.

Page 20: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

288

14.6 Test di indipendenza

Nella prima parte di queste dispense si è studiato l’indice chi-quadrato per misurare il grado di dipendenza

assoluta (o dipendenza in distribuzione) fra due variabili rilevate contemporaneamente su n unità statistiche.

Quando l’insieme di unità statistiche considerate è l’insieme delle unità che costituiscono un campione

casuale il risultato ottenuto con la 6.3.1 o con la 6.3.2 viene utilizzato per verificare se è verosimile l’ipotesi

che le variabili siano indipendenti nella popolazione da cui il campione è stato estratto.

Indicato rispettivamente con k e h il numero di determinazioni assunte dalle due variabili di interesse, Z e W,

le njl che compaiono nella 6.3.1 o le fjl che compaiono nella 6.3.2 rappresentano le frequenze congiunte

campionarie relative alle variabili casuali X “valore di Z sull’unità estratta” e di Y “valore di W sull’unità

estratta” mentre le

n

nnn

.l.j'jl per j = 1, 2, …, k; l = 1, 2, …, h

o le

.l.j'jl fff per j = 1, 2, …, k; l = 1, 2, …, h

sono le corrispondenti frequenze teoriche, calcolate sotto ipotesi di indipendenza assoluta fra le due variabili.

Assumendo come vera l’ipotesi nulla di indipendenza, le statistiche 6.3.1 e 6.3.2 tendono a distribuirsi come

una variabile chi-quadrato con un numero di gradi di libertà pari a (k1)(h1), purché siano soddisfatte due

condizioni:

- la numerosità campionaria n deve essere sufficientemente elevata

- le 'jl

'jl fnn devono essere almeno pari a 5 per ogni j = 1, 2, …, k, l = 1, 2, …, h.

Se è vera l’ipotesi di indipendenza fra le due variabili nella popolazione, la statistica test 6.3.1 (o la 6.3.2)

tende ad assumere valori prossimi a zero. L’ipotesi nulla di indipendenza sembra quindi tanto più verosimile

quanto più il valore della statistica test è prossima a zero, per cui la regione di rifiuto dell’ipotesi nulla è

posizionata lungo la coda destra della distribuzione della 2

11 hkχ .

Scelto quindi un livello di significatività , la regione di rifiuto dell’ipotesi di indipendenza fra Z e W è

costituita da tutti quei valori maggiori del quantile 2

1,11 αhkχ .

Page 21: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

289

Esempio 14.6.1

Si verifichi l’ipotesi di indipendenza fra due variabili Z e W al livello di significatività =0.05 sapendo che su un

campione casuale si sono ottenuti i seguenti risultati relativi alle variabili casuali X “valore di Z sull’individuo estratto”

e di Y “valore di W sull’individuo estratto”

X\Y A B

a 30 32 62

b 6 22 28

36 54 90

Si controlla facilmente che le frequenze teoriche calcolate sotto ipotesi di indipendenza sono tutte maggiori di 5, come

risulta dai valori riportati nella tabella successiva

X\Y A B

a 24.8 37.2 62

b 11.2 16.8 28

36 54 90

Utilizzando la formula di calcolo semplificata 6.3.3 la statistica test risulta pari a

8410.512854

22

2836

6

6254

32

6236

3090

22222

1212

e l’ipotesi di indipendenza va quindi rifiutata perché la statistica risulta maggiore del quantile 3.841 che nella chi-

quadrato con 1 grado di libertà isola alla sua destra un’area pari a 0.05.

Esempio 14.6.2

Si verifichi l’ipotesi di indipendenza fra due variabili Z e W al livello di significatività =0.01 sapendo che su un

campione di 100 elementi si sono ottenuti i seguenti risultati relativi alle variabili casuali X “valore di Z sull’individuo

estratto” e di Y “valore di W sull’individuo estratto”

X\Y A B

a 0.02 0.18 0.20

b 0.25 0.25 0.50

c 0.25 0.05 0.30

0.52 0.48 1.00

Le frequenze relative teoriche calcolate sotto ipotesi di indipendenza assumono i valori riportati nella tabella successiva

X\Y A B

a 0.104 0.096 0.20

b 0.260 0.240 0.50

c 0.156 0.144 0.30

0.52 0.48 1.00

per cui ogni 'jl

'jl fn 100 è superiore a 5.

Utilizzando la formula di calcolo semplificata 6.3.4 la statistica test risulta pari a

0150.261...5.052.0

25.0

2.048.0

18.0

2.052.0

02.0100

2222

1213

e l’ipotesi di indipendenza va quindi rifiutata perché la statistica risulta maggiore del quantile 9.210 che nella chi-

quadrato con 2 gradi di libertà isola alla sua destra un’area pari a 0.01.

Page 22: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

290

14.7 Test sulla bontà di adattamento

Un ulteriore comune utilizzo dei dati campionari è la verifica di ipotesi funzionali, ossia la verifica di ipotesi

circa la distribuzione della variabile di interesse. Anche se generalmente non si è in grado di stabilire con

certezza la distribuzione di Z, è tuttavia possibile che le informazioni parziali in possesso del ricercatore, o

altre considerazioni di varia natura, consentano di formulare un’ipotesi distributiva.

In analogia con le situazioni esaminate in precedenza, lo scopo dell’indagine campionaria consiste nel

verificare se l’ipotesi nulla circa la forma funzionale della distribuzione della variabile nella popolazione

possa essere ritenuta compatibile o meno con i dati campionari raccolti.

Le ipotesi di questo genere vengono verificate attraverso i cosiddetti test funzionali che possono essere

utilizzati anche in situazioni diverse come, per esempio, quando si ha interesse a confrontare la distribuzione

di una variabile rilevata su due diverse popolazioni oppure su una stessa popolazione in tempi diversi, al fine

di valutare se si rilevano differenze significative.

Data una certa variabile Z con distribuzione f(z), l’ipotesi da sottoporre a verifica assume la forma

zfzf 00 :H 14.7.1

dove la distribuzione teorica f0(z) può essere completamente o solo parzialmente specificata, nel senso che

l’ipotesi può riguardare o meno anche il valore dei parametri che compaiono nel modello. Nel caso in cui

l’ipotesi venga completamente specificata, si formulano delle ipotesi anche sui valori dei parametri che

caratterizzano la funzione, mentre in altri casi l’ipotesi riguarda solo la forma funzionale della f0(z).

Il criterio generale per la verifica di un’ipotesi 14.7.1 si basa sul confronto fra la distribuzione teorica, sotto

ipotesi nulla, e la distribuzione della variabile nella popolazione, che a sua volta viene stimata sulla base dei

dati campionari raccolti, ossia attraverso la distribuzione della v.c. X “valore di Z sull’unità estratta”. Occorre

quindi calcolare una qualche statistica test in grado di misurare la differenza fra le due distribuzioni e

determinare la distribuzione di probabilità di tale differenza, in modo da individuare la regione critica e la

regione di accettazione dell’ipotesi nulla.

Uno dei test utilizzati frequentemente, soprattutto quando la variabile considerata è di tipo qualitativo o

quantitativo discreto, è la statistica chi-quadrato analizzata in precedenza. In questo caso, però, la statistica si

basa sulla differenza fra i valori assunti dalle probabilità teoriche, calcolate sotto H0, rispetto ai valori delle

stime campionarie corrispondenti, date dalle frequenze relative calcolate sul campione osservato.

Considerata una variabile qualitativa o quantitativa discreta Z che assume k determinazioni diverse, sia

P(Z=zj) = j per j = 1, 2, …, k 14.7.2

la probabilità che Z assuma la generica determinazione zj.

L’ipotesi da verificare può essere espressa nel modo seguente

Page 23: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

291

jj 00 :H per j = 1, 2, …, k 14.7.3

e il generico valore di probabilità teorica j0 , calcolata sulla base del modello distributivo ipotizzato sotto

H0, va confrontato con la sua stima campionaria, che corrisponde alla frequenza relativa osservata

n

nf

jj 14.7.4

pari al rapporto fra il numero dei casi in cui si è rilevata la j-esima determinazione della variabile in esame

rispetto alla numerosità campionaria complessiva.

È evidente che quanto più i valori fj e 0j risultano simili fra loro, tanto più sembra verosimile l’ipotesi nulla

14.7.3, mentre al crescere della loro differenza si sarà portati a rifiutare H0.

Il test chi-quadrato che consente di valutare complessivamente l’entità delle differenze fra le k coppie di

valori fj e 0j assume la forma seguente

k

j j

jjk

π

πfnχ

1 0

202

1 . 14.7.5

La statistica test 14.7.5 risulta pari a zero se e solo se le frequenze relative campionarie sono tutte uguali alle

corrispondenti probabilità sotto ipotesi nulla, mentre assume valori via via crescenti al crescere delle

differenze fra i valori di queste coppie.

Sotto ipotesi nulla e per una numerosità campionaria n sufficientemente elevata, la distribuzione della

statistica test 14.7.5 tende ad una distribuzione chi-quadrato con un numero di gradi di libertà pari a k1 e

cioè al numero di determinazioni della v.c. X diminuito di 1.

Anche in questo caso l’ipotesi nulla viene rifiutata per valori alti della statistica test per cui, fissato il livello

di significatività , la regione di rifiuto è posizionata alla destra del quantile 2

1,1k .

La distribuzione asintotica chi-quadrato è valida purché siano verificate condizioni analoghe a quelle

descritte nel precedente paragrafo. In particolare:

- la numerosità campionaria n deve essere sufficientemente elevata

- i prodotti jn 0 devono essere almeno pari a 5 per ogni j = 1, 2, …, k.

Esempio 14.7.1

Si vuole verificare l’ipotesi che un dado sia bilanciato al livello di significatività del 5% sapendo che in 1800 lanci sono

stati ottenuti i risultati riportati nella tabella successiva

Page 24: 14. TEORIA DEI TEST STATISTICIdocenti-deps.unisi.it/stefanianaddeo/wp-content/... · numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se

292

Distribuzione dei risultati ottenuti lanciando un dado

X Frequenze assolute Frequenze relative

1 324 0.18

2 342 0.19

3 306 0.17

4 270 0.15

5 270 0.15

6 288 0.16

1800 1.00

L’ipotesi nulla assume la forma

6,...,2,16

1:H0 jj

e quindi i prodotti 3006

18000 jn sono tutti maggiori di 5.

La statistica 14.7.5 assume il valore

4.141/6

1/6-0.16...

1/6

1/6-0.19

1/6

1/6-0.181800

22225

mentre il quantile di ordine 0.95 della chi-quadrato con 5 gradi di libertà risulta pari a 11.07, per cui l’ipotesi nulla va

rifiutata.

Se si fosse scelto un livello di significatività =0.01, il quantile della chi-quadrato sarebbe stato uguale a 15.09 e

l’ipotesi nulla sarebbe risultata compatibile con il risultato campionario osservato.

La statistica 14.7.5 può essere utilizzata anche per variabili casuali continue. In questo caso, però, è

necessaria la creazione di un certo numero di classi di valori e il calcolo delle probabilità teoriche e delle

frequenze campionarie corrispondenti per ciascuna di queste classi.

Se l’ipotesi nulla si riferisce alla forma della distribuzione della variabile (discreta o continua) specificando

anche il valore dei parametri che la caratterizzano, il test viene effettuato sostituendo al valore di questi

parametri le corrispondenti stime ottenute sul campione osservato. In questa situazione il numero dei gradi di

libertà della distribuzione chi-quadrato risente del numero di parametri stimati. Indicato con q il numero di

questi parametri stimati, i g.d.l. della chi-quadrato diventano kq1.