Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

40
Num 02 - 1 / 40 Lezione 8 Numerosità del campione

Transcript of Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Page 1: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 1 / 40

Lezione 8Numerosità del campione

Page 2: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 2 / 40

parte 2la numerosità minima del campionenei test di ipotesi

Page 3: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 3 / 40

• come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che viene quantificata attraverso l’intervallo di confidenza:

• Dato un campione con immagini { X1, X2, …, Xn } proveniente da

una popolazione su cui è definita una variabile casuale X avente

densità f (x) qualsiasi con media e varianza 2 si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri della popolazione.

gli strumenti di inferenza

mnX vsnvin SS 222

n

j

jn Xn

X1

1

n

j

njn XXn

S1

22

1

1

Page 4: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 4 / 40

la numerosità minima del campione nei testsulla media

Page 5: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 5 / 40

azioni decisionali sull’ipotesi H0

Come è facile vedere se il test a cui è stata sottoposta l’ipotesi H0 ha avuto esito positivo ed ha fornito informazioni sufficienti (potremmo dire: “se il test è stato utile”) l’azione decisionale è

la cioè il rifiuto di H0 :

non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio;

si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione;

Page 6: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 6 / 40

azioni decisionali sull’ipotesi H0

esempio 1:

preso un campione di n elementi da una popolazione su cui è

definita una variabile casuale X con media incognita e varianza 2 conosciuta posso esprimere una decisione in merito

all’ipotesi H0 : 0 ?

le premesse a questo test sono le seguenti:– si estrae un campione casuale dalla popolazione e si

misurando i valori della caratteristica comune

– si definisce la variabile casuale X,

– si individuano i valori assunti dalla variabile casuale X in corrispondenza degli elementi che compongono il campione,

Page 7: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 7 / 40

azioni decisionali sull’ipotesi H0

esempio 1:

preso un campione di n elementi da una popolazione su cui è

definita una variabile casuale X con media incognita e varianza 2 conosciuta posso esprimere una decisione in merito

all’ipotesi H0 : 0 ?

questo test si conduce:– definendo una opportuna variabile casuale a partire dagli

stimatori campionari e fissando un valore “critico” (cioè un discriminante),

– calcolando il valore della variabile prescelta,– confrontando tale valore con quello critico fissato e

decidendo, in base al confronto, se è possibile rifiutare

oppure se non è possibile rifiutare H0 : 0

Page 8: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 8 / 40

azioni decisionali sull’ipotesi H0

esempio 1:I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns.

1) Come definiamo la variabile casuale X ?

La variabile casuale X associa a ciascun punto campione un numero positivo ed adimensionale di valore uguale al valore dello slew-rate misurato in mV/ns .

Page 9: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 9 / 40

azioni decisionali sull’ipotesi H0

esempio 1:I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns.

2) Come valutare la affermazione dei tecnici del dR&D?

Dato che non sarà possibile provare l’intera popolazione (non ancora prodotta) sarà necessario agire tramite un gruppo di prototipi, cioè un campione, ed accettare l’incertezza insita nel trasferire informazioni ricavate dal campione alla intera popolazione: ovviamente si userà la media campionaria come stimatore di .

Page 10: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 10 / 40

azioni decisionali sull’ipotesi H0

esempio 1:I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns.

3) Come definire il valore discriminante per la media campionaria?

Si fissa il discriminante ad un valore diverso da 0 , tale da

individuare un campo di valori in cui, se fosse realmente uguale

a 0 , il valore della media campionaria (aleatorio a causa della

aleatorietà del campione) avrebbe probabilità molto bassa di entrare.

Page 11: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 11 / 40

azioni decisionali sull’ipotesi H0

(approccio pessimistico)

esempio 1:Il responsabile del Laboratorio Prove e Misure decide pertanto di adottare un test che prevede le seguenti fasi:

3. se il valore della media campionariarisulterà inferiore a 78,5 si rifiuterà l’affermazione dei tecnici del dR&D circa il preteso miglioramento; se invece tale soglia verrà uguagliata o superata non si contesterà la loro affermazione.

1. si costituirà un campione composto da un prestabilito numero di OpAmp, ad esempio 49 OpAmp;

2. mediante appositi strumenti si misurerà lo slew-rate di ciascun elemento del campione per ricavare i valori della X;

Page 12: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 12 / 40

criterio decisionale sull’ipotesi H0

esempio 1:Il criterio decisionale adottato è quindi il seguente:

049

049

5,78

5,78

H

H

rifiutose

rifiutose

nonX

X

Page 13: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 13 / 40

Effetto della numerosità del campioneSe il campione è “fedele” il valore della media campionaria non dipende dalla numerosità

049

049

5,78

5,78

H

H

rifiutose

rifiutose

nonX

X

Page 14: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 14 / 40

Effetto della numerosità del campioneAl contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione!

049

049

5,78

5,78

H

H

rifiutose

rifiutose

nonX

X

?

Page 15: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 15 / 40

Effetto della numerosità del campioneAl contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione!

049

049

5,78

5,78

H

H

rifiutose

rifiutose

nonX

X

Page 16: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 16 / 40

i test sulla media:

H0

Page 17: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 17 / 40

formulazione di un test sulla media

per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi:

1. scelta della numerosità del campione;

2. costruzione della variabile casuale X

3. individuazione della “ipotesi principale” H0 ;

4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;

5. scelta dello stimatore campionario e determinazione della sua distribuzione ;

6. definizione della affidabilità richiesta ;

7. definizione della eventuale potenza minima richiesta ;

8. determinazione del valore del/dei discriminanti ;

9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizioe si aumenta la numerosità del campione ;

Page 18: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 18 / 40

formulazione di un test sulla media

per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi:

1. scelta della numerosità del campione;

2. costruzione della variabile casuale X

3. individuazione della “ipotesi principale” H0 ;

4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;

5. scelta dello stimatore campionario e determinazione della sua distribuzione ;

6. definizione della affidabilità richiesta ;

7. definizione della eventuale potenza minima richiesta ;

8. determinazione del valore del/dei discriminanti ;

9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizioe si aumenta la numerosità del campione ;

Page 19: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 19 / 40

formulazione di un test sulla media

5. si sceglie la variabile campionaria idonea a svolgere il test:

se la varianza 2 è nota e se il campione è numeroso (n 30) si potrebbero usare indifferentemente:

- la media campionaria

che ha distribuzione normale con media e varianza 2 /n;

- la variabile

che ha distribuzione normale standard.

n

jjn X

nX

1

1

n

XZ n

0

Page 20: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 20 / 40

formulazione di un test sulla media

5. si sceglie la variabile campionaria idonea a svolgere il test:

se la varianza 2 è nota e se il campione è numeroso (n 30) si potrebbero usare indifferentemente:

- la media campionaria

che ha distribuzione normale con media e varianza 2 /n;

- la variabile

che ha distribuzione normale standard.

n

jjn X

nX

1

1

n

XZ n

0

Problema: non dispongo di valori tabulati !

Page 21: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 21 / 40

formulazione di un test sulla media

5. si sceglie la variabile campionaria idonea a svolgere il test: se la popolazione ha distribuzione normale con varianza 2 incognita si usa la variabile

che ha distribuzione t di Student con n - 1 g.d.l.

n

SX

Tn

n 0

se n > 30 la variabile T può essere approssimata con la:

che ha distribuzione normale standard

n

SX

Zn

n 0

Page 22: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 22 / 40

numerosità del campione: normale standard

1. si stabilisce la numerosità n del campione con cui si vuole condurre il test.

supponiamo di avere scelto come variabile campionaria la:

che, per n sufficientemente grande, sappiamo avere distribuzione normale standardizzata

n

XZ n

0

per comprendere l’effetto di un aumento della numerosità del campione si può fare la seguente considerazione:

Page 23: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 23 / 40

numerosità del campione: normale standard

n

XZ n

0

nX

Z

n

XZ nn

00

Page 24: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 24 / 40

nX

Z

n

XZ nn

00

numerosità del campione: normale standard

Page 25: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 25 / 40

nX

Z

n

XZ nn

00

numerosità del campione: normale standard

Page 26: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 26 / 40

numerosità del campione: normale standard

Page 27: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 27 / 40

numerosità del campione: t di Student

Qualora la varianza della X per l’intera popolazione non sia conosciuta si può condurre il calcolo della numerosità richiesta al campione mediante lo stimatore “varianza campionaria corretta”:

n

S

XT

n

n

2

n

j

njn XXn

S1

22

1

1

Sappiamo che se n è sufficientemente grande la variabile casuale

segue una distribuzione “ t di Student con n-1 g.d.l ”.

Page 28: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 28 / 40

numerosità del campione: t di Student

Page 29: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 29 / 40

numerosità del campione: t di Student

Page 30: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 30 / 40

Un problema da considerare è rappresentato dal fatto che il

valore critico t1- /2 della t di Student dipende da n

numerosità del campione: t di Student

Page 31: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 31 / 40

Un primo calcolo approssimato può essere condotto sostituendo al quantile della T il corrispondente quantile di una variabile Z normale standard.

Se n’min > 30 sappiamo che la distribuzione t di Student non

differisce in maniera evidente dalla distribuzione normale standard.

Individuato così un primo valore approssimato si può

proseguire cercando il valore corretto di nmin mediante un procedimento iterativo:

numerosità del campione: t di Student

Page 32: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 32 / 40

partendo da una prima valutazione del quantile della

t di Student calcolato per un numero di g.d.l. pari a n’min - 1

si calcola:

Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richiesta al campione.

numerosità del campione: t di Student

Page 33: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 33 / 40

Se pensiamo di dover operare con un campione di numerosità

ridotta n < 30 dobbiamo ricordare che la distribuzione della media campionaria può essere considerata normale

solamente se anche la X segue la distribuzione normale!!!

Se ciò si verifica possiamo individuare il valore della

numerosità richiesta nmin con un procedimento uguale a

quello già mostrato per n > 30.

numerosità del campione: t di Student

Page 34: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 34 / 40

Partiamo da una prima valutazione condotta con la:

per poi ricalcolare iterativamente il valore di nmin partendo da

una prima valutazione del quantile della t di Student calcolato

per un numero di g.d.l. pari a n’min - 1

Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.

numerosità del campione: t di Student

Page 35: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 35 / 40

la numerosità minima del campione nel testsulla varianza

Page 36: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 36 / 40

distribuzione della varianza campionaria corretta

• dato un campione con immagini { X1, X2, …, Xn } proveniente

da una popolazione infinita su cui è definita una variabile

casuale X con distribuzione normale, media e varianza 2,

la varianza campionaria corretta divisa per 02

fornisce una variabile casuale che segue una

distribuzione C 2 con n - 1 gradi di libertà

Page 37: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 37 / 40

Quantili critici nel test sulla varianza

/ 2 / 2

Page 38: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 38 / 40

numerosità del campione nel test sulla varianza

Nei vari casi le regioni di rifiuto sono:

12/1

22

2

2/2

an

a cS

cP

Page 39: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 39 / 40

Consistenza della varianza campionaria corretta

Sappiamo che Sn2 è uno stimatore

corretto e consistente della varianza

quindi, al crescere della numerosità n del campione, il suo valore si distribuisce in modo sempre più “concentrato in prossimità” di 2

E’ pertanto possibile ipotizzare che, per valori di n sufficientemente elevati, la casualità con cui viene estratto il campione non faccia variare in modo

significativo il valore della varianza campionaria Sn2.

Page 40: Num 02 - 1 / 40 Lezione 8 Numerosità del campione.

Num 02 - 40 / 40

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza

il più basso valore dei gradi di libertà per cui i valori

critici della C 2 soddisfano la forma corrispondente:

è pari a nmin - 1

il valore di nmin non compare in modo esplicito,

ma deve essere individuato attraverso i gradi di

libertà della C 2