Post on 01-May-2015
Num 02 - 1 / 40
Lezione 8Numerosità del campione
Num 02 - 2 / 40
parte 2la numerosità minima del campionenei test di ipotesi
Num 02 - 3 / 40
• come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che viene quantificata attraverso l’intervallo di confidenza:
• Dato un campione con immagini { X1, X2, …, Xn } proveniente da
una popolazione su cui è definita una variabile casuale X avente
densità f (x) qualsiasi con media e varianza 2 si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri della popolazione.
gli strumenti di inferenza
mnX vsnvin SS 222
n
j
jn Xn
X1
1
n
j
njn XXn
S1
22
1
1
Num 02 - 4 / 40
la numerosità minima del campione nei testsulla media
Num 02 - 5 / 40
azioni decisionali sull’ipotesi H0
Come è facile vedere se il test a cui è stata sottoposta l’ipotesi H0 ha avuto esito positivo ed ha fornito informazioni sufficienti (potremmo dire: “se il test è stato utile”) l’azione decisionale è
la cioè il rifiuto di H0 :
non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio;
si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione;
Num 02 - 6 / 40
azioni decisionali sull’ipotesi H0
esempio 1:
preso un campione di n elementi da una popolazione su cui è
definita una variabile casuale X con media incognita e varianza 2 conosciuta posso esprimere una decisione in merito
all’ipotesi H0 : 0 ?
le premesse a questo test sono le seguenti:– si estrae un campione casuale dalla popolazione e si
misurando i valori della caratteristica comune
– si definisce la variabile casuale X,
– si individuano i valori assunti dalla variabile casuale X in corrispondenza degli elementi che compongono il campione,
Num 02 - 7 / 40
azioni decisionali sull’ipotesi H0
esempio 1:
preso un campione di n elementi da una popolazione su cui è
definita una variabile casuale X con media incognita e varianza 2 conosciuta posso esprimere una decisione in merito
all’ipotesi H0 : 0 ?
questo test si conduce:– definendo una opportuna variabile casuale a partire dagli
stimatori campionari e fissando un valore “critico” (cioè un discriminante),
– calcolando il valore della variabile prescelta,– confrontando tale valore con quello critico fissato e
decidendo, in base al confronto, se è possibile rifiutare
oppure se non è possibile rifiutare H0 : 0
Num 02 - 8 / 40
azioni decisionali sull’ipotesi H0
esempio 1:I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns.
1) Come definiamo la variabile casuale X ?
La variabile casuale X associa a ciascun punto campione un numero positivo ed adimensionale di valore uguale al valore dello slew-rate misurato in mV/ns .
Num 02 - 9 / 40
azioni decisionali sull’ipotesi H0
esempio 1:I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns.
2) Come valutare la affermazione dei tecnici del dR&D?
Dato che non sarà possibile provare l’intera popolazione (non ancora prodotta) sarà necessario agire tramite un gruppo di prototipi, cioè un campione, ed accettare l’incertezza insita nel trasferire informazioni ricavate dal campione alla intera popolazione: ovviamente si userà la media campionaria come stimatore di .
Num 02 - 10 / 40
azioni decisionali sull’ipotesi H0
esempio 1:I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns.
3) Come definire il valore discriminante per la media campionaria?
Si fissa il discriminante ad un valore diverso da 0 , tale da
individuare un campo di valori in cui, se fosse realmente uguale
a 0 , il valore della media campionaria (aleatorio a causa della
aleatorietà del campione) avrebbe probabilità molto bassa di entrare.
Num 02 - 11 / 40
azioni decisionali sull’ipotesi H0
(approccio pessimistico)
esempio 1:Il responsabile del Laboratorio Prove e Misure decide pertanto di adottare un test che prevede le seguenti fasi:
3. se il valore della media campionariarisulterà inferiore a 78,5 si rifiuterà l’affermazione dei tecnici del dR&D circa il preteso miglioramento; se invece tale soglia verrà uguagliata o superata non si contesterà la loro affermazione.
1. si costituirà un campione composto da un prestabilito numero di OpAmp, ad esempio 49 OpAmp;
2. mediante appositi strumenti si misurerà lo slew-rate di ciascun elemento del campione per ricavare i valori della X;
Num 02 - 12 / 40
criterio decisionale sull’ipotesi H0
esempio 1:Il criterio decisionale adottato è quindi il seguente:
049
049
5,78
5,78
H
H
rifiutose
rifiutose
nonX
X
Num 02 - 13 / 40
Effetto della numerosità del campioneSe il campione è “fedele” il valore della media campionaria non dipende dalla numerosità
049
049
5,78
5,78
H
H
rifiutose
rifiutose
nonX
X
Num 02 - 14 / 40
Effetto della numerosità del campioneAl contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione!
049
049
5,78
5,78
H
H
rifiutose
rifiutose
nonX
X
?
Num 02 - 15 / 40
Effetto della numerosità del campioneAl contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione!
049
049
5,78
5,78
H
H
rifiutose
rifiutose
nonX
X
Num 02 - 16 / 40
i test sulla media:
H0
Num 02 - 17 / 40
formulazione di un test sulla media
per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizioe si aumenta la numerosità del campione ;
Num 02 - 18 / 40
formulazione di un test sulla media
per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizioe si aumenta la numerosità del campione ;
Num 02 - 19 / 40
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la varianza 2 è nota e se il campione è numeroso (n 30) si potrebbero usare indifferentemente:
- la media campionaria
che ha distribuzione normale con media e varianza 2 /n;
- la variabile
che ha distribuzione normale standard.
n
jjn X
nX
1
1
n
XZ n
0
Num 02 - 20 / 40
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la varianza 2 è nota e se il campione è numeroso (n 30) si potrebbero usare indifferentemente:
- la media campionaria
che ha distribuzione normale con media e varianza 2 /n;
- la variabile
che ha distribuzione normale standard.
n
jjn X
nX
1
1
n
XZ n
0
Problema: non dispongo di valori tabulati !
Num 02 - 21 / 40
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test: se la popolazione ha distribuzione normale con varianza 2 incognita si usa la variabile
che ha distribuzione t di Student con n - 1 g.d.l.
n
SX
Tn
n 0
se n > 30 la variabile T può essere approssimata con la:
che ha distribuzione normale standard
n
SX
Zn
n 0
Num 02 - 22 / 40
numerosità del campione: normale standard
1. si stabilisce la numerosità n del campione con cui si vuole condurre il test.
supponiamo di avere scelto come variabile campionaria la:
che, per n sufficientemente grande, sappiamo avere distribuzione normale standardizzata
n
XZ n
0
per comprendere l’effetto di un aumento della numerosità del campione si può fare la seguente considerazione:
Num 02 - 23 / 40
numerosità del campione: normale standard
n
XZ n
0
nX
Z
n
XZ nn
00
Num 02 - 24 / 40
nX
Z
n
XZ nn
00
numerosità del campione: normale standard
Num 02 - 25 / 40
nX
Z
n
XZ nn
00
numerosità del campione: normale standard
Num 02 - 26 / 40
numerosità del campione: normale standard
Num 02 - 27 / 40
numerosità del campione: t di Student
Qualora la varianza della X per l’intera popolazione non sia conosciuta si può condurre il calcolo della numerosità richiesta al campione mediante lo stimatore “varianza campionaria corretta”:
n
S
XT
n
n
2
n
j
njn XXn
S1
22
1
1
Sappiamo che se n è sufficientemente grande la variabile casuale
segue una distribuzione “ t di Student con n-1 g.d.l ”.
Num 02 - 28 / 40
numerosità del campione: t di Student
Num 02 - 29 / 40
numerosità del campione: t di Student
Num 02 - 30 / 40
Un problema da considerare è rappresentato dal fatto che il
valore critico t1- /2 della t di Student dipende da n
numerosità del campione: t di Student
Num 02 - 31 / 40
Un primo calcolo approssimato può essere condotto sostituendo al quantile della T il corrispondente quantile di una variabile Z normale standard.
Se n’min > 30 sappiamo che la distribuzione t di Student non
differisce in maniera evidente dalla distribuzione normale standard.
Individuato così un primo valore approssimato si può
proseguire cercando il valore corretto di nmin mediante un procedimento iterativo:
numerosità del campione: t di Student
Num 02 - 32 / 40
partendo da una prima valutazione del quantile della
t di Student calcolato per un numero di g.d.l. pari a n’min - 1
si calcola:
Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richiesta al campione.
numerosità del campione: t di Student
Num 02 - 33 / 40
Se pensiamo di dover operare con un campione di numerosità
ridotta n < 30 dobbiamo ricordare che la distribuzione della media campionaria può essere considerata normale
solamente se anche la X segue la distribuzione normale!!!
Se ciò si verifica possiamo individuare il valore della
numerosità richiesta nmin con un procedimento uguale a
quello già mostrato per n > 30.
numerosità del campione: t di Student
Num 02 - 34 / 40
Partiamo da una prima valutazione condotta con la:
per poi ricalcolare iterativamente il valore di nmin partendo da
una prima valutazione del quantile della t di Student calcolato
per un numero di g.d.l. pari a n’min - 1
Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.
numerosità del campione: t di Student
Num 02 - 35 / 40
la numerosità minima del campione nel testsulla varianza
Num 02 - 36 / 40
distribuzione della varianza campionaria corretta
• dato un campione con immagini { X1, X2, …, Xn } proveniente
da una popolazione infinita su cui è definita una variabile
casuale X con distribuzione normale, media e varianza 2,
la varianza campionaria corretta divisa per 02
fornisce una variabile casuale che segue una
distribuzione C 2 con n - 1 gradi di libertà
Num 02 - 37 / 40
Quantili critici nel test sulla varianza
/ 2 / 2
Num 02 - 38 / 40
numerosità del campione nel test sulla varianza
Nei vari casi le regioni di rifiuto sono:
12/1
22
2
2/2
an
a cS
cP
Num 02 - 39 / 40
Consistenza della varianza campionaria corretta
Sappiamo che Sn2 è uno stimatore
corretto e consistente della varianza
quindi, al crescere della numerosità n del campione, il suo valore si distribuisce in modo sempre più “concentrato in prossimità” di 2
E’ pertanto possibile ipotizzare che, per valori di n sufficientemente elevati, la casualità con cui viene estratto il campione non faccia variare in modo
significativo il valore della varianza campionaria Sn2.
Num 02 - 40 / 40
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
il più basso valore dei gradi di libertà per cui i valori
critici della C 2 soddisfano la forma corrispondente:
è pari a nmin - 1
il valore di nmin non compare in modo esplicito,
ma deve essere individuato attraverso i gradi di
libertà della C 2