Le distribuzioni campionarie
Click here to load reader
Transcript of Le distribuzioni campionarie
Le distribuzioni campionarie
Quando non è conveniente o possibile esaminare l’intera popolazione si ricorre allo studio di uncampione rappresentativo di essa, estendendo attraverso l’inferenza, i risultati del campioneall’intera popolazione.
Definiamo i concetti di:
•Popolazione obiettivo: la totalità degli elementi presi in esame sui quali si vogliono ottenereinformazioni.
•Campione casuale: si ottiene estraendo a sorte da una popolazione, di dimensione N, unaunità per volta. Ogni unità ha la stessa probabilità 1/N di essere estratta. L’insieme delle unitàestratte in questo modo costituisce un campione casuale.
•Campione stratificato proporzionale: in questo caso la popolazione viene suddivisa insottopopolazioni disgiunte ed esaustive chiamate strati; all’interno di ognuno di essi vieneeffettuato un campionamento casuale semplice. Da ogni strato si calcola la media, chiamatamedia di strato; la media pesata delle medie di strato dà la media di popolazione. Anche levarianze sono calcolate all’interno di ogni strato e opportunamente pesate danno la varianzastimata della popolazione.
•Campione casuale stratificato con allocazione ottimale: in questo caso si vuole avere untasso di campionamento diversificato per ogni strato. In particolare si vuole incrementare lanumerosità negli strati ad elevata variabilità e diminuirla dove invece è meno elevata.
1Cos'è la Statistica - G. Garau, L. Schirru
Statistiche e momenti campionari
* Un parametro è una misura di sintesi che descrive una caratteristica dell’intera popolazione.
Se si vuole studiare una popolazione avente forma nota e funzione di densità ,
ossia con un parametro * incognito, il procedimento da seguire è quello di estrarre un campione e rappresentare o
stimare il parametro con il valore di qualche funzione .
In altri termini si tratta di determinare quale sia la migliore funzione per stimare .
Definiamo a questo punto i concetti di
Statistica**: una statistica è una funzione di variabili casuali osservabili e quindi a sua volta una variabile casuale, che non
contiene alcun parametro incognito.
Momento campionario: Sia x1, x2, …, xn, un campione casuale. Il momento campionario di ordine r, indicato da sarà
definito come:
);( xf
) ..., ,(1 n
xxt
** In Descrittiva abbiamo definito la statistica come una misura di sintesi che descrive una caratteristica di un campione della popolazione.
'
rM
n
i
r
irX
nM
1
' 1
Se r=1 si ha la media campionaria, solitamente indicata con . Presentiamo alcuni esempi:x
n
ii
Xn
X1
1
n
ii
XXn
S1
22 )(1
1
Media campionaria Varianza campionaria
2Cos'è la Statistica - G. Garau, L. Schirru
Le statistiche campionarie
Le statistiche campionarie sono esempi di statistiche che possono essere utilizzate per stimare i corrispondenti parametri della popolazione. Si può dimostrare che:
22 1var e
nXXE
XX Per i passaggi matematici si rimanda al testo.
Se il valore atteso della media campionaria è uguale alla media della popolazione significa che la media campionaria (la
statistica) è uguale al parametro media da stimare e che la distribuzione è centrata intorno alla media ( ).
Il fatto, invece, che la il valore atteso della varianza campionaria sia uguale alla varianza della popolazione fratto la sua
numerosità, significa che la dispersione dei valori dei valori di intorno a è piccola quando l’ampiezza del campione è
grande.
Questo significa che se l’ampiezza del campione è grande i valori di media campionaria, usati per stimare la media della
popolazione tendono ad essere più concentrati intorno alla stessa media della popolazione rispetto a quanto lo sarebbero
se l’ampiezza fosse piccola. Questo fatto viene spiegato meglio dalla legge dei grandi numeri.
Valore atteso della media campionaria Valore atteso della varianza campionaria
X
3Cos'è la Statistica - G. Garau, L. Schirru
La legge dei grandi numeriLa legge dei grandi numeri dice che, in seguito ad un gran numero di prove nel lancio di una moneta, la differenza tra ilnumero di teste ottenuto ed il valore atteso ottenuto moltiplicando 0,5 per il numero di lanci, in termini assoluti è grande,ma in termini relativi, all’aumentare del numero di lancio (o prove), tale differenza sarà sempre più piccola.
Si può dire che il numero di teste sarà uguale alla metà del numero dei lanci più una quantità piccola che si chiama errorealeatorio e che sarà grande in valore assoluto, ma piccola in percentuale (rispetto al numero dei lanci effettuati).
Differenze in termini relativi
Nel seguito di questa Unità Didattica vedremo delle altre distribuzioni (distribuzioni campionarie) derivate dalla
distribuzione normale, e per questo facili da studiare, ma estremamente utili per modellare una vasta gamma di fenomeni
empirici. Tali distribuzioni saranno utili in particolare nel prossimo modulo.
4Cos'è la Statistica - G. Garau, L. Schirru
La distribuzione Chi-quadro,
Definizione: La somma dei quadrati di variabili casuali normali standardizzate e indipendenti ha una distribuzione chi quadro con (n-k) gradi di libertà *. Il grafico di tale distribuzione dipende quindi dai gradi di libertà (gdl).
* Dove n è la numerosità e k è il numero dei parametri.
2
2
Distribuzione
5Cos'è la Statistica - G. Garau, L. Schirru
Esercizio: Data la distribuzione con 5 gradi di libertà,
trovare il valore di tale che l’area a destra di vale 2
22
05.0
1
Le tavole presentate nell’appendice del libro tabulano l’area per cui, l’area da noi cercata è 0.95=1-0.05, con 5 gradi di libertà.
1
6Cos'è la Statistica - G. Garau, L. Schirru
La distribuzione T di Student
Definizione: Si considera Z avente una distribuzione normale standardizzata e U, una distribuzione ; se Z
e U sono indipendenti allora:
ha una distribuzione T di Student con k gradi di libertà. La distribuzione T di Student, si approssima alla
normale per
2
kT
kU
Z~
30n Vedere tavole nell’Appendice del libro.
Distribuzione T di Student
7Cos'è la Statistica - G. Garau, L. Schirru
Esercizio: Data la distribuzione T di Student con 9 gradi di libertà, trovare il valore di tale che
l’area a destra di vale
t 05.0
t
Le tavole presentate nell’appendice del libro tabulano i valori da a t, per cui l’area . L’area da noi cercata è 0.95=1-
0.05, con 9 gradi di libertà.
1
1
8Cos'è la Statistica - G. Garau, L. Schirru
La distribuzione F di Fisher
Definizione: Sia U una Variabile Casuale con m gradi di libertà e sia V una Variabile Casuale con n
gradi di libertà; se U e V sono indipendenti allora la Variabile Casuale F sarà:2
2
nmF
nV
mUF
,~
Distribuzione F di Fisher
9Cos'è la Statistica - G. Garau, L. Schirru
Esercizio: Data la distribuzione F di Fisher con
trovare il valore di tale che l’area a destra di vale
25 e 1421
F F 10.0
79.1)25,14(10,0
F
10Cos'è la Statistica - G. Garau, L. Schirru