Le distribuzioni campionarie

10

Click here to load reader

Transcript of Le distribuzioni campionarie

Page 1: Le distribuzioni campionarie

Le distribuzioni campionarie

Quando non è conveniente o possibile esaminare l’intera popolazione si ricorre allo studio di uncampione rappresentativo di essa, estendendo attraverso l’inferenza, i risultati del campioneall’intera popolazione.

Definiamo i concetti di:

•Popolazione obiettivo: la totalità degli elementi presi in esame sui quali si vogliono ottenereinformazioni.

•Campione casuale: si ottiene estraendo a sorte da una popolazione, di dimensione N, unaunità per volta. Ogni unità ha la stessa probabilità 1/N di essere estratta. L’insieme delle unitàestratte in questo modo costituisce un campione casuale.

•Campione stratificato proporzionale: in questo caso la popolazione viene suddivisa insottopopolazioni disgiunte ed esaustive chiamate strati; all’interno di ognuno di essi vieneeffettuato un campionamento casuale semplice. Da ogni strato si calcola la media, chiamatamedia di strato; la media pesata delle medie di strato dà la media di popolazione. Anche levarianze sono calcolate all’interno di ogni strato e opportunamente pesate danno la varianzastimata della popolazione.

•Campione casuale stratificato con allocazione ottimale: in questo caso si vuole avere untasso di campionamento diversificato per ogni strato. In particolare si vuole incrementare lanumerosità negli strati ad elevata variabilità e diminuirla dove invece è meno elevata.

1Cos'è la Statistica - G. Garau, L. Schirru

Page 2: Le distribuzioni campionarie

Statistiche e momenti campionari

* Un parametro è una misura di sintesi che descrive una caratteristica dell’intera popolazione.

Se si vuole studiare una popolazione avente forma nota e funzione di densità ,

ossia con un parametro * incognito, il procedimento da seguire è quello di estrarre un campione e rappresentare o

stimare il parametro con il valore di qualche funzione .

In altri termini si tratta di determinare quale sia la migliore funzione per stimare .

Definiamo a questo punto i concetti di

Statistica**: una statistica è una funzione di variabili casuali osservabili e quindi a sua volta una variabile casuale, che non

contiene alcun parametro incognito.

Momento campionario: Sia x1, x2, …, xn, un campione casuale. Il momento campionario di ordine r, indicato da sarà

definito come:

);( xf

) ..., ,(1 n

xxt

** In Descrittiva abbiamo definito la statistica come una misura di sintesi che descrive una caratteristica di un campione della popolazione.

'

rM

n

i

r

irX

nM

1

' 1

Se r=1 si ha la media campionaria, solitamente indicata con . Presentiamo alcuni esempi:x

n

ii

Xn

X1

1

n

ii

XXn

S1

22 )(1

1

Media campionaria Varianza campionaria

2Cos'è la Statistica - G. Garau, L. Schirru

Page 3: Le distribuzioni campionarie

Le statistiche campionarie

Le statistiche campionarie sono esempi di statistiche che possono essere utilizzate per stimare i corrispondenti parametri della popolazione. Si può dimostrare che:

22 1var e

nXXE

XX Per i passaggi matematici si rimanda al testo.

Se il valore atteso della media campionaria è uguale alla media della popolazione significa che la media campionaria (la

statistica) è uguale al parametro media da stimare e che la distribuzione è centrata intorno alla media ( ).

Il fatto, invece, che la il valore atteso della varianza campionaria sia uguale alla varianza della popolazione fratto la sua

numerosità, significa che la dispersione dei valori dei valori di intorno a è piccola quando l’ampiezza del campione è

grande.

Questo significa che se l’ampiezza del campione è grande i valori di media campionaria, usati per stimare la media della

popolazione tendono ad essere più concentrati intorno alla stessa media della popolazione rispetto a quanto lo sarebbero

se l’ampiezza fosse piccola. Questo fatto viene spiegato meglio dalla legge dei grandi numeri.

Valore atteso della media campionaria Valore atteso della varianza campionaria

X

3Cos'è la Statistica - G. Garau, L. Schirru

Page 4: Le distribuzioni campionarie

La legge dei grandi numeriLa legge dei grandi numeri dice che, in seguito ad un gran numero di prove nel lancio di una moneta, la differenza tra ilnumero di teste ottenuto ed il valore atteso ottenuto moltiplicando 0,5 per il numero di lanci, in termini assoluti è grande,ma in termini relativi, all’aumentare del numero di lancio (o prove), tale differenza sarà sempre più piccola.

Si può dire che il numero di teste sarà uguale alla metà del numero dei lanci più una quantità piccola che si chiama errorealeatorio e che sarà grande in valore assoluto, ma piccola in percentuale (rispetto al numero dei lanci effettuati).

Differenze in termini relativi

Nel seguito di questa Unità Didattica vedremo delle altre distribuzioni (distribuzioni campionarie) derivate dalla

distribuzione normale, e per questo facili da studiare, ma estremamente utili per modellare una vasta gamma di fenomeni

empirici. Tali distribuzioni saranno utili in particolare nel prossimo modulo.

4Cos'è la Statistica - G. Garau, L. Schirru

Page 5: Le distribuzioni campionarie

La distribuzione Chi-quadro,

Definizione: La somma dei quadrati di variabili casuali normali standardizzate e indipendenti ha una distribuzione chi quadro con (n-k) gradi di libertà *. Il grafico di tale distribuzione dipende quindi dai gradi di libertà (gdl).

* Dove n è la numerosità e k è il numero dei parametri.

2

2

Distribuzione

5Cos'è la Statistica - G. Garau, L. Schirru

Page 6: Le distribuzioni campionarie

Esercizio: Data la distribuzione con 5 gradi di libertà,

trovare il valore di tale che l’area a destra di vale 2

22

05.0

1

Le tavole presentate nell’appendice del libro tabulano l’area per cui, l’area da noi cercata è 0.95=1-0.05, con 5 gradi di libertà.

1

6Cos'è la Statistica - G. Garau, L. Schirru

Page 7: Le distribuzioni campionarie

La distribuzione T di Student

Definizione: Si considera Z avente una distribuzione normale standardizzata e U, una distribuzione ; se Z

e U sono indipendenti allora:

ha una distribuzione T di Student con k gradi di libertà. La distribuzione T di Student, si approssima alla

normale per

2

kT

kU

Z~

30n Vedere tavole nell’Appendice del libro.

Distribuzione T di Student

7Cos'è la Statistica - G. Garau, L. Schirru

Page 8: Le distribuzioni campionarie

Esercizio: Data la distribuzione T di Student con 9 gradi di libertà, trovare il valore di tale che

l’area a destra di vale

t 05.0

t

Le tavole presentate nell’appendice del libro tabulano i valori da a t, per cui l’area . L’area da noi cercata è 0.95=1-

0.05, con 9 gradi di libertà.

1

1

8Cos'è la Statistica - G. Garau, L. Schirru

Page 9: Le distribuzioni campionarie

La distribuzione F di Fisher

Definizione: Sia U una Variabile Casuale con m gradi di libertà e sia V una Variabile Casuale con n

gradi di libertà; se U e V sono indipendenti allora la Variabile Casuale F sarà:2

2

nmF

nV

mUF

,~

Distribuzione F di Fisher

9Cos'è la Statistica - G. Garau, L. Schirru

Page 10: Le distribuzioni campionarie

Esercizio: Data la distribuzione F di Fisher con

trovare il valore di tale che l’area a destra di vale

25 e 1421

F F 10.0

79.1)25,14(10,0

F

10Cos'è la Statistica - G. Garau, L. Schirru