Post on 03-Nov-2015
description
Parte 6 Distribuzione campionaria Psicometria 1 - p. 1/??
Psicometria 1PS 123
Parte 6Distribuzione campionaria
Corrado Caudek
Dipartimento di Psicologia, Universit di Trieste
Parte 6 Distribuzione campionaria Psicometria 1 - p. 2/??
Sommario
Parte 6 Distribuzione campionaria Psicometria 1 - p. 3/??
Sommario
Il materiale coperto contenuto nel capitolo 4 deltesto di Agresti e Finlay (1997).n Distribuzione campionaria.
u Distribuzione campionaria della media.u Distribuzione della popolazione.u Distribuzione di un campione.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 4/??
Stima e test dipotesi
Parte 6 Distribuzione campionaria Psicometria 1 - p. 5/??
Inferenza statistica
Linferenza statistica il processo che consente diformulare delle conclusioni relative ad unapopolazione sulla base di un campione diosservazioni estratte a caso dalla popolazione.Centrale allinferenza statistica classica lanozione di distribuzione campionaria, ovvero ladescrizione di come variano le statistiche deicampioni, se campioni casuali aventi la stessagrandezza n vengono ripetutamente estratti dallapopolazione.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 6/??
Stima e test dipotesi
Anche se, in ciascuna applicazione praticadellinferenza statistica, il ricercatore disponesolamente di un unico campione casuale digrandezza n, la possibilit che il campionamentovenga ripetuto fornisce, in principio, la fondazioneconcettuale per decidere quanto il campioneosservato sia informativo della popolazione nelsuo complesso.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 7/??
Parametri e statistiche
Si ricordi cheUn parametro un numero che descrive unqualche aspetto della popolazione.
n Per esempio, il reddito italiano medio unparametro. Supponiamo che = e43, 236.
n In qualsiasi situazione concreta, i parametri sonosconosciuti.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 8/??
Parametri e statistiche
Una statistica un numero che pu essere cal-colato utilizzando i dati forniti da un campione,senza alcuna conoscenza dei parametri dellapopolazione.
n Supponiamo che, per un campione casuale din = 1000 famiglie italiane, il reddito medio siauguale a e42, 586. La media del campionex=e42, 586 una statistica.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 9/??
Stima e test dipotesi
n Solitamente, non siamo interessati allestatistiche in s, ma a quello che le statistiche cidicono della popolazione.u Potremmo usare la media di un campione di
famiglie italiane, per esempio, per stimare ilreddito medio (sconosciuto) della popolazione.
u Oppure, potremmo usare la media delcampione per stabilire se il reddito medioitaliano sia mutato dallultimo censimento.
n Questi due tipi di domande sono propri dei duepricipali approcci allinferenza statistica classica:1. la stima di parametri;2. il test dipotesi statistiche.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 10/??
Variabilit campionaria
Un aspetto fondamentale delle statistichecampionarie riguarda il fatto che variano dacampione a campione.
n Nel caso dellesempio precedente, sarebbemolto improbabile trovare, per un secondocampione casuale di 1000 famiglie italiane, unreddito medio esattamente uguale a e42, 586.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 11/??
Variabilit campionaria
La variazione di una statistica campionaria dacampione a campione viene detta variabilitcampionaria.
n Quando la variabilit campionaria moltogrande, il campione poco informativo aproposito del parametro della popolazione.
n Quando la variabilit campionaria piccola,invece, la statistica del campione informativadel parametro della popolazione, anche se molto raro che la statistica di un qualsiasicampione sia esattamente uguale al parametrodella popolazione.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 12/??
Simulazione 1
Parte 6 Distribuzione campionaria Psicometria 1 - p. 13/??
Simulazione 1
La variabilit campionaria verr illustrata nel modoseguente:1. verr considerata una variabile discreta che pu
assumere soltanto un piccolo numero di valoripossibili (N = 4);
2. verr fornito lelenco di tutti i possibili campionidi grandezza n = 2;
3. verr calcolata la media di ciascuno dei possibilicampioni di grandezza n = 2;
4. verr esaminata la distribuzione delle medie ditutti i possibili campioni di grandezza n = 2.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 14/??
Simulazione 1
La media e la varianza della popolazioneverranno pure calcolate.n e sono dei parametri, mentre la media xi e la
varianza s2i
di ciascun campione sono dellestatistiche.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 15/??
Simulazione 1
n Lesperimento di questo esempio consiste inn = 2 estrazioni con rimessa di una pallina xi daunurna che contiene N = 4 palline.
n Le palline sono numerate nel modo seguente:{2, 3, 5, 9}.
n Lestrazione con rimessa corrisponde ad unapopolazione di grandezza infinita ( semprepossibile infatti estrarre una nuova pallinadallurna).
Parte 6 Distribuzione campionaria Psicometria 1 - p. 16/??
Simulazione 1
Per ciascun campione di grandezza n = 2 vienecalcolata la media dei valori delle palline estrattex =
2
i=1xi/2.
n Per esempio, se le palline estratte sono x1 = 2 ex2 = 3, allora
x = (2 + 3)/2 = 5/2 = 2.5
Parte 6 Distribuzione campionaria Psicometria 1 - p. 17/??
Tre distribuzioni
Dobbiamo distinguere tre distribuzioni:
1. la distribuzione della popolazione,2. la distribuzione di un particolare campione,3. la distribuzione campionaria delle medie di tutti i
possibili campioni.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 18/??
Distribuzione della popolazione
Distribuzione della popolazione: la distribuzionedi X (il valore della pallina estratta) nellapopolazione. In questo caso la popolazione infinita e ha la seguente distribuzione di probabilit:
xi pi
2 14
3 14
5 14
9 14
somma 1.0
Parte 6 Distribuzione campionaria Psicometria 1 - p. 19/??
Distribuzione della popolazione
n La media della popolazione
=
xipi = 4.75
n La varianza della popolazione
2 =
(xi )2pi = 7.1875
Parte 6 Distribuzione campionaria Psicometria 1 - p. 20/??
Distribuzione di un campione
Distribuzione di un campione: la distribuzione diX in un particolare campione.
n Per esempio, se x1 = 2 e x2 = 3, allora la mediadi questo campione sar x = 2.5 e la varianzasar s2 = 0.5.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 21/??
Distribuzione campionaria della media
Distribuzione campionaria della media: ladistribuzione delle medie di tutti i possibilicampioni.n Se n = 2, ci sono 4 4 = 16 possibili campioni.
Possiamo dunque elencarli, insieme alle loromedie.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 22/??
Distribuzione campionaria della media
campione media xi campione media xi{2, 3} 2.5 {3, 2} 2.5{5, 2} 3.5 {2, 5} 3.5{9, 2} 5.5 {2, 9} 5.5{5, 3} 4.0 {3, 5} 4.0{9, 3} 6.0 {3, 9} 6.0{9, 5} 7.0 {5, 9} 7.0{2, 2} 2 {3, 3} 3{5, 5} 5 {9, 9} 9
Parte 6 Distribuzione campionaria Psicometria 1 - p. 23/??
Distribuzione campionaria della media
La distribuzione campionaria della media ha laseguente distribuzione di probabilit:
xi pi
2.0 1/162.5 2/163.0 1/163.5 2/164.0 2/165.0 1/165.5 2/166.0 2/167.0 2/169.0 1/16
somma 1.0
Parte 6 Distribuzione campionaria Psicometria 1 - p. 24/??
Distribuzione campionaria della media
n La media della distribuzione campionaria dellamedia
x =
xipi = 4.75
n La varianza della distribuzione campionaria dellamedia
2x
=
(xi x)2pi = 3.59375
Parte 6 Distribuzione campionaria Psicometria 1 - p. 25/??
Distribuzione campionaria della media
n Lesercizio presente ha a che fare con unasituazione particolare, quella in cui ladistribuzione della popolazione conosciuta.
n In pratica, la distribuzione della popolazione non mai conosciuta.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 26/??
Distribuzione campionaria della media
Con questo esercizio possiamo per di notarecome la distribuzione campionaria della mediapossieda due importanti propriet.
La media x della distribuzione campionaria dellamedia uguale alla media della popolazione .
La varianza 2x
della distribuzione campionariadella media uguale al rapporto tra la varianzadella popolazione 2 e la numerosit n del cam-pione:
2x
=2
n=
7.1875
2= 3.59375
Parte 6 Distribuzione campionaria Psicometria 1 - p. 27/??
Distribuzione campionaria della media
Si noti che:n la media e la varianza della distribuzione
campionaria sono determinate dalla media evarianza della popolazione:
x = 2
x=
2
n
n la varianza della distribuzione campionaria dellamedia pi piccola della varianza dellapopolazione.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 28/??
Distribuzione campionaria della media
In seguito utilizzeremo le propriet delladistribuzione campionaria per fare delle inferenzea proposito dei parametri della popolazione anchequando la distribuzione della popolazione non conosciuta.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 29/??
Tre distribuzioni
Si noti inoltre che abbiamo distinto tra tre diversedistribuzioni.
1. Distribuzione della popolazione: = {2, 3, 5, 9}, = 4.75, 2 = 7.1875
2. Distribuzione di un particolare campione:i = {2, 3}, x = 2.5, s
2 = 0.5
3. Distribuzione campionaria della media:x = {2.5, 3.5, 5.5, 4, 6, 7, 2.5, 3.5, 4, 6, 7, 2, 5, 3, 9},x = 4.75,
2
x= 3.59375
Parte 6 Distribuzione campionaria Psicometria 1 - p. 30/??
Tre distribuzioni
Distribuzione della popolazione La distribuzione checontiene tutte le osservazioni. Media e varianzadi questa distribuzione si indicano con e 2.
Distribuzione del campione La distribuzione dei valoridella popolazione che fanno parte di unparticolare campione casuale di grandezza n.Le singole osservazioni si indicano conx1, . . . , xn, e hanno media x e varianza s2.
Distribuzione campionaria delle medie dei campioni Ladistribuzione di xi per tutti i possibili campioni digrandezza n che si possono estrarre dallapopolazione considerata. Media e varianzadella distribuzione campionaria della media siindicano con x e 2x.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 31/??
Definizione
La distribuzione che sta alla base dellinferenzastatistica la distribuzione campionaria.
Definizione: la distribuzione campionaria di una sta-tistica la distribuzione dei valori che quella sta-tistica assume in tutti i campioni di numerosit nche possono essere estratti dalla popolazione.
n Si noti che, se in una simulazione consideriamoun numero di campioni minore di quello cheteoricamente possibile, la distribuzionerisultante ci fornir soltanto unapprossimazionealla vera distribuzione campionaria.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 32/??
Simulazione 2
Parte 6 Distribuzione campionaria Psicometria 1 - p. 33/??
Simulazione 2
Consideriamo ora unaltro esempio in cui lavariabilit campionaria verr illustrata nel modoseguente:1. la stessa popolazione dellesempio precedente
verr usata;2. utilizzando R, verranno estratti con rimessa da
questa popolazione 50000 campioni causali digrandezza n = 2;
3. verr calcolata la media di ciascuno di questicampioni di grandezza n = 2;
4. verranno calcolate la media e la varianza delladistribuzione delle medie dei 50000 campioni digrandezza n = 2.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 34/??
Simulazione 2
N
Parte 6 Distribuzione campionaria Psicometria 1 - p. 35/??
Simulazione 2
Risultati della simulazione
> Mean
[1] 4.75> Var
[1] 7.1875> MeanSampDistr[1] 4.73943> VarSampDistr[1] 3.578548> Var/n[1] 3.59375
Parte 6 Distribuzione campionaria Psicometria 1 - p. 36/??
Simulazione 2
n Popolazione: = 4.75, 2 = 7.1875.
n Distribuzione campionaria della media:x = 4.75,
2
x= 3.59375.
n Risultati della simulazione:x = 4.73943,
2
x= 3.578548.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 37/??
Simulazione 3
Parte 6 Distribuzione campionaria Psicometria 1 - p. 38/??
Simulazione 3
In un terzo esempio, considereremo ladistribuzione campionaria della media nel caso diuna variabile continua.1. Verr utilizzata una popolazione teorica
distribuita normalmente con media e varianzaconosciute: N (125, 33).
2. Usando R, verranno estratti da questapopolazione 50000 campioni causali digrandezza n = 10.
3. Verr calcolata la media di ciascuno di questicampioni di grandezza n = 10;
4. Verranno calcolate la media e la varianza delladistribuzione delle medie dei 50000 campioni digrandezza n = 10.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 39/??
Simulazione 3
n
Parte 6 Distribuzione campionaria Psicometria 1 - p. 40/??
Simulazione 3
Risultati della simulazione> Mean
[1] 125> Var
[1] 33> MeanSampDistr[1] 125.0029> VarSampDistr[1] 3.277463> Var/n[1] 3.300000
Parte 6 Distribuzione campionaria Psicometria 1 - p. 41/??
Simulazione 3
n Popolazione: = 125, 2 = 33.
n Distribuzione campionaria della media:x = 125,
2
x= 3.3.
n Risultati della simulazione:x = 125.0029,
2
x= 3.277463.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 42/??
Distribuzione campionaria al variare di n
110 120 130 140
0
.
0
0
.
2
0
.
4
0
.
6
Media di campioni di grandezza n = 2
D
e
n
s
i
t
110 120 130 140
0
.
0
0
.
2
0
.
4
0
.
6
Media di campioni di grandezza n = 10
D
e
n
s
i
t
110 120 130 140
0
.
0
0
.
2
0
.
4
0
.
6
Media di campioni di grandezza n = 100
D
e
n
s
i
t
Parte 6 Distribuzione campionaria Psicometria 1 - p. 43/??
Simulazione 4
Parte 6 Distribuzione campionaria Psicometria 1 - p. 44/??
Simulazione 4
n Consideriamo ora una popolazione asimmetrica,2
=2.
n La distribuzione 2 con parametro = 2 ha unamedia = e una varianza uguale a 2 = 2.
n A differenza della distribuzione normale, ladistribuzione 2
=2 dotata di unasimmetria
positiva.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 45/??
Simulazione 4
n Usando R, verranno estratti da questapopolazione 10000 campioni causali digrandezza n = 2, 5, 25, 100 e verr calcolata lamedia di ciascuno di questi campioni digrandezza n.
n Allistogramma che rappresenta la distribuzionedelle medie dei campioni di grandezza n verrsovrapposta la distribuzione normale conparametri = e 2 = (2)/n.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 46/??
Distribuzione 2 con parametro = 2
0 1 2 3 4 5 6
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
Chi quadrato
D
e
n
s
i
t
Parte 6 Distribuzione campionaria Psicometria 1 - p. 47/??
Distribuzione campionaria della media
0 1 2 3 4 5 6
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
Media di campioni di grandezza n = 2
D
e
n
s
i
t
0 1 2 3 4 5 6
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
Media di campioni di grandezza n = 5
D
e
n
s
i
t
0 1 2 3 4 5 6
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
Media di campioni di grandezza n = 25
D
e
n
s
i
t
0 1 2 3 4 5 6
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
Media di campioni di grandezza n = 100
D
e
n
s
i
t
Parte 6 Distribuzione campionaria Psicometria 1 - p. 48/??
Conclusioni
Parte 6 Distribuzione campionaria Psicometria 1 - p. 49/??
Conclusioni
n Da questi esempi possiamo concludere leseguenti regole generali. Supponiamo che x siala media di un campione casuale estratto da unapopolazione avente media e varianza 2.
u La media della distribuzione campionaria di x uguale alla media della popolazione: x = .
u La varianza della distribuzione campionaria dix uguale a 2
x=
2
n.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 50/??
Conclusioni
n Di conseguenza, al crescere della numerositdel campione, la media del campione x diventasempre pi simile alla media della popolazione.
u In un campione molto grande, x sar quasicertamente molto simile a . Tale fatto chiamato legge dei grandi numeri.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 51/??
Conclusioni
n Indipendentemente dalla forma delladistribuzione della popolazione, la distribuzionecampionaria di x approssimativamentenormale e questapprossimazione tantomigliore quanto maggiori sono le dimensioni delcampione: x N (,
n). Tale fatto chiamato
teorema del limite centrale.
u Quanto debba essere grande n affinchquesta approssimazione sia accettabiledipende dalla forma della distribuzione dellapopolazione in generale, comunque, n = 100 sufficiente.
Parte 6 Distribuzione campionaria Psicometria 1 - p. 52/??
Conclusioni
n Se la distribuzione della popolazione normaleallora, indipendentemente dalla grandezza n delcampione, la distribuzione campionaria di x sarnormale.