Distr Camp

52
 Parte 6 – Distribuzione campionaria  Psicometria 1 - p. 1/ ?? Psicometria 1 PS 123 Parte 6 Distribuzione campionaria Corrado Caudek Dipartimento di Psicologia, Università di Trieste

description

statistica

Transcript of Distr Camp

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 1/??

    Psicometria 1PS 123

    Parte 6Distribuzione campionaria

    Corrado Caudek

    Dipartimento di Psicologia, Universit di Trieste

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 2/??

    Sommario

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 3/??

    Sommario

    Il materiale coperto contenuto nel capitolo 4 deltesto di Agresti e Finlay (1997).n Distribuzione campionaria.

    u Distribuzione campionaria della media.u Distribuzione della popolazione.u Distribuzione di un campione.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 4/??

    Stima e test dipotesi

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 5/??

    Inferenza statistica

    Linferenza statistica il processo che consente diformulare delle conclusioni relative ad unapopolazione sulla base di un campione diosservazioni estratte a caso dalla popolazione.Centrale allinferenza statistica classica lanozione di distribuzione campionaria, ovvero ladescrizione di come variano le statistiche deicampioni, se campioni casuali aventi la stessagrandezza n vengono ripetutamente estratti dallapopolazione.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 6/??

    Stima e test dipotesi

    Anche se, in ciascuna applicazione praticadellinferenza statistica, il ricercatore disponesolamente di un unico campione casuale digrandezza n, la possibilit che il campionamentovenga ripetuto fornisce, in principio, la fondazioneconcettuale per decidere quanto il campioneosservato sia informativo della popolazione nelsuo complesso.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 7/??

    Parametri e statistiche

    Si ricordi cheUn parametro un numero che descrive unqualche aspetto della popolazione.

    n Per esempio, il reddito italiano medio unparametro. Supponiamo che = e43, 236.

    n In qualsiasi situazione concreta, i parametri sonosconosciuti.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 8/??

    Parametri e statistiche

    Una statistica un numero che pu essere cal-colato utilizzando i dati forniti da un campione,senza alcuna conoscenza dei parametri dellapopolazione.

    n Supponiamo che, per un campione casuale din = 1000 famiglie italiane, il reddito medio siauguale a e42, 586. La media del campionex=e42, 586 una statistica.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 9/??

    Stima e test dipotesi

    n Solitamente, non siamo interessati allestatistiche in s, ma a quello che le statistiche cidicono della popolazione.u Potremmo usare la media di un campione di

    famiglie italiane, per esempio, per stimare ilreddito medio (sconosciuto) della popolazione.

    u Oppure, potremmo usare la media delcampione per stabilire se il reddito medioitaliano sia mutato dallultimo censimento.

    n Questi due tipi di domande sono propri dei duepricipali approcci allinferenza statistica classica:1. la stima di parametri;2. il test dipotesi statistiche.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 10/??

    Variabilit campionaria

    Un aspetto fondamentale delle statistichecampionarie riguarda il fatto che variano dacampione a campione.

    n Nel caso dellesempio precedente, sarebbemolto improbabile trovare, per un secondocampione casuale di 1000 famiglie italiane, unreddito medio esattamente uguale a e42, 586.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 11/??

    Variabilit campionaria

    La variazione di una statistica campionaria dacampione a campione viene detta variabilitcampionaria.

    n Quando la variabilit campionaria moltogrande, il campione poco informativo aproposito del parametro della popolazione.

    n Quando la variabilit campionaria piccola,invece, la statistica del campione informativadel parametro della popolazione, anche se molto raro che la statistica di un qualsiasicampione sia esattamente uguale al parametrodella popolazione.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 12/??

    Simulazione 1

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 13/??

    Simulazione 1

    La variabilit campionaria verr illustrata nel modoseguente:1. verr considerata una variabile discreta che pu

    assumere soltanto un piccolo numero di valoripossibili (N = 4);

    2. verr fornito lelenco di tutti i possibili campionidi grandezza n = 2;

    3. verr calcolata la media di ciascuno dei possibilicampioni di grandezza n = 2;

    4. verr esaminata la distribuzione delle medie ditutti i possibili campioni di grandezza n = 2.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 14/??

    Simulazione 1

    La media e la varianza della popolazioneverranno pure calcolate.n e sono dei parametri, mentre la media xi e la

    varianza s2i

    di ciascun campione sono dellestatistiche.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 15/??

    Simulazione 1

    n Lesperimento di questo esempio consiste inn = 2 estrazioni con rimessa di una pallina xi daunurna che contiene N = 4 palline.

    n Le palline sono numerate nel modo seguente:{2, 3, 5, 9}.

    n Lestrazione con rimessa corrisponde ad unapopolazione di grandezza infinita ( semprepossibile infatti estrarre una nuova pallinadallurna).

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 16/??

    Simulazione 1

    Per ciascun campione di grandezza n = 2 vienecalcolata la media dei valori delle palline estrattex =

    2

    i=1xi/2.

    n Per esempio, se le palline estratte sono x1 = 2 ex2 = 3, allora

    x = (2 + 3)/2 = 5/2 = 2.5

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 17/??

    Tre distribuzioni

    Dobbiamo distinguere tre distribuzioni:

    1. la distribuzione della popolazione,2. la distribuzione di un particolare campione,3. la distribuzione campionaria delle medie di tutti i

    possibili campioni.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 18/??

    Distribuzione della popolazione

    Distribuzione della popolazione: la distribuzionedi X (il valore della pallina estratta) nellapopolazione. In questo caso la popolazione infinita e ha la seguente distribuzione di probabilit:

    xi pi

    2 14

    3 14

    5 14

    9 14

    somma 1.0

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 19/??

    Distribuzione della popolazione

    n La media della popolazione

    =

    xipi = 4.75

    n La varianza della popolazione

    2 =

    (xi )2pi = 7.1875

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 20/??

    Distribuzione di un campione

    Distribuzione di un campione: la distribuzione diX in un particolare campione.

    n Per esempio, se x1 = 2 e x2 = 3, allora la mediadi questo campione sar x = 2.5 e la varianzasar s2 = 0.5.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 21/??

    Distribuzione campionaria della media

    Distribuzione campionaria della media: ladistribuzione delle medie di tutti i possibilicampioni.n Se n = 2, ci sono 4 4 = 16 possibili campioni.

    Possiamo dunque elencarli, insieme alle loromedie.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 22/??

    Distribuzione campionaria della media

    campione media xi campione media xi{2, 3} 2.5 {3, 2} 2.5{5, 2} 3.5 {2, 5} 3.5{9, 2} 5.5 {2, 9} 5.5{5, 3} 4.0 {3, 5} 4.0{9, 3} 6.0 {3, 9} 6.0{9, 5} 7.0 {5, 9} 7.0{2, 2} 2 {3, 3} 3{5, 5} 5 {9, 9} 9

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 23/??

    Distribuzione campionaria della media

    La distribuzione campionaria della media ha laseguente distribuzione di probabilit:

    xi pi

    2.0 1/162.5 2/163.0 1/163.5 2/164.0 2/165.0 1/165.5 2/166.0 2/167.0 2/169.0 1/16

    somma 1.0

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 24/??

    Distribuzione campionaria della media

    n La media della distribuzione campionaria dellamedia

    x =

    xipi = 4.75

    n La varianza della distribuzione campionaria dellamedia

    2x

    =

    (xi x)2pi = 3.59375

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 25/??

    Distribuzione campionaria della media

    n Lesercizio presente ha a che fare con unasituazione particolare, quella in cui ladistribuzione della popolazione conosciuta.

    n In pratica, la distribuzione della popolazione non mai conosciuta.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 26/??

    Distribuzione campionaria della media

    Con questo esercizio possiamo per di notarecome la distribuzione campionaria della mediapossieda due importanti propriet.

    La media x della distribuzione campionaria dellamedia uguale alla media della popolazione .

    La varianza 2x

    della distribuzione campionariadella media uguale al rapporto tra la varianzadella popolazione 2 e la numerosit n del cam-pione:

    2x

    =2

    n=

    7.1875

    2= 3.59375

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 27/??

    Distribuzione campionaria della media

    Si noti che:n la media e la varianza della distribuzione

    campionaria sono determinate dalla media evarianza della popolazione:

    x = 2

    x=

    2

    n

    n la varianza della distribuzione campionaria dellamedia pi piccola della varianza dellapopolazione.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 28/??

    Distribuzione campionaria della media

    In seguito utilizzeremo le propriet delladistribuzione campionaria per fare delle inferenzea proposito dei parametri della popolazione anchequando la distribuzione della popolazione non conosciuta.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 29/??

    Tre distribuzioni

    Si noti inoltre che abbiamo distinto tra tre diversedistribuzioni.

    1. Distribuzione della popolazione: = {2, 3, 5, 9}, = 4.75, 2 = 7.1875

    2. Distribuzione di un particolare campione:i = {2, 3}, x = 2.5, s

    2 = 0.5

    3. Distribuzione campionaria della media:x = {2.5, 3.5, 5.5, 4, 6, 7, 2.5, 3.5, 4, 6, 7, 2, 5, 3, 9},x = 4.75,

    2

    x= 3.59375

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 30/??

    Tre distribuzioni

    Distribuzione della popolazione La distribuzione checontiene tutte le osservazioni. Media e varianzadi questa distribuzione si indicano con e 2.

    Distribuzione del campione La distribuzione dei valoridella popolazione che fanno parte di unparticolare campione casuale di grandezza n.Le singole osservazioni si indicano conx1, . . . , xn, e hanno media x e varianza s2.

    Distribuzione campionaria delle medie dei campioni Ladistribuzione di xi per tutti i possibili campioni digrandezza n che si possono estrarre dallapopolazione considerata. Media e varianzadella distribuzione campionaria della media siindicano con x e 2x.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 31/??

    Definizione

    La distribuzione che sta alla base dellinferenzastatistica la distribuzione campionaria.

    Definizione: la distribuzione campionaria di una sta-tistica la distribuzione dei valori che quella sta-tistica assume in tutti i campioni di numerosit nche possono essere estratti dalla popolazione.

    n Si noti che, se in una simulazione consideriamoun numero di campioni minore di quello cheteoricamente possibile, la distribuzionerisultante ci fornir soltanto unapprossimazionealla vera distribuzione campionaria.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 32/??

    Simulazione 2

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 33/??

    Simulazione 2

    Consideriamo ora unaltro esempio in cui lavariabilit campionaria verr illustrata nel modoseguente:1. la stessa popolazione dellesempio precedente

    verr usata;2. utilizzando R, verranno estratti con rimessa da

    questa popolazione 50000 campioni causali digrandezza n = 2;

    3. verr calcolata la media di ciascuno di questicampioni di grandezza n = 2;

    4. verranno calcolate la media e la varianza delladistribuzione delle medie dei 50000 campioni digrandezza n = 2.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 34/??

    Simulazione 2

    N

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 35/??

    Simulazione 2

    Risultati della simulazione

    > Mean

    [1] 4.75> Var

    [1] 7.1875> MeanSampDistr[1] 4.73943> VarSampDistr[1] 3.578548> Var/n[1] 3.59375

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 36/??

    Simulazione 2

    n Popolazione: = 4.75, 2 = 7.1875.

    n Distribuzione campionaria della media:x = 4.75,

    2

    x= 3.59375.

    n Risultati della simulazione:x = 4.73943,

    2

    x= 3.578548.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 37/??

    Simulazione 3

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 38/??

    Simulazione 3

    In un terzo esempio, considereremo ladistribuzione campionaria della media nel caso diuna variabile continua.1. Verr utilizzata una popolazione teorica

    distribuita normalmente con media e varianzaconosciute: N (125, 33).

    2. Usando R, verranno estratti da questapopolazione 50000 campioni causali digrandezza n = 10.

    3. Verr calcolata la media di ciascuno di questicampioni di grandezza n = 10;

    4. Verranno calcolate la media e la varianza delladistribuzione delle medie dei 50000 campioni digrandezza n = 10.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 39/??

    Simulazione 3

    n

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 40/??

    Simulazione 3

    Risultati della simulazione> Mean

    [1] 125> Var

    [1] 33> MeanSampDistr[1] 125.0029> VarSampDistr[1] 3.277463> Var/n[1] 3.300000

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 41/??

    Simulazione 3

    n Popolazione: = 125, 2 = 33.

    n Distribuzione campionaria della media:x = 125,

    2

    x= 3.3.

    n Risultati della simulazione:x = 125.0029,

    2

    x= 3.277463.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 42/??

    Distribuzione campionaria al variare di n

    110 120 130 140

    0

    .

    0

    0

    .

    2

    0

    .

    4

    0

    .

    6

    Media di campioni di grandezza n = 2

    D

    e

    n

    s

    i

    t

    110 120 130 140

    0

    .

    0

    0

    .

    2

    0

    .

    4

    0

    .

    6

    Media di campioni di grandezza n = 10

    D

    e

    n

    s

    i

    t

    110 120 130 140

    0

    .

    0

    0

    .

    2

    0

    .

    4

    0

    .

    6

    Media di campioni di grandezza n = 100

    D

    e

    n

    s

    i

    t

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 43/??

    Simulazione 4

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 44/??

    Simulazione 4

    n Consideriamo ora una popolazione asimmetrica,2

    =2.

    n La distribuzione 2 con parametro = 2 ha unamedia = e una varianza uguale a 2 = 2.

    n A differenza della distribuzione normale, ladistribuzione 2

    =2 dotata di unasimmetria

    positiva.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 45/??

    Simulazione 4

    n Usando R, verranno estratti da questapopolazione 10000 campioni causali digrandezza n = 2, 5, 25, 100 e verr calcolata lamedia di ciascuno di questi campioni digrandezza n.

    n Allistogramma che rappresenta la distribuzionedelle medie dei campioni di grandezza n verrsovrapposta la distribuzione normale conparametri = e 2 = (2)/n.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 46/??

    Distribuzione 2 con parametro = 2

    0 1 2 3 4 5 6

    0

    .

    1

    0

    .

    2

    0

    .

    3

    0

    .

    4

    0

    .

    5

    Chi quadrato

    D

    e

    n

    s

    i

    t

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 47/??

    Distribuzione campionaria della media

    0 1 2 3 4 5 6

    0

    .

    0

    0

    .

    5

    1

    .

    0

    1

    .

    5

    2

    .

    0

    Media di campioni di grandezza n = 2

    D

    e

    n

    s

    i

    t

    0 1 2 3 4 5 6

    0

    .

    0

    0

    .

    5

    1

    .

    0

    1

    .

    5

    2

    .

    0

    Media di campioni di grandezza n = 5

    D

    e

    n

    s

    i

    t

    0 1 2 3 4 5 6

    0

    .

    0

    0

    .

    5

    1

    .

    0

    1

    .

    5

    2

    .

    0

    Media di campioni di grandezza n = 25

    D

    e

    n

    s

    i

    t

    0 1 2 3 4 5 6

    0

    .

    0

    0

    .

    5

    1

    .

    0

    1

    .

    5

    2

    .

    0

    Media di campioni di grandezza n = 100

    D

    e

    n

    s

    i

    t

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 48/??

    Conclusioni

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 49/??

    Conclusioni

    n Da questi esempi possiamo concludere leseguenti regole generali. Supponiamo che x siala media di un campione casuale estratto da unapopolazione avente media e varianza 2.

    u La media della distribuzione campionaria di x uguale alla media della popolazione: x = .

    u La varianza della distribuzione campionaria dix uguale a 2

    x=

    2

    n.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 50/??

    Conclusioni

    n Di conseguenza, al crescere della numerositdel campione, la media del campione x diventasempre pi simile alla media della popolazione.

    u In un campione molto grande, x sar quasicertamente molto simile a . Tale fatto chiamato legge dei grandi numeri.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 51/??

    Conclusioni

    n Indipendentemente dalla forma delladistribuzione della popolazione, la distribuzionecampionaria di x approssimativamentenormale e questapprossimazione tantomigliore quanto maggiori sono le dimensioni delcampione: x N (,

    n). Tale fatto chiamato

    teorema del limite centrale.

    u Quanto debba essere grande n affinchquesta approssimazione sia accettabiledipende dalla forma della distribuzione dellapopolazione in generale, comunque, n = 100 sufficiente.

  • Parte 6 Distribuzione campionaria Psicometria 1 - p. 52/??

    Conclusioni

    n Se la distribuzione della popolazione normaleallora, indipendentemente dalla grandezza n delcampione, la distribuzione campionaria di x sarnormale.