Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20...

25
Elementi di Psicometria con Laboratorio di SPSS 1 09-Campione e popolazione vers. 1.0 (31 ottobre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2014-2015 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 1 / 25

Transcript of Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20...

Page 1: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Elementi di Psicometria con Laboratorio di SPSS 109-Campione e popolazionevers. 1.0 (31 ottobre 2014)

Germano Rossi1

[email protected]

1Dipartimento di Psicologia, Università di Milano-Bicocca

2014-2015

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 1 / 25

Page 2: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Campione e popolazione

Chi si occupa di comportamento necessita di studiare ilcomportamento delle persone e di trarre delle conclusioniGli psicologi, di solito, possono misurare però solo una piccolaparte di queste personePer questo motivo, la maggior parte della ricerca in psicologia sibasa su un piccolo campione di dati da cui derivano affermazionigeneraliLa statistica descrittiva si applica a dati di qualsiasi ampiezza (intermini di casi statistici)Per cui le statistiche descrittive valgono sia per un campione siaper una popolazione

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 2 / 25

Page 3: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Campione e popolazione

Un campione (ricordiamo) è una piccola parte della popolazioneRicordiamo anche che una popolazione è l’insieme di tutti i casistatistici possibili con le caratteristiche che intendiamo studiareIn altre parole: il campione è costituito da tutte le misurazioni cheho fatto in “questa” raccolta di datiLa popolazione è costituita da tutte le misurazioni che avreipotuto fare in questa raccolta datiIl campione è sempre finitoLa popolazione può essere finita o infinita

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 3 / 25

Page 4: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Campione e popolazione

Il termine “finito” indica che esiste un numero che rappresenti ilmassimo dei casi statistici considerabili (Ad es. tutti gli studentiimmatricolati a Psicologia nell’a.a. 2014/15)Il termine “infinito” che non esiste un numero massimo di casistatistici (Ad es. tutti tempi di reazione a un certo stimolo)Il campionamento è l‘estrazione di un campione dalla popolazione(secondo determinati criteri) per poterla studiare più agevolmenteSe conosciamo le caratteristiche della popolazione, sarà facileestrarre un campione che ben la rappresentioppure riconoscere che il campione in esame rappresenta bene lapopolazioni oppure no

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 4 / 25

Page 5: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Campione e popolazione

Molto spesso nelle scienze sociali non si conoscono lecaratteristiche della popolazioneSe non la conosciamo dovremo cercare di estrarre un campioneche sia una buona stima della popolazioneDal momento che non sempre conosciamo le caratteristiche dellapopolazione, le statistiche descrittive dei campioni sono usatecome stima delle analoghe statistiche della popolazioneNon abbiamo la certezza che queste stime siano “vere” ma sonole stime “migliori” dal momento che non conosciamo nulla!

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 5 / 25

Page 6: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Rappresentatività

Generalizziamo il concetto di “buona stima” dicendo che ilcampione dev’essere rappresentativoIl campione selezionato “dovrebbe” rappresentare “in piccolo” lapopolazione che si vuol studiare. . . quindi il campione dovrebbeavere le stesse caratteristiche della popolazione (e nella stessaproporzione)

Gruppoconcreto

che studio

Omeo-morfi-smo

Gruppoteorico che

voglio studiare

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 6 / 25

Page 7: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Rappresentatività

Sulla base del campione rappresentativo, estendiamo i datiottenuti all’intera popolazione, tramite l’inferenza statistica

Campione Popolazioneinferenza

Una volta selezionate le variabili che ci interessa studiare (chesaranno chiamate variabili dipendenti), si individuano anche dellevariabili che si ritengono importanti o che possonoessere/produrre influenza su (che verranno chiamate variabiliindipendenti). Il campione deve distribuirsi (in queste variabili)proporzionalmente alla popolazione

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 7 / 25

Page 8: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Rappresentatività

Un modo generalmente usato per avere la rappresentatività èquella della selezione casuale dei casi statistica dalla popolazioneQuesti campioni sono chiamati campioni casuali della popolazioneIn italiano, casuale ha più un significato di arbitrario, informale,quello che capita...Ma ha anche un significato diversoQuando metto la mano nel sacchetto con i numeri della tombola,non guardo dentro al sacchetto per poter estrarre un numerocasuale...Casuale (in statistica) significa appunto che non uso strategie perselezionare un caso statistico a scapito di un altro...

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 8 / 25

Page 9: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Casuale o randomizzato

Il vostro libro usa sia casuale sia randomizzato.È lo stesso concettoIn inglese, “random” enfatizza il fatto che tutti gli eventi possibilihanno la stessa possibilità di essere selezionatiUn campione casuale (o randomizzato) è quindi uno dei possibilicampioni estraibili da quella popolazioneInoltre, tutti i casi selezionati per quel campione avevano la stessaprobabilità di essere selezionati

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 9 / 25

Page 10: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Estrazione casuale

Esistono numerosi modi per selezionare un campione casualeIn molti casi si tratta di identificare ogni caso in qualche modo (ades. con un numero)Poi è possibile (ad es.)

mettere tutti gli identificatori in un “contenitore”, da cui siselezionano “alla cieca” fino a raggiungere il numero di casi stabilitoper il campioneusare un numero casuale (computer, calcolatrice, tavole dei numericasuali) per selezionaresi ordinano gli identificatori e si selezionano quelli che sono in unacerta posizione (ad es. 1 ogni 20)

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 10 / 25

Page 11: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Estrazione casuale

In teoria, dopo aver selezionato un caso, dovremmo ri-immetterlonel mucchio; altrimenti gli altri non avranno la stessa probabilitàdei precedenti (1/n, 1/(n-1), 1/(n-2)...)non si fa, perché (con popolazioni grandi o infinite) la diversaprobabilità è piccolissima

1 su 1000000 = 0.0000010000 (1 milione)1 su 999900 = 0.0000010001 (1 milione-100)

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 25

Page 12: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Stima della media

Se estraiamo un campione da una popolazione e il campione èrappresentativo di quella popolazione, il campione dovrebbe averegli stessi indici statisticiOvviamente non è sempre veroMa possiamo vedere/calcolare/studiare quanto potrebberodifferire le statistiche calcolate su un campione rispetto aiparametri della popolazione da cui sono state trattePer questo useremo campioni estratti da una popolazione comese fossero “casi statistici”E ci concentreremo sulla media (ma potremmo rifare lo stessodiscorso sulla mediana o su altre statistiche descrittive)

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 12 / 25

Page 13: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Stima della media

Ipotizziamo di estrarre un campione di 100 casi da unapopolazione e di calcolare la media di una certa variabileUsiamo la variabile Fondamentalismo su una popolazione di 659persone (popolazione finita). La sua media è 90.3915Estraiamo un campione casuale di 100 persone e calcoliamo lamedia di questo campione: 91.46Estraiamo altri 19 campioni di ampiezza 100 dalla stessapopolazione e calcoliamo la media per ciascuno:

87.83, 90.63, 91.90, 91.99, 90.10, 90.80, 93.84, 90.80, 89.80,90.12, 90.71, 88.56, 89.67, 90.76, 87.77, 90.51, 89.78, 90.68,90.40

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 13 / 25

Page 14: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Stima della media

Medie Scarto

91.46 1.0787.83 -2.5690.63 0.2491.90 1.5191.99 1.6090.10 -0.2990.80 0.4193.84 3.45 max90.80 0.4189.80 -0.5990.12 -0.2790.71 0.3288.56 -1.8389.67 -0.7290.76 0.3787.77 -2.6290.51 0.1289.78 -0.6190.68 0.2990.40 0.01 min

Poiché vengono dalla stessa popolazione, lamedia di ogni campione estratto tenderà adoscillare attorno alla media della popolazione

Per ciascun campione estratto, non posso direcon sicurezza se è più o meno vicino alla mediadella popolazione (se non la conosco)

Ma la media delle 20 medie (90.35), avrà unvalore sicuramente più vicino alla media dellapopolazione: 90.3915

Medie Scarto90.39 Media popolazione90.35 -0.04 Media dei campioni

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 14 / 25

Page 15: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Stima della media

Sulle 20 medie, possiamo calcolare la deviazione standardEssendo la dev.st. delle medie dei campioni, ci informa su quantole medie campionarie si discostano dalla media di tutti i campionimessi assiemeViene chiamata errore standard della mediaUn piccolo errore standard indica che le medie campionariesono tendenzialmente vicine alla media della popolazionePiù piccolo l’errore standard, migliore è la stima della media dellapopolazione

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 15 / 25

Page 16: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Stima della media

Un grande errore standard indica che le medie campionariesono tendenzialmente disperse attorno alla media dellapopolazionePiù grande l’errore standard, meno sicuri siamo della “bontà” dellastima della media della popolazione

Anche la numerosità del campione incide sull’errore standardPiù grande è la numerosità dei campioni minore l’errore standardPiù piccola la numerosità dei campioni, maggiore l’errore standard

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 16 / 25

Page 17: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria

Anziché 20 campioni ne potremmo estrarre 10.000avremmo 10.000 medie e potremmo costruire una distribuzione difrequenza di quelle medieL’importante è che ogni campione sia casuale, ovvero

ogni caso di un singolo campione abbia la stessa probabilità diessere estratto degli altriogni possibile campione estraibile dalla popolazione abbia la stessaprobabilità degli altri

La distribuzione di frequenza che costruiremmo con le medie deicampioni si chiama distribuzione campionaria delle medieSe il numero di campioni estratto è sufficientemente elevato, lemedie dei campioni tenderanno a distribuirsi secondo la curvadella normale

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 17 / 25

Page 18: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria

Dal momento che le medie campionarie tendono a distribuirsicome una curva normalein statistica vengono considerate stime non affidabili le medie chestanno nell’estremo 2,5% di entrambi i latiSono campioni che vengono estratti abbastanza raramente: infattisono nell’area del 2,5% (negativa o positiva)a queste aree, la statistica associa il concetto di “significatività”In linea di massima, “significatività” significa valori la cuiprobabilità di comparire sono molto basse e che quindi vengonoconsiderati “anomali” perché molto probabilmente “differenti” daquelli della popolazione

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 18 / 25

Page 19: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Intervallo di confidenza (o di fiducia)

Il 95% attorno alla media rappresenta l’intervallo di fiduciaÈ semplicemente un‘aspetto complementare a quello precedentegli stessi valori che determinano il 2.5% estremo, determinaanche il 95% interno(se ne parlerà in un prossimo capitolo)

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 19 / 25

Page 20: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria

Se effettivamente estraessimo un numero elevatissimo dicampioni da una popolazione (metodo Monte Carlo), avremmouna distribuzione sperimentale, mentre quella su cui noilavoreremo è una distribuzione teoricaLa distribuzione campionaria delle medie si basa sul teorema dellimite centrale che afferma che, all’aumentare dell’ampiezza deicampioni, la distribuzione campionaria della media si avvicineràsempre più ad una distribuzione normale, indipendentementedalla forma delle misurazioni individualiSe una variabile si distribuisce normalmente, anche piccolicampioni produrrano una distribuzione campionaria normaleCon variabili non normali, la distribuzione campionaria deve avereN ≥ 30 o 40

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 20 / 25

Page 21: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria delle medie

●●●●●

●●

●●

●●

●●

●●

●●

●●●●●●

●●

●●

●●

●●

●●●●

●●

●●●

●●

●●

●●

●●●●●●●

●●

●●●●●

●●

●●

●●●

●●

●●

●●●

●●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●●

●●

●●●●●●

●●

●●

●●●

●●●●

●●●●

●●

●●

●●

●●●

●●

●●●●

●●●●

●●

●●●

●●

●●●●●●●

●●●●●●

●●

●●

●●●●

●●●

●●

●●●

●●

●●

●●

●●

●●●

●●●●

●●●

●●

●●

●●●●●

●●●●

●●●

●●

●●

●●

●●

●●●●

●●●●

●●●

●●●

●●

●●●●●

●●●

●●

●●●●●●

●●●

●●

●●●

●●●

●●●

●●●●

●●

●●

●●

●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●●●

●●●●●

●●

●●

●●●

●●●

●●

●●●

●●

●●●●●

●●

●●●

●●●

●●●

●●●

●●

●●●

●●

●●

●●

●●●●

●●●●

●●●

●●●●●●

●●●

●●

●●

●●●●

●●

●●

●●●

●●●●

●●

●●

●●●●

●●

●●

●●●●

●●●

●●

●●

●●●

●●●

●●

●●●●●

●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●●●

●●●●

●●●●●●

●●

●●

●●●

●●

●●●

●●●

●●●

●●●

●●

●●●

●●

●●●●●

●●

●●●

●●●

●●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●●●●●●

●●

0 200 600 1000

−4

−2

02

4

Media= 0.03

Popolazione normale Popolazione normale

Media= 0.03

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

100 campioni N=10

Media dei campioni= 0.01

−2 −1 0 1 2

0.0

0.4

0.8

1.2

100 campioni N=30

Media dei campioni= 0.03

−2 −1 0 1 2

0.0

1.0

2.0

A partire da una popolazionedistribuita normalmente(1000 casi, valori -4 4)

abbiamo il grafico deivalori [1]

l’istogramma dellefrequenze [2]

l’istogramma con normaledi 100 campioni diampiezza 10 [3]

l’istogramma con normaledi 100 campioni diampiezza 30 [4]

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 21 / 25

Page 22: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria delle medie

−4 −2 0 2 4

0.0

0.2

0.4

Popolazione normale

−1.0 0.0 0.5 1.00.

00.

51.

01.

5

Campioni N=10

−0.6 −0.2 0.2 0.6

0.0

1.0

2.0

Campioni N=30

la curva della ditribuzione“normale” [1]

la curva di 100 campionidi ampiezza 10 [2]

la curva di 100 campionidi ampiezza 30 [3]

estratti da una popolazioneche si distribuiva normalmente

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 22 / 25

Page 23: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria delle medie

●●

●●

●●

●●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●●

●●

●●●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

0 200 600 1000

020

6010

0

Media= 50.1001

Popolazione uniforme Popolazione uniforme

Media= 50.1001

Fre

quen

cy

0 20 40 60 80 100

040

80

100 campioni N=10

Media dei campioni= 51.1035

Den

sity

0 20 40 60 80 100

0.00

0.02

0.04

100 campioni N=30

Media dei campioni= 49.9936

Den

sity

0 20 40 60 80 100

0.00

0.03

0.06

A partire da una popolazioneuniformemente distribuita(1000 casi, valori 1-100)

abbiamo il grafico deivalori [1]

l’istogramma dellefrequenze [2]

l’istogramma con normaledi 100 campioni diampiezza 10 [3]

l’istogramma con normaledi 100 campioni diampiezza 30 [4]

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 23 / 25

Page 24: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria delle medie

−20 20 60 100

0.00

00.

006

Popolazione uniforme

20 40 60 800.

000.

020.

04

Campioni N=10

35 45 55 65

0.00

0.03

0.06

Campioni N=30

la curva delladistribuzione uniforme [1]

la curva di 100 campionidi ampiezza 10 [2]

la curva di 100 campionidi ampiezza 30 [3]

estratti da una popolazioneche non si distribuivanormalmente

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 24 / 25

Page 25: Elementi di Psicometria con Laboratorio di SPSS 1 · 2014. 10. 31. · Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei

Distribuzione campionaria

La distribuzione campionaria è una distribuzione di probabilità eper una numerosità (N) del campione superiore o uguale a 30,tende verso una curva stabile (e “normale”) con

Mx = µ e σx =σ√N

σx è la deviazione standard delle medie campionarie ancheconosciuta come errore standard della mediaindica quanto affidabile è ciascuna media campionaria

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 25 / 25