Elementi di Psicometria con Laboratorio di SPSS 1 lineari Abbiamo visto che se aggiungo o sottraggo...

31
Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2014-2015 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 1 / 26

Transcript of Elementi di Psicometria con Laboratorio di SPSS 1 lineari Abbiamo visto che se aggiungo o sottraggo...

Elementi di Psicometria con Laboratorio di SPSS 105-Deviazione standard e punteggi z

vers. 1.1 (22 ottobre 2014)

Germano Rossi1

[email protected]

1Dipartimento di Psicologia, Università di Milano-Bicocca

2014-2015

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 1 / 26

Introduzione

Per le variabili quantitative usiamo delle unità di misura (anni,numero di errori. . . )I punteggi grezzi (ciò che abbiamo misurato) sono semplici dainterpretare se conosciamo la scala su cui sono misurati (i metri, igradi centigradi e simili)Non sono facili da interpretare se usano scale non conosciute (ades. intervallo 6-36 oppure 30-180)Variabili diverse possono usare unità diverse (età,soddisfazione. . . ) con metriche diverse (età -> 0-n; soddisfazione-> 0-10, . . . ) che possono cambiare da una cultura all’altra (kg olibbre, km o miglia, . . . )

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 2 / 26

Introduzione

Non sono molto utili neppure per confrontare fra loro variabilidiverse: un 25 in un test di abilità matematica (AM) è migliore opeggiore di un 55 in un test di abilità verbale (AV)?Dipende dalle relative scale:

se AM ha un range 1-30e AV un range 10-60entrambi i punteggi sono abbastanza vicini al valore massimoMa uno è “migliore” dell’altro?

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 3 / 26

Introduzione

Nella vita reale, le unità di misura sono già un’enormesemplificazione della nostra vitaConfrontare variabili diverse fra loro non è possibile se nonusando la stessa scala di misura e lo stesso metroÈ come decidere se 3 banane sono di più di 3 aranceSono cose diverse e non possiamo confrontarleA meno di non trasformarle in una stessa unità di misura

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 4 / 26

Confrontare variabili

Ad esempio“3 banane pesano di più di 3 arance?”“In 3 banane ci sono più vitamine che in 3 arance?”“3 banane occupano più spazio di 3 arance?”“ci sono più frutti di tipo ’banane’ o di tipo ’arance’?”

Ma in statistica vorremmo avere un’unica un’unità di misura che valgaper misurare qualsiasi variabileQuale potrebbe essere questa unità di misura?

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 5 / 26

Distanze dalla media

0 1 2 3 4 5 6 7 8 9 10

L’unità di misura parte da 0 e va fino a 10. Se sottraiamo 5 a tutti i punteggiotteniamo:

-5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5

L’unità di misura parte da -5 e va fino a +5

Non cambia nulla, abbiamo trasformato lo zero assoluto in uno zero relativo.La nuova unità di misura è la deviazione dalla media (x−M ); in termini piùprecisi è “quante unità di misura di questa variabile, ogni punteggio distadalla media della variabile”.

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 6 / 26

Deviazione standard

Non basta modificare la metrica ed esprimere tutto in base a“quanti scarti ci sono da qui alla media”perché ogni variabile ha una sua estensione e una sua unità dimisura specificaAnche se diciamo che “X dista 2 dalla sua media” e “Y dista 3dalla sua media”, se X misura i chilometri e Y il peso. . . . nonpossiamo fare confronti.Ma la deviazione standard è la radice quadrata della varianza

ds =√var =

√∑(Xi −X)2

N

e se esprimiamo gli scarti in termini di distanza. . . .

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 7 / 26

Trasformazioni lineari

Abbiamo visto che se aggiungo o sottraggo una costante ad unadistribuzione, la media subisce la stessa trasformazione

X =∑

X ⇒∑

(X + k) = X + k

per cui se io tolgo ad AM e AV la loro media, trasformo le due variabili inmodo che abbiano entrambe M=0∑

(X −X) = X −X = 0

Ho semplicemente spostato le misure in modo che la media di entrambefosse 0.

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 8 / 26

Trasformazioni lineari

Adesso hanno la stessa media (zero) ma hanno ancora varianza diversa

Come possiamo rendere i campi di variazione uguali?

Una prima possibilità è di dividere tutto per un determinato valore (ades. le rispettive gamme) e poi moltiplicare tutto per uno stesso valore(ad es. 100)

Un’altra possibilità è quella di usare la deviazione standard come unitàdi misura

In pratica, ci chiediamo “Quante deviazioni standard ci sono fra undeterminato valore X e la media?”

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 9 / 26

Variabili standardizzate

Punti z

“Quante deviazioni standard ci sono fra un determinato valore X ela media?”La risposta implica utilizzare la deviazione standard (σ) comenuova unità di misuraGli scarti dalla media (X −X) vengono divisi per la dev. st.:

zx =X −Xσ

Il punteggio trasformato in “numero di scarti dalla media” sichiama punto z o punteggio z

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 10 / 26

Variabili standardizzate

Punti z

Il punto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggiocorrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (∑

z = 0), perché i punti z sono scartidalla media trasformati in modo uniforme e la somma degli scartiè 0La deviazione standard dei punti z è 1 (σz = 1), perché ladeviazione standard è l’unità di misuraValori negativi indicano punteggi inferiori alla mediaValori positivi, punteggi sopra la media

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26

Variabili standardizzate

Punti z

Il punto z è una misura standardLa media dei punti z è 0 (z = 0), visto che un qualunque punteggiocorrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (∑

z = 0), perché i punti z sono scartidalla media trasformati in modo uniforme e la somma degli scartiè 0La deviazione standard dei punti z è 1 (σz = 1), perché ladeviazione standard è l’unità di misuraValori negativi indicano punteggi inferiori alla mediaValori positivi, punteggi sopra la media

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26

Variabili standardizzate

Punti z

Il punto z è una misura standardLa media dei punti z è 0 (z = 0), visto che un qualunque punteggiocorrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (∑

z = 0), perché i punti z sono scartidalla media trasformati in modo uniforme e la somma degli scartiè 0

La deviazione standard dei punti z è 1 (σz = 1), perché ladeviazione standard è l’unità di misuraValori negativi indicano punteggi inferiori alla mediaValori positivi, punteggi sopra la media

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26

Variabili standardizzate

Punti z

Il punto z è una misura standardLa media dei punti z è 0 (z = 0), visto che un qualunque punteggiocorrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (∑

z = 0), perché i punti z sono scartidalla media trasformati in modo uniforme e la somma degli scartiè 0La deviazione standard dei punti z è 1 (σz = 1), perché ladeviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla mediaValori positivi, punteggi sopra la media

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26

Variabili standardizzate

Punti z

Il punto z è una misura standardLa media dei punti z è 0 (z = 0), visto che un qualunque punteggiocorrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (∑

z = 0), perché i punti z sono scartidalla media trasformati in modo uniforme e la somma degli scartiè 0La deviazione standard dei punti z è 1 (σz = 1), perché ladeviazione standard è l’unità di misuraValori negativi indicano punteggi inferiori alla media

Valori positivi, punteggi sopra la media

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26

Variabili standardizzate

Punti z

Il punto z è una misura standardLa media dei punti z è 0 (z = 0), visto che un qualunque punteggiocorrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (∑

z = 0), perché i punti z sono scartidalla media trasformati in modo uniforme e la somma degli scartiè 0La deviazione standard dei punti z è 1 (σz = 1), perché ladeviazione standard è l’unità di misuraValori negativi indicano punteggi inferiori alla mediaValori positivi, punteggi sopra la media

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26

Variabili standardizzate

Punti Z

La trasformazione in punti z, si dice anche “standardizzazione”La distribuzione dei punti z si dice “distribuzione standardizzata”perché è una delle tante possibili curve di frequenza, ma conmedia e ds conosciute a prioriI punti z permettono di confrontare fra loro punteggi provenienti dadistribuzioni di frequenza diverse

Esempiox=70, M=82, σ=12 (z=-1) x=23, M=35, σ= 6 (z=-2)23 è 2 ds al di sotto della sua media, mentre 70 è solo 1 ds sotto lasua media; se fossero punteggi di profitto, confrontandoli, dovremmodire 23 è un valore “peggiore” rispetto a 70 non perché è più piccoloma perché il suo punto z è inferiore

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 12 / 26

Variabili standardizzate

Esempi d’uso dei punti z

Conoscendo media, varianza e il punto z, si può calcolare il valoredi X (cioè il punto grezzo):

X = X + zxσx

EsempioSe un test di profitto ha M=82 è σ=12, a quale punteggio corrisponde ilpunto z=1.2?

X = 82 + 1.2 ∗ 12 = 96.4

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 13 / 26

Variabili standardizzate

Scale derivate dai punti z

Ci sono scale standardizzate utilizzate comunemente in psicologia(specie per i test) che derivano dai punti zpunteggi T: hanno media 50 e ds=10. Si ottengono conT = 10z + 50

punteggi SAT: hanno media 500 e ds=100. Si ottengono conSAT = 100z + 500

QI o IQ: la maggior parte dei test d’intelligenza (come il WAIS)utilizza una media di 100 e ds=15. Si ottengono conQI = 15z + 100

QI o IQ: il test d’intelligenza Stanford-Binet utilizza una media di100 e ds=16. Si ottengono con QI = 16z + 100

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 14 / 26

Variabili standardizzate

Spss: punti z

Spss permette di calcolare i punti z di una variabile per ogni unitàstatistica, tramite Analizza | Statistiche descrittive| Descrittive... e attivando il flag Salva valoristandardizzati come variabili

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 15 / 26

Variabili standardizzate

Spss: punti z

Viene aggiunta una variabile con il nome corrispondentepreceduto da Z

Questa variabile può essere usata come qualsiasi altra

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 16 / 26

Variabili standardizzate

Tavole della distr. normale

Nella curva normaleogni z corrisponde adun area

L’area può essereproposta in modi diversi

Ad ogni z corrispondeun’area fino a z=−∞

Fra z=−3 e z=−∞ c’èun’area del 99.87%

La tavola del vostro libro (Howitt) propone l’area per determinatipunti z

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 17 / 26

Variabili standardizzate

Tavole della distr. normale

Alcuni punti z corrispondono adaree particolari

z=-1.64 corrisponde al 5%/95%

z=-1.96 corrisponde al2.5%/97.5%

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 18 / 26

Variabili standardizzate

Tavole della distr. normale

La curva normale è simmetrica

Quindi ogni metà è il 50%

Allontanandoci da z=0 abbiamoaree simili per z simili

z=-0.10 -> 53.98% (cioè 3.98%sotto)

z=0.10 -> 46.02% (cioè50-46.02=3.98% sopra la media)

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 19 / 26

Variabili standardizzate

Tavole della distr. normale

z=1.64 corrisponde al 95%/5%

z=1.96 corrisponde al97.5%/2.5%

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 20 / 26

Variabili standardizzate

Tavole della distr. normale

Altri libri riportano tavole più complete (ad es. Welkowitz, Cohen, Ewen:Tavola A, p. 473 ss.)

La tavola riporta le proporzione diarea sottese alla curva normalecalcolate a partire dalla media(ricordarsi che l’intera area èsimmetrica)

Per ogni punto z viene indicatal’area fra z=0 e il punto z stesso(area in grigio)

La proporzione di area è indicatacome percentuale (34,13) condue decimali

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 21 / 26

Variabili standardizzate

Tavole della distr. normale

La prima colonna indica il primo decimale del punto z, ogni colonnasuccessiva indica il secondo decimale

All’incrocio fra una riga (ad es. 0,3) e una colonna (0,05) troviamo l’areacorrispondente (ad es. 0,35)

Es. l’area fra z=0,35 e 0 è pari a 13,68

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 22 / 26

Variabili standardizzate

Esempi d’uso dei punti z

Qual è la % di soggetti con un punteggio inferiore o uguale a 120 (M=100,s=20)?

calcolo il punto z[(120-100)/20=1]

tavole della normale; cerco la rigacorrispondente a z=1.0, avanzofino alla colonna 0 e leggo l’areacorrispondente [34,13]

questa è l’area fra la z=0 e z=|1|;mi interessa anche la metàinferiore, sommo 50,00 [50,00 +34.13 = 84.13%]

oppure Howitt; cerco 1.00, trovo15.87%, ma è quella superiore,quindi 100-15.87=84.13%

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 23 / 26

Variabili standardizzate

Esempi d’uso dei punti z

Qual è la % di soggetti con un punteggio inferiore a 80 (M=100, s=20)?

calcolo il punto z [(80-100)/20=-1]

negativo perché sotto la media

tavole della normale; cerco la rigacorrispondente a z 1.0, avanzofino alla colonna 0 e leggo l’areacorrispondente [34,13]

poiché questa è l’area fra la z=0e z=|1| e mi interessa l’areainferiore, faccio il complemento[50,00 - 34,13 = 15.87%]

oppure Howitt; cerco -1.00, trovo84.13%, ma è quella superiore,quindi 100-84.13=15.87%

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 24 / 26

Variabili standardizzate

Esempi d’uso dei punti z

Qual è la % di soggetti con punteggio compreso fra 80 e 120?

calcolo i punti z [-1 e +1]

tavole della normale; cerco la rigacorrispondete al punto z 1.0,avanzo fino alla colonna 0 e leggol’area corrispondente [34,13]

poiché questa è l’area fra la z=0e z=|1| ed entrambe sono uguali,sommo l’area 2 volte [34,13 +34,13 = 68.26%]

oppure Howitt; cerco 1.00, trovo34.13%, raddoppio, quindi 34,13+ 34,13 = 68.26%

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 25 / 26

Variabili standardizzate

Esempi d’uso dei punti z

A quale punto z corrisponde l’area con il 10% di punteggi superiori?

poiché le tavole indicano l’areafra z=0 e z=x, devo trovare il restodi 10,00 [50,00-10,00=40,00]

cerco dentro le tavole unaproporzione che si avvicini a40,00. . . corrisponde a z=1.28

i punteggi il cui z è >= di 1.28,rientrano nel 10% superiore

oppure Howitt; cerco un’areavicina al 10% sul lato positivo;trovo 9.68% -> z=1.30

G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 26 / 26