Perché costruire un test psicologico è difficile [modalità... · sulle misure Le misure sono...

Perch costruire un test psicologico difficile

Misurazione e attendibilit

Misurazione

I problemi di misurazione degli oggetti di studio sono comuni a tutte le discipline scientifiche.

In psicologia il problema solo pi evidente, non pi grave.

I costrutti che intendiamo misurare sono infatti non direttamente osservabili.

Freddo Prepotente

Egoista

Ansioso Superstizioso

Depresso

Item (misure osservate)

Aggressivo

Formale

Impulsivo

Antisociale autostimaDotato di bassa

autostima

colpaTendente ai sensi di

colpaIrrazionale

TimidoCriteri generatori

InstabilitemotivaPsicoticismo

Costrutti, tratti, concetti(tutti non osservabili)

Il peso della teoria

Spesso la definizione teorica di un fenomeno o costrutto varia da teoria a teoria.

stato cos anche per molti concetti propri delle scienze mature.

Spesso in psicologia, il disaccordo fra teorie rende problematica la misura del fenomeno.

la teoria, descrivendo le caratteristiche del fenomeno, a determinare le sue misure.

MISURAZIONE

Assegnazione di valori numerici adoggetti o eventi secondo regoleche ci consentono di rappresentarepropriet degli oggetti ed eventitramite le propriet del sistemanumerico utilizzo di unostrumento

MISURAZIONE

Sistema empirico (SE):ci che si vuole misurare; costituito da elementi legati tra loro da relazioni

SE

Sistema numerico (SN): ci che serve per misurare; esprime mediante i numeri le relazioni esistenti nel sistema empirico

SN

Occorre tenere presente che ad ogni misura associato sempre un errore

Il punteggio osservato si deve a: Il livello del soggetto nella caratteristica (V) Circostanze casuali, o errore casuale di misura (E)

X = misura rilevataV = parte vera

E = errore: fluttuazioni casuali (sempre)costante o sistematico (talvolta).

EVX +=

MISURAZIONE

Relazioni fra misure, costrutto, ed errore

x2 x3 x4

Coscienziosit

2 3 4

x1 x5

E1 5

V1V2 V3 V4

V5

E E E E

Puntuale Meticoloso

Coscienzioso

Ordinato

Puntiglioso

Il costrutto si riflettesulle misure

Le misure sono fraloro correlate

A maggiore intercorrelazioneCorrisponde minore errore di misura

MISURAZIONE - 1

Lerrore casuale di misurazione E responsabile dellimprecisione del punteggio X.

Quando E=0, X=V, e la misura perfettamente attendibile (precisa)

fondamentale sapere quanto precisa una misurazione o un test. Dobbiamo conoscere quindi V e E

X lo osserviamo, invece V ed E non li osserviamo direttamente: vanno stimati

MISURAZIONE 2 Facciamo attenzione a comprendere

meglio il significato della porzione vera del punteggio.

VA = parte vera del costrutto A (quello che vogliamo misurare) VB = parte vera del costrutto B (che non volevamo misurare)S = altre fonti sistematiche, anche di errore

ESVVX

SVVV

BA

BA

+++=++=

....

....

Attendibilit Affinch una misura sia valida, si richiede

che essa misuri sistematicamentequalcosa.

Lattendibilit rappresenta la precisione di una misura (ci che nella misura non errore).

Lattendibilit definibile come il rapporto fra la componente sistematica e la variabilit totale della misura.

V

V Er =

+

Primo accenno alla validit Una misura valida se coglie il concetto

che essa intende rilevare. La validit il limite superiore

dellattendibilit. Infatti lattendibilit data da tutta la

componente sistematica della misura la validit solo da una parte della componente

sistematica.

Accertare la validit pi difficile che accertare lattendibilit.

....

A

A B

Vval

V V S E=

+ + + ...A B

A B

V V S

V V S Er

+ +=

+ + +

Assunzioni sullattendibilit Lerrore di misurazione una variabile

aleatoria, distribuita normalmente. Ci significa che ci si aspetta tanti piccoli errori, vicini allo zero, e pochi errori di una certa entit.

La media degli errori di misurazione uguale a 0. Gli errori casuali tendono ad annullarsi allaumentare del numero di misurazioni. Pi misure facciamo, pi precisa sar la misurazione.

I punteggi veri e gli errori di misurazione sono tra loro indipendenti. La varianza di errore uguale ad ogni livello del punteggio vero: Facciamo lo stesso tipo di errore per punteggi veri bassi, e per punteggi veri alti.

Assunzioni sullattendibilit Gli errori di misurazione compiuti in due

somministrazioni indipendenti sono fra loro indipendenti.

Se queste assunzioni sono vere, possibile utilizzare diversi metodi per misurare la varianza vera e la varianza derrore, e da queste calcolare lattendibilit come rapporto:

V

V Er =

+

Vari genere di attendibilit1) Metodo del Test-Retest:

Si somministra il test al tempo T1 ed al tempo T2 e si calcola la correlazione tra i punteggi. Questo metodo non necessit di ulteriori specificazioni. Basta saper calcolare la r di Pearsontra due serie di punteggi.

2) Metodo delle Forme Parallele:Si somministrano due versioni equivalenti del test (stessa media

e stessa dev. St.) Quindi si calcola la correlazione tra i le due forme come stima dellattendibilit test-retest.

3) Metodo dello Split-Half:Si somministra il test in un unico tempo T1. Si divide il test a

met e si considerano le due met come forme parallele (stessa media e stessa dev. St.) Quindi si calcola la correlazione tra le due met come stima dellattendibilit test-retest.

4) Metodo della Coerenza Interna:Si somministra il test in un unico tempo T1. Ogni item viene

considerato un test a se stante. Si stima (con apposite formule) la correlazione media tra tutti gli item. Questa una stima dellattendibilit

PG T1 PG T2

ss1 11 12ss2 15 14ss3 17 14ss4 20 19ss5 20 21ss6 25 27ss7 22 18ss8 21 24ss9 34 31ss10 38 36ss11 40 37

Media 23,91 23,00Dev St. 9,03 8,39

Cov (PG T1, PG T2)

Dev.St.(PG T1) Dev.St.(PG T2)r tt =

Svolgimento:

Cov (PG T1, PG T2) = 73.45

Dev.St.(PG T1) = 9.03

Dev.St.(PG T2) = 8.39

Rtt = 73.45/ (9.03 8.39) =

73.45 / 75.74 =.96

Test-retest

Interpretazione attendibilit test-retest

Buoni coefficienti test-retest dovrebbero superare .80 (livello piuttosto esigente).

Il coefficiente test-retest cala allaumentare del tempo trascorso fra le rilevazioni.

Il coefficiente test-retest interpretabile se si assume che il concetto misurato non si modifichi nel tempo

Il problema principale quello di verificare che le due forme siano effettivamente parallele. Ci significa verificare che le due forme abbiano la stessa media e la stessa varianza. Prendiamo i seguenti dati:

Forme parallele

T1 T2Forma A Forma B

ss1 11 12ss2 15 14ss3 17 14ss4 20 19ss5 20 21ss6 25 27ss7 22 18ss8 21 24ss9 34 31ss10 38 36ss11 40 37

Media 23,91 23,00Dev St. 9,03 8,39

Svolgimento:

t-test sulle due medie

tsp=1.3; Gdl=10;tcr=2,23

Le medie sono uguali.

Fare Test F sulle due varianze

Fsp=1.15, gdl = 10,10 Fcr=2.97

Le varianze sono uguali.

Quindi rtt = .96

Item 1 2 3 4 5 6 7 8 9 10Sogg.

1 1 0 1 1 0 1 0 1 1 12 0 0 1 0 1 1 0 1 0 03 1 1 0 1 1 1 1 0 1 14 0 0 1 0 0 1 0 1 0 05 1 0 1 1 0 1 0 0 1 16 1 1 0 0 1 0 1 1 0 07 0 0 1 0 0 0 1 0 0 08 1 1 1 1 0 1 0 0 0 09 0 1 0 0 1 1 1 0 0 110 1 0 0 1 0 0 1 0 0 111 1 1 1 0 1 0 0 1 1 0

Sommiamo gli item pari e dispariSogg. Item Dispari Item Pari

1 3 42 2 23 4 44 1 25 3 36 3 27 2 08 2 39 2 310 2 211 4 2

Media 2,55 2,45Dev.St. 0,89 1,08

Svolgimento:

Verificare che le due met abbiano la stessa media e la stessa varianza. t-test=ns, F-

test=ns: OK

Calcolare la correlazione tra le due met =.40

Split-halfPrendiamo i seguenti dati di un test di 10 item somministrato a 11 soggetti:

Interpretazione coefficiente split-half Lattendibilit dipende molto dalla

lunghezza del test la correlazione split-half una sottostima dellattendibilit Infatti la divisione del test a met ne

dimezza la lunghezza

Ci sono delle formule che permettono di correggere tale sottostima.

1 ( 1)tt

tttt

nrRn

n r=

+ -Rntt = attendibilit del test allungato.

n = il numero delle volte che il test

viene allungato o abbreviato. Si ottiene come rapporto tra numero degli item finale su

numero degli item iniziali.

r tt = attendibilit iniziale.Si chiama formula profetica

Applicazione al problema precedente: rtt = ,40; n = 10/5 = 2

2 .40 .80.58

1 (2 1) .40 1.40ttRn

= = =

+ -

Formula di Spearman-Brown

La formula di RULON

totale

differenza

xxR 2

2

1=

Sogg. Item Dispari Item Pari Differenza Totale Pari+Dispari1 3 4 -1 72 2 2 0 43 4 4 0 84 1 2 -1 35 3 3 0 66 3 2 1 57 2 0 2 28 2 3 -1 59 2 3 -1 510 2 2 0 411 4 2 2 6

Media 2,55 2,45 0,09 5,00Dev.St. 0,89 1,08 1,08 1,65

Varianza 0,79 1,16 1,17 2,73

57.43.173.2

17.11 ===xxR

Split-half

+=totale

BA

xxR 2

22

12 58.)71.1(2

73.2

16.179.012 ==

+=xxR

Sogg. Item Dispari (A) Item Pari (B) Differenza Totale Pari+Dispari1 3 4 -1 72 2 2 0 43 4 4 0 84 1 2 -1 35 3 3 0 66 3 2 1 57 2 0 2 28 2 3 -1 59 2 3 -1 510 2 2 0 411 4 2 2 6

Media 2,55 2,45 0,09 5,00Dev.St. 0,89 1,08 1,08 1,65

Varianza 0,79 1,16 1,17 2,73

La formula di GUTTMAN

Split-half

Il coefficiente di Cronbach

=

totale

i

K

K2

2

1

1

Il coefficiente KR-20

Si utilizza per item

dicotomici o politomici

Si utilizza solo per item

dicotomici

=

totale

iiqp

K

KKR

220

11

Coerenza interna

K = numero di item

2i= varianza di ciascunitem

Item 1 2 3 4 5 6 7 8 9 10 TotaleSogg.

1 1 0 1 1 0 1 0 1 1 1 72 0 0 1 0 1 1 0 1 0 0 43 1 1 0 1 1 1 1 0 1 1 84 0 0 1 0 0 1 0 1 0 0 35 1 0 1 1 0 1 0 0 1 1 66 1 1 0 0 1 0 1 1 0 0 57 0 0 1 0 0 0 1 0 0 0 28 1 1 1 1 0 1 0 0 0 0 59 0 1 0 0 1 1 1 0 0 1 5

10 1 0 0 1 0 0 1 0 0 1 411 1 1 1 0 1 0 0 1 1 0 6

Media 0,64 0,45 0,64 0,45 0,45 0,64 0,45 0,45 0,36 0,45 5,00Dev.St. 0,48 0,50 0,48 0,50 0,50 0,48 0,50 0,50 0,48 0,50 1,65

Varianza 0,23 0,25 0,23 0,25 0,25 0,23 0,25 0,25 0,23 0,25 2,73

Item 1 2 3 4 5 6 7 8 9 10 TotaleSogg.

1 1 0 1 1 0 1 0 1 1 1 72 0 0 1 0 1 1 0 1 0 0 43 1 1 0 1 1 1 1 0 1 1 84 0 0 1 0 0 1 0 1 0 0 35 1 0 1 1 0 1 0 0 1 1 66 1 1 0 0 1 0 1 1 0 0 57 0 0 1 0 0 0 1 0 0 0 28 1 1 1 1 0 1 0 0 0 0 59 0 1 0 0 1 1 1 0 0 1 5

10 1 0 0 1 0 0 1 0 0 1 411 1 1 1 0 1 0 0 1 1 0 6

p(1) 0,64 0,45 0,64 0,45 0,45 0,64 0,45 0,45 0,36 0,45 5,00q(0) 0,36 0,55 0,36 0,55 0,55 0,36 0,55 0,55 0,64 0,55 1,65pXq 0,23 0,25 0,23 0,25 0,25 0,23 0,25 0,25 0,23 0,25 2,73

Il coefficiente di Cronbach

1261.73.2

42.21

9

10

73.2

625.423.1

9

10

1

1 2

2

=

=

=

+=

=

=

totale

i

K

K

Il coefficiente KR-20

1261.73.2

42.21

9

10

73.2

625.423.1

9

10

1

1 220

=

=

=

+=

=

=

totale

iiqp

K

KKR

Utilizzando i dati precedenti

Interpretazione

Valore minimo accettabile: .70 (se abbiamo pochissimi item, pu andar bene .60)

corretto calcolare quando gli item della scala misurano tutti una caratteristica omogenea

Allo stesso tempo, se gli item sono fra loro troppo simili, sar molto elevata, ma la validit della misura pu risultare bassa In questi casi rischiamo di avere una misura

iper-specifica

Attendibilit, validit, specificit

x2 x3 x4

Coscienziosit

2 3 4

x1 x5

E1 5

V1V2 V3 V4

V5

E E E E

Ossessivit

Gli item che sviluppaticome misura di coscienziosit,in realt misurano un fattore di iper-specifico di Perfezionismo,ed un terzo costrutto ancora differente:lossessivit

Perfezionismo

Perché costruire un test psicologico è difficile [modalità... · sulle misure Le misure sono...

Documents

Transcript of Perché costruire un test psicologico è difficile [modalità... · sulle misure Le misure sono...