86194482 Psicometria I

PSICOMETRIA I

a.a. 2010-2011

Fascia DI-M Dott. Sjoerd Ebisch

Ricevimento: Ore 10-11 presso il laboratorio di psicometria

Sir Francis Galton

1822-1911

Obiettivi formativi:

Il programma si propone di offrire allo studente

un’introduzione alle tematiche connesse alla misura in

psicologia e una trattazione dei concetti di base per

affrontare problemi di quantificazione e di

elaborazione di dati.

Programma del corso:

Gli argomenti trattati saranno:

1) la misura in psicologia: attendibilità e validità dei test, il modello

classico dell’errore;

2) le variabili;

3) le scale di misura;

4) frequenze e distribuzioni di frequenze;

5) tabelle e grafici;

6) indici di tendenza centrale: media, moda e mediana;

7) indici di dispersione: deviazione standard e varianza;

8) indici di posizione: quartili, decili e percentili;

9) standardizzazione;

10) relazioni tra variabili: gli indici di correlazione e la regressione

semplice.

Modalità d'esame:

L’esame consiste in una prova scritta con domande a scelta multipla

ed esercizi da svolgere e un’eventuale prova di integrazione orale.

Libri di testo:

Per la parte relativa al punto 1, la misura in psicologia:

• Kline, P., Manuale di Psicometria, Roma, Astrolabio 1996

(esclusivamente dal Capitolo 1 al Capitolo 3)

Per la parte relativa alla statistica descrittiva (punti 2-10):

• Areni, Ercolani, Leone (2001), Statistica per la psicologia, vol. 1.

Fondamenti di psicometria e statistica descrittiva.

Esercizi:

• Areni, A., Scalisi, T. G. e Bosco, A. Esercitazioni di psicometria.

Masson, 2005 (pag. 348).

http://www.psicometria.unich.it/

CHE COSA E’ PSICOMETRIA?

• La psicometria studia la teoria e la tecnica della misura

in psicologia



in psicologia

• La misura di:

– Intelligenza, conoscenza, abilità, atteggiamento,

personalità, …



in psicologia

• La misura di:

– Intelligenza, conoscenza, abilità, atteggiamento,

personalità, …

1) la costruzione degli strumenti e delle procedure per la

misura (psicologiche)

2) lo sviluppo ed il perfezionamento dei metodi teorici

della misura

La quantificazione in psicologia

• Psicometria:

« l'assegnazione dei numeri agli oggetti o agli

eventi, secondo una certa regola »

• Fisica:

« la misura è la valutazione e l'espressione

numerica della grandezza di una quantità

riguardante un altro evento »


• La misura delle caratteristiche psicologiche:

– Indiretta, ottenute mediante inferenza

Esempio:

Intelligenza > comportamento > osservazioni

• L’imprecisione della misura: elevata nella

psicologia

– attendibilità

• Perché? Cosa rende imprecisa e controversa la

misure psicologica?

– Percezione diretta vs. osservazione indiretta

• Definizione della caratteristica comportamentale

– teoria e validità


• Costrutto (psicologico): caratteristica psicologica

> concetto/idea


• Costrutto (psicologico): caratteristica psicologica

> concetto/idea

Ad esempio:

Francis Galton: intelligence is a true, biologically-based mental faculty

that can be studied by measuring a person's reaction times to cognitive

tasks

Alfred Binet, and the French school of intelligence: intelligence is an

aggregate of dissimilar abilities, not a unitary entity with specific,

identifiable properties


• Intelligence (Mainstream Science on Intelligence, 1994)

A very general mental capability that, among other things, involves the ability

to reason, plan, solve problems, think abstractly, comprehend complex ideas,

learn quickly and learn from experience. It is not merely book learning, a

narrow academic skill, or test-taking smarts. Rather, it reflects a broader and

deeper capability for comprehending our surroundings—"catching on,"

"making sense" of things, or "figuring out" what to do


• Intelligence (Intelligence: Knowns and Unknowns,1995, Psychological

Association):

Individuals differ from one another in their ability to understand complex ideas,

to adapt effectively to the environment, to learn from experience, to engage

in various forms of reasoning, to overcome obstacles by taking thought.

Although these individual differences can be substantial, they are never

entirely consistent: a given person's intellectual performance will vary on

different occasions, in different domains, as judged by different criteria.

Concepts of "intelligence" are attempts to clarify and organize this complex

set of phenomena. Although considerable clarity has been achieved in some

areas, no such conceptualization has yet answered all the important

questions, and none commands universal assent. Indeed, when two dozen

prominent theorists were recently asked to define intelligence, they gave two

dozen, somewhat different, definitions


• Scopo della misura in psicologia:

– La descrizione dell’oggetto di studio

> studio scientifico

> applicazioni pratiche

• Come altre misure: la quantificazione,

l’assegnazione di numero a oggetti secondo

determinate regole



• Le misure psicologiche:

i test psicologici

• I test psicologici e contesti

– Cognitivi

> abilità (capacità specifiche), intelligenza

(abilità generali), profitto (capacità in una

materia specifica), attitudine (prestazioni

future)


• I test psicologici e contesti

– Non-cognitivi

> Personalità (tratti): questionari standardizzati,

interviste, osservazioni dirette, proiettivi

> Atteggiamento (dimensione valutativa): rilevante

per il rapporto fra valutazione-comportamento


• Scale di atteggiamento:

– Thurstone


Agree Disagree

I like going to Chinese

restaurants[ ] [ ]

Chinese restaurants provide good

value for money[ ] [ ]

There are one or more Chinese

restaurants near where I live[ ] [ ]

I only go to restaurants with

others (never alone)[ ] [ ]


– Guttman



– Differenziale semantico


• Scale di

atteggiamento:

– Likert


• I principi di psicometria:

– ATTENDIBILITA’

– VALIDITA’


• L’ATTENDIBILITA’

– La precisione dello strumento

• Quanto errore è incluso nella misura?

• Misurare un costrutto in modo consistente

nel tempo, fra individui, situazioni e item

(test-retest, coerenza interna)



– Variabili di interferenza test-retest (soggetti):

• cambio dell’ambiente, stato mentale (e.g.

stanchezza, malattia, problemi personali),

fattori di sviluppo (bambini)



– Variabili di interferenza test-retest (test):

• Istruzioni scadenti/variabili, codifica

soggettiva, la possibilità di tirare ad

indovinare, la difficoltà degli item, la

lunghezza del test



– Variabili di interferenza test-retest (vari):

• Intervallo di tempo (almeno 3 mesi), livello

di difficoltà degli item, campionamento dei

soggetti, dimensione del campione


• LA VALIDITA’

– La capacità di una misura di cogliere il

costrutto psicologico che ci interessa

• Misuro ciò che voglio misurare?

• In altre parole, i comportamenti misurati

riflettono veramente il costrutto (quale non è

direttamente osservabile)?



X: misura V: vero E: errore

X = V + E

ρ (rho) = V__ = la percentuale di X che non

V + E riflette l’errore



X: misura V: vero E: errore

X = V + E

ρ (rho) = V__ = la percentuale di X che non

V + E riflette l’errore

! Non possiamo sapere V


• LA VALIDITA’

– Validità di contenuto

– Validità di costrutto

• Validità convergente

• Validità discriminante

– Validità di criterio

• Validità concorrente

• Validità predittiva

– Validità nomologica

– L’attendibilità


• LA VALIDITA’

– Validità di contenuto

La capacità dello strumento di rappresentare

accuratamente l’universo di comportamenti del

costrutto

Non statistico

Ad esempio: il test QI include tutte le aree considerate

rilevanti nella letterature scientifica?


• LA VALIDITA’


Il grado in cui lo strumento misura effettivamente ciò

che intende di misurare

Ad esempio: un certo test QI misura l’intelligenza?


• LA VALIDITA’



Il grado di accordo fra diversi tentativi di misura dello

stesso costrutto / la convergenza fra diverse misure

Ad esempio: quanto è associato un nuovo test di ansia

ad altri test di ansia?

> ottenere la stessa diagnosi


• LA VALIDITA’



Il grado in cui i tentativi di misurare costrutti diversi

sono effettivamente distinguibili l’uno dall’altro

Ad esempio: empatia vs. estroversione.

> non confondere diverse diagnosi


• LA VALIDITA’


Confronto fra lo strumento (test) e una variabile di

criterio rappresentativo per il costrutto

Ad esempio: relazione fra un test di selezione del

personale e misure di prestazione al lavoro, oppure

relazione fra un test QI e prestazioni accademici


• LA VALIDITA’



Il grado in cui la misura dello strumento correla con

altre misure dello stesso costrutto allo stesso

momento

Ad esempio: test – valutazione prestazione di lavoro


• LA VALIDITA’




altre misure dello stesso costrutto nel futuro

Ad esempio: valutazione esame di maturità –

valutazione esame di psicometria

> condizioni a rischio


• LA VALIDITA’

– Teoria di riferimento:

• Validità concorrente vs. predittiva

Due concetti non dipendenti, ma riflettono aspetti

diversi dello stesso costrutto: concorrente (ansia -

depressione)

Due concetti dipendenti: predittiva (motivazione >

successo lavorativo)


• LA VALIDITA’

– Validità nomologica

Il grado in cui le ipotesi basate sulla misura del

costrutto vengono effettivamente verificate,

considerando uno schema concettuale che include

anche altri costrutti teoricamente correlate

Complesso di associazioni fra il costrutto e una

molteplicità di criteri


• LA VALIDITA’

– L’attendibilità

Condizione necessaria per la verifica della validità (ma

non sufficiente)

Caso: test item aspecifico (misura costrutto A ed un po’

B)

Attendibilità = Va + Vb__

Va + Vb + E

Validità di A= Va____

Va + Vb + E


• ATTENDIBILITA’ & VALIDITA’

Una misura può essere attendibile senza essere

necessariamente valida

ma

l’attendibilità e’ necessaria (ma non sufficiente)

per la validità


Scale di misure

• Scala nominale

– Categorizzare

• Maschio vs. femmina (dicotomica)

• Sani, ansiosi, nevrotici, psicotici, depressi,

…

• Abruzzo, Puglia, Campania, Molise, Marche,

Lazio, altri (esempio)

Scale di misure

• Scala nominale

– Equivalenza nelle categorie, non equivalenza

fra le categorie

> Relazione di equivalenza: simmetrica e

transitiva:

• Individuo A = individuo B

allora B = A (simmetria)

• B = C

allora anche A = C (transitiva)

Scale di misure

• Scala nominale

– Equivalenza nelle categorie, non equivalenza

fra le categorie

> Relazione di non equivalenza: simmetrica e

non transitiva:

• Individuo A ≠ individuo B

allora B ≠ A (simmetria)

• Ma se A ≠ B ≠ C

A = C oppure A ≠ C (non transitiva)

Scale di misure

• Scala nominale

– Statistica: contare frequenze nelle categorie,

confrontare le frequenze

Scala come qualcosa che discrimina

Classificazione come la base di ogni misura, ma

livelli di classificazione possono essere più o

meno precisi

Scale di misure

• Scala ordinale

– Quantitativa: ordine

• Numero 1 rappresenta una quantità superiore

rispetto a n. 2, etc.

• Lo stesso numero rappresenta la stessa

quantità della caratteristica in esame

• Il numero assegnato non rappresenta

direttamente la quantità, ma solo l’ordine

(più grande di …)

Scale di misure

Scala ordinale: ad esempio preferenze:

Esempio: Miglior film 2011

A) Il discorso del re

B) Il cigno nero

• The Fighter

• Inception

• I ragazzi stanno bene

• 127 ore

C) The Social Network

D) Toy Story 3 - La grande fuga

E) Il Grinta

• Un gelido inverno

Scale di misure

• Scala ordinale

– Relazione di equivalenza fra soggetti con lo stesso

numero (valore)

– Relazione di ordine fra le ripartizioni / classe /

categorie

> asimmetrica e transitiva

• Individuo A > individuo B

ma B non è > A (asimmetria)

• A > B e B > C

allora A > C (transitiva)

Scale di misure

• Scala a intervalli equivalenti

– Nominale: uguale-non uguale

– Ordinale: più grande di …

– Intervalli equivalenti: distanza, quanto più

grande di …

– Unità di misura costante

Scale di misure


– Nominale: uguale-non uguale

– Ordinale: più grande di…

– Intervalli equivalenti: distanza

– Unità di misura costante, che consente tecniche

statistiche più sofisticate

Problema: difficile ottenere intervalli uguali!

Scale di misure


– Le misure di costrutti psicologici solitamente

sono misurati attraverso scale a intervalli

equivalenti (esempio)

Scale di misure


– Nessuna indicazione vera sulla quantità

effettiva della caratteristica dei soggetti

misurati, nessuna indicazione vera sulla loro

posizione reciproca

Scale di misure


– Non c’e’ uno ZERO assoluto (ma ZERO

arbitrario) e, quindi, non possiamo parlare di

vera e propria quantità misurata

– Per questo non è possibile sostenere che un

individuo A possiede il costrutto di misura in

quantità doppia rispetto all’individuo B

(esempio trasformazione lineare)

Scale di misure

• Scala a rapporti equivalenti

– Proporzionale o razionale

– Elimina il limite dello ZERO arbitrario

– Le operazioni aritmetiche sono possibili sia

sulle differenze tra i valori, sia sui valori stessi

– Rimane arbitrario l’unità di misura

Scale di misure


– Individuo A risolve un problema in 1 minuto,

mentre individuo B ha bisogno di 2 minuti

> A la metà di B

– Cambiando l’unità, il rapporto non cambia

Scale di misure


– In psicologia le scale a rapporti equivalenti non

esistono, a meno che non si utilizzano misure

fisiche

• Tempi di reazione, parametri fisiologici, oscillazioni

magneto/elettroencefalografiche,

» neuroimmagini ,

Scale di misure


– Frequenza di un certo comportamento come

misura di una caratteristica psicologica

• Scala a intervalli o rapporti equivalenti?

• Variabile:

– Qualsiasi caratteristica che possa assumere

diversi valori in un dato intervallo

• Il sorgere del sole?

Variabili e mutabili

• Variabile:



• L’ora del sorgere del sole?


• Variabile:



• Risolvere un problema?


• Variabile:



• Il tempo per risolvere un problema?


• Variabile:



• Livello di ansia, intelligenza, peso, altezza, …


• Variabile: continua vs. discreta

– Variabili continue

• Continuità: la variabile può, teoricamente,

assumere qualsiasi valore della serie

numerica

> Solo l’imprecisione della misura la

rende discreta


• Variabile: continua vs. discreta

– Variabili discrete

• Possono assumere solo i valori interi della

serie numerica

Esistono pero’ anche variabili veramente

discreti


• Variabile: dipendente vs. independente

– Variabili indipendenti

• Input in un sistema, prendono valori

differenti liberamente


• Variabile: dipendente vs. independente

– Variabili dipendenti

• Cambiano come conseguenza dei

cambiamenti di altri valori nel sistema


• Mutabile

– Non classificabile in termini quantitativi

• Genere, appartenenza regionale

• Variabili continue/discrete ridotte

(classificate)


• Mutabile vs. variabile

– Mutabile: scala nominale

– Variabile: scala ordinale, a intervalli

equivalenti, o a rapporti equivalenti


• Frequenza:

– Il numero delle volte in cui si verifica un

determinato “evento” in un gruppo di altri

eventi

• Ad esempio: frequenza di mutabili (scala

nominale) o variabili (scala a intervalli o

rapporti equivalenti)

Concetto di frequenza

• Calcolo delle frequenze:

– La somma di tutte le frequenze è uguale a

n, il numero totale dei soggetti:

∑f = n

n = numero di casi

f = frequenza di un valore X


• Calcolo delle frequenze (variabili):

– Trasformazione variabili in classi

– Decisioni: numero di classi e l’ampiezza

degli intervalli

– Ampiezza: intervalli mutualmente esclusivi

– Limiti tabulati, limiti veri (reali),

X centrale (Xc)


• Calcolo delle frequenze:

– Trasformazione frequenze in distribuzione

di frequenze percentuali

f % = f * 100

n

f % = percentuale dei casi che assumano valore

X


• La costruzione de tabelle a doppia entrata

– Come si distribuiscono le frequenze nelle

diverse categorie?

– r righe (categorie e classi della prima

variabile) e c colonne (categorie e classi

della seconda variabile)



– Frequenze interne: le frequenze di occorrenza

simultanea delle categorie stesse

– Frequenze marginali per riga: somma di tutte le

frequenze interne della riga stessa

– Frequenze marginali per colonna: somma di tutte

le frequenze interne della colonna stessa



– Trasformazione frequenze in distribuzione

di frequenze percentuali

f % = f * 100

n

1.Frequenze percentuali per riga

2.Frequenze percentuali per colonna

3.Frequenze percentuali sul totale


• 2 parametri fondamentali

1. il valore che rappresenta l’insieme stesso

2. Il valore che specifica la variabilità

>>> descrivere l’oggetto della ricerca in modo

quantitativo

Le distribuzioni e la loro descrizione

• La tendenza centrale della distribuzione dei

dati e la loro dispersione

• La forma della distribuzione

La distribuzione di Gauss

o distribuzione normale


Carl Friedrich Gauss

1777 - 1855

• Indicatori di tendenza centrale e di

dispersione: scala nominale

Distribuzione di frequenze



dispersione: scala nominale

– Moda = l’osservazione che si presenta con

maggiore frequenza nella distribuzione dei dati

• Unico modo per sintetizzare dati qualitativi,

ma problematica con poche osservazioni, …

– Dispersione: dipende dal numero di categorie, …



dispersione: scala ordinale

– Anche per la scala ordinale gli indicatori di

tendenza centrale e di dispersione sono molto

limitati



dispersione: scala ordinale

– Mediana (Me) = modalità dell’osservazione che

divide la distribuzione al di sopra o al di sotto del

quale cade un ugual numero di osservazioni

– Distanza interquartilica (DI) = la distanza fra il

primo e terzo quartile (indicatore descrittivo )


• Indicatori di tendenza centrale: scala

ordinale

– Mediana (Me) = POS Me = n + 1

2

Ade esempio, serie di dati o dati raggruppati


• Indicatori di dispersione: scala ordinale

– Primo quartile = POS Q1 = n + 1

4 * 1

– Secondo quartile = POS Q2 = n + 1

4 * 2

– Terzo quartile = POS Q3 = n + 1

4 * 3


• POS Me

• POS Q1

• POS Q2

• POS Q3

• Differenza interquarilica DI = (Q3 - Q1)

- Ad esempio, scala ordinale, differenziale semantico,

Likert, …


• Indicatori di dispersione: scala ordinale

– In modo analogo si definiscono i

• Decili: nove punti che dividono la distribuzione

(/10) POS D1 – POS D9

• Percentili/centili: 99 punti (/100)

POS P1 – POS P99



dispersione: scala a intervallo o a rapporto

– Tendenza centrale: la media aritmetica:

somma delle misure osservate diviso il

numero delle osservazioni fatte

– Pero’, anche moda e mediana


• Indicatori di tendenza centrale: scala a

intervallo o a rapporto

– Tendenza centrale: la media aritmetica

(serie di dati)




– Tendenza centrale: la media aritmetica

(dati raggruppati)




– Tendenza centrale: la mediana (posizione e

valore esatto)

Dati raggruppati:

Me = x + POS Me – f cum * i

fi

• Meno sensibile agli estremi della distribuzione,

più stabile delle media nel caso di pochi o

estremi valori


• Indicatori di dispersione: scala a intervallo o

a rapporto

– Scarto semplice medio: SSM

• La media delle differenze dalla media

– Varianza: s2

• Media del quadrato degli scostamenti dalla

media

– Deviazione standard: s

• Radice quadrata della varianza



a rapporto

– Scarto semplice medio: SSM

• La media delle differenze dalla media



a rapporto

– Varianza: s2

• Media del quadrato degli scostamenti dalla

media


• µ e σ2

Media e varianza della popolazione

• x e s2

Media e varianza del campione



a rapporto

– Varianza: s2

• La quantità al numeratore della formula:

devianza (composto da più parti)

• La varianza non può essere mai negativa

• La varianza non utilizza la stessa unità di

misura usata per la media (indice quadratico)



a rapporto




• Indicatori di dispersione: scala a intervallo o a

rapporto


• Indicatore dello stesso ordine di grandezza della

media

• Circa 2/3 delle osservazioni cadono nell’intervallo

x ± 1s

• Circa 95% delle osservazioni cade nell’intervallo

x ± 2s

• Circa 99% delle osservazioni cade nell’intervallo

x ± 3s


• Indicatori di dispersione: scala a intervallo o a

rapporto




a rapporto



Formula abbreviata: non è necessario

calcolare gli scarti dalla media



a rapporto

– Coefficiente di variazione

• Indicatore di variabilità relativa



a rapporto

– Coefficiente di variazione

Vantaggi/svantaggi• La deviazione standard deve essere sempre interpretata nel

contesto del valore della media. CV invece non ha nessuna

dimensione.

• CV è utile per confrontare misure in unità diverse (ad

esempio redditi £ o $) o gruppi con media molto diversa

• Quando la media è vicina allo zero, CV infinita e molto

sensibile a piccoli cambiamenti della media


• La standardizzazione delle misure

– Standardizzare: riferire la misura stessa ad

una scala standard con media e varianza note

• La scala “standard” o “z”

• Media = 0

• Varianza = 1



– La distribuzione normale

• Curva di Gauss: una distribuzione teorica di

frequenza di punteggi di una popolazione

• Si pensi a una popolazione ―ideale‖, teoricamente

infinita, di punteggi della variabile x


Carl Friedrich Gauss

1777 - 1855



• La distribuzione di frequenza di x ha alcune

specifiche caratteristiche:

– Asse delle ascisse: valori x

– Asse delle ordinate: frequenze f(x) di ciascun valore






– La curva assume la caratteristica forma a campana






– E’ simmetrica è unimodale




• La distribuzione di frequenza di x ha alcune specifiche

caratteristiche:

– La media corrisponde al valore x con la massima frequenza.

– La curva è definita da due valori della distribuzione: la media (µ)

e la deviazione standard (σ)






– E’ asintotica all’asse orizzontale (ascisse)




• La distribuzione di frequenza di x ha alcune specifiche

caratteristiche:

– L’area sottesa dall’intera curva è 1 (100%)


• Covarianza: “variare insieme”

Misurare quanto due variabili cambiano insieme

– A) Forma: tipo di relazione

– B) Entità: legame tra le variabili

– C) Direzione: positiva, negativa

> Indica un rapporto predittivo fra variabili (non

causale!!!)

Relazioni tra variabili





• DIAGRAMMA DI DISPERSIONE


• 1) Coefficiente di correlazione lineare:

“Coefficiente di correlazione r di Bravais-Pearson‖

oppure

―Coefficiente di correlazione prodotto-momento‖

Relazione fra due variabili misurati su scala a

intervalli o a rapporti equivalenti

Il coefficiente r può assumere tutti i valori compresi

tra -1 e +1




oppure


Le 3 formule:

1) Utilizzando i punteggi standardizzati (z):

prodotto zxzy come misura di concordanza

fra x e y




oppure


Le 3 formule:

2) Basata su medie e deviazioni standard




oppure


Le 3 formule:

3) Basata sui dati grezzi




oppure


La covarianza: media del prodotto degli scarti di

ciascuna variabile dalla propria media

la varianza dell’intersezione tra x e y, cioè,

la parte di varianza comune alle due variabili


• 2) Coefficiente di correlazione tra ranghi

Coefficiente rs di Spearman

Relazione fra due variabili misurati su scala

ordinale, ma anche a intervalli o a rapporti

equivalenti



Coefficiente rs di Spearman

- rs varia tra -1 e +1.

- E una buona stima di r quando n è abbastanza

grande.

- Il calcolo di rs si basa sulle differenze riscontrate

tra i ranghi attribuiti nelle due variabili.

- Non necessariamente lineare

- Misura di associazione (dipendenza statistica)

- Non-parametrico (distribuzione non-normale)



Coefficiente tau di Kendall

- Utile quando il numero di ranghi uguali è elevato

- Di solito inferiore a rs

- Mai una buona stima di r

Correzione per ranghi uguali!!!



Coefficiente tau di Kendall


• 4) Il coefficiente di correlazione punto-biseriale rpb

Misurare la relazione tra una variabile su scala a

intervalli o rapporti equivalenti e una variabile

categoriale a due livelli (dicotomica: 0 1)

- Matematicamente equivalente a Pearson


• 5) Il coefficiente di correlazione tra variabili

dicotomiche

Coefficiente di correlazione rphi


• Data distribution:

- Il grado di dipendenza tra x e y non dipende dalla scala usata per esprimere

le variabili.

- La maggior parte delle misure di correlazione dipendono dalla selezione del

campione. Di solito, la dipendenza è più forte nel caso di una distribuzione

più larga.


• Attenzione!- Correlazione non implica una rapporto causale (ma non lo esclude…) e non

fornisce informazione riguardo alla direzione di un eventuale rapporto causale

(cosa causa cosa?).

- Correlazione non implica un rapporto lineare.

r=0.81

Importante

visualizzare

i dati !!!


• 5) La regressione

Variabile indipendente – variabile dipendente

Causa – effetto / antecedente - susseguente

Quanto v.i. spiega v.d?

Es. QI > successo scolastico

Età > Sviluppo lobo frontale

Personalità > qualità rapporti sociali



Variabile indipendente – variabile dipendente

Quanto v.i. spiega v.d?

"Half the money I spend on advertising is

wasted; the trouble is I don't know which half."

— John Wanamaker, 19th-century U.S.

department store pioneer



Coefficiente di correlatione: r

Coefficiente di determinazione: r2

Esprime la proporzione di varianza della variabile dipendente

che viene ―spiegata‖ dalla variabile indipendente

1- r2 è la proporzione della varianza della v.d. non spiegata dalla

v.i. (varianza residua)



L’equazione di regressione

“formula di predizione”

Criterio per scegliere la retta migliore possibile:

Criterio dei minimi quadrati

―La retta che rende minima la somma delle distanze al

quadrato tra le y (osservate) e y’ (stimate)‖

∑(yi – y’i)2 = minimo



y = a + bx

b: coefficiente di regressione

b = ∑(x-µx)(y- µy) = n ∑xy - ∑x ∑y

∑(x- µx)2 n∑x2-(∑x)2

a: l’intercetta sull’asse delle ordinate (y)

a = µy - bµx



"Half the money I spend on advertising is wasted; the trouble is I don't know which

half."

— John Wanamaker, 19th-century U.S. department store pioneer


• I principi di psicometria:

– ATTENDIBILITA’

– VALIDITA’



Misurare quanto due variabili cambiano insieme




> Indica un rapporto predittivo fra variabili (non

causale!!!)






• DIAGRAMMA DI DISPERSIONE



– La precisione dello strumento

• Quanto errore è incluso nella misura?

• Misurare un costrutto in modo consistente

nel tempo, fra individui, situazioni e item

(test-retest, coerenza interna)



– Variabili di interferenza test-retest (soggetti):

• cambio dell’ambiente, stato mentale (e.g.

stanchezza, malattia, problemi personali),

fattori di sviluppo (bambini)



– Variabili di interferenza test-retest (test):

• Istruzioni scadenti/variabili, codifica

soggettiva, la possibilità di tirare ad

indovinare, la difficoltà degli item, la

lunghezza del test



– Variabili di interferenza test-retest (vari):

• Intervallo di tempo (almeno 3 mesi), livello

di difficoltà degli item, campionamento dei

soggetti, dimensione del campione


• L’ATTENDIBILITA’: test-retest

– Coefficiente di attendibilità test-retest

&

Coefficiente di equivalenza (forme parallele)

– X = V + E

> Attendibilità: il rapporto tra la varianza della

parte vera e la varianza osservata

= sv2 / sx

2


• L’ATTENDIBILITA’: test-retest

– Formula profetica di Spearman-Brown:

correggere la stima dell’attendibilità quanto

calcolato con un numero minore di item,

rispetto al test totale


• L’ATTENDIBILITA’: coerenza interna

• Coerenza bassa: una parte del test misura la variabile, ma

impossibile che le altri parti misurano la stessa variabile

• Polemica: Cattell (coerenza interna alta è antitetica alla validità)

• La correlazione di un test con qualsiasi variabile non può mai essere

più alta della correlazione del test con se stesso.

– α di Cronbach

&

– K-R20 di Kuder-Richardson (item dicotomici)


• LA VALIDITA’

– La capacità di una misura di cogliere il

costrutto psicologico che ci interessa

• Misuro ciò che voglio misurare?

• In altre parole, i comportamenti misurati

riflettono veramente il costrutto (quale non è

direttamente osservabile)?


• LA VALIDITA’


Il grado in cui lo strumento misura effettivamente ciò

che intende di misurare

Ad esempio: un certo test QI misura l’intelligenza?


• LA VALIDITA’



Il grado di accordo fra diversi tentativi di misura dello

stesso costrutto / la convergenza fra diverse misure

Ad esempio: quanto è associato un nuovo test di ansia

ad altri test di ansia?

> ottenere la stessa diagnosi


• LA VALIDITA’



Il grado in cui i tentativi di misurare costrutti diversi

sono effettivamente distinguibili l’uno dall’altro

Ad esempio: empatia vs. estroversione.

> non confondere diverse diagnosi


• LA VALIDITA’


Confronto fra lo strumento (test) e una variabile di

criterio rappresentativo per il costrutto

Ad esempio: relazione fra un test di selezione del

personale e misure di prestazione al lavoro, oppure

relazione fra un test QI e prestazioni accademici


• LA VALIDITA’




altre misure dello stesso costrutto allo stesso

momento

Ad esempio: test – valutazione prestazione di lavoro


• LA VALIDITA’




altre misure dello stesso costrutto nel futuro

Ad esempio: valutazione esame di maturità –

valutazione esame di psicometria

> condizioni a rischio


• LA VALIDITA’

– Attenzione!

Una buona validità concorrente o predittiva

oppure

una mancanza di validità discriminante?


• Gli errori

Casuali

&

Sistematici

La teoria classica dell’errore si occupa dell’errore

casuale!

Il modello classico dell’errore dei test

• Gli errori

Un test è tanto più attendibile, quanto minore è il suo

errore


• Termini e assunzioni

– Il punteggio vero

• X = V + E

• ∑E / N = 0 (distribuzione normale degli errori)



– L’errore standard di misurazione

• Basato sul punteggio vero

• Stima della deviazione standard

• Quanto è maggiore la deviazione standard, tanto più grande

è l’errore

• Quanto è maggiore la correlazione test-retest, tanto più

piccolo è l’errore

3.1 ESmis = DSt / √1 – rtt



– L’universo, popolazione o dominio di item

• Test come selezione casuale di item

• Nella misura in cui gli item del test non riflettono l’universo

degli item, il test sarà sbagliato



– Il punteggio vero e l’universo degli item

• Il punteggio vero riflette il punteggio di un individuo se

fosse misurato su tutto l’universo degli item

• L’errore del test riflette quanto gli item riescono a

rappresentare un campione accurato dell’universo degli item

• Ovviamente, questo è troppo semplicistico…



– Presupposti statistici del modello

• r(media)ij : correlazione media tra gli item nell’universo

degli item

> indica in che misura esiste un nucleo comune fra gli item

• La dispersione delle correlazioni indica fino a che punto gli

item variano nel condividere questo nucleo comune

• Nel modello si assume che la correlazione media di ciascun

item con tutti gli altri non varia.



– Correlazione di un item con il punteggio vero

• 3.2 rit = √r(media)ij

La correlazione di un item con il punteggio vero è

uguale alla radice quadrata della sua correlazione

media con tutti gli altri item.

Quali item includere nel test?

quelli che possiedono un’alta correlazione media

con gli altri item; quelli che correlano in misura

elevata con il punteggio vero


• Attendibilità

– La correlazione media di un test (di un item) con tutti

i test (con tutti gli item) dell’universo si chiami

coefficiente di attendibilità: r11

– La radice quadrata dell’attendibilità è la correlazione

del test, o dell’item, con il punteggio vero (vedi

formula 3.2)


• Attendibilità

– Stime di attendibilità

• Non è possibile calcolare la correlazione media di

un test o di un item con tutti i test o item

dell’universo: è infinito!

• Per questo ogni coefficiente di attendibilità r11 è

solo una stima di r(media)11: i test o gli item non

sono mai un insieme casuale presi dall’universo


• Attendibilità

– Punteggi fallibili, ossia punteggi ottenuti

• Punteggio fallibile: X (=V+E)

• Secondo formula 3.2, la correlazione di un test o

un item con il punteggio vero è la radice quadrata

della sua attendibilità, quindi, tale correlazione

può essere calcolata.

• Stimare i punteggi standard veri in base ai

punteggi fallibili:

3.3 Z’1 = r1tZ1 = √r11Z1


• Attendibilità

– Punteggi fallibili, ossia punteggi ottenuti

• Punteggio fallibile: X (=V+E)

• Visto che il quadrato di una correlazione è la varianza

spiegata, r21t è la percentuale della varianza del

punteggio vero spiegabile da una misurazione fallibile

e vice versa. Quindi r11 è la stessa percentuale di

varianza di un punteggio vero nella misura fallibile.

• Oppure: 3.4 r11 = σt / σ1

che significa che l’attendibilità di un test può essere

vista come la quantità di varianza di un punteggio

vero in un test divisa per la varianza reale


• Attendibilità

– Omogeneità degli item e attendibilità

• Risulta che l’attendibilità è strettamente legata

alla correlazione degli item tra loro

• Dunque, c’è un rapporto fra l’attendibilità di un

test e la correlazione media fra gli item, ossia la

loro omogeneità. Le correlazioni, però, non sono

identiche, ma distribuiti intorno alla loro media

(distribuzione normale).


• Attendibilità


• Risulta che l’attendibilità è strettamente legata

alla correlazione degli item tra loro

• E’ possibile stimare la precisione del coefficiente

di attendibilità calcolando l’errore standard della

stima della correlazione media tra item

nell’universo di item

3.5 σstima r(media)ij = σrij / √(1/2) k(k-1) -1


• Attendibilità


• Formula 3.5 chiarisce tre punti importanti:

1) Quanto più le correlazioni fra gli item

differiscono fra loro, tanto è maggiore l’errore

standard di questa stima

2) Col crescere del numero di item, deve

diminuire l’errore standard della stima

3) Aumentando l’omogeneità e la lunghezza di un

test, cresce la precisione della stima della sua

attendibilità


• Attendibilità

– Modello classico dell’errore

• Principi per la costruzione dei test:

1) Attendibilità e lunghezza del test

2) Attendibilità e campioni di item

3) errore standard di errore


• Attendibilità

– Attendibilità e lunghezza di un test

• Più un test è breve, più è utile. In pratica, brevità e

attendibilità si compensano a vicenda

• La formula profetica di Spearman-Brown: stima

della correlazione di un test di k item con un altro

insieme di k item tratto dello stesso universo.

Ogni metà del test può essere considerata come un

campione preso dall’universo degli item.


• Attendibilità

– Attendibilità e campioni di item

• E’ tedioso e costoso calcolare tutte le correlazioni

fra gli item. Esistono metodi più semplici per

raggiungere lo stesso risultato:

Coefficiente alpha (di Cronbach)

Al posto della correlazione media fra gli item

viene utilizzata la covarianza media fra gli item.

Al posto dell’1 nel denominatore viene utilizzata

la media della varianza degli item.


• Attendibilità

– Attendibilità e campioni di item

• Coefficiente alpha (di Cronbach)

– I test attendibili hanno una varianza maggiore rispetto

alle misure inattendibili (più discriminante)

– Quanto è più bassa l’attendibilità tanto più è grande

l’errore standard


86194482 Psicometria I

Documents

Transcript of 86194482 Psicometria I