METODOLOGIA DELLA RICERCA EPG PSICOMETRIA II -INTRODUZIONE- Fascia I-Z [email protected] .
86194482 Psicometria I
Transcript of 86194482 Psicometria I
PSICOMETRIA I
a.a. 2010-2011
Fascia DI-M Dott. Sjoerd Ebisch
Ricevimento: Ore 10-11 presso il laboratorio di psicometria
Sir Francis Galton
1822-1911
Obiettivi formativi:
Il programma si propone di offrire allo studente
un’introduzione alle tematiche connesse alla misura in
psicologia e una trattazione dei concetti di base per
affrontare problemi di quantificazione e di
elaborazione di dati.
Programma del corso:
Gli argomenti trattati saranno:
1) la misura in psicologia: attendibilità e validità dei test, il modello
classico dell’errore;
2) le variabili;
3) le scale di misura;
4) frequenze e distribuzioni di frequenze;
5) tabelle e grafici;
6) indici di tendenza centrale: media, moda e mediana;
7) indici di dispersione: deviazione standard e varianza;
8) indici di posizione: quartili, decili e percentili;
9) standardizzazione;
10) relazioni tra variabili: gli indici di correlazione e la regressione
semplice.
Modalità d'esame:
L’esame consiste in una prova scritta con domande a scelta multipla
ed esercizi da svolgere e un’eventuale prova di integrazione orale.
Libri di testo:
Per la parte relativa al punto 1, la misura in psicologia:
• Kline, P., Manuale di Psicometria, Roma, Astrolabio 1996
(esclusivamente dal Capitolo 1 al Capitolo 3)
Per la parte relativa alla statistica descrittiva (punti 2-10):
• Areni, Ercolani, Leone (2001), Statistica per la psicologia, vol. 1.
Fondamenti di psicometria e statistica descrittiva.
Esercizi:
• Areni, A., Scalisi, T. G. e Bosco, A. Esercitazioni di psicometria.
Masson, 2005 (pag. 348).
CHE COSA E’ PSICOMETRIA?
• La psicometria studia la teoria e la tecnica della misura
in psicologia
• La misura di:
– Intelligenza, conoscenza, abilità, atteggiamento,
personalità, …
CHE COSA E’ PSICOMETRIA?
• La psicometria studia la teoria e la tecnica della misura
in psicologia
• La misura di:
– Intelligenza, conoscenza, abilità, atteggiamento,
personalità, …
1) la costruzione degli strumenti e delle procedure per la
misura (psicologiche)
2) lo sviluppo ed il perfezionamento dei metodi teorici
della misura
La quantificazione in psicologia
• Psicometria:
« l'assegnazione dei numeri agli oggetti o agli
eventi, secondo una certa regola »
• Fisica:
« la misura è la valutazione e l'espressione
numerica della grandezza di una quantità
riguardante un altro evento »
La quantificazione in psicologia
• La misura delle caratteristiche psicologiche:
– Indiretta, ottenute mediante inferenza
Esempio:
Intelligenza > comportamento > osservazioni
• L’imprecisione della misura: elevata nella
psicologia
– attendibilità
• Perché? Cosa rende imprecisa e controversa la
misure psicologica?
– Percezione diretta vs. osservazione indiretta
• Definizione della caratteristica comportamentale
– teoria e validità
La quantificazione in psicologia
• Costrutto (psicologico): caratteristica psicologica
> concetto/idea
La quantificazione in psicologia
• Costrutto (psicologico): caratteristica psicologica
> concetto/idea
Ad esempio:
Francis Galton: intelligence is a true, biologically-based mental faculty
that can be studied by measuring a person's reaction times to cognitive
tasks
Alfred Binet, and the French school of intelligence: intelligence is an
aggregate of dissimilar abilities, not a unitary entity with specific,
identifiable properties
La quantificazione in psicologia
• Intelligence (Mainstream Science on Intelligence, 1994)
A very general mental capability that, among other things, involves the ability
to reason, plan, solve problems, think abstractly, comprehend complex ideas,
learn quickly and learn from experience. It is not merely book learning, a
narrow academic skill, or test-taking smarts. Rather, it reflects a broader and
deeper capability for comprehending our surroundings—"catching on,"
"making sense" of things, or "figuring out" what to do
La quantificazione in psicologia
• Intelligence (Intelligence: Knowns and Unknowns,1995, Psychological
Association):
Individuals differ from one another in their ability to understand complex ideas,
to adapt effectively to the environment, to learn from experience, to engage
in various forms of reasoning, to overcome obstacles by taking thought.
Although these individual differences can be substantial, they are never
entirely consistent: a given person's intellectual performance will vary on
different occasions, in different domains, as judged by different criteria.
Concepts of "intelligence" are attempts to clarify and organize this complex
set of phenomena. Although considerable clarity has been achieved in some
areas, no such conceptualization has yet answered all the important
questions, and none commands universal assent. Indeed, when two dozen
prominent theorists were recently asked to define intelligence, they gave two
dozen, somewhat different, definitions
La quantificazione in psicologia
• Scopo della misura in psicologia:
– La descrizione dell’oggetto di studio
> studio scientifico
> applicazioni pratiche
• Come altre misure: la quantificazione,
l’assegnazione di numero a oggetti secondo
determinate regole
La quantificazione in psicologia
• I test psicologici e contesti
– Cognitivi
> abilità (capacità specifiche), intelligenza
(abilità generali), profitto (capacità in una
materia specifica), attitudine (prestazioni
future)
La quantificazione in psicologia
• I test psicologici e contesti
– Non-cognitivi
> Personalità (tratti): questionari standardizzati,
interviste, osservazioni dirette, proiettivi
> Atteggiamento (dimensione valutativa): rilevante
per il rapporto fra valutazione-comportamento
La quantificazione in psicologia
• Scale di atteggiamento:
– Thurstone
La quantificazione in psicologia
Agree Disagree
I like going to Chinese
restaurants[ ] [ ]
Chinese restaurants provide good
value for money[ ] [ ]
There are one or more Chinese
restaurants near where I live[ ] [ ]
I only go to restaurants with
others (never alone)[ ] [ ]
• L’ATTENDIBILITA’
– La precisione dello strumento
• Quanto errore è incluso nella misura?
• Misurare un costrutto in modo consistente
nel tempo, fra individui, situazioni e item
(test-retest, coerenza interna)
La quantificazione in psicologia
• L’ATTENDIBILITA’
– Variabili di interferenza test-retest (soggetti):
• cambio dell’ambiente, stato mentale (e.g.
stanchezza, malattia, problemi personali),
fattori di sviluppo (bambini)
La quantificazione in psicologia
• L’ATTENDIBILITA’
– Variabili di interferenza test-retest (test):
• Istruzioni scadenti/variabili, codifica
soggettiva, la possibilità di tirare ad
indovinare, la difficoltà degli item, la
lunghezza del test
La quantificazione in psicologia
• L’ATTENDIBILITA’
– Variabili di interferenza test-retest (vari):
• Intervallo di tempo (almeno 3 mesi), livello
di difficoltà degli item, campionamento dei
soggetti, dimensione del campione
La quantificazione in psicologia
• LA VALIDITA’
– La capacità di una misura di cogliere il
costrutto psicologico che ci interessa
• Misuro ciò che voglio misurare?
• In altre parole, i comportamenti misurati
riflettono veramente il costrutto (quale non è
direttamente osservabile)?
La quantificazione in psicologia
• L’ATTENDIBILITA’
X: misura V: vero E: errore
X = V + E
ρ (rho) = V__ = la percentuale di X che non
V + E riflette l’errore
La quantificazione in psicologia
• L’ATTENDIBILITA’
X: misura V: vero E: errore
X = V + E
ρ (rho) = V__ = la percentuale di X che non
V + E riflette l’errore
! Non possiamo sapere V
La quantificazione in psicologia
• LA VALIDITA’
– Validità di contenuto
– Validità di costrutto
• Validità convergente
• Validità discriminante
– Validità di criterio
• Validità concorrente
• Validità predittiva
– Validità nomologica
– L’attendibilità
La quantificazione in psicologia
• LA VALIDITA’
– Validità di contenuto
La capacità dello strumento di rappresentare
accuratamente l’universo di comportamenti del
costrutto
Non statistico
Ad esempio: il test QI include tutte le aree considerate
rilevanti nella letterature scientifica?
La quantificazione in psicologia
• LA VALIDITA’
– Validità di costrutto
Il grado in cui lo strumento misura effettivamente ciò
che intende di misurare
Ad esempio: un certo test QI misura l’intelligenza?
La quantificazione in psicologia
• LA VALIDITA’
– Validità di costrutto
• Validità convergente
Il grado di accordo fra diversi tentativi di misura dello
stesso costrutto / la convergenza fra diverse misure
Ad esempio: quanto è associato un nuovo test di ansia
ad altri test di ansia?
> ottenere la stessa diagnosi
La quantificazione in psicologia
• LA VALIDITA’
– Validità di costrutto
• Validità discriminante
Il grado in cui i tentativi di misurare costrutti diversi
sono effettivamente distinguibili l’uno dall’altro
Ad esempio: empatia vs. estroversione.
> non confondere diverse diagnosi
La quantificazione in psicologia
• LA VALIDITA’
– Validità di criterio
Confronto fra lo strumento (test) e una variabile di
criterio rappresentativo per il costrutto
Ad esempio: relazione fra un test di selezione del
personale e misure di prestazione al lavoro, oppure
relazione fra un test QI e prestazioni accademici
La quantificazione in psicologia
• LA VALIDITA’
– Validità di criterio
• Validità concorrente
Il grado in cui la misura dello strumento correla con
altre misure dello stesso costrutto allo stesso
momento
Ad esempio: test – valutazione prestazione di lavoro
La quantificazione in psicologia
• LA VALIDITA’
– Validità di criterio
• Validità predittiva
Il grado in cui la misura dello strumento correla con
altre misure dello stesso costrutto nel futuro
Ad esempio: valutazione esame di maturità –
valutazione esame di psicometria
> condizioni a rischio
La quantificazione in psicologia
• LA VALIDITA’
– Teoria di riferimento:
• Validità concorrente vs. predittiva
Due concetti non dipendenti, ma riflettono aspetti
diversi dello stesso costrutto: concorrente (ansia -
depressione)
Due concetti dipendenti: predittiva (motivazione >
successo lavorativo)
La quantificazione in psicologia
• LA VALIDITA’
– Validità nomologica
Il grado in cui le ipotesi basate sulla misura del
costrutto vengono effettivamente verificate,
considerando uno schema concettuale che include
anche altri costrutti teoricamente correlate
Complesso di associazioni fra il costrutto e una
molteplicità di criteri
La quantificazione in psicologia
• LA VALIDITA’
– L’attendibilità
Condizione necessaria per la verifica della validità (ma
non sufficiente)
Caso: test item aspecifico (misura costrutto A ed un po’
B)
Attendibilità = Va + Vb__
Va + Vb + E
Validità di A= Va____
Va + Vb + E
La quantificazione in psicologia
• ATTENDIBILITA’ & VALIDITA’
Una misura può essere attendibile senza essere
necessariamente valida
ma
l’attendibilità e’ necessaria (ma non sufficiente)
per la validità
La quantificazione in psicologia
Scale di misure
• Scala nominale
– Categorizzare
• Maschio vs. femmina (dicotomica)
• Sani, ansiosi, nevrotici, psicotici, depressi,
…
• Abruzzo, Puglia, Campania, Molise, Marche,
Lazio, altri (esempio)
Scale di misure
• Scala nominale
– Equivalenza nelle categorie, non equivalenza
fra le categorie
> Relazione di equivalenza: simmetrica e
transitiva:
• Individuo A = individuo B
allora B = A (simmetria)
• B = C
allora anche A = C (transitiva)
Scale di misure
• Scala nominale
– Equivalenza nelle categorie, non equivalenza
fra le categorie
> Relazione di non equivalenza: simmetrica e
non transitiva:
• Individuo A ≠ individuo B
allora B ≠ A (simmetria)
• Ma se A ≠ B ≠ C
A = C oppure A ≠ C (non transitiva)
Scale di misure
• Scala nominale
– Statistica: contare frequenze nelle categorie,
confrontare le frequenze
Scala come qualcosa che discrimina
Classificazione come la base di ogni misura, ma
livelli di classificazione possono essere più o
meno precisi
Scale di misure
• Scala ordinale
– Quantitativa: ordine
• Numero 1 rappresenta una quantità superiore
rispetto a n. 2, etc.
• Lo stesso numero rappresenta la stessa
quantità della caratteristica in esame
• Il numero assegnato non rappresenta
direttamente la quantità, ma solo l’ordine
(più grande di …)
Scale di misure
Scala ordinale: ad esempio preferenze:
Esempio: Miglior film 2011
A) Il discorso del re
B) Il cigno nero
• The Fighter
• Inception
• I ragazzi stanno bene
• 127 ore
C) The Social Network
D) Toy Story 3 - La grande fuga
E) Il Grinta
• Un gelido inverno
Scale di misure
• Scala ordinale
– Relazione di equivalenza fra soggetti con lo stesso
numero (valore)
– Relazione di ordine fra le ripartizioni / classe /
categorie
> asimmetrica e transitiva
• Individuo A > individuo B
ma B non è > A (asimmetria)
• A > B e B > C
allora A > C (transitiva)
Scale di misure
• Scala a intervalli equivalenti
– Nominale: uguale-non uguale
– Ordinale: più grande di …
– Intervalli equivalenti: distanza, quanto più
grande di …
– Unità di misura costante
Scale di misure
• Scala a intervalli equivalenti
– Nominale: uguale-non uguale
– Ordinale: più grande di…
– Intervalli equivalenti: distanza
– Unità di misura costante, che consente tecniche
statistiche più sofisticate
Problema: difficile ottenere intervalli uguali!
Scale di misure
• Scala a intervalli equivalenti
– Le misure di costrutti psicologici solitamente
sono misurati attraverso scale a intervalli
equivalenti (esempio)
Scale di misure
• Scala a intervalli equivalenti
– Nessuna indicazione vera sulla quantità
effettiva della caratteristica dei soggetti
misurati, nessuna indicazione vera sulla loro
posizione reciproca
Scale di misure
• Scala a intervalli equivalenti
– Non c’e’ uno ZERO assoluto (ma ZERO
arbitrario) e, quindi, non possiamo parlare di
vera e propria quantità misurata
– Per questo non è possibile sostenere che un
individuo A possiede il costrutto di misura in
quantità doppia rispetto all’individuo B
(esempio trasformazione lineare)
Scale di misure
• Scala a rapporti equivalenti
– Proporzionale o razionale
– Elimina il limite dello ZERO arbitrario
– Le operazioni aritmetiche sono possibili sia
sulle differenze tra i valori, sia sui valori stessi
– Rimane arbitrario l’unità di misura
Scale di misure
• Scala a rapporti equivalenti
– Individuo A risolve un problema in 1 minuto,
mentre individuo B ha bisogno di 2 minuti
> A la metà di B
– Cambiando l’unità, il rapporto non cambia
Scale di misure
• Scala a rapporti equivalenti
– In psicologia le scale a rapporti equivalenti non
esistono, a meno che non si utilizzano misure
fisiche
• Tempi di reazione, parametri fisiologici, oscillazioni
magneto/elettroencefalografiche,
» neuroimmagini ,
Scale di misure
• Scala a rapporti equivalenti
– Frequenza di un certo comportamento come
misura di una caratteristica psicologica
• Scala a intervalli o rapporti equivalenti?
• Variabile:
– Qualsiasi caratteristica che possa assumere
diversi valori in un dato intervallo
• Il sorgere del sole?
Variabili e mutabili
• Variabile:
– Qualsiasi caratteristica che possa assumere
diversi valori in un dato intervallo
• L’ora del sorgere del sole?
Variabili e mutabili
• Variabile:
– Qualsiasi caratteristica che possa assumere
diversi valori in un dato intervallo
• Risolvere un problema?
Variabili e mutabili
• Variabile:
– Qualsiasi caratteristica che possa assumere
diversi valori in un dato intervallo
• Il tempo per risolvere un problema?
Variabili e mutabili
• Variabile:
– Qualsiasi caratteristica che possa assumere
diversi valori in un dato intervallo
• Livello di ansia, intelligenza, peso, altezza, …
Variabili e mutabili
• Variabile: continua vs. discreta
– Variabili continue
• Continuità: la variabile può, teoricamente,
assumere qualsiasi valore della serie
numerica
> Solo l’imprecisione della misura la
rende discreta
Variabili e mutabili
• Variabile: continua vs. discreta
– Variabili discrete
• Possono assumere solo i valori interi della
serie numerica
Esistono pero’ anche variabili veramente
discreti
Variabili e mutabili
• Variabile: dipendente vs. independente
– Variabili indipendenti
• Input in un sistema, prendono valori
differenti liberamente
Variabili e mutabili
• Variabile: dipendente vs. independente
– Variabili dipendenti
• Cambiano come conseguenza dei
cambiamenti di altri valori nel sistema
Variabili e mutabili
• Mutabile
– Non classificabile in termini quantitativi
• Genere, appartenenza regionale
• Variabili continue/discrete ridotte
(classificate)
Variabili e mutabili
• Mutabile vs. variabile
– Mutabile: scala nominale
– Variabile: scala ordinale, a intervalli
equivalenti, o a rapporti equivalenti
Variabili e mutabili
• Frequenza:
– Il numero delle volte in cui si verifica un
determinato “evento” in un gruppo di altri
eventi
• Ad esempio: frequenza di mutabili (scala
nominale) o variabili (scala a intervalli o
rapporti equivalenti)
Concetto di frequenza
• Calcolo delle frequenze:
– La somma di tutte le frequenze è uguale a
n, il numero totale dei soggetti:
∑f = n
n = numero di casi
f = frequenza di un valore X
Concetto di frequenza
• Calcolo delle frequenze (variabili):
– Trasformazione variabili in classi
– Decisioni: numero di classi e l’ampiezza
degli intervalli
– Ampiezza: intervalli mutualmente esclusivi
– Limiti tabulati, limiti veri (reali),
X centrale (Xc)
Concetto di frequenza
• Calcolo delle frequenze:
– Trasformazione frequenze in distribuzione
di frequenze percentuali
f % = f * 100
n
f % = percentuale dei casi che assumano valore
X
Concetto di frequenza
• La costruzione de tabelle a doppia entrata
– Come si distribuiscono le frequenze nelle
diverse categorie?
– r righe (categorie e classi della prima
variabile) e c colonne (categorie e classi
della seconda variabile)
Concetto di frequenza
• La costruzione de tabelle a doppia entrata
– Frequenze interne: le frequenze di occorrenza
simultanea delle categorie stesse
– Frequenze marginali per riga: somma di tutte le
frequenze interne della riga stessa
– Frequenze marginali per colonna: somma di tutte
le frequenze interne della colonna stessa
Concetto di frequenza
• La costruzione de tabelle a doppia entrata
– Trasformazione frequenze in distribuzione
di frequenze percentuali
f % = f * 100
n
1.Frequenze percentuali per riga
2.Frequenze percentuali per colonna
3.Frequenze percentuali sul totale
Concetto di frequenza
• 2 parametri fondamentali
1. il valore che rappresenta l’insieme stesso
2. Il valore che specifica la variabilità
>>> descrivere l’oggetto della ricerca in modo
quantitativo
Le distribuzioni e la loro descrizione
• La tendenza centrale della distribuzione dei
dati e la loro dispersione
• La forma della distribuzione
La distribuzione di Gauss
o distribuzione normale
Le distribuzioni e la loro descrizione
Carl Friedrich Gauss
1777 - 1855
• Indicatori di tendenza centrale e di
dispersione: scala nominale
Distribuzione di frequenze
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale e di
dispersione: scala nominale
– Moda = l’osservazione che si presenta con
maggiore frequenza nella distribuzione dei dati
• Unico modo per sintetizzare dati qualitativi,
ma problematica con poche osservazioni, …
– Dispersione: dipende dal numero di categorie, …
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale e di
dispersione: scala ordinale
– Anche per la scala ordinale gli indicatori di
tendenza centrale e di dispersione sono molto
limitati
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale e di
dispersione: scala ordinale
– Mediana (Me) = modalità dell’osservazione che
divide la distribuzione al di sopra o al di sotto del
quale cade un ugual numero di osservazioni
– Distanza interquartilica (DI) = la distanza fra il
primo e terzo quartile (indicatore descrittivo )
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale: scala
ordinale
– Mediana (Me) = POS Me = n + 1
2
Ade esempio, serie di dati o dati raggruppati
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala ordinale
– Primo quartile = POS Q1 = n + 1
4 * 1
– Secondo quartile = POS Q2 = n + 1
4 * 2
– Terzo quartile = POS Q3 = n + 1
4 * 3
Le distribuzioni e la loro descrizione
• POS Me
• POS Q1
• POS Q2
• POS Q3
• Differenza interquarilica DI = (Q3 - Q1)
- Ad esempio, scala ordinale, differenziale semantico,
Likert, …
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala ordinale
– In modo analogo si definiscono i
• Decili: nove punti che dividono la distribuzione
(/10) POS D1 – POS D9
• Percentili/centili: 99 punti (/100)
POS P1 – POS P99
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale e di
dispersione: scala a intervallo o a rapporto
– Tendenza centrale: la media aritmetica:
somma delle misure osservate diviso il
numero delle osservazioni fatte
– Pero’, anche moda e mediana
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale: scala a
intervallo o a rapporto
– Tendenza centrale: la media aritmetica
(serie di dati)
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale: scala a
intervallo o a rapporto
– Tendenza centrale: la media aritmetica
(dati raggruppati)
Le distribuzioni e la loro descrizione
• Indicatori di tendenza centrale: scala a
intervallo o a rapporto
– Tendenza centrale: la mediana (posizione e
valore esatto)
Dati raggruppati:
Me = x + POS Me – f cum * i
fi
• Meno sensibile agli estremi della distribuzione,
più stabile delle media nel caso di pochi o
estremi valori
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Scarto semplice medio: SSM
• La media delle differenze dalla media
– Varianza: s2
• Media del quadrato degli scostamenti dalla
media
– Deviazione standard: s
• Radice quadrata della varianza
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Scarto semplice medio: SSM
• La media delle differenze dalla media
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Varianza: s2
• Media del quadrato degli scostamenti dalla
media
Le distribuzioni e la loro descrizione
• µ e σ2
Media e varianza della popolazione
• x e s2
Media e varianza del campione
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Varianza: s2
• La quantità al numeratore della formula:
devianza (composto da più parti)
• La varianza non può essere mai negativa
• La varianza non utilizza la stessa unità di
misura usata per la media (indice quadratico)
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Deviazione standard: s
• Radice quadrata della varianza
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o a
rapporto
– Deviazione standard: s
• Indicatore dello stesso ordine di grandezza della
media
• Circa 2/3 delle osservazioni cadono nell’intervallo
x ± 1s
• Circa 95% delle osservazioni cade nell’intervallo
x ± 2s
• Circa 99% delle osservazioni cade nell’intervallo
x ± 3s
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o a
rapporto
– Deviazione standard: s
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Deviazione standard: s
• Radice quadrata della varianza
Formula abbreviata: non è necessario
calcolare gli scarti dalla media
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Coefficiente di variazione
• Indicatore di variabilità relativa
Le distribuzioni e la loro descrizione
• Indicatori di dispersione: scala a intervallo o
a rapporto
– Coefficiente di variazione
Vantaggi/svantaggi• La deviazione standard deve essere sempre interpretata nel
contesto del valore della media. CV invece non ha nessuna
dimensione.
• CV è utile per confrontare misure in unità diverse (ad
esempio redditi £ o $) o gruppi con media molto diversa
• Quando la media è vicina allo zero, CV infinita e molto
sensibile a piccoli cambiamenti della media
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– Standardizzare: riferire la misura stessa ad
una scala standard con media e varianza note
• La scala “standard” o “z”
• Media = 0
• Varianza = 1
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– La distribuzione normale
• Curva di Gauss: una distribuzione teorica di
frequenza di punteggi di una popolazione
• Si pensi a una popolazione ―ideale‖, teoricamente
infinita, di punteggi della variabile x
Le distribuzioni e la loro descrizione
Carl Friedrich Gauss
1777 - 1855
• La standardizzazione delle misure
– La distribuzione normale
• La distribuzione di frequenza di x ha alcune
specifiche caratteristiche:
– Asse delle ascisse: valori x
– Asse delle ordinate: frequenze f(x) di ciascun valore
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– La distribuzione normale
• La distribuzione di frequenza di x ha alcune
specifiche caratteristiche:
– La curva assume la caratteristica forma a campana
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– La distribuzione normale
• La distribuzione di frequenza di x ha alcune
specifiche caratteristiche:
– E’ simmetrica è unimodale
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– La distribuzione normale
• La distribuzione di frequenza di x ha alcune specifiche
caratteristiche:
– La media corrisponde al valore x con la massima frequenza.
– La curva è definita da due valori della distribuzione: la media (µ)
e la deviazione standard (σ)
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– La distribuzione normale
• La distribuzione di frequenza di x ha alcune
specifiche caratteristiche:
– E’ asintotica all’asse orizzontale (ascisse)
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– La distribuzione normale
• La distribuzione di frequenza di x ha alcune specifiche
caratteristiche:
– L’area sottesa dall’intera curva è 1 (100%)
Le distribuzioni e la loro descrizione
• La standardizzazione delle misure
– La distribuzione normale
Le distribuzioni e la loro descrizione
• Covarianza: “variare insieme”
Misurare quanto due variabili cambiano insieme
– A) Forma: tipo di relazione
– B) Entità: legame tra le variabili
– C) Direzione: positiva, negativa
> Indica un rapporto predittivo fra variabili (non
causale!!!)
Relazioni tra variabili
• Covarianza: “variare insieme”
– A) Forma: tipo di relazione
– B) Entità: legame tra le variabili
– C) Direzione: positiva, negativa
• DIAGRAMMA DI DISPERSIONE
Relazioni tra variabili
• 1) Coefficiente di correlazione lineare:
“Coefficiente di correlazione r di Bravais-Pearson‖
oppure
―Coefficiente di correlazione prodotto-momento‖
Relazione fra due variabili misurati su scala a
intervalli o a rapporti equivalenti
Il coefficiente r può assumere tutti i valori compresi
tra -1 e +1
Relazioni tra variabili
• 1) Coefficiente di correlazione lineare:
“Coefficiente di correlazione r di Bravais-Pearson‖
oppure
―Coefficiente di correlazione prodotto-momento‖
Le 3 formule:
1) Utilizzando i punteggi standardizzati (z):
prodotto zxzy come misura di concordanza
fra x e y
Relazioni tra variabili
• 1) Coefficiente di correlazione lineare:
“Coefficiente di correlazione r di Bravais-Pearson‖
oppure
―Coefficiente di correlazione prodotto-momento‖
Le 3 formule:
2) Basata su medie e deviazioni standard
Relazioni tra variabili
• 1) Coefficiente di correlazione lineare:
“Coefficiente di correlazione r di Bravais-Pearson‖
oppure
―Coefficiente di correlazione prodotto-momento‖
Le 3 formule:
3) Basata sui dati grezzi
Relazioni tra variabili
• 1) Coefficiente di correlazione lineare:
“Coefficiente di correlazione r di Bravais-Pearson‖
oppure
―Coefficiente di correlazione prodotto-momento‖
La covarianza: media del prodotto degli scarti di
ciascuna variabile dalla propria media
la varianza dell’intersezione tra x e y, cioè,
la parte di varianza comune alle due variabili
Relazioni tra variabili
• 2) Coefficiente di correlazione tra ranghi
Coefficiente rs di Spearman
Relazione fra due variabili misurati su scala
ordinale, ma anche a intervalli o a rapporti
equivalenti
Relazioni tra variabili
• 2) Coefficiente di correlazione tra ranghi
Coefficiente rs di Spearman
- rs varia tra -1 e +1.
- E una buona stima di r quando n è abbastanza
grande.
- Il calcolo di rs si basa sulle differenze riscontrate
tra i ranghi attribuiti nelle due variabili.
- Non necessariamente lineare
- Misura di associazione (dipendenza statistica)
- Non-parametrico (distribuzione non-normale)
Relazioni tra variabili
• 3) Coefficiente di correlazione tra ranghi
Coefficiente tau di Kendall
- Utile quando il numero di ranghi uguali è elevato
- Di solito inferiore a rs
- Mai una buona stima di r
Correzione per ranghi uguali!!!
Relazioni tra variabili
• 4) Il coefficiente di correlazione punto-biseriale rpb
Misurare la relazione tra una variabile su scala a
intervalli o rapporti equivalenti e una variabile
categoriale a due livelli (dicotomica: 0 1)
- Matematicamente equivalente a Pearson
Relazioni tra variabili
• 5) Il coefficiente di correlazione tra variabili
dicotomiche
Coefficiente di correlazione rphi
Relazioni tra variabili
• Data distribution:
- Il grado di dipendenza tra x e y non dipende dalla scala usata per esprimere
le variabili.
- La maggior parte delle misure di correlazione dipendono dalla selezione del
campione. Di solito, la dipendenza è più forte nel caso di una distribuzione
più larga.
Relazioni tra variabili
• Attenzione!- Correlazione non implica una rapporto causale (ma non lo esclude…) e non
fornisce informazione riguardo alla direzione di un eventuale rapporto causale
(cosa causa cosa?).
- Correlazione non implica un rapporto lineare.
r=0.81
Importante
visualizzare
i dati !!!
Relazioni tra variabili
• 5) La regressione
Variabile indipendente – variabile dipendente
Causa – effetto / antecedente - susseguente
Quanto v.i. spiega v.d?
Es. QI > successo scolastico
Età > Sviluppo lobo frontale
Personalità > qualità rapporti sociali
Relazioni tra variabili
• 5) La regressione
Variabile indipendente – variabile dipendente
Quanto v.i. spiega v.d?
"Half the money I spend on advertising is
wasted; the trouble is I don't know which half."
— John Wanamaker, 19th-century U.S.
department store pioneer
Relazioni tra variabili
• 5) La regressione
Coefficiente di correlatione: r
Coefficiente di determinazione: r2
Esprime la proporzione di varianza della variabile dipendente
che viene ―spiegata‖ dalla variabile indipendente
1- r2 è la proporzione della varianza della v.d. non spiegata dalla
v.i. (varianza residua)
Relazioni tra variabili
• 5) La regressione
L’equazione di regressione
“formula di predizione”
Criterio per scegliere la retta migliore possibile:
Criterio dei minimi quadrati
―La retta che rende minima la somma delle distanze al
quadrato tra le y (osservate) e y’ (stimate)‖
∑(yi – y’i)2 = minimo
Relazioni tra variabili
• 5) La regressione
y = a + bx
b: coefficiente di regressione
b = ∑(x-µx)(y- µy) = n ∑xy - ∑x ∑y
∑(x- µx)2 n∑x2-(∑x)2
a: l’intercetta sull’asse delle ordinate (y)
a = µy - bµx
Relazioni tra variabili
• 5) La regressione
"Half the money I spend on advertising is wasted; the trouble is I don't know which
half."
— John Wanamaker, 19th-century U.S. department store pioneer
Relazioni tra variabili
• Covarianza: “variare insieme”
Misurare quanto due variabili cambiano insieme
– A) Forma: tipo di relazione
– B) Entità: legame tra le variabili
– C) Direzione: positiva, negativa
> Indica un rapporto predittivo fra variabili (non
causale!!!)
Relazioni tra variabili
• Covarianza: “variare insieme”
– A) Forma: tipo di relazione
– B) Entità: legame tra le variabili
– C) Direzione: positiva, negativa
• DIAGRAMMA DI DISPERSIONE
Relazioni tra variabili
• L’ATTENDIBILITA’
– La precisione dello strumento
• Quanto errore è incluso nella misura?
• Misurare un costrutto in modo consistente
nel tempo, fra individui, situazioni e item
(test-retest, coerenza interna)
La quantificazione in psicologia
• L’ATTENDIBILITA’
– Variabili di interferenza test-retest (soggetti):
• cambio dell’ambiente, stato mentale (e.g.
stanchezza, malattia, problemi personali),
fattori di sviluppo (bambini)
La quantificazione in psicologia
• L’ATTENDIBILITA’
– Variabili di interferenza test-retest (test):
• Istruzioni scadenti/variabili, codifica
soggettiva, la possibilità di tirare ad
indovinare, la difficoltà degli item, la
lunghezza del test
La quantificazione in psicologia
• L’ATTENDIBILITA’
– Variabili di interferenza test-retest (vari):
• Intervallo di tempo (almeno 3 mesi), livello
di difficoltà degli item, campionamento dei
soggetti, dimensione del campione
La quantificazione in psicologia
• L’ATTENDIBILITA’: test-retest
– Coefficiente di attendibilità test-retest
&
Coefficiente di equivalenza (forme parallele)
– X = V + E
> Attendibilità: il rapporto tra la varianza della
parte vera e la varianza osservata
= sv2 / sx
2
Relazioni tra variabili
• L’ATTENDIBILITA’: test-retest
– Formula profetica di Spearman-Brown:
correggere la stima dell’attendibilità quanto
calcolato con un numero minore di item,
rispetto al test totale
Relazioni tra variabili
• L’ATTENDIBILITA’: coerenza interna
• Coerenza bassa: una parte del test misura la variabile, ma
impossibile che le altri parti misurano la stessa variabile
• Polemica: Cattell (coerenza interna alta è antitetica alla validità)
• La correlazione di un test con qualsiasi variabile non può mai essere
più alta della correlazione del test con se stesso.
– α di Cronbach
&
– K-R20 di Kuder-Richardson (item dicotomici)
Relazioni tra variabili
• LA VALIDITA’
– La capacità di una misura di cogliere il
costrutto psicologico che ci interessa
• Misuro ciò che voglio misurare?
• In altre parole, i comportamenti misurati
riflettono veramente il costrutto (quale non è
direttamente osservabile)?
La quantificazione in psicologia
• LA VALIDITA’
– Validità di costrutto
Il grado in cui lo strumento misura effettivamente ciò
che intende di misurare
Ad esempio: un certo test QI misura l’intelligenza?
La quantificazione in psicologia
• LA VALIDITA’
– Validità di costrutto
• Validità convergente
Il grado di accordo fra diversi tentativi di misura dello
stesso costrutto / la convergenza fra diverse misure
Ad esempio: quanto è associato un nuovo test di ansia
ad altri test di ansia?
> ottenere la stessa diagnosi
La quantificazione in psicologia
• LA VALIDITA’
– Validità di costrutto
• Validità discriminante
Il grado in cui i tentativi di misurare costrutti diversi
sono effettivamente distinguibili l’uno dall’altro
Ad esempio: empatia vs. estroversione.
> non confondere diverse diagnosi
La quantificazione in psicologia
• LA VALIDITA’
– Validità di criterio
Confronto fra lo strumento (test) e una variabile di
criterio rappresentativo per il costrutto
Ad esempio: relazione fra un test di selezione del
personale e misure di prestazione al lavoro, oppure
relazione fra un test QI e prestazioni accademici
La quantificazione in psicologia
• LA VALIDITA’
– Validità di criterio
• Validità concorrente
Il grado in cui la misura dello strumento correla con
altre misure dello stesso costrutto allo stesso
momento
Ad esempio: test – valutazione prestazione di lavoro
La quantificazione in psicologia
• LA VALIDITA’
– Validità di criterio
• Validità predittiva
Il grado in cui la misura dello strumento correla con
altre misure dello stesso costrutto nel futuro
Ad esempio: valutazione esame di maturità –
valutazione esame di psicometria
> condizioni a rischio
La quantificazione in psicologia
• LA VALIDITA’
– Attenzione!
Una buona validità concorrente o predittiva
oppure
una mancanza di validità discriminante?
La quantificazione in psicologia
• Gli errori
Casuali
&
Sistematici
La teoria classica dell’errore si occupa dell’errore
casuale!
Il modello classico dell’errore dei test
• Gli errori
Un test è tanto più attendibile, quanto minore è il suo
errore
Il modello classico dell’errore dei test
• Termini e assunzioni
– Il punteggio vero
• X = V + E
• ∑E / N = 0 (distribuzione normale degli errori)
Il modello classico dell’errore dei test
• Termini e assunzioni
– L’errore standard di misurazione
• Basato sul punteggio vero
• Stima della deviazione standard
• Quanto è maggiore la deviazione standard, tanto più grande
è l’errore
• Quanto è maggiore la correlazione test-retest, tanto più
piccolo è l’errore
3.1 ESmis = DSt / √1 – rtt
Il modello classico dell’errore dei test
• Termini e assunzioni
– L’universo, popolazione o dominio di item
• Test come selezione casuale di item
• Nella misura in cui gli item del test non riflettono l’universo
degli item, il test sarà sbagliato
Il modello classico dell’errore dei test
• Termini e assunzioni
– Il punteggio vero e l’universo degli item
• Il punteggio vero riflette il punteggio di un individuo se
fosse misurato su tutto l’universo degli item
• L’errore del test riflette quanto gli item riescono a
rappresentare un campione accurato dell’universo degli item
• Ovviamente, questo è troppo semplicistico…
Il modello classico dell’errore dei test
• Termini e assunzioni
– Presupposti statistici del modello
• r(media)ij : correlazione media tra gli item nell’universo
degli item
> indica in che misura esiste un nucleo comune fra gli item
• La dispersione delle correlazioni indica fino a che punto gli
item variano nel condividere questo nucleo comune
• Nel modello si assume che la correlazione media di ciascun
item con tutti gli altri non varia.
Il modello classico dell’errore dei test
• Termini e assunzioni
– Correlazione di un item con il punteggio vero
• 3.2 rit = √r(media)ij
La correlazione di un item con il punteggio vero è
uguale alla radice quadrata della sua correlazione
media con tutti gli altri item.
Quali item includere nel test?
quelli che possiedono un’alta correlazione media
con gli altri item; quelli che correlano in misura
elevata con il punteggio vero
Il modello classico dell’errore dei test
• Attendibilità
– La correlazione media di un test (di un item) con tutti
i test (con tutti gli item) dell’universo si chiami
coefficiente di attendibilità: r11
– La radice quadrata dell’attendibilità è la correlazione
del test, o dell’item, con il punteggio vero (vedi
formula 3.2)
Il modello classico dell’errore dei test
• Attendibilità
– Stime di attendibilità
• Non è possibile calcolare la correlazione media di
un test o di un item con tutti i test o item
dell’universo: è infinito!
• Per questo ogni coefficiente di attendibilità r11 è
solo una stima di r(media)11: i test o gli item non
sono mai un insieme casuale presi dall’universo
Il modello classico dell’errore dei test
• Attendibilità
– Punteggi fallibili, ossia punteggi ottenuti
• Punteggio fallibile: X (=V+E)
• Secondo formula 3.2, la correlazione di un test o
un item con il punteggio vero è la radice quadrata
della sua attendibilità, quindi, tale correlazione
può essere calcolata.
• Stimare i punteggi standard veri in base ai
punteggi fallibili:
3.3 Z’1 = r1tZ1 = √r11Z1
Il modello classico dell’errore dei test
• Attendibilità
– Punteggi fallibili, ossia punteggi ottenuti
• Punteggio fallibile: X (=V+E)
• Visto che il quadrato di una correlazione è la varianza
spiegata, r21t è la percentuale della varianza del
punteggio vero spiegabile da una misurazione fallibile
e vice versa. Quindi r11 è la stessa percentuale di
varianza di un punteggio vero nella misura fallibile.
• Oppure: 3.4 r11 = σt / σ1
che significa che l’attendibilità di un test può essere
vista come la quantità di varianza di un punteggio
vero in un test divisa per la varianza reale
Il modello classico dell’errore dei test
• Attendibilità
– Omogeneità degli item e attendibilità
• Risulta che l’attendibilità è strettamente legata
alla correlazione degli item tra loro
• Dunque, c’è un rapporto fra l’attendibilità di un
test e la correlazione media fra gli item, ossia la
loro omogeneità. Le correlazioni, però, non sono
identiche, ma distribuiti intorno alla loro media
(distribuzione normale).
Il modello classico dell’errore dei test
• Attendibilità
– Omogeneità degli item e attendibilità
• Risulta che l’attendibilità è strettamente legata
alla correlazione degli item tra loro
• E’ possibile stimare la precisione del coefficiente
di attendibilità calcolando l’errore standard della
stima della correlazione media tra item
nell’universo di item
3.5 σstima r(media)ij = σrij / √(1/2) k(k-1) -1
Il modello classico dell’errore dei test
• Attendibilità
– Omogeneità degli item e attendibilità
• Formula 3.5 chiarisce tre punti importanti:
1) Quanto più le correlazioni fra gli item
differiscono fra loro, tanto è maggiore l’errore
standard di questa stima
2) Col crescere del numero di item, deve
diminuire l’errore standard della stima
3) Aumentando l’omogeneità e la lunghezza di un
test, cresce la precisione della stima della sua
attendibilità
Il modello classico dell’errore dei test
• Attendibilità
– Modello classico dell’errore
• Principi per la costruzione dei test:
1) Attendibilità e lunghezza del test
2) Attendibilità e campioni di item
3) errore standard di errore
Il modello classico dell’errore dei test
• Attendibilità
– Attendibilità e lunghezza di un test
• Più un test è breve, più è utile. In pratica, brevità e
attendibilità si compensano a vicenda
• La formula profetica di Spearman-Brown: stima
della correlazione di un test di k item con un altro
insieme di k item tratto dello stesso universo.
Ogni metà del test può essere considerata come un
campione preso dall’universo degli item.
Il modello classico dell’errore dei test
• Attendibilità
– Attendibilità e campioni di item
• E’ tedioso e costoso calcolare tutte le correlazioni
fra gli item. Esistono metodi più semplici per
raggiungere lo stesso risultato:
Coefficiente alpha (di Cronbach)
Al posto della correlazione media fra gli item
viene utilizzata la covarianza media fra gli item.
Al posto dell’1 nel denominatore viene utilizzata
la media della varianza degli item.
Il modello classico dell’errore dei test
• Attendibilità
– Attendibilità e campioni di item
• Coefficiente alpha (di Cronbach)
– I test attendibili hanno una varianza maggiore rispetto
alle misure inattendibili (più discriminante)
– Quanto è più bassa l’attendibilità tanto più è grande
l’errore standard
Il modello classico dell’errore dei test