Metodologie Quantitative Analisi...
Transcript of Metodologie Quantitative Analisi...
1
M
Q
Metodologie Quantitative
Analisi Fattoriale
La logica della scoperta e la struttura
dei dati
Marco Perugini
Milano-Bicocca
Lezione: VIII
Lezione: VIII
2
Indicatori e Costrutti
Indicatore: misura empirica osservabile (ad es., comportamento, risposta)
Costrutto: dimensione latente non osservabile
L’indicatore e’ in relazione al costrutto tramite una regola di corrispondenza
Il costrutto e’ la dimensione latente che associa gli indicatori
Costrutto
X1 X2 X2
Indicatori
Lezione: VIII
3
Indicatori
Un buon indicatore deve essere una buona misura del costrutto e non deve essere una buona misura di altri costrutti
Piu’ indicatori sono necessari per definire un costrutto
La definizione “vera” di un costrutto deriva degli indicatori
Molto spesso in Psicologia il costrutto e’ ipotetico/latente mentre gli indicatori sono osservabili/empirici
Lezione: VIII
4
Costrutto
Un costrutto puo’ essere definito come un un concetto (dimensione, fattore, tratto, classe, componente) teorico con certe conseguenze empiriche
Gli indicatori misurano le conseguenze empiriche
Il costrutto associa gli indicatori (legno puo’ associare tavolo, sedia, quadro, bastone, albero, casa, barca)
Da un punto di vista statistico, se alcuni indicatori corrrelano tra di essi, possiamo inferire la presenza di un costrutto sottostante (o viceversa)
Lezione: VIII
5
Esempio di indicatori e costrutto
1. Costrutto
2. Definizione
3. Indicatori
Estroversione
Tendenza stabile ad essere aperto,
interessato agli altri, loquace, dominante
Aggettivi: Estroverso, Loquace, Dinamico,
Introverso (-), Riservato (-), Timido (-)
Items: E’ il primo a prendere l’iniziativa,
Gli piace chiacchierare, Si tiene a
distanza (-), E’ silenzioso con persone
che non conosce (-)
Lezione: VIII
6
Due tipi di indicatori e costrutti
Riflessivo
Bollen e Lennox, 1991, Psych. Bull.
Formativo
Estroversione
Loquace Vivace Dinamico
Alcolismo
Whisky Vino Birra
Causale o
funzionale?
Non assumiamo che sono correlati Assumiamo che sono correlati
Lezione: VIII
7
La struttura dei dati
• Si parte da una matrice di dati che viene trasformata in una matrice di relazioni tra variabili
nkz
zz
z
n
22212
12111
k21
S
.
.
.
S
zS
v...vv
Soggetti
Variabili
kka
aa
aa
k
22212
12111
k21
v
.
.
.
v
v
v...vv
Variabili
Variabili
Lezione: VIII
8
La struttura dei dati
Relazioni tra variabili
Tipi principali di coefficienti di associazione
Livello di misurazione
Variabile 1 Variabile 2 Coefficiente
Nominale Nominale Phi
Nominale Nominale Contingenza
Nominale Ordinale Gamma
Ordinale Ordinale Kendall's Tau
Dicotomica Intervallo Punto-biseriale
Artificialmente Dicot. Intervallo Biseriale
Artificialmente Dicot. Nominale Tetracorico
Latente (da Ordinale) Latente (da Ordinale) Policorico
Latente (da Ordinale) Intervallo Poliseriale
Intervallo Intervallo r di Pearson
Ricordatevi che questi coefficienti di associazioni rivelano solo relazioni lineari
Lezione: VIII
9
La struttura dei dati
• A seconda del livello di misurazione e degli scopi specifici, si possono usare delle tecniche diverse (ad es., MDS, SSA, Cluster Analysis, Analisi delle Corrispondenze, Modelli di Classe Latente, Analisi Fattoriale)
• Queste tecniche hanno un scopo simile: identificare delle categorie (classi, dimensioni, fattori, tratti, componenti, raggruppamenti) che associano le variabili
kka
aa
aa
k
22212
12111
k21
v
.
.
.
v
v
v...vv
Variabili
Variabili
Lezione: VIII
10
Parsimonia
• Il numero delle dimensioni (costrutti) e’ SEMPRE minore del numero delle misure (indicatori, variabili)
• I costrutti hanno un livello di astrazione piu’ elevato degli indicatori
• Lo scopo e’ di spiegare il piu’ possibile le relazioni tra le variabili con il numero minore di dimensioni
• La parsimonia NON e’ la semplicita’, ma un punto di equilibrio tra semplicita’ e potere esplicativo (rappresentativita’)
• “Everything should be made as simple as possible, but not simpler” (Einstein)
Lezione: VIII
11
Modello verso Realta’
• Le dimensioni sono un modello del fenomeno studiato e non la realta’
• Evitare la Fallacia Induttivistica: i dati non sono MAI sufficienti per determinare in maniera univoca delle teorie che possono essere generalizzate induttivamente oltre i dati stessi
• Le teorie sono indeterminate empiricamente
Disegnate la funzione che passa per questi punti
12
Un possibile modello
Lezione: VIII
Si diverte molto Ama chiacchierare Ama le feste Prende l’iniziativa
Variabili osservate, misurate sui
soggetti
Estroversione
Tratto latente
La variabilità osservata negli items è rappresentata da un
unico fattore che raggruppa le variabili
13
Un altro possibile modello
Lezione: VIII
V5 V4 V1 V2 V3
Fattore 1 Fattore 2
V6
Ovviamente i fattori utili a rappresentare la variabilità delle
variabili osservate possono essere numerosi
14
Fattori ed errori
Lezione: VIII
Guadagnando in parsimonia ed interpretabilità delle relazioni, non ci si
può aspettare di non perdere qualcosa in precisione
V5 V4 V1 V2 V3
Fattore 1 Fattore 2
V6 Variabilità osservata
Variabilità catturata
(spiegata)
AF
errore 1 errore 2 errore 3 errore 4 errore 5 errore 6 Variabilità non
rappresentata dai fattori
15
Tipi di Analisi Fattoriale
Lezione: VIII
Esploratoria
Confermatoria
Analisi Fattori Comuni
Analisi Componenti Principali
Modelli LISREL
Accorpamento di Variabili
Verifica di un modello teorico
Forma del modello decisa
dai noi
Forma del modello decisa dall’algoritmo
AF
16
Rappresentazioni di r
Lezione: VIII
Ogni relazione tra variabili puo’ essere rappresentata graficamente al
fine di capirne le proprieta’ e le caratteristiche
Rappresentazione cartesiana (diagramma di dispersione)
Rappresentazione in termini di varianza condivisa
Rappresentazione vettoriale (prossima lezione)
17
Correlazione: rappresentazione
-4,0 -2,0 0,0 2,0 4,0
Z(x)
-4,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
Z(v
)
Lezione: VIII
La correlazione indica quanta variabilità ci aspettiamo in una variabile
al variare dell’altra
associazione r=0.78
178.78.^
Se xz varia di 1 rispetto alla media, prediciamo che il soggetto abbia .78 in vz
xxvv zrz ˆ
Notiamo che 1 è la deviazione standard di xz
1
.78
18
Rappresentazione varianze
Lezione: VIII
La varianza di una variabile può essere rappresentata mediante un
diagramma di Venn
Maggiore è la varianza, più grande è il cerchio
X
Varianza di X
V
Varianza di v
19
Varianza condivisa
Lezione: VIII
Se due variabili condividono della varianza, cioè se covariano, le loro
varianza saranno sovrapposte
Varianza di X
V
Varianza di v
X
Varianza condivisa
20
Varianza condivisa
Lezione: VIII
Il quadrato della correlazione, R2, ci indica la percentuale
(proporzione) di varianza condivisa dalle due variabili
vz xz
Varianza condivisa
Variabili standardizzate Le varianze sono uguali
e uguali ad 1
2
condivisas
Questa è la varianza della parte di vz associata a xz
21
Varianza condivisa
Lezione: VIII
Per capire quanto forte è l’associazione possiamo elevare al quadrato
la correlazione e interpretarla come varianza condivisa
vz xz
49.2 R
Legame forte r=0.70 r*r=0.49
Legame debole r=0.10 r*r=0.01
vz xz
01.2 R
Le variabili condividono circa il 50% della variabilità
Le variabili condividono circa il 1% della variabilità
22
Varianza condivisa
Lezione: VIII
Per capire quanto forte è l’associazione (lineare) possiamo elevare al
quadrato la correlazione e interpretarla come varianza condivisa
vz xz
12 R
Legame perfetto r=1 r*r=1
Indipendenza r=0 r*r=0
vz xz
02 R
Le variabili condividono il 100% della variabilità
Le variabili condividono lo 0% della variabilità
23
Perché è utile questa rappresentazione?
Lezione: VIII
Perché estrarre uno (o più) fattori al fine di massimizzare la rappresentatività
delle relazioni fra variabili osservate equivale a prendere quella combinazioni di
variabili che condividono maggior varianza
a4 a2
a3
a1
Fattore estratto
Perché la bontà dei fattori può essere concettualizzata e quantificata come la
loro capacità di catturare la varianza comune tra le variabili osservate
24
Cenni di Algebra
• Un algebra è un sistema di segni in cui sono definite delle “operazioni”
• Algebra scalare
• Algebra dei vettori
• Algebra matriciale
In algebra matriciale un “numero” è chiamato “scalare”
Lezione: VIII
25
Vettori 1
4
12
5
a
vettore riga vettore colonna
4125'a
un vettore è un insieme di numeri che hanno qualche
cosa in comune, ad es. esprimono le misurazioni di
una variabile
elementi
Lezione: VIII
26
Vettori 2
In generale un vettore si indica con una lettera minuscola in grassetto. Formalmente i vettori hanno una dimensione (ovvero il numero di elementi che contengono)
nv
v
v
2
1
v
nvvv 21'v
n è la dimensione del vettore
Lezione: VIII
27
Moltiplicazione fra vettori
12615
8410
425
)4(3)2(3)5(3
)4(2)2(2)5(2
)4(1)2(1)5(1
425
3
2
1
Solo se hanno le stesse dimensioni e solo fra un v. colonna e un v. riga
Lezione: VIII
28
Matrici
Una matrice è un insieme di numeri che hanno qualche cosa in comune, disposti in righe e colonne. Ad es. una tabella di dati statistici
142
301A
232221
131211
aaa
aaaA
Il primo indice indica la riga e il secondo indica la colonna
La matrice si indica con una lettera maiuscola in grassetto
Lezione: VIII
29
Trasposta
Trasposta: le righe di A diventano le colonne di A’
13
40
21
142
301(A’)’=A
Lezione: VIII
30
Matrici: op. con scalari 1
4567
7654
13233343
433323133 A
Si somma lo scalare ad ogni elemento
Addizione
Lezione: VIII
31
Matrici: op. con scalari 2
Moltiplicazione
36912
12963
13233343
433323133 A
Si moltiplica lo scalare ad ogni elemento
Lezione: VIII
32
Matrici: op. fra matrici
655
1053
152341
643221
124
632
531
421BA
Addizione: si sommano gli elementi corrispondenti
Solo se le due matrici hanno la stessa dimensione
Lezione: VIII
33
Matrici: moltiplicazione
2 x 3
12
43
12
321
231
Solo se il numero di colonne della prima matrice è uguale al numero di righe della seconda
3 x 2 Si usa il meccanismo della moltiplicazione dei vettori, applicandolo ad ogni riga della matrice A e ad ogni colonna della B
La matrice risultato sarà 2 x 2
Lezione: VIII
34
Moltiplicazione: ovvero
10381)1(3)4(2)1(1
2662)2(3)3(2)2(1
152121)1(2)4(3)1(1
7492)2(2)3(3)2(1
22
21
12
11
c
c
c
c
102
157C
Lezione: VIII
35
Matrici particolari
03
52Matrice quadrata: quando il numero delle righe è lo stesso di quello
delle colonne
Matrice nulla: una matrice quadrata con tutti elementi uguali a 0
000
000
000
Matrice identita’ (I): una matrice quadrata con 1 lungo la diagonale
principale e 0 negli altri
100
010
001
Lezione: VIII
36
Matrice inversa e ortogonale
La matrice inversa (A-1) è la matrice che risolve questa relazione: A A-1 = I
Deve essere una matrice quadrata e non sempre esiste la matrice inversa di una matrice.
Un matrice è ortogonale se AA’=A’A=I L’inversa di una matrice ortogonale è uguale alla
trasposta della matrice: A A-1 = I=AA’
Lezione: VIII
37
AF: Equazioni di base
Si assume che i punteggi standardizzati nelle variabili osservate (Z) possono essere riprodotti moltiplicando i punteggi fattoriali (F) per le saturazioni fattoriali (A’, matrice trasposta)
nkz
zz
z
n
22212
12111
k21
S
.
.
.
S
zS
v...vv
Soggetti
Variabili
=
npf
ff
f
F
n
22212
12111
p21
S
.
.
.
s
fs
F...F
Soggetti
Fattori
X
kpp
212
12111
k21
aF
.
aF
aaF
vvv
Fatt.
Var
Z A’ F
Lezione: VIII
38
Equazioni di base
Egualmente si puo’ dimostrare che la matrice di correlazione
tra le variabili (R) e’ equivalente al prodotto delle matrici
fattoriali (A x A’)
= X
kpk
212
12111
p21
av
.
av
aav
FFF
Var.
Fattori
R A A`
pkp
212
12111
k21
aF
.
aF
aaF
vvv
Fatt.
Variabili
kkk
212
12111
k21
rv
.
rv
rrv
vvv
Var.
Variabili
Lezione: VIII