Analisi fattoriale - psicometria.unich.it fattoriale.pdf · • L’analisi fattoriale viene...
Transcript of Analisi fattoriale - psicometria.unich.it fattoriale.pdf · • L’analisi fattoriale viene...
Analisi fattoriale
• L’analisi fattoriale viene effettuata per studiare, riassumere e semplificare le relazioni in un insieme di variabili
• Ciò permette di individuare uno o più fattori o dimensioni latenti (ad esempio un tratto di personalità, un atteggiamento) che si suppone abbiano dato origine alle similarità tra le variabili osservate.
Il punto di partenza dell’analisi fattoriale è rappresentato da una matrice che contiene le correlazioni tra le variabili osservate (R). Il punto di arrivo è formato da una matrice che contiene una misura della relazione tra le variabili osservate e i fattori latenti (A matrice di saturazione).
Il modello teorico L’analisi fattoriale esamina la varianza che le variabili hanno in comune (varianza comune) L’ipotesi di base è che la correlazione tra le variabili sia determinata da dimensioni non osservabili (fattori) che in qualche modo sono causa o determinano i punteggi osservati nella variabili osservate
Quando si usa… Costruzione e validazione di strumenti di misura (Ad es. gli indicatori empirici sono coerenti con la definizione del costrutto e con i criteri generativi del test?)
Verifica della struttura teorica di un’ insieme di misure (Un atteggiamento consta di separate componenti cognitive, emotive e comportamentali?).
Ridurre una grande quantità di variabili osservate in un numero più gestibile di componenti
Fattore = variabile (costrutto) che non è direttamente osservabile ma deve essere inferito attraverso variabili osservate. Factor Loading (saturazione) = è il coefficiente di correlazione che mostra l’importanza (peso) di ogni variabile nel definire un fattore Eigenvalue (autovalore)= rappresenta la quota di varianza delle variabili spiegata dal fattore Soluzione fattoriale = è il set di fattori e di relazioni tra variabili e fattori che rappresenta la soluzione al problema fattoriale
Terminologia
L’analisi fattoriale si articola in alcuni passi:
1. Valutazione dell’adeguatezza delle variabili
2. Valutazione della fattorializzabilità della matrice
3. Scelta del metodo di estrazione dei fattori
4. Scelta del numero di fattori
5. Scelta del metodo di rotazione dei fattori
6. Interpretazione della soluzione
7. Validazione della soluzione
Soluzione iniziale: produce in output i valori delle comunalità, gli autovalori e la proporzione di varianza spiegata
Comunalità h2
• La comunalità esprime la proporzione della varianza di ogni variabile riprodotta da un certo numero di componenti. Essendo una proporzione, essa varia tra zero e uno. Quindi ci dice quanta varianza perdiamo di ciascuna variabile, tenendo conto delle componenti che abbiamo deciso di utilizzare.
• Le comunalità indicano la parte di varianza spiegata di ogni
indicatore, considerando il modello fattoriale stimato
• Vanno tendenzialmente tenuti in considerazione item o variabili che abbiano un valore di comunalità di almeno .500
COEFFICIENTI: Coefficienti di correlazione della matrice R
SIGNIFICATIVITA’: Livelli di significatività dei coefficienti di R
INVERSA: Matrice inversa di R
RIPRODOTTA: Matrice R riprodotta dalla soluzione fattoriale e matrice dei residui
DETERMINANTE: Esamina la fattorializzabilità della matrice delle correlazioni. Se è uguale a 0 esiste almeno una variabile che è combinazione lineare perfetta delle altre, non ammette inversa e l’analisi fattoriale non può essere effettuata
TEST di sfericità di Bartlett: esamina l’ipotesi nulla che R=I. Se il test è significativo si può effettuare l’analisi fattoriale. TEST KMO (Kaiser-Meyer-Olkin): confronta la grandezza delle correlazioni osservate rispetto alle correlazioni parziali. Se la somma delle ultime è più piccola rispetto alle prime il KMO è vicino a 1 e la matrice può essere fattorializzata. Valori: >0.90 eccellenti 80-90 buoni 70-80 accettabili 60-70 mediocri
FINESTRA ESTRAZIONI
Componenti Principali (ACP) è utile per approssimare una soluzione di analisi fattoriale. Non distingue tra varianza comune e varianza unica: tutti i fattori sono fattori comuni che assorbiscono tutta la varianza e le saturazioni risultano gonfiate.
Minimi quadrati non ponderati e Minimi quadrati generalizzati: In questo metodo vengono minimizzate le correlazioni residue, cioè quella parte delle correlazioni che non è spiegata dai fattori. Non è necessaria una stima della comunalità, ma bisogna fornire il numero di fattori da estrarre.
Massima verosimiglianza: Stima le saturazioni della popolazione che hanno la massima verosimiglianza (massima probabilità) nel produrre la matrice delle correlazioni campionarie
Fattorializzazione asse principale (o Analisi dei fattori principali AFP): è un metodo simile all’APC, ma si differenzia da questa perché utilizza una matrice ridotta e analizza soltanto la varianza che e attribuibile ai fattori comuni, eliminando la varianza unica delle variabili.
Determina tramite una campione di variabili i fattori comuni che hanno correlazione massima con i fattori comuni nell’universo delle variabili
Matrice delle correlazioni
Soluzione fattoriale non ruotata
Grafico decrescente autovalori (Scree Plot)
Estrai fattori con autovalori maggiori di 1 Kaiser’s rule mineigen greater than 1 criterion (K1)
Numero di fattori da estrarre
Lo scopo del processo di rotazione è quello di rendere la soluzione fattoriale più interpretabile facendo assumere ai fattori una nuova posizione nello spazio fattoriale. La dimensionalità non cambia (se abbiamo estratto m fattori rimarranno m fattori, ma cambia , cambierà la varianza spiegata da ogni singolo fattore che risulterà più omogenea.
Ci sono due tipi di rotazioni: ORTOGONALI: I fattori vengono ruotati lasciando inalterato il vincolo dell’ortogonalità (i fattori continuano a NON essere correlati) OBLIQUE: I fattori possono essere correlati
A questo punto dobbiamo scegliere che tipo di rotazione effettuare!
Assente: Non effettua alcuna rotazione
Rotazione ortogonale Varimax: cerca di semplificare (=ridurre) il numero delle variabili che generano la matrice di correlazione, semplifica l’interpretazione del fattore
Rotazione ortogonale Quatrimax:cerca di semplificare il numero delle righe (=osservazioni), semplifica l’interpretazione delle variabili
Rotazione ortogonale Equamax: bilancia i criteri dei metodi Varimax e Quatrimax
Rotazione obliqua Promax: E’ un metodo più diretto che cerca la rotazione che meglio si adatta a rappresentare i fattori con un singolo item e lo fa direttamente. E’ definita dal parametro Kappa, che di defoult è pari a 4. Valori maggiori o inferiori a 4 rendono la rotazione più o meno obliqua
Rotazione obliqua Oblimin: cerca di adattare i fattori agli item e li correla.
Finestra Opzioni ESCLUSIONE LISTWISE: Usa solo i casi che hanno valori validi in tutte le variabili ESCLUSIONE PAIRWISE: I casi che hanno valori validi sono calcolati attraverso una matrice di correlazione SOSTITUISCI CON LA MEDIA: Sostituisce il valore mancante di ogni variabile con la media della variabile del campione
Esempio…
• Vogliamo conoscere la struttura fattoriale di una scala composta da 10 item su scala Likert a 4 passi, per la misura della depressione la depressione.
• In accordo con Beck (1979) sono stati costruiti gli item considerando che la depressione coinvolge alterazioni cognitivo-affettive e somatiche.
Gli item misurano i seguenti sintomi: 1. Tristezza 2. Fallimento 3. Sfiducia 4. Pensiero suicidario 5. Autosvalutazione 6. Energia 7. Cambiamento di appetito 8. Cambiamento nel sonno 9. Mancanza di concentrazione 10. Affaticamento
1. FATTORIALIZZABILITA’ DELLA MATRICE
KMO and Bartlett's Test
.865
1508.331
45
.000
Kaiser-Mey er-Olkin Measure of Sampling
Adequacy .
Approx. Chi-Square
df
Sig.
Bart lett's Test of
Sphericity
Il KMO è pari a .86 quindi rientra nella fascia dei valori buoni e il Test di Specificità di Bartlett è significativo! La matrice è fattorializzabile
Correlation Matrixa
1.000 .383 .438 .413 .425 .344 .260 .328 .353 .300
.383 1.000 .415 .304 .511 .264 .238 .317 .324 .200
.438 .415 1.000 .328 .514 .273 .240 .230 .369 .193
.413 .304 .328 1.000 .290 .163 .142 .219 .205 .130
.425 .511 .514 .290 1.000 .372 .240 .297 .368 .248
.344 .264 .273 .163 .372 1.000 .377 .383 .540 .595
.260 .238 .240 .142 .240 .377 1.000 .378 .370 .347
.328 .317 .230 .219 .297 .383 .378 1.000 .394 .314
.353 .324 .369 .205 .368 .540 .370 .394 1.000 .422
.300 .200 .193 .130 .248 .595 .347 .314 .422 1.000
.000 .000 .000 .000 .000 .000 .000 .000 .000
.000 .000 .000 .000 .000 .000 .000 .000 .000
.000 .000 .000 .000 .000 .000 .000 .000 .000
.000 .000 .000 .000 .000 .001 .000 .000 .001
.000 .000 .000 .000 .000 .000 .000 .000 .000
.000 .000 .000 .000 .000 .000 .000 .000 .000
.000 .000 .000 .001 .000 .000 .000 .000 .000
.000 .000 .000 .000 .000 .000 .000 .000 .000
.000 .000 .000 .000 .000 .000 .000 .000 .000
.000 .000 .000 .001 .000 .000 .000 .000 .000
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
Correlat ion
Sig. (1-tailed)
item1 item2 item3 item4 item5 item6 item7 item8 item9 item10
Determinant = .055a.
2. MATRICE DI CORRELAZIONE TRA LE VARIABILI
Tutti gli item sono fortemente correlati tra loro, ma i primi cinque lo sono maggiormente tra loro rispetto agli altri cinque. Infatti ciascun gruppo è relativo ai due processi distintivi coinvolti nella depressione. La sezione al di sotto riporta la significatività delle correlazioni. Come possiamo vedere sono tutte significative
METODO DI ESTRAZIONE E NUMERO DEI FATTORI DA ESTRARRE
Utilizzo il metodo degli assi principali
Ci sono diversi metodi per decidere quanti fattori estrarre. In questo caso utilizzo il criterio degli Autovalori maggiori di 1, (Kaiser’s rule mineigen greater than 1 criterion) dove è necessario estrarre i fattori che presentano un autovalore > 1 !
Possiamo effettuare una scelta anche sulla base dello Scree Plot
SCELTA DEL METODO DI ROTAZIONE
Utilizzo una rotazione Promax
Total Variance Explained
3.989 39.893 39.893 3.436 34.358 34.358 2.892
1.351 13.510 53.403 .809 8.087 42.445 2.909
.806 8.055 61.458
.776 7.764 69.223
.648 6.477 75.699
.582 5.816 81.516
.549 5.494 87.010
.490 4.901 91.911
.449 4.494 96.405
.360 3.595 100.000
Factor
1
2
3
4
5
6
7
8
9
10
Total % of Variance Cumulat ive % Total % of Variance Cumulat ive % Total
Init ial Eigenv alues Extraction Sums of Squared Loadings Rotation
Sums of
Squared
Loadingsa
Extraction Method: Princ ipal Axis Factoring.
When f actors are correlated, sums of squared loadings cannot be added to obtain a total v ariance.a.
I primi due autovalori sono maggiori di 1, quindi è necessario estrarre 2 fattori!
Il primo fattore spiega il 39.89% della varianza Il secondo fattore spiega il 13.51% della varianza
Il grafico degli autovalori indica la presenza di un primo fattore preponderante, di un secondo fattore importante e sostanziale appiattimento della curva a partire dal terzo fattore, la soluzione a due fattori sembra supportata.
Communalities
.364 .429
.340 .417
.368 .463
.215 .249
.421 .498
.492 .650
.245 .279
.281 .304
.400 .466
.387 .489
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
Initial Extract ion
Extract ion Method: Principal Ax is Factoring.
Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali
Factor Matrixa
.691 -.416
.659 -.179
.648 .278
.623 .202
.594 .332
.577 .290
.564 -.413
.541 -.103
.495 -.185
.416 .275
item6
item9
item5
item1
item3
item2
item10
item8
item7
item4
1 2
Factor
Extraction Method: Princ ipal Axis Factoring.
2 factors extracted. 9 iterations required.a.
In tabella troviamo i valori delle comunalità iniziali e finali , e della soluzione fattoriale non ruotata. Questa soluzione iniziale consente di calcolare empiricamente le comunalità: le comunalità empiriche vengono sostituite alle stime iniziali e il processo di estrazione dei fattori viene ripetuto. Il processo si interrompe quando i valori empirici delle comunalità divengono sufficientemente stabili (ovvero il valore delle comunalità ottenuto nella interazione precedente non cambia in maniera apprezzabile in quella successiva)
Communalities
.364 .429
.340 .417
.368 .463
.215 .249
.421 .498
.492 .650
.245 .279
.281 .304
.400 .466
.387 .489
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
Initial Extract ion
Extract ion Method: Principal Ax is Factoring.
Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali
Factor Matrixa
.691 -.416
.659 -.179
.648 .278
.623 .202
.594 .332
.577 .290
.564 -.413
.541 -.103
.495 -.185
.416 .275
item6
item9
item5
item1
item3
item2
item10
item8
item7
item4
1 2
Factor
Extraction Method: Princ ipal Axis Factoring.
2 factors extracted. 9 iterations required.a.
N.B. Durante questo processo il numero dei fattori deve rimanere costante. I valori finali delle comunalità possono essere ricavati dalla soluzione stessa elevando al quadrato le saturazioni di ogni variabile in ogni fattore comune e sommando tali quadrati. Es. La comunalità finale dell’item 1 (.429)si ottiene elevando al quadrato e sommando le saturazioni dell’item 1 nel primo fattore (.6232) e nel secondo fattore (.2022)!
Structure Matrix
.804 .431
.690 .320
.668 .509
.529 .438
.525 .359
.451 .704
.378 .680
.463 .648
.382 .646
.245 .495
item6
item10
item9
item8
item7
item5
item3
item1
item2
item4
1 2
Factor
Extraction Method: Princ ipal Axis Fac toring.
Rotation Method: Promax with Kaiser Normalizat ion.
Matrice della struttura
Questa è una matrice delle correlazioni tra variabili osservate e fattori.
Factor Correlation Matrix
1.000 .593
.593 1.000
Factor
1
2
1 2
Extraction Method: Princ ipal Axis Factoring.
Rotation Method: Promax with Kaiser Normalizat ion.
Correlazione tra i fattori obliqui. I fattori correlano tra loro
Pattern Matrixa
.846 -.070
.772 -.138
.565 .174
.481 .075
.416 .192
-.038 .702
.051 .674
-.001 .647
.123 .575
-.074 .540
item6
item10
item9
item7
item8
item3
item5
item2
item1
item4
1 2
Factor
Extraction Method: Princ ipal Axis Factoring.
Rotation Method: Promax with Kaiser Normalizat ion.
Rotation converged in 3 iterations.a.
Considerando che saturazioni fattoriali >.30 sono significative, la soluzione ruotata mostra come sul primo fattore saturano gli item relativi alla componente somatica della depressione (item, 6,7,8,9 e 10). Sul secondo fattore saturano gli item relativi alla componente cognitivo-affettiva della depressione (item 1,2,3,4 e 5).
Matrice dei modelli La matrice dei modelli, invece, è la matrice dei coefficienti di impatto dei fattori sulle variabili osservate. E’ questa la matrice che vado ad interpretare poiché è quella fattorialmente semplice!
Grafico fattoriale nello spazio fattoriale ruotato
Il pattern fattoriale può essere rappresentato graficamente. Gli assi fattoriali sono rappresentati come ortogonali anche se la soluzione è obliqua. Da questa rappresentazione però si evince chiaramente la struttura semplice raggiunta tramite la soluzione obliqua: gli item che saturano sul fattore 1 e 2 si trovano in corrispondenza degli assi dei due rispettivi fattori.
CONCLUSIONI In linea con le nostre ipotesi l’esame fattoriale esplorativo della scala, ha evidenziato come questa presenti una struttura bi-fattoriale. Possiamo considerare, quindi, che la misura della depressione per questo strumento, include una fattore che chiameremo somatico ed un altro che chiameremo cognitivo-affettivo.