Analisi fattoriale - psicometria.unich.it fattoriale.pdf · • L’analisi fattoriale viene...

Analisi fattoriale

• L’analisi fattoriale viene effettuata per studiare, riassumere e semplificare le relazioni in un insieme di variabili

• Ciò permette di individuare uno o più fattori o dimensioni latenti (ad esempio un tratto di personalità, un atteggiamento) che si suppone abbiano dato origine alle similarità tra le variabili osservate.

Il punto di partenza dell’analisi fattoriale è rappresentato da una matrice che contiene le correlazioni tra le variabili osservate (R). Il punto di arrivo è formato da una matrice che contiene una misura della relazione tra le variabili osservate e i fattori latenti (A matrice di saturazione).

Il modello teorico L’analisi fattoriale esamina la varianza che le variabili hanno in comune (varianza comune) L’ipotesi di base è che la correlazione tra le variabili sia determinata da dimensioni non osservabili (fattori) che in qualche modo sono causa o determinano i punteggi osservati nella variabili osservate

Quando si usa… Costruzione e validazione di strumenti di misura (Ad es. gli indicatori empirici sono coerenti con la definizione del costrutto e con i criteri generativi del test?)

Verifica della struttura teorica di un’ insieme di misure (Un atteggiamento consta di separate componenti cognitive, emotive e comportamentali?).

Ridurre una grande quantità di variabili osservate in un numero più gestibile di componenti

Fattore = variabile (costrutto) che non è direttamente osservabile ma deve essere inferito attraverso variabili osservate. Factor Loading (saturazione) = è il coefficiente di correlazione che mostra l’importanza (peso) di ogni variabile nel definire un fattore Eigenvalue (autovalore)= rappresenta la quota di varianza delle variabili spiegata dal fattore Soluzione fattoriale = è il set di fattori e di relazioni tra variabili e fattori che rappresenta la soluzione al problema fattoriale

Terminologia

L’analisi fattoriale si articola in alcuni passi:

1. Valutazione dell’adeguatezza delle variabili

2. Valutazione della fattorializzabilità della matrice

3. Scelta del metodo di estrazione dei fattori

4. Scelta del numero di fattori

5. Scelta del metodo di rotazione dei fattori

6. Interpretazione della soluzione

7. Validazione della soluzione

Soluzione iniziale: produce in output i valori delle comunalità, gli autovalori e la proporzione di varianza spiegata

Comunalità h2

• La comunalità esprime la proporzione della varianza di ogni variabile riprodotta da un certo numero di componenti. Essendo una proporzione, essa varia tra zero e uno. Quindi ci dice quanta varianza perdiamo di ciascuna variabile, tenendo conto delle componenti che abbiamo deciso di utilizzare.

• Le comunalità indicano la parte di varianza spiegata di ogni

indicatore, considerando il modello fattoriale stimato

• Vanno tendenzialmente tenuti in considerazione item o variabili che abbiano un valore di comunalità di almeno .500

COEFFICIENTI: Coefficienti di correlazione della matrice R

SIGNIFICATIVITA’: Livelli di significatività dei coefficienti di R

INVERSA: Matrice inversa di R

RIPRODOTTA: Matrice R riprodotta dalla soluzione fattoriale e matrice dei residui

DETERMINANTE: Esamina la fattorializzabilità della matrice delle correlazioni. Se è uguale a 0 esiste almeno una variabile che è combinazione lineare perfetta delle altre, non ammette inversa e l’analisi fattoriale non può essere effettuata

TEST di sfericità di Bartlett: esamina l’ipotesi nulla che R=I. Se il test è significativo si può effettuare l’analisi fattoriale. TEST KMO (Kaiser-Meyer-Olkin): confronta la grandezza delle correlazioni osservate rispetto alle correlazioni parziali. Se la somma delle ultime è più piccola rispetto alle prime il KMO è vicino a 1 e la matrice può essere fattorializzata. Valori: >0.90 eccellenti 80-90 buoni 70-80 accettabili 60-70 mediocri

FINESTRA ESTRAZIONI

Componenti Principali (ACP) è utile per approssimare una soluzione di analisi fattoriale. Non distingue tra varianza comune e varianza unica: tutti i fattori sono fattori comuni che assorbiscono tutta la varianza e le saturazioni risultano gonfiate.

Minimi quadrati non ponderati e Minimi quadrati generalizzati: In questo metodo vengono minimizzate le correlazioni residue, cioè quella parte delle correlazioni che non è spiegata dai fattori. Non è necessaria una stima della comunalità, ma bisogna fornire il numero di fattori da estrarre.

Massima verosimiglianza: Stima le saturazioni della popolazione che hanno la massima verosimiglianza (massima probabilità) nel produrre la matrice delle correlazioni campionarie

Fattorializzazione asse principale (o Analisi dei fattori principali AFP): è un metodo simile all’APC, ma si differenzia da questa perché utilizza una matrice ridotta e analizza soltanto la varianza che e attribuibile ai fattori comuni, eliminando la varianza unica delle variabili.

Determina tramite una campione di variabili i fattori comuni che hanno correlazione massima con i fattori comuni nell’universo delle variabili

Matrice delle correlazioni

Soluzione fattoriale non ruotata

Grafico decrescente autovalori (Scree Plot)

Estrai fattori con autovalori maggiori di 1 Kaiser’s rule mineigen greater than 1 criterion (K1)

Numero di fattori da estrarre

Lo scopo del processo di rotazione è quello di rendere la soluzione fattoriale più interpretabile facendo assumere ai fattori una nuova posizione nello spazio fattoriale. La dimensionalità non cambia (se abbiamo estratto m fattori rimarranno m fattori, ma cambia , cambierà la varianza spiegata da ogni singolo fattore che risulterà più omogenea.

Ci sono due tipi di rotazioni: ORTOGONALI: I fattori vengono ruotati lasciando inalterato il vincolo dell’ortogonalità (i fattori continuano a NON essere correlati) OBLIQUE: I fattori possono essere correlati

A questo punto dobbiamo scegliere che tipo di rotazione effettuare!

Assente: Non effettua alcuna rotazione

Rotazione ortogonale Varimax: cerca di semplificare (=ridurre) il numero delle variabili che generano la matrice di correlazione, semplifica l’interpretazione del fattore

Rotazione ortogonale Quatrimax:cerca di semplificare il numero delle righe (=osservazioni), semplifica l’interpretazione delle variabili

Rotazione ortogonale Equamax: bilancia i criteri dei metodi Varimax e Quatrimax

Rotazione obliqua Promax: E’ un metodo più diretto che cerca la rotazione che meglio si adatta a rappresentare i fattori con un singolo item e lo fa direttamente. E’ definita dal parametro Kappa, che di defoult è pari a 4. Valori maggiori o inferiori a 4 rendono la rotazione più o meno obliqua

Rotazione obliqua Oblimin: cerca di adattare i fattori agli item e li correla.

Finestra Opzioni ESCLUSIONE LISTWISE: Usa solo i casi che hanno valori validi in tutte le variabili ESCLUSIONE PAIRWISE: I casi che hanno valori validi sono calcolati attraverso una matrice di correlazione SOSTITUISCI CON LA MEDIA: Sostituisce il valore mancante di ogni variabile con la media della variabile del campione

Esempio…

• Vogliamo conoscere la struttura fattoriale di una scala composta da 10 item su scala Likert a 4 passi, per la misura della depressione la depressione.

• In accordo con Beck (1979) sono stati costruiti gli item considerando che la depressione coinvolge alterazioni cognitivo-affettive e somatiche.

Gli item misurano i seguenti sintomi: 1. Tristezza 2. Fallimento 3. Sfiducia 4. Pensiero suicidario 5. Autosvalutazione 6. Energia 7. Cambiamento di appetito 8. Cambiamento nel sonno 9. Mancanza di concentrazione 10. Affaticamento

1. FATTORIALIZZABILITA’ DELLA MATRICE

KMO and Bartlett's Test

.865

1508.331

45

.000

Kaiser-Mey er-Olkin Measure of Sampling

Adequacy .

Approx. Chi-Square

df

Sig.

Bart lett's Test of

Sphericity

Il KMO è pari a .86 quindi rientra nella fascia dei valori buoni e il Test di Specificità di Bartlett è significativo! La matrice è fattorializzabile

Correlation Matrixa

1.000 .383 .438 .413 .425 .344 .260 .328 .353 .300

.383 1.000 .415 .304 .511 .264 .238 .317 .324 .200

.438 .415 1.000 .328 .514 .273 .240 .230 .369 .193

.413 .304 .328 1.000 .290 .163 .142 .219 .205 .130

.425 .511 .514 .290 1.000 .372 .240 .297 .368 .248

.344 .264 .273 .163 .372 1.000 .377 .383 .540 .595

.260 .238 .240 .142 .240 .377 1.000 .378 .370 .347

.328 .317 .230 .219 .297 .383 .378 1.000 .394 .314

.353 .324 .369 .205 .368 .540 .370 .394 1.000 .422

.300 .200 .193 .130 .248 .595 .347 .314 .422 1.000

.000 .000 .000 .000 .000 .000 .000 .000 .000

.000 .000 .000 .000 .000 .000 .000 .000 .000

.000 .000 .000 .000 .000 .000 .000 .000 .000

.000 .000 .000 .000 .000 .001 .000 .000 .001

.000 .000 .000 .000 .000 .000 .000 .000 .000

.000 .000 .000 .000 .000 .000 .000 .000 .000

.000 .000 .000 .001 .000 .000 .000 .000 .000

.000 .000 .000 .000 .000 .000 .000 .000 .000

.000 .000 .000 .000 .000 .000 .000 .000 .000

.000 .000 .000 .001 .000 .000 .000 .000 .000

item1

item2

item3

item4

item5

item6

item7

item8

item9

item10

item1

item2

item3

item4

item5

item6

item7

item8

item9

item10

Correlat ion

Sig. (1-tailed)

item1 item2 item3 item4 item5 item6 item7 item8 item9 item10

Determinant = .055a.

2. MATRICE DI CORRELAZIONE TRA LE VARIABILI

Tutti gli item sono fortemente correlati tra loro, ma i primi cinque lo sono maggiormente tra loro rispetto agli altri cinque. Infatti ciascun gruppo è relativo ai due processi distintivi coinvolti nella depressione. La sezione al di sotto riporta la significatività delle correlazioni. Come possiamo vedere sono tutte significative

METODO DI ESTRAZIONE E NUMERO DEI FATTORI DA ESTRARRE

Utilizzo il metodo degli assi principali

Ci sono diversi metodi per decidere quanti fattori estrarre. In questo caso utilizzo il criterio degli Autovalori maggiori di 1, (Kaiser’s rule mineigen greater than 1 criterion) dove è necessario estrarre i fattori che presentano un autovalore > 1 !

Possiamo effettuare una scelta anche sulla base dello Scree Plot

SCELTA DEL METODO DI ROTAZIONE

Utilizzo una rotazione Promax

Total Variance Explained

3.989 39.893 39.893 3.436 34.358 34.358 2.892

1.351 13.510 53.403 .809 8.087 42.445 2.909

.806 8.055 61.458

.776 7.764 69.223

.648 6.477 75.699

.582 5.816 81.516

.549 5.494 87.010

.490 4.901 91.911

.449 4.494 96.405

.360 3.595 100.000

Factor

1

2

3

4

5

6

7

8

9

10

Total % of Variance Cumulat ive % Total % of Variance Cumulat ive % Total

Init ial Eigenv alues Extraction Sums of Squared Loadings Rotation

Sums of

Squared

Loadingsa

Extraction Method: Princ ipal Axis Factoring.

When f actors are correlated, sums of squared loadings cannot be added to obtain a total v ariance.a.

I primi due autovalori sono maggiori di 1, quindi è necessario estrarre 2 fattori!

Il primo fattore spiega il 39.89% della varianza Il secondo fattore spiega il 13.51% della varianza

Il grafico degli autovalori indica la presenza di un primo fattore preponderante, di un secondo fattore importante e sostanziale appiattimento della curva a partire dal terzo fattore, la soluzione a due fattori sembra supportata.

Communalities

.364 .429

.340 .417

.368 .463

.215 .249

.421 .498

.492 .650

.245 .279

.281 .304

.400 .466

.387 .489

item1

item2

item3

item4

item5

item6

item7

item8

item9

item10

Initial Extract ion

Extract ion Method: Principal Ax is Factoring.

Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali

Factor Matrixa

.691 -.416

.659 -.179

.648 .278

.623 .202

.594 .332

.577 .290

.564 -.413

.541 -.103

.495 -.185

.416 .275

item6

item9

item5

item1

item3

item2

item10

item8

item7

item4

1 2

Factor


2 factors extracted. 9 iterations required.a.

In tabella troviamo i valori delle comunalità iniziali e finali , e della soluzione fattoriale non ruotata. Questa soluzione iniziale consente di calcolare empiricamente le comunalità: le comunalità empiriche vengono sostituite alle stime iniziali e il processo di estrazione dei fattori viene ripetuto. Il processo si interrompe quando i valori empirici delle comunalità divengono sufficientemente stabili (ovvero il valore delle comunalità ottenuto nella interazione precedente non cambia in maniera apprezzabile in quella successiva)

Communalities

.364 .429

.340 .417

.368 .463

.215 .249

.421 .498

.492 .650

.245 .279

.281 .304

.400 .466

.387 .489

item1

item2

item3

item4

item5

item6

item7

item8

item9

item10

Initial Extract ion

Extract ion Method: Principal Ax is Factoring.

Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali

Factor Matrixa

.691 -.416

.659 -.179

.648 .278

.623 .202

.594 .332

.577 .290

.564 -.413

.541 -.103

.495 -.185

.416 .275

item6

item9

item5

item1

item3

item2

item10

item8

item7

item4

1 2

Factor


2 factors extracted. 9 iterations required.a.

N.B. Durante questo processo il numero dei fattori deve rimanere costante. I valori finali delle comunalità possono essere ricavati dalla soluzione stessa elevando al quadrato le saturazioni di ogni variabile in ogni fattore comune e sommando tali quadrati. Es. La comunalità finale dell’item 1 (.429)si ottiene elevando al quadrato e sommando le saturazioni dell’item 1 nel primo fattore (.6232) e nel secondo fattore (.2022)!

Structure Matrix

.804 .431

.690 .320

.668 .509

.529 .438

.525 .359

.451 .704

.378 .680

.463 .648

.382 .646

.245 .495

item6

item10

item9

item8

item7

item5

item3

item1

item2

item4

1 2

Factor

Extraction Method: Princ ipal Axis Fac toring.

Rotation Method: Promax with Kaiser Normalizat ion.

Matrice della struttura

Questa è una matrice delle correlazioni tra variabili osservate e fattori.

Factor Correlation Matrix

1.000 .593

.593 1.000

Factor

1

2

1 2



Correlazione tra i fattori obliqui. I fattori correlano tra loro

Pattern Matrixa

.846 -.070

.772 -.138

.565 .174

.481 .075

.416 .192

-.038 .702

.051 .674

-.001 .647

.123 .575

-.074 .540

item6

item10

item9

item7

item8

item3

item5

item2

item1

item4

1 2

Factor



Rotation converged in 3 iterations.a.

Considerando che saturazioni fattoriali >.30 sono significative, la soluzione ruotata mostra come sul primo fattore saturano gli item relativi alla componente somatica della depressione (item, 6,7,8,9 e 10). Sul secondo fattore saturano gli item relativi alla componente cognitivo-affettiva della depressione (item 1,2,3,4 e 5).

Matrice dei modelli La matrice dei modelli, invece, è la matrice dei coefficienti di impatto dei fattori sulle variabili osservate. E’ questa la matrice che vado ad interpretare poiché è quella fattorialmente semplice!

Grafico fattoriale nello spazio fattoriale ruotato

Il pattern fattoriale può essere rappresentato graficamente. Gli assi fattoriali sono rappresentati come ortogonali anche se la soluzione è obliqua. Da questa rappresentazione però si evince chiaramente la struttura semplice raggiunta tramite la soluzione obliqua: gli item che saturano sul fattore 1 e 2 si trovano in corrispondenza degli assi dei due rispettivi fattori.

CONCLUSIONI In linea con le nostre ipotesi l’esame fattoriale esplorativo della scala, ha evidenziato come questa presenti una struttura bi-fattoriale. Possiamo considerare, quindi, che la misura della depressione per questo strumento, include una fattore che chiameremo somatico ed un altro che chiameremo cognitivo-affettivo.

Analisi fattoriale - psicometria.unich.it fattoriale.pdf · • L’analisi fattoriale viene...

Documents

Transcript of Analisi fattoriale - psicometria.unich.it fattoriale.pdf · • L’analisi fattoriale viene...