ANALISI FATTORIALE E PSICOLOGIA Nasce come metodo di spiegazione di dati di tipo psicologico XCHE...
-
Upload
alessia-lombardo -
Category
Documents
-
view
220 -
download
1
Transcript of ANALISI FATTORIALE E PSICOLOGIA Nasce come metodo di spiegazione di dati di tipo psicologico XCHE...
ANALISI FATTORIALE E PSICOLOGIA
Nasce come metodo di spiegazione di dati di tipo psicologico
XCHE’
Permette di studiare molte variabili contemporaneamente
ANALISI FATTORIALE: che cos’è
Corpo di metodi statistici che aiutano il ricercatore a definire meglio le proprie variabili e a decidere quali dovrebbero essere studiate e messe in relazione
Sviluppo Psicologia
Tecnica utilizzata per
STUDIARE RIASSUMERE SEMPLIFICARE
le relazioni in un insieme di variabili
SCOPO
Ridurre l’informazione contenuta in un insieme di dati individuando uno o più FATTORI (dimensioni) latenti che raggruppano una serie di variabili
RISULTATO
POCHI FATTORI partendo da MOLTE VARIABILI
- CULTURA GENERALE
- COMPRENSIONE
- ANALOGIE
- VOCABOLARIO
FATTORE
ABILITA’ VERBALE
ESEMPIO:
FASI dell’AF
PUNTO DI PARTENZA: trasformazione di una matrice “soggetti x variabili” in una matrice “variabili x variabili” (matrice di correlazione R ridotta)
Matrice SOGGETTI X VARIABILI
es. 100 X 10
Item 1 Item 2 Item 3 …
Andrea 3 2 2 …
Anna 2 4 1 …
Paola 4 5 3 …
… … … … …
Matrice VARIABILI X VARIABILI
es. 10 X 10
Item 1 Item 2 Item 3 …
Item 1 ? .34 .42 …
Item 2 .34 ? .52 …
Item 3 .42 .52 ? …
… … … … …
MATRICE DI CORRELAZIONE R RIDOTTA
PUNTO DI ARRIVO: matrice delle saturazioni A (relazioni fra variabili e fattori latenti)
Matrice VARIABILI X FATTORI
es. 10 X 2
Fattore 1 Fattore 2
Item 1 .60 .34
Item 2 .48 .23
Item 3 .56 .49
… … …
MATRICE DELLE SATURAZIONI A
Riassumendo
Matrice SOGGETTI X VARIABILI
Matrice VARIABILI X VARIABILI (R)
Matrice VARIABILI X FATTORI (A)
Matrice 100 X 10
Matrice 10 X 10
Matrice 10X 2
Riassumendo
Tipi di Analisi Fattoriale
• Analisi Fattoriale Esplorativa (AFE) è la situazione in cui il ricercatore non ha in mente nessuna ipotesi teorica (approccio data driven)
• Analisi Fattoriale Confermatoria (AFC) il ricercatore dispone di una precisa ipotesi a priori sulla struttura dei fattori
Modello teorico dell’AFE
IPOTESI FONDAMENTALE
La CORRELAZIONE tra le variabili è DETERMINATA da dimensioni non osservabili, i FATTORI, che in qualche modo causano o DETERMINANO i PUNTEGGI riscontrabili nelle VARIABILI osservate
Esamina la VARIANZA che le variabili hanno in comune (VARIANZA COMUNE) per cercare di determinare i fattori sottostanti
VARIANZA: indicatore di variabilità che corrisponde alla media del quadrato degli scostamenti dalla media
s2 = (xi-x)2
n
Non tutta la varianza degli item può essere spiegata dai fattori comuni
FATTORE UNICO VARIANZA UNICA
FATTORE 1 FATTORE 2
VAR 1 VAR 2
Fattore unico 1 Fattore unico 2
Scomposizione della varianza
• Varianza totale= varianza comune+varianza unica (1= h2+u2)
• Comunalità = varianza totale – unicità
(h2= 1 – u2)
• Unicità = varianza totale – comunalità
(u2= 1 – h2)
COMUNALITA’: parte di varianza totale che viene spiegata dai fattori comuni
UNICITA’: parte di varianza totale che viene spiegata dal fattore unico
Varianza attribuibile a processi che agiscono sistematicamente solo su una variabile (specificità)
Varianza dovuta all’errore di misurazione
ASSUNTO FONDAMENTALE AFE
Il punteggio standardizzato di un soggetto in una
variabile è uguale alla somma ponderata del
punteggio ottenuto dallo stesso soggetto nei
fattori comuni e nel fattore unico
• Zik = Fi1ak1+ Fi2ak2+… Fimakm+uik
• Zik= punteggio standardizzato del soggetto i nella variabile k
• Fi1= punteggio standardizzato per il soggetto i nel fattore comune 1
• ak1= saturazione fattoriale (factor loading) della variabile k nel fattore comune 1
• uik = punteggio standardizzato per il soggetto i nel fattore unico associato alla variabile k
Espressione matriciale
Z = F*A’+U• Z matrice dei punteggi standardizzati
• F matrice dei punteggi nei fattori comuni
• A’ matrice (trasposta) delle saturazioni nei fattori comuni
• U matrice dei fattori unici per ogni soggetto in ogni variabile
R = AA’ + U2
EQUAZIONE FONDAMENTALE AF
• R matrice delle correlazioni tra le variabili
• A matrice delle saturazioni nei fattori comuni
• A’ matrice (trasposta) di A
• U2 matrice diagonale che contiene la varianza unica relativa ad ogni variabile
COMUNALITA’
Somme dei quadrati delle saturazioni riga x riga
Rappresentano ciò che vi è in comune tra ogni variabile e tutti i fattori, cioè la PORZIONE DI VARIANZA DELLA VARIABILE SPIEGATA DAI FATTORI
Quadrato saturazioni: porzione di varianza della singola variabile che è spiegata dal fattore
Fattore 1 Fattore 2 h2
(comunalità)
Item 1 .60 .34 .602 +. 342
Item 2 .48 .23 .482 +. 232
Item 3 .56 .49 .562 +. 492
… … … …
Matrice delle saturazioni fattoriali A
Item 1 Item 2 Item 3 …
Item 1 ? .34 .42 …
Item 2 .34 ? .52 …
Item 3 .42 .52 ? …
… … … … …
MATRICE DI CORRELAZIONE R RIDOTTA
? = STIMA DELLE COMUNALITA’
COSA ACCADREBBE SE SI METTESSE 1 SULLA DIAGONALE PRINCIPALE?
La varianza di errore e specifica andrebbero a gonfiare la varianza estratta dai fattori distorcendo le stime dei parametri
LA MATRICE DI CORRELAZIONE CON 1 SULLA DIAGONALE PRINCIPALE VIENE USATA NELL’ACP
5 PASSI FONDAMENTALI DELL’AFE
1) SELEZIONE DELLE VARIABILI
2) CALCOLO DELLA MATRICE DELLE CORRELAZIONI TRA LE VARIABILI (R)
3) ESTRAZIONE DEI FATTORI (A)
4) ROTAZIONE DEI FATTORI
5) INTERPRETAZIONE DELLA MATRICE DEI FATTORI RUOTATI
Fattore 1 Fattore 2
Item 1 .60 .34
Item 2 .48 .23
Item 3 .56 .49
… … …
MATRICE DELLE SATURAZIONI FATTORIALI A
RUOTARE I FATTORI = spostarne la posizione nello spazio
In modo che:
solo poche variabili presentino saturazioni elevate su ciascuno di essi
Ogni singola variabile tenda a correlare solo con un fattore
Fattore 1 Fattore 2
Item 1 .70
Item 3 .63
Item 4 .54
Item 10 .45
Item 2 .77
Item 5 .75
Item 6 .66
Item 7 .60
Item 8 .54
Item 9 .51
MATRICE DELLE SATURAZIONI RUOTATA
INTERPRETAZIONE
Ci si serve di tutte le conoscenze disponibili riguardo alle variabili così come di ogni altra informazione pertinente
Si comincia analizzando le variabili che presentano saturazioni più elevate nei fattori ruotati
MATRICE DELLE CORRELAZIONI TRA LE VARIABILI R
(MATRICE VARIABILI x VARIABILI)
ESTRAZIONE DEI FATTORI
MATRICE DELLE SATURAZIONI NON RUOTATE A
ROTAZIONE DEI FATTORI
MATRICE DELLE SATURAZIONI RUOTATE
INTERPRETAZIONE DEI FATTORI
MATRICE SOGGETTI x VARIABILI
DECISIONI DA PRENDERE IN UN AFE
1) QUALI VARIABILI E CAMPIONE UTILIZZARE
2) SE L’AFE E’ LA PIU’ APPROPRIATA FORMA DI ANALISI PER RAGGIUNGERE GLI OBIETTIVI DELLA SUA RICERCA
3) QUALE PROCEDURA UTILIZZARE PER ADATTARE IL MODELLO AI DATI
4) QUANTI FATTORI INCLUDERE NELLO STUDIO
5) COME RUOTARLI PER OTTENERE UNA SOLUZIONE FACILMENTE INTERPRETABILE
Il ricercatore deve DECIDERE:
PROGETTO DI RICERCA: VARIABILI E CAMPIONE
1) DEFINIRE PRELIMINARMENTE L’AREA CHE SI VUOLE STUDIARE;
2) FARSI UN’IDEA DEI FATTORI CHE CI ASPETTA DI OTTENERE;
3) SCEGLIERE LE VARIABILI
4) SELEZIONARE UN CAMPIONE RAPPRESENTATIVO SU CUI RACCOGLIERE I DATI
5) FARE LE ANALISI
VARIABILI:
•ogni fattore atteso deve essere sovradeterminato, cioè rappresentato da più variabili con un rapporto di almeno 1:4-1:5
•Le variabili con bassa comunalità dovrebbero essere eliminate;
CAMPIONE:
Campioni di medie dimensioni
Il campione deve assicurare variabilità al fattore
VARIABILI
CONDIZIONI OTTIMALI
CONDIZIONI MODERATE
CONDIZIONI SCARSE
Campioni anche piccoli
Anche campioni grandi potrebbero non essere sufficienti!
Attenzione alle condizioni di raccolta dati
APPROPRIATEZZA AFE
Qual è l’obiettivo del mio progetto di ricerca?
PARSIMONIOSA RAPPRESENTAZIONE DELLE ASSOCIAZIONI TRA LE VARIABILI
SEMPLIFICAZIONE DEI DATI
AFE ACP
L’Analisi delle Componenti Principali (ACP)
Tecnica di semplificazione dei dati diversa dall’AF e creata per raggiungere scopi diversi
AF: cerca di spiegare più COVARIANZA possibile delle variabili (spiegare le correlazioni)
ACP: cerca di spiegare più VARIANZA possibile delle variabili (trasformando linearmente le variabili originali)
• L’ACP non fa distinzione fra varianza comune (comunalità) e varianza specifica delle variabili
• Nel processo di calcolo delle componenti principali è possibile individuare tante componenti quanto sono le variabili originali
• Non si possono ruotare le componenti
• Le componenti non sono latenti
TECNICA DI ESTRAZIONE DEI FATTORI
METODO DEI FATTORI PRINCIPALI (AFP)
METODO DEI MINIMI QUADRATI (MQ)
METODO DELLA MASSIMA VEROSIMIGLIANZA (ML)
AFP
Vantaggi:
-No assunzione di normalità multivariata;
-Raramente risultati distorti
Limiti:
-Necessaria stima delle comunalità elemento di indeterminatezza nella soluzione
Vantaggi:
-Non necessaria stima delle comunalità;
Limiti:
-Spesso risultati diversi da AFP perché non analizza gli elementi sulla diagonale principale
Vantaggi:
-Test per verificare la bontà dell’adattamento del modello ai dati;
-Non dipendente dalla scala di misura delle variabili
Limiti:
-Assunzione di normalità multivariata
MQ ML
SELEZIONE DEL NUMERO DI FATTORI DA ESTRARRE
Non esiste un metodo certo per determinare l’esatto numero di fattori da estrarre!
MEGLIO SBAGLIARE ESTRAENDO TROPPI FATTORI PIUTTOSTO CHE TROPPO POCHI
PRINCIPALI TECNICHE PER DECIDERE QUANTI FATTORI ESTRARRE
CRITERIO DEGLI AUTOVALORI > 1
SCREE TEST
ANALISI PARALLELA
INDICI DI BONTA’ DELL’ADATTAMENTO DEL MODELLO AI DATI
1) Fare riferimento alla letteratura e a precedenti ricerche;
2) Utilizzare più indicatori possibili;
3) Se ci sono, controllare i valori di almeno un indice di bontà dell’adattamento del modello ai dati;
4) Testare la scelta effettuate su più gruppi di dati
ROTAZIONE DEI FATTORI
CRITERIO DELLA STRUTTURA SEMPLICE (THURSTONE)
Ogni fattore deve saturare una minoranza di variabili e ogni variabile deve essere spiegata possibilmente da un solo fattore
X1 X2 X3 X4 X5 X6
X1
X2 .75
X3 .83 .70
X4 .32 .25 .39
X5 .28 .31 .25 .79
X6 .36 .32 .33 .82 .76
MATRICE DI CORRELAZIONE DI 6 VARIABILI ARTIFICIALI
Fattore 1
Fattore 2
h2
X1 .77 .55 .89
X2 .66 .44 .63
X3 .74 .49 .78
X4 .78 –.49 .85
X5 .71 –.48 .73
X6 .77 –.45 .79
ANALISI DEI FATTORI PRINCIPALI (AFP)
FATTORE I
1
X5
.5 .25 .75 1
.25
.5
.75
X2
X1X3
X6X4
FATTORE II
Soluzione originale AFP (i fattori coincidono con gli assi cartesiani)
ROTAZIONI ORTOGONALI: durante la rotazione i fattori mantengono il vincolo dell’ortogonalità
ROTAZIONI OBLIQUE: durante la rotazione i fattori divengono correlati
FATTORE I 1
X5
.5 .25 .75 1
.25
.5
.75
X2
X1X3
X6X4
FATTORE II
ROTAZIONE ORTOGONALE 45°
1
X5
.5 .25 .75 1
.25
.5
.75
X2
X1X3
X6X4
ROTAZIONE OBLIQUA (ANGOLI DIVERSI)
FATTORE I
FATTORE II
● Più semplici da effettuare● Inadeguate per molti costrutti esaminati in psicologia poiché costituiti da fattori correlati● Individuano strutture semplici più povere di quelle reali quando i fattori sono correlati● Conducono a gravi distorsioni se si utilizzano con fattori correlati
● Più complesse● Adeguate per la maggior parte dei costrutti psicologici● Non individuano strutture fattoriali più povere quando i fattori non sono correlati● Non comportano distorsioni se si utilizzano su fattori non correlati● Stimando le correlazioni tra i fattori permettono una comprensione più approfondita dei dati
LIMITI E VANTAGGI DELLE ROTAZIONI
ORTOGONALI OBLIQUE
ROTAZIONI OBLIQUE PIU’ COMPLESSE PERCHE’:
-NO SISTEMA DI RIFERIMENTO CARTESIANO;
-COMUNALITA’ PIU’ DIFFICILI DA CALCOLARE;
-SOLUZIONE SU TRE MATRICI (PATTERN, STRUCTURE E DI CORRELAZIONE FATTORIALE)
MATRICE PATTERN (P): contiene i coefficienti relativi all’impatto diretto di ciascun fattore sulle variabili, al netto dell’impatto degli altri fattori
MATRICE STRUCTURE (S): contiene le correlazioni tra le variabili e i fattori, che saranno tanto maggiori rispetto ai coefficienti della matrice Pattern quanto più è elevata la correlazione tra i fattori
EFFETTO DIRETTO DEL FATTORE SULLA VARIABILE
CORRELAZIONI TRA VARIABILI E FATTORI
Pattern Structure
FATTORE I
FATTTOREII
FATTTOREII
FATTORE I
Structure
Pattern
Più la soluzione è obliqua più la S e la P saranno differenti, più diminuisce il grado di obliquità più le due matrici si avvicineranno sino ad arrivare a coincidere quando i due fattori diventano ortogonali
FATTORI PIU’ CORRELATI / ROTAZIONE PIU’ OBLIQUA
FATTORI MENO CORRELATI / ROTAZIONE MENO OBLIQUA
DECISIONI DA PRENDERE IN UN’ANALISI FATTORIALE ESPLORATIVA
Variabili Campione
AFE o ACP?
Analisi dei Fattori Principali Minimi Quadrati Massima Verosimiglianza
Autovalori > 1 Scree test Analisi parallela Indici di goodness of fit
OrtogonaliOblique
• Progetto di ricerca
5 TEMI PRINCIPALI:
• Appropriatezza dell’AFE
• Tecniche di estrazione dei fattori
• Numero di fattori da estrarre
• Rotazione dei fattori
ESEMPIO PRATICO DI AFE
SCALA DIMENSIONI DEL SELF-CONSTRUAL
(13 ITEM con Likert a 7 punti)
Scala inserita nell’European Opinion Survey (EOS), questionario costruito per una ricerca cross-culturale relativa al senso di identità nazionale in alcuni Paesi Europei
PUNTI FONDAMENTALI AFE:
1) PROGETTO DI RICERCA
CAMPIONE: medie dimensioni (300 soggetti) in quanto i fattori, stando alla letteratura, dovrebbero essere sovradeterminati, ma non si hanno dati sulle comunalità delle variabili
VARIABILI: ?
2) APPROPRIATEZZA AFE
SCOPO ANALISI: scoprire se esistono e dunque individuare i fattori latenti
AFE
ANALISI DELLA DISTIBUZIONE DEI DATI
(minimo-massimo, range, distribuzione di frequenza, media, deviazione standard etc)
3) SCELTA TECNICA ESTRAZIONE FATTORI
Poiché la distribuzione è NORMALE MULTIVARIATA, conoscendo i vantaggi e gli svantaggi delle varie tecniche, si sceglie di utilizzare il metodo della Massima Verosimiglianza
ML
4) SELEZIONE DEL NUMERO DEI FATTORI DA ESTRARRE
Non esistendo un unico criterio certo si sceglie di utilizzare:
AUTOVALORI > 1
SCREE TEST
ANALISI PARALLELA
Fattori
Autovalori iniziali
Totale
% di varian
za
% cumulati
ve1 3.88 29.84 29.84
2 2.66 20.51 50.36
3 1.02 7.88 58.24
4 .84 6.48 64.73
5 .78 6.00 70.73
6 .70 5.40 76.14
…
AUTOVALORI
Scree Plot
Factor Number
13121110987654321
Eig
en
valu
e5
4
3
2
1
0
SCREE PLOT
Number of variables: 13Number of subjects: 300
Number of replications: 1000++++++++++++++++++++++++++++++++++++++++++++++++
Random Eigenvalue DS++++++++++++++++++++++++++++++++++++++++++++++++
1 1.3585 .04812 1.2733 .03113 1.2056 .03054 1.1396 .02865 1.0860 .02326 1.0369 .0210
ANALISI PARALLELA
χ2 gl p
26.94
53 .26
INDICE DI GOODNESS OF FIT
Valore del χ2 non significativo il modello trovato ha un buon fit con i dati
(se fosse stato significativo il modello a due fattori sarebbe stato “lontano” dai dati ottenuti con la somministrazione)
5) ROTAZIONE DEI FATTORI
FATTORI NON CORRELATI
RUOTAZIONE ORTOGONALE VARIMAX
FattoriItem 1 2INT4 .73
INT7 .72
INT3 .70
INT6 .64
INT2 .63
INT1 .63
INT5 .55
IND4
.64IND6
.63
IND2
.62IND5
.60
IND1
.56IND3
.55
MATRICE RUOTATA VARIMAX