ANALISI FATTORIALE E PSICOLOGIA Nasce come metodo di spiegazione di dati di tipo psicologico XCHE...

Post on 01-May-2015

221 views 1 download

Transcript of ANALISI FATTORIALE E PSICOLOGIA Nasce come metodo di spiegazione di dati di tipo psicologico XCHE...

ANALISI FATTORIALE E PSICOLOGIA

Nasce come metodo di spiegazione di dati di tipo psicologico

XCHE’

Permette di studiare molte variabili contemporaneamente

ANALISI FATTORIALE: che cos’è

Corpo di metodi statistici che aiutano il ricercatore a definire meglio le proprie variabili e a decidere quali dovrebbero essere studiate e messe in relazione

Sviluppo Psicologia

Tecnica utilizzata per

STUDIARE RIASSUMERE SEMPLIFICARE

le relazioni in un insieme di variabili

SCOPO

Ridurre l’informazione contenuta in un insieme di dati individuando uno o più FATTORI (dimensioni) latenti che raggruppano una serie di variabili

RISULTATO

POCHI FATTORI partendo da MOLTE VARIABILI

- CULTURA GENERALE

- COMPRENSIONE

- ANALOGIE

- VOCABOLARIO

FATTORE

ABILITA’ VERBALE

ESEMPIO:

FASI dell’AF

PUNTO DI PARTENZA: trasformazione di una matrice “soggetti x variabili” in una matrice “variabili x variabili” (matrice di correlazione R ridotta)

Matrice SOGGETTI X VARIABILI

es. 100 X 10

Item 1 Item 2 Item 3 …

Andrea 3 2 2 …

Anna 2 4 1 …

Paola 4 5 3 …

… … … … …

Matrice VARIABILI X VARIABILI

es. 10 X 10

Item 1 Item 2 Item 3 …

Item 1 ? .34 .42 …

Item 2 .34 ? .52 …

Item 3 .42 .52 ? …

… … … … …

MATRICE DI CORRELAZIONE R RIDOTTA

PUNTO DI ARRIVO: matrice delle saturazioni A (relazioni fra variabili e fattori latenti)

Matrice VARIABILI X FATTORI

es. 10 X 2

Fattore 1 Fattore 2

Item 1 .60 .34

Item 2 .48 .23

Item 3 .56 .49

… … …

MATRICE DELLE SATURAZIONI A

Riassumendo

Matrice SOGGETTI X VARIABILI

Matrice VARIABILI X VARIABILI (R)

Matrice VARIABILI X FATTORI (A)

Matrice 100 X 10

Matrice 10 X 10

Matrice 10X 2

Riassumendo

Tipi di Analisi Fattoriale

• Analisi Fattoriale Esplorativa (AFE) è la situazione in cui il ricercatore non ha in mente nessuna ipotesi teorica (approccio data driven)

• Analisi Fattoriale Confermatoria (AFC) il ricercatore dispone di una precisa ipotesi a priori sulla struttura dei fattori

Modello teorico dell’AFE

IPOTESI FONDAMENTALE

La CORRELAZIONE tra le variabili è DETERMINATA da dimensioni non osservabili, i FATTORI, che in qualche modo causano o DETERMINANO i PUNTEGGI riscontrabili nelle VARIABILI osservate

Esamina la VARIANZA che le variabili hanno in comune (VARIANZA COMUNE) per cercare di determinare i fattori sottostanti

VARIANZA: indicatore di variabilità che corrisponde alla media del quadrato degli scostamenti dalla media

s2 = (xi-x)2

n

Non tutta la varianza degli item può essere spiegata dai fattori comuni

FATTORE UNICO VARIANZA UNICA

FATTORE 1 FATTORE 2

VAR 1 VAR 2

Fattore unico 1 Fattore unico 2

Scomposizione della varianza

• Varianza totale= varianza comune+varianza unica (1= h2+u2)

• Comunalità = varianza totale – unicità

(h2= 1 – u2)

• Unicità = varianza totale – comunalità

(u2= 1 – h2)

COMUNALITA’: parte di varianza totale che viene spiegata dai fattori comuni

UNICITA’: parte di varianza totale che viene spiegata dal fattore unico

Varianza attribuibile a processi che agiscono sistematicamente solo su una variabile (specificità)

Varianza dovuta all’errore di misurazione

ASSUNTO FONDAMENTALE AFE

Il punteggio standardizzato di un soggetto in una

variabile è uguale alla somma ponderata del

punteggio ottenuto dallo stesso soggetto nei

fattori comuni e nel fattore unico

• Zik = Fi1ak1+ Fi2ak2+… Fimakm+uik

• Zik= punteggio standardizzato del soggetto i nella variabile k

• Fi1= punteggio standardizzato per il soggetto i nel fattore comune 1

• ak1= saturazione fattoriale (factor loading) della variabile k nel fattore comune 1

• uik = punteggio standardizzato per il soggetto i nel fattore unico associato alla variabile k

Espressione matriciale

Z = F*A’+U• Z matrice dei punteggi standardizzati

• F matrice dei punteggi nei fattori comuni

• A’ matrice (trasposta) delle saturazioni nei fattori comuni

• U matrice dei fattori unici per ogni soggetto in ogni variabile

R = AA’ + U2

EQUAZIONE FONDAMENTALE AF

• R matrice delle correlazioni tra le variabili

• A matrice delle saturazioni nei fattori comuni

• A’ matrice (trasposta) di A

• U2 matrice diagonale che contiene la varianza unica relativa ad ogni variabile

COMUNALITA’

Somme dei quadrati delle saturazioni riga x riga

Rappresentano ciò che vi è in comune tra ogni variabile e tutti i fattori, cioè la PORZIONE DI VARIANZA DELLA VARIABILE SPIEGATA DAI FATTORI

Quadrato saturazioni: porzione di varianza della singola variabile che è spiegata dal fattore

Fattore 1 Fattore 2 h2

(comunalità)

Item 1 .60 .34 .602 +. 342

Item 2 .48 .23 .482 +. 232

Item 3 .56 .49 .562 +. 492

… … … …

Matrice delle saturazioni fattoriali A

Item 1 Item 2 Item 3 …

Item 1 ? .34 .42 …

Item 2 .34 ? .52 …

Item 3 .42 .52 ? …

… … … … …

MATRICE DI CORRELAZIONE R RIDOTTA

? = STIMA DELLE COMUNALITA’

COSA ACCADREBBE SE SI METTESSE 1 SULLA DIAGONALE PRINCIPALE?

La varianza di errore e specifica andrebbero a gonfiare la varianza estratta dai fattori distorcendo le stime dei parametri

LA MATRICE DI CORRELAZIONE CON 1 SULLA DIAGONALE PRINCIPALE VIENE USATA NELL’ACP

5 PASSI FONDAMENTALI DELL’AFE

1) SELEZIONE DELLE VARIABILI

2) CALCOLO DELLA MATRICE DELLE CORRELAZIONI TRA LE VARIABILI (R)

3) ESTRAZIONE DEI FATTORI (A)

4) ROTAZIONE DEI FATTORI

5) INTERPRETAZIONE DELLA MATRICE DEI FATTORI RUOTATI

Fattore 1 Fattore 2

Item 1 .60 .34

Item 2 .48 .23

Item 3 .56 .49

… … …

MATRICE DELLE SATURAZIONI FATTORIALI A

RUOTARE I FATTORI = spostarne la posizione nello spazio

In modo che:

solo poche variabili presentino saturazioni elevate su ciascuno di essi

Ogni singola variabile tenda a correlare solo con un fattore

Fattore 1 Fattore 2

Item 1 .70

Item 3 .63

Item 4 .54

Item 10 .45

Item 2 .77

Item 5 .75

Item 6 .66

Item 7 .60

Item 8 .54

Item 9 .51

MATRICE DELLE SATURAZIONI RUOTATA

INTERPRETAZIONE

Ci si serve di tutte le conoscenze disponibili riguardo alle variabili così come di ogni altra informazione pertinente

Si comincia analizzando le variabili che presentano saturazioni più elevate nei fattori ruotati

MATRICE DELLE CORRELAZIONI TRA LE VARIABILI R

(MATRICE VARIABILI x VARIABILI)

ESTRAZIONE DEI FATTORI

MATRICE DELLE SATURAZIONI NON RUOTATE A

ROTAZIONE DEI FATTORI

MATRICE DELLE SATURAZIONI RUOTATE

INTERPRETAZIONE DEI FATTORI

MATRICE SOGGETTI x VARIABILI

DECISIONI DA PRENDERE IN UN AFE

1) QUALI VARIABILI E CAMPIONE UTILIZZARE

2) SE L’AFE E’ LA PIU’ APPROPRIATA FORMA DI ANALISI PER RAGGIUNGERE GLI OBIETTIVI DELLA SUA RICERCA

3) QUALE PROCEDURA UTILIZZARE PER ADATTARE IL MODELLO AI DATI

4) QUANTI FATTORI INCLUDERE NELLO STUDIO

5) COME RUOTARLI PER OTTENERE UNA SOLUZIONE FACILMENTE INTERPRETABILE

Il ricercatore deve DECIDERE:

PROGETTO DI RICERCA: VARIABILI E CAMPIONE

1) DEFINIRE PRELIMINARMENTE L’AREA CHE SI VUOLE STUDIARE;

2) FARSI UN’IDEA DEI FATTORI CHE CI ASPETTA DI OTTENERE;

3) SCEGLIERE LE VARIABILI

4) SELEZIONARE UN CAMPIONE RAPPRESENTATIVO SU CUI RACCOGLIERE I DATI

5) FARE LE ANALISI

VARIABILI:

•ogni fattore atteso deve essere sovradeterminato, cioè rappresentato da più variabili con un rapporto di almeno 1:4-1:5

•Le variabili con bassa comunalità dovrebbero essere eliminate;

CAMPIONE:

Campioni di medie dimensioni

Il campione deve assicurare variabilità al fattore

VARIABILI

CONDIZIONI OTTIMALI

CONDIZIONI MODERATE

CONDIZIONI SCARSE

Campioni anche piccoli

Anche campioni grandi potrebbero non essere sufficienti!

Attenzione alle condizioni di raccolta dati

APPROPRIATEZZA AFE

Qual è l’obiettivo del mio progetto di ricerca?

PARSIMONIOSA RAPPRESENTAZIONE DELLE ASSOCIAZIONI TRA LE VARIABILI

SEMPLIFICAZIONE DEI DATI

AFE ACP

L’Analisi delle Componenti Principali (ACP)

Tecnica di semplificazione dei dati diversa dall’AF e creata per raggiungere scopi diversi

AF: cerca di spiegare più COVARIANZA possibile delle variabili (spiegare le correlazioni)

ACP: cerca di spiegare più VARIANZA possibile delle variabili (trasformando linearmente le variabili originali)

• L’ACP non fa distinzione fra varianza comune (comunalità) e varianza specifica delle variabili

• Nel processo di calcolo delle componenti principali è possibile individuare tante componenti quanto sono le variabili originali

• Non si possono ruotare le componenti

• Le componenti non sono latenti

TECNICA DI ESTRAZIONE DEI FATTORI

METODO DEI FATTORI PRINCIPALI (AFP)

METODO DEI MINIMI QUADRATI (MQ)

METODO DELLA MASSIMA VEROSIMIGLIANZA (ML)

AFP

Vantaggi:

-No assunzione di normalità multivariata;

-Raramente risultati distorti

Limiti:

-Necessaria stima delle comunalità elemento di indeterminatezza nella soluzione

Vantaggi:

-Non necessaria stima delle comunalità;

Limiti:

-Spesso risultati diversi da AFP perché non analizza gli elementi sulla diagonale principale

Vantaggi:

-Test per verificare la bontà dell’adattamento del modello ai dati;

-Non dipendente dalla scala di misura delle variabili

Limiti:

-Assunzione di normalità multivariata

MQ ML

SELEZIONE DEL NUMERO DI FATTORI DA ESTRARRE

Non esiste un metodo certo per determinare l’esatto numero di fattori da estrarre!

MEGLIO SBAGLIARE ESTRAENDO TROPPI FATTORI PIUTTOSTO CHE TROPPO POCHI

PRINCIPALI TECNICHE PER DECIDERE QUANTI FATTORI ESTRARRE

CRITERIO DEGLI AUTOVALORI > 1

SCREE TEST

ANALISI PARALLELA

INDICI DI BONTA’ DELL’ADATTAMENTO DEL MODELLO AI DATI

1) Fare riferimento alla letteratura e a precedenti ricerche;

2) Utilizzare più indicatori possibili;

3) Se ci sono, controllare i valori di almeno un indice di bontà dell’adattamento del modello ai dati;

4) Testare la scelta effettuate su più gruppi di dati

ROTAZIONE DEI FATTORI

CRITERIO DELLA STRUTTURA SEMPLICE (THURSTONE)

Ogni fattore deve saturare una minoranza di variabili e ogni variabile deve essere spiegata possibilmente da un solo fattore

  X1 X2 X3 X4 X5 X6

X1            

X2 .75          

X3 .83 .70        

X4 .32 .25 .39      

X5 .28 .31 .25 .79    

X6 .36 .32 .33 .82 .76  

MATRICE DI CORRELAZIONE DI 6 VARIABILI ARTIFICIALI

  Fattore 1

Fattore 2

h2

X1 .77 .55 .89

X2 .66 .44 .63

X3 .74 .49 .78

X4 .78 –.49 .85

X5 .71 –.48 .73

X6 .77 –.45 .79

ANALISI DEI FATTORI PRINCIPALI (AFP)

FATTORE I

1

X5

.5 .25 .75 1

.25

.5

.75

X2

X1X3

X6X4

FATTORE II

Soluzione originale AFP (i fattori coincidono con gli assi cartesiani)

ROTAZIONI ORTOGONALI: durante la rotazione i fattori mantengono il vincolo dell’ortogonalità

ROTAZIONI OBLIQUE: durante la rotazione i fattori divengono correlati

FATTORE I 1

X5

.5 .25 .75 1

.25

.5

.75

X2

X1X3

X6X4

FATTORE II

ROTAZIONE ORTOGONALE 45°

1

X5

.5 .25 .75 1

.25

.5

.75

X2

X1X3

X6X4

ROTAZIONE OBLIQUA (ANGOLI DIVERSI)

FATTORE I

FATTORE II

● Più semplici da effettuare● Inadeguate per molti costrutti esaminati in psicologia poiché costituiti da fattori correlati● Individuano strutture semplici più povere di quelle reali quando i fattori sono correlati● Conducono a gravi distorsioni se si utilizzano con fattori correlati

● Più complesse● Adeguate per la maggior parte dei costrutti psicologici● Non individuano strutture fattoriali più povere quando i fattori non sono correlati● Non comportano distorsioni se si utilizzano su fattori non correlati● Stimando le correlazioni tra i fattori permettono una comprensione più approfondita dei dati

LIMITI E VANTAGGI DELLE ROTAZIONI

ORTOGONALI OBLIQUE

ROTAZIONI OBLIQUE PIU’ COMPLESSE PERCHE’:

-NO SISTEMA DI RIFERIMENTO CARTESIANO;

-COMUNALITA’ PIU’ DIFFICILI DA CALCOLARE;

-SOLUZIONE SU TRE MATRICI (PATTERN, STRUCTURE E DI CORRELAZIONE FATTORIALE)

MATRICE PATTERN (P): contiene i coefficienti relativi all’impatto diretto di ciascun fattore sulle variabili, al netto dell’impatto degli altri fattori

MATRICE STRUCTURE (S): contiene le correlazioni tra le variabili e i fattori, che saranno tanto maggiori rispetto ai coefficienti della matrice Pattern quanto più è elevata la correlazione tra i fattori

EFFETTO DIRETTO DEL FATTORE SULLA VARIABILE

CORRELAZIONI TRA VARIABILI E FATTORI

Pattern Structure

FATTORE I

FATTTOREII

FATTTOREII

FATTORE I

Structure

Pattern

Più la soluzione è obliqua più la S e la P saranno differenti, più diminuisce il grado di obliquità più le due matrici si avvicineranno sino ad arrivare a coincidere quando i due fattori diventano ortogonali

FATTORI PIU’ CORRELATI / ROTAZIONE PIU’ OBLIQUA

FATTORI MENO CORRELATI / ROTAZIONE MENO OBLIQUA

DECISIONI DA PRENDERE IN UN’ANALISI FATTORIALE ESPLORATIVA

Variabili Campione

AFE o ACP?

Analisi dei Fattori Principali Minimi Quadrati Massima Verosimiglianza

Autovalori > 1 Scree test Analisi parallela Indici di goodness of fit

OrtogonaliOblique

• Progetto di ricerca

5 TEMI PRINCIPALI:

• Appropriatezza dell’AFE

• Tecniche di estrazione dei fattori

• Numero di fattori da estrarre

• Rotazione dei fattori

ESEMPIO PRATICO DI AFE

SCALA DIMENSIONI DEL SELF-CONSTRUAL

(13 ITEM con Likert a 7 punti)

Scala inserita nell’European Opinion Survey (EOS), questionario costruito per una ricerca cross-culturale relativa al senso di identità nazionale in alcuni Paesi Europei

PUNTI FONDAMENTALI AFE:

1) PROGETTO DI RICERCA

CAMPIONE: medie dimensioni (300 soggetti) in quanto i fattori, stando alla letteratura, dovrebbero essere sovradeterminati, ma non si hanno dati sulle comunalità delle variabili

VARIABILI: ?

2) APPROPRIATEZZA AFE

SCOPO ANALISI: scoprire se esistono e dunque individuare i fattori latenti

AFE

ANALISI DELLA DISTIBUZIONE DEI DATI

(minimo-massimo, range, distribuzione di frequenza, media, deviazione standard etc)

3) SCELTA TECNICA ESTRAZIONE FATTORI

Poiché la distribuzione è NORMALE MULTIVARIATA, conoscendo i vantaggi e gli svantaggi delle varie tecniche, si sceglie di utilizzare il metodo della Massima Verosimiglianza

ML

4) SELEZIONE DEL NUMERO DEI FATTORI DA ESTRARRE

Non esistendo un unico criterio certo si sceglie di utilizzare:

AUTOVALORI > 1

SCREE TEST

ANALISI PARALLELA

  

Fattori

Autovalori iniziali

 Totale

% di varian

za

% cumulati

ve1 3.88 29.84 29.84

2 2.66 20.51 50.36

3 1.02 7.88 58.24

4 .84 6.48 64.73

5 .78 6.00 70.73

6 .70 5.40 76.14

AUTOVALORI

Scree Plot

Factor Number

13121110987654321

Eig

en

valu

e5

4

3

2

1

0

SCREE PLOT

Number of variables: 13Number of subjects: 300

Number of replications: 1000++++++++++++++++++++++++++++++++++++++++++++++++

Random Eigenvalue DS++++++++++++++++++++++++++++++++++++++++++++++++

1 1.3585 .04812 1.2733 .03113 1.2056 .03054 1.1396 .02865 1.0860 .02326 1.0369 .0210

ANALISI PARALLELA

χ2 gl p

26.94

53 .26

INDICE DI GOODNESS OF FIT

Valore del χ2 non significativo il modello trovato ha un buon fit con i dati

(se fosse stato significativo il modello a due fattori sarebbe stato “lontano” dai dati ottenuti con la somministrazione)

5) ROTAZIONE DEI FATTORI

FATTORI NON CORRELATI

RUOTAZIONE ORTOGONALE VARIMAX

  FattoriItem 1 2INT4 .73

 

INT7 .72 

INT3 .70 

INT6 .64 

INT2 .63 

INT1 .63 

INT5 .55 

IND4 

.64IND6

 .63

IND2 

.62IND5

 .60

IND1 

.56IND3

 .55

MATRICE RUOTATA VARIMAX