Metodologie Quantitative Analisi...

1

M

Q

Metodologie Quantitative

Analisi Fattoriale

La logica della scoperta e la struttura

dei dati

Marco Perugini

Milano-Bicocca

Lezione: VIII

Lezione: VIII

2

Indicatori e Costrutti

Indicatore: misura empirica osservabile (ad es., comportamento, risposta)

Costrutto: dimensione latente non osservabile

L’indicatore e’ in relazione al costrutto tramite una regola di corrispondenza

Il costrutto e’ la dimensione latente che associa gli indicatori

Costrutto

X1 X2 X2

Indicatori

Lezione: VIII

3

Indicatori

Un buon indicatore deve essere una buona misura del costrutto e non deve essere una buona misura di altri costrutti

Piu’ indicatori sono necessari per definire un costrutto

La definizione “vera” di un costrutto deriva degli indicatori

Molto spesso in Psicologia il costrutto e’ ipotetico/latente mentre gli indicatori sono osservabili/empirici

Lezione: VIII

4

Costrutto

Un costrutto puo’ essere definito come un un concetto (dimensione, fattore, tratto, classe, componente) teorico con certe conseguenze empiriche

Gli indicatori misurano le conseguenze empiriche

Il costrutto associa gli indicatori (legno puo’ associare tavolo, sedia, quadro, bastone, albero, casa, barca)

Da un punto di vista statistico, se alcuni indicatori corrrelano tra di essi, possiamo inferire la presenza di un costrutto sottostante (o viceversa)

Lezione: VIII

5

Esempio di indicatori e costrutto

1. Costrutto

2. Definizione

3. Indicatori

Estroversione

Tendenza stabile ad essere aperto,

interessato agli altri, loquace, dominante

Aggettivi: Estroverso, Loquace, Dinamico,

Introverso (-), Riservato (-), Timido (-)

Items: E’ il primo a prendere l’iniziativa,

Gli piace chiacchierare, Si tiene a

distanza (-), E’ silenzioso con persone

che non conosce (-)

Lezione: VIII

6

Due tipi di indicatori e costrutti

Riflessivo

Bollen e Lennox, 1991, Psych. Bull.

Formativo

Estroversione

Loquace Vivace Dinamico

Alcolismo

Whisky Vino Birra

Causale o

funzionale?

Non assumiamo che sono correlati Assumiamo che sono correlati

Lezione: VIII

7

La struttura dei dati

• Si parte da una matrice di dati che viene trasformata in una matrice di relazioni tra variabili

nkz

zz

z

n

22212

12111

k21

S

.

.

.

S

zS

v...vv

Soggetti

Variabili

kka

aa

aa

k

22212

12111

k21

v

.

.

.

v

v

v...vv

Variabili

Variabili

Lezione: VIII

8


Relazioni tra variabili

Tipi principali di coefficienti di associazione

Livello di misurazione

Variabile 1 Variabile 2 Coefficiente

Nominale Nominale Phi

Nominale Nominale Contingenza

Nominale Ordinale Gamma

Ordinale Ordinale Kendall's Tau

Dicotomica Intervallo Punto-biseriale

Artificialmente Dicot. Intervallo Biseriale

Artificialmente Dicot. Nominale Tetracorico

Latente (da Ordinale) Latente (da Ordinale) Policorico

Latente (da Ordinale) Intervallo Poliseriale

Intervallo Intervallo r di Pearson

Ricordatevi che questi coefficienti di associazioni rivelano solo relazioni lineari

Lezione: VIII

9


• A seconda del livello di misurazione e degli scopi specifici, si possono usare delle tecniche diverse (ad es., MDS, SSA, Cluster Analysis, Analisi delle Corrispondenze, Modelli di Classe Latente, Analisi Fattoriale)

• Queste tecniche hanno un scopo simile: identificare delle categorie (classi, dimensioni, fattori, tratti, componenti, raggruppamenti) che associano le variabili

kka

aa

aa

k

22212

12111

k21

v

.

.

.

v

v

v...vv

Variabili

Variabili

Lezione: VIII

10

Parsimonia

• Il numero delle dimensioni (costrutti) e’ SEMPRE minore del numero delle misure (indicatori, variabili)

• I costrutti hanno un livello di astrazione piu’ elevato degli indicatori

• Lo scopo e’ di spiegare il piu’ possibile le relazioni tra le variabili con il numero minore di dimensioni

• La parsimonia NON e’ la semplicita’, ma un punto di equilibrio tra semplicita’ e potere esplicativo (rappresentativita’)

• “Everything should be made as simple as possible, but not simpler” (Einstein)

Lezione: VIII

11

Modello verso Realta’

• Le dimensioni sono un modello del fenomeno studiato e non la realta’

• Evitare la Fallacia Induttivistica: i dati non sono MAI sufficienti per determinare in maniera univoca delle teorie che possono essere generalizzate induttivamente oltre i dati stessi

• Le teorie sono indeterminate empiricamente

Disegnate la funzione che passa per questi punti

12

Un possibile modello

Lezione: VIII

Si diverte molto Ama chiacchierare Ama le feste Prende l’iniziativa

Variabili osservate, misurate sui

soggetti

Estroversione

Tratto latente

La variabilità osservata negli items è rappresentata da un

unico fattore che raggruppa le variabili

13

Un altro possibile modello

Lezione: VIII

V5 V4 V1 V2 V3

Fattore 1 Fattore 2

V6

Ovviamente i fattori utili a rappresentare la variabilità delle

variabili osservate possono essere numerosi

14

Fattori ed errori

Lezione: VIII

Guadagnando in parsimonia ed interpretabilità delle relazioni, non ci si

può aspettare di non perdere qualcosa in precisione

V5 V4 V1 V2 V3

Fattore 1 Fattore 2

V6 Variabilità osservata

Variabilità catturata

(spiegata)

AF

errore 1 errore 2 errore 3 errore 4 errore 5 errore 6 Variabilità non

rappresentata dai fattori

15

Tipi di Analisi Fattoriale

Lezione: VIII

Esploratoria

Confermatoria

Analisi Fattori Comuni

Analisi Componenti Principali

Modelli LISREL

Accorpamento di Variabili

Verifica di un modello teorico

Forma del modello decisa

dai noi

Forma del modello decisa dall’algoritmo

AF

16

Rappresentazioni di r

Lezione: VIII

Ogni relazione tra variabili puo’ essere rappresentata graficamente al

fine di capirne le proprieta’ e le caratteristiche

Rappresentazione cartesiana (diagramma di dispersione)

Rappresentazione in termini di varianza condivisa

Rappresentazione vettoriale (prossima lezione)

17

Correlazione: rappresentazione

-4,0 -2,0 0,0 2,0 4,0

Z(x)

-4,0

-3,0

-2,0

-1,0

0,0

1,0

2,0

3,0

Z(v

)

Lezione: VIII

La correlazione indica quanta variabilità ci aspettiamo in una variabile

al variare dell’altra

associazione r=0.78

178.78.^

Se xz varia di 1 rispetto alla media, prediciamo che il soggetto abbia .78 in vz

xxvv zrz ˆ

Notiamo che 1 è la deviazione standard di xz

1

.78

18

Rappresentazione varianze

Lezione: VIII

La varianza di una variabile può essere rappresentata mediante un

diagramma di Venn

Maggiore è la varianza, più grande è il cerchio

X

Varianza di X

V

Varianza di v

19

Varianza condivisa

Lezione: VIII

Se due variabili condividono della varianza, cioè se covariano, le loro

varianza saranno sovrapposte

Varianza di X

V

Varianza di v

X

Varianza condivisa

20

Varianza condivisa

Lezione: VIII

Il quadrato della correlazione, R2, ci indica la percentuale

(proporzione) di varianza condivisa dalle due variabili

vz xz

Varianza condivisa

Variabili standardizzate Le varianze sono uguali

e uguali ad 1

2

condivisas

Questa è la varianza della parte di vz associata a xz

21

Varianza condivisa

Lezione: VIII

Per capire quanto forte è l’associazione possiamo elevare al quadrato

la correlazione e interpretarla come varianza condivisa

vz xz

49.2 R

Legame forte r=0.70 r*r=0.49

Legame debole r=0.10 r*r=0.01

vz xz

01.2 R

Le variabili condividono circa il 50% della variabilità

Le variabili condividono circa il 1% della variabilità

22

Varianza condivisa

Lezione: VIII

Per capire quanto forte è l’associazione (lineare) possiamo elevare al

quadrato la correlazione e interpretarla come varianza condivisa

vz xz

12 R

Legame perfetto r=1 r*r=1

Indipendenza r=0 r*r=0

vz xz

02 R

Le variabili condividono il 100% della variabilità

Le variabili condividono lo 0% della variabilità

23

Perché è utile questa rappresentazione?

Lezione: VIII

Perché estrarre uno (o più) fattori al fine di massimizzare la rappresentatività

delle relazioni fra variabili osservate equivale a prendere quella combinazioni di

variabili che condividono maggior varianza

a4 a2

a3

a1

Fattore estratto

Perché la bontà dei fattori può essere concettualizzata e quantificata come la

loro capacità di catturare la varianza comune tra le variabili osservate

24

Cenni di Algebra

• Un algebra è un sistema di segni in cui sono definite delle “operazioni”

• Algebra scalare

• Algebra dei vettori

• Algebra matriciale

In algebra matriciale un “numero” è chiamato “scalare”

Lezione: VIII

25

Vettori 1

4

12

5

a

vettore riga vettore colonna

4125'a

un vettore è un insieme di numeri che hanno qualche

cosa in comune, ad es. esprimono le misurazioni di

una variabile

elementi

Lezione: VIII

26

Vettori 2

In generale un vettore si indica con una lettera minuscola in grassetto. Formalmente i vettori hanno una dimensione (ovvero il numero di elementi che contengono)

nv

v

v

2

1

v

nvvv 21'v

n è la dimensione del vettore

Lezione: VIII

27

Moltiplicazione fra vettori

12615

8410

425

)4(3)2(3)5(3

)4(2)2(2)5(2

)4(1)2(1)5(1

425

3

2

1

Solo se hanno le stesse dimensioni e solo fra un v. colonna e un v. riga

Lezione: VIII

28

Matrici

Una matrice è un insieme di numeri che hanno qualche cosa in comune, disposti in righe e colonne. Ad es. una tabella di dati statistici

142

301A

232221

131211

aaa

aaaA

Il primo indice indica la riga e il secondo indica la colonna

La matrice si indica con una lettera maiuscola in grassetto

Lezione: VIII

29

Trasposta

Trasposta: le righe di A diventano le colonne di A’

13

40

21

142

301(A’)’=A

Lezione: VIII

30

Matrici: op. con scalari 1

4567

7654

13233343

433323133 A

Si somma lo scalare ad ogni elemento

Addizione

Lezione: VIII

31

Matrici: op. con scalari 2

Moltiplicazione

36912

12963

13233343

433323133 A

Si moltiplica lo scalare ad ogni elemento

Lezione: VIII

32

Matrici: op. fra matrici

655

1053

152341

643221

124

632

531

421BA

Addizione: si sommano gli elementi corrispondenti

Solo se le due matrici hanno la stessa dimensione

Lezione: VIII

33

Matrici: moltiplicazione

2 x 3

12

43

12

321

231

Solo se il numero di colonne della prima matrice è uguale al numero di righe della seconda

3 x 2 Si usa il meccanismo della moltiplicazione dei vettori, applicandolo ad ogni riga della matrice A e ad ogni colonna della B

La matrice risultato sarà 2 x 2

Lezione: VIII

34

Moltiplicazione: ovvero

10381)1(3)4(2)1(1

2662)2(3)3(2)2(1

152121)1(2)4(3)1(1

7492)2(2)3(3)2(1

22

21

12

11

c

c

c

c

102

157C

Lezione: VIII

35

Matrici particolari

03

52Matrice quadrata: quando il numero delle righe è lo stesso di quello

delle colonne

Matrice nulla: una matrice quadrata con tutti elementi uguali a 0

000

000

000

Matrice identita’ (I): una matrice quadrata con 1 lungo la diagonale

principale e 0 negli altri

100

010

001

Lezione: VIII

36

Matrice inversa e ortogonale

La matrice inversa (A-1) è la matrice che risolve questa relazione: A A-1 = I

Deve essere una matrice quadrata e non sempre esiste la matrice inversa di una matrice.

Un matrice è ortogonale se AA’=A’A=I L’inversa di una matrice ortogonale è uguale alla

trasposta della matrice: A A-1 = I=AA’

Lezione: VIII

37

AF: Equazioni di base

Si assume che i punteggi standardizzati nelle variabili osservate (Z) possono essere riprodotti moltiplicando i punteggi fattoriali (F) per le saturazioni fattoriali (A’, matrice trasposta)

nkz

zz

z

n

22212

12111

k21

S

.

.

.

S

zS

v...vv

Soggetti

Variabili

=

npf

ff

f

F

n

22212

12111

p21

S

.

.

.

s

fs

F...F

Soggetti

Fattori

X

kpp

212

12111

k21

aF

.

aF

aaF

vvv

Fatt.

Var

Z A’ F

Lezione: VIII

38

Equazioni di base

Egualmente si puo’ dimostrare che la matrice di correlazione

tra le variabili (R) e’ equivalente al prodotto delle matrici

fattoriali (A x A’)

= X

kpk

212

12111

p21

av

.

av

aav

FFF

Var.

Fattori

R A A`

pkp

212

12111

k21

aF

.

aF

aaF

vvv

Fatt.

Variabili

kkk

212

12111

k21

rv

.

rv

rrv

vvv

Var.

Variabili

Lezione: VIII

Metodologie Quantitative Analisi...

Documents

Transcript of Metodologie Quantitative Analisi...