Appunti di analisi fattoriale - Germano Rossi Home Page · L’analisi fattoriale `e un metodo di...

35
Appunti di analisi fattoriale Germano Rossi e Paola Venuti 15 maggio 2004 vers. 0.1.4 1

Transcript of Appunti di analisi fattoriale - Germano Rossi Home Page · L’analisi fattoriale `e un metodo di...

Appunti di analisi fattoriale

Germano Rossi e Paola Venuti

15 maggio 2004vers. 0.1.4

1

Indice

Indice 2

1 L’analisi fattoriale da un punto di vista intuitivo 5

2 Come si esegue un’analisi fattoriale: indicazioni intuitive 132.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.2 Scelta del campione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3 Dai dati alla matrice di correlazione. . . . . . . . . . . . . . . . . . . . . . . . . . 152.4 Determinazione dei fattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.5 Rotazione dei fattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.6 L’interpretazione dei fattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.7 Esempio di interpretazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.8 Punteggi fattoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.9 Appendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Riferimenti bibliografici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2

Introduzione

L’analisi fattoriale puo genericamente essere pensata come la ricerca di variabili latenti a partireda alcune variabili osservate. Una variabile osservata e una variabile che e stata effettivamentemisurata, mentre una variabile latente e un tipo di variabile che non e stata misurata, che forsenon e neppure misurabile e che percio viene ipotizzata e “analizzata” attraverso i suoi effetti.Le influenze che una variabile latente ha su altre variabili misurabili diventano un modo perrisalire a questa variabile nascosta. Storicamente, nell’ambito dell’analisi fattoriale, le variabililatenti vengono chiamate “fattori”. Nei suoi primi modelli matematici, l’analisi fattoriale erauna tecnica di analisi esplorativa appunto perche permetteva di “esplorare” le relazioni nascostefra un gran numero di variabili. In tempi piu recenti, la tecnica delle equazioni strutturali hapermesso di sviluppare una tecnica di analisi fattoriale di tipo confermativo, che cioe permettedi verificare se effettivamente i fattori ipotizzati servono a spiegare le variabili misurate.

3

Capitolo 1

L’analisi fattoriale da un punto divista intuitivo

L’analisi fattoriale e un metodo di elaborazione dei dati che appare molto complesso, in quanto sibasa su una serie di tecniche matematiche piuttosto difficili da studiare e da spiegare in terminisemplici.

Il procedimento logico che sta alla base di questa tecnica e gli scopi per cui viene generalmenteusata sono meno complessi da capire ed e quello che cercheremo qui di illustrare, partendo daun ipotetico esempio di ricerca basato su dati immaginari.

Supponiamo di voler fare una ricerca per vedere, al termine di una terza media inferiore, chetipo di abilita hanno acquisito gli allievi, per poterli cosı indirizzare verso la scelta scolastica delloro futuro.

Si decide di applicare ad ognuno dei 301 ragazzi delle classi terze, una serie di prove (varia-bili osservate) relative a varie abilita ed acquisizioni insegnate ed apprese nel corso degli anniscolastici.

Le prove sono le seguenti:1. Lettura di un testo;2. Comprensione del brano letto;3. Descrizione orale di avvenimenti;4. Invenzione e racconto di una storia;5. Risoluzione di problemi aritmetici;6. Contare e ordinare sequenze numeriche;7. Risoluzione di problemi geometrici;8. Riconoscimento di figure;9. Individuazione di parole contenenti errori;

10. Individuazione di particolari uguali in due figure diverse;11. Individuazione di particolari diversi in due figure uguali;12. Descrizione scritta di stati d’animo;13. Risoluzione di rebus.

Queste prove vengono somministrate in ordine casuale e ogni soggetto ottiene per ciascunadi esse un punteggio compreso fra 1 e 10. Questi risultati sono mostrati nella Tab. 1.1.

Gia ad una prima osservazione, questi risultati mostrano che, generalmente, i soggetti chehanno ottenuto un punteggio alto (ss. 10 e 18), medio (ss. 2 e 15), basso (ss. 20 e 27) nellaprima prova hanno ottenuto risultati simili anche nelle prove 2 e 3. Ancora, i ss. che hannoottenuto un punteggio alto (ss. 10 e 4) nella prova 5 hanno ottenuto punteggi alti anche nelle

1Usiamo un numero di soggetti ridotto a puro titolo esemplificativo (cfr. il cap. 1).

5

6 CAPITOLO 1. UN PUNTO DI VISTA INTUITIVO

Tabella 1.1: Risultati ipotetici ottenuti da 30 ragazzi di terza media in 13 prove finali

ProveSog. 1 2 3 4 5 6 7 8 9 10 11 12 13

1 6 7 6 6 4 3 5 4 8 5 4 7 52 4 3 2 3 8 7 7 8 1 9 10 1 63 7 7 6 7 5 6 6 6 6 7 7 7 54 9 8 7 9 9 10 7 7 8 6 7 7 95 3 2 3 1 6 5 5 6 4 7 6 2 46 4 3 4 4 6 5 5 5 3 6 7 3 47 6 6 6 7 8 7 8 8 7 9 8 6 78 5 4 4 5 6 4 6 4 4 3 2 4 59 5 6 7 6 9 8 8 9 6 10 9 7 9

10 10 9 7 10 9 7 7 9 10 10 9 10 711 4 3 4 2 4 4 4 5 2 4 3 1 312 6 7 7 8 7 9 7 6 8 6 5 7 913 3 2 3 3 5 6 6 5 1 5 6 2 514 6 7 6 6 6 5 5 8 8 9 8 7 715 4 3 2 3 7 7 6 7 1 6 5 1 616 3 2 3 1 3 2 2 4 4 4 3 2 217 5 6 5 5 6 6 7 7 6 7 7 6 818 10 9 7 9 9 10 10 8 9 8 8 9 819 8 7 6 5 9 9 8 10 7 9 10 5 1020 2 1 3 1 4 5 4 5 3 4 4 4 121 4 3 4 2 1 3 1 4 2 4 3 2 222 6 7 6 6 10 9 10 10 7 9 9 7 823 3 2 3 1 5 4 5 6 3 7 6 3 724 7 7 6 7 9 8 9 7 6 6 7 7 625 9 8 7 9 10 9 9 9 7 8 7 7 826 9 10 7 10 8 7 7 7 8 6 7 9 727 1 2 3 1 3 3 2 5 4 6 8 2 228 5 6 7 6 6 6 6 4 6 4 3 7 929 8 7 6 7 7 6 7 6 8 7 7 7 930 7 7 8 8 7 7 7 6 6 6 5 6 8

prove 6 e 7. I ss. che hanno ottenuto bassi punteggi (s. 21) nella prova 10 li hanno avuti anchenella 11. Non si riesce pero a notare un andamento costante in tutte le prove, ad es. il soggetto 1ha un punteggio medio nelle prime tre prove, un basso punteggio nelle prove 5 e 6, un punteggioalto nella nona prova e nuovamente un punteggio basso nelle prove 10 e 11. Questo andamentosi puo notare meglio nel grafico di Fig. 1.1 relativo ai ss. 1, 2, 11 e 12.

Si puo a questo punto tentare un’ipotesi: tra alcune delle variabili esiste un particolarerapporto per cui i ss. che ottengono un determinato punteggio in una di queste prove ottengonopunteggi analoghi nelle altre prove dello stesso gruppo. Allo stesso tempo fra altre variabiliesiste un rapporto analogo al precedente anche se non sembra che vi sia una relazione precisafra i due gruppi di variabili.

Questa nostra ipotesi sull’andamento dei dati rilevati, pero non e facilmente dimostrabile.Si puo percio pensare di ricorrere ad una metodica statistica che permetta di rilevare in chemisura le variabili siano tra loro in relazione. In statistica ne esiste una che effettivamenterisponde alle nostre esigenze: il coefficiente di correlazione prodotto-momento di Bravais-Pearson(Cristante, Lis, & Sambin, 1982). Ricordiamo che questo indice statistico misura il grado direlazione esistente fra due variabili: se le variabili mutano concordemente (nel senso che soggettiche hanno ottenuto punteggi alti nella prima prova li ottengono pure alti nella seconda, e isoggetti che invece ottengono punteggi bassi nella prima lo ottengono anche nella seconda) si

7

Figura 1.1: Rappresentazione grafica dei punteggi di alcuni soggetti

avra una correlazione elevata, se mutano indipendentemente l’una dall’altra non si avra alcunacorrelazione. Abbiamo utilizzato questo coefficiente di “accordo” considerando tutte le coppieche e stato possibile ottenere tra le variabili. La Tab. 1.2 riporta i valori di questi coefficientiin una tabella che e chiamata matrice delle correlazioni. All’incrocio fra una riga e una colonnasi trova l’indice di somiglianza delle due variabili indicate rispettivamente all’inizio della riga edin cima alla colonna.

Analizziamo questa tabella considerando come elevate, a solo titolo esemplificativo, le corre-lazioni superiori o uguali a .80 (anche se questo valore e di molto superiore a quello critico perun livello di significativita del 5%; cfr. Cristante et al., 1982). La tabella che segue presenta solometa dell’intera matrice delle correlazioni perche, la correlazione della variabile 2 con la variabile3 (.91) e uguale alla correlazione della variabile 3 con la variabile 2. L’intera matrice, quindi, esimmetrica rispetto alla diagonale (definita principale), cioe le due meta risultano speculari l’unaall’altra. Una seconda caratteristica di questa tabella e la presenza di un trattino ad indicarela correlazione di una variabile con se stessa che generalmente non viene calcolata oppure vieneindicata con il valore 1.

Tabella 1.2: Matrice delle correlazioni fra prove finali

1 2 3 4 5 6 7 8 9 10 11 12 131 -2 .94 -3 .81 .91 -4 .92 .96 .89 -5 .70 .67 .56 .70 -6 .68 .65 .58 .69 .89 -7 .68 .68 .59 .71 .93 .87 -8 .54 .54 .39 .47 .83 .75 .74 -9 .81 .89 .87 .83 .54 .49 .53 .45 -

10 .43 .45 .33 .39 .68 .55 .59 .90 .45 -11 .37 .39 .24 .34 .65 .57 .56 .84 .36 .91 -12 .82 .92 .90 .90 .58 .55 .63 .44 .93 .41 .33 -13 .67 .72 .69 .70 .77 .76 .78 .62 .62 .56 .47 .64 -

8 CAPITOLO 1. UN PUNTO DI VISTA INTUITIVO

Osservando questa tabella ci rendiamo conto che la nostra ipotesi iniziale era esatta. Esistonoinfatti delle relazioni molto alte tra alcune variabili (ad esempio la 1 con la 2; la 1 con la 3; la 2con la 3, tutte con valori superiori a .80) e altri valori piu bassi (ad esempio la 1 con le variabili8, 10 e 11 tutte inferiori a .55).

Si puo quindi dire che le prime 3 variabili sono strettamente collegate fra loro e quindipotrebbe essere che misurino abilita simili o addirittura aspetti diversi di una sola abilita. Secio e facile da individuare analizzando le prime tre variabili oppure la 5 e la 6, perche sono leune vicine alle altre, per altre variabili che non presentano questa vicinanza sulla matrice (adesempio la 1 e la 9) questo rapporto non e immediatamente visibile.

Proviamo a riorganizzare la matrice delle correlazioni in modo che la maggior parte dellevariabili molto correlate fra loro si trovino le une vicino alle altre anche fisicamente nella matricestessa.

Cerchiamo la correlazione piu alta esistente nella matrice (.95 tra la variabile 2 e la variabile4) e riorganizziamo la variabile 2 in ordine decrescente di valori (Tab. 1.3).

Tabella 1.3: Correlazioni della variabile 2 con le altre variabili

var. 22 -4 .961 .94

12 .923 .919 .89

13 .727 .685 .676 .658 .54

10 .4511 .39

A questo punto riproduciamo tutta la matrice di correlazione secondo l’ordine delle variabiliindicato dai valori decrescenti della variabile 2 (Tab. 1.4).

Possiamo vedere che le variabili 2, 4, 1, 12, 3, 9 e 13 sono tutte tra loro altamente correlate,mentre le loro correlazioni con tutte le altre variabili sono minori. Analogamente per le variabili7, 5, 6 e per le variabili 8, 10, 11 le quali formano altri due gruppetti fra loro isolati. Comerisulta dalla Tab. 1.5 si possono individuare, quindi, 3 blocchi di variabili, strettamente unite alloro interno e separate dalle altre.

Per spiegarci il motivo di questi raggruppamenti2 proviamo ad analizzare il significato dellevariabili che li compongono.

1. Il primo raggruppamento e formato dalle variabili:2 - Comprensione di un brano letto4 - Invenzione e racconto di una storia1 - Lettura di un testo

12 - Descrizione scritta di stati d’animo3 - Descrizione orale di avvenimenti

2Usiamo il termine “ raggruppamento” nel suo significato quotidiano; non intendiamo affatto riferirci a tecnichedi analisi particolari quali la cluster analysis.

9

Tabella 1.4: Matrice delle correlazioni ordinata secondo i valori decrescenti della variabile 2

2 4 1 12 3 9 13 7 5 6 8 10 112 -4 .96 -1 .94 .92 -

12 .92 .90 .82 -3 .91 .89 .81 .90 -9 .89 .83 .81 .93 .87 -

13 .72 .70 .67 .64 .69 .62 -7 .68 .71 .68 .63 .59 .53 .78 -5 .67 .70 .70 .58 .56 .54 .77 .93 -6 .65 .69 .68 .55 .58 .49 .76 .87 .89 -8 .54 .47 .54 .44 .39 .45 .62 .74 .83 .75 -

10 .45 .39 .43 .41 .33 .45 .56 .59 .68 .55 .90 -11 .39 .34 .37 .33 .24 .36 .47 .56 .65 .57 .84 .91 -

Tabella 1.5: Matrice delle correlazioni con i raggruppamenti delle variabili evidenziati

2 4 1 12 3 9 13 7 5 6 8 10 112 -4 .96 -1 .94 .92 -

12 .92 .90 .82 -3 .91 .89 .81 .90 -9 .89 .83 .81 .93 .87 -

13 .72 .70 .67 .64 .69 .62 -7 .68 .71 .68 .63 .59 .53 .78 -5 .67 .70 .70 .58 .56 .54 .77 .93 -6 .65 .69 .68 .55 .58 .49 .76 .87 .89 -8 .54 .47 .54 .44 .39 .45 .62 .74 .83 .75 -

10 .45 .39 .43 .41 .33 .45 .56 .59 .68 .55 .90 -11 .39 .34 .37 .33 .24 .36 .47 .56 .65 .57 .84 .91 -

9 - Individuazione di parole contenenti errori13 - Risoluzione di rebus

Queste variabili indicano tutte delle abilita di tipo linguistico e verbale legate ai processidi lettura, scrittura e comprensione di materiale scritto o letto. Le ultime due variabiliindicano delle capacita logiche legate a conoscenze linguistiche o ortografiche.

2. Il secondo raggruppamento e formato da:7 - Risoluzione di problemi geometrici5 - Risoluzione di problemi aritmetici6 - Contare e ordinare sequenze numeriche

Chiaramente, queste variabili indicano tutte un’abilita legata alla conoscenza dei numeri,dei rapporti matematici e geometrici.

3. Quest’ultimo raggruppamento comprende:8 - Riconoscimento di figure

10 - Individuazione di particolari uguali in due figure diverse11 - Individuazione di particolari diversi in due figure uguali

10 CAPITOLO 1. UN PUNTO DI VISTA INTUITIVO

Altrettanto chiaramente queste variabili indicano abilita di tipo percettivo relative alladiscriminazione di stimoli visivi.

L’aver raggruppato i dati in questo modo ci ha reso molto piu evidente i rapporti esistentitra le variabili e ci ha permesso con piu facilita di interpretare i risultati. In questo caso, essen-do l’esempio immaginario e i dati pochi, stato possibile realizzare raggruppamenti in manieraempirica ottenendo dei risultati estremamente chiari.

Nella realta della ricerca psicologica i tatti non sono cosı semplici: il numero dei dati e soventemaggiore, sono presenti errori nel modo di rilevare i dati, il livello delle correlazioni non semprerisulta cosı nettamente differenziato... Da queste difficolta e nata l’esigenza di elaborare unatecnica matematica e statistica che permettesse di ottenere dei raggruppamenti di variabili inbase ad un tratto comune che li unifica e che consente di spiegare le correlazioni tra esse esistenti.Questa tecnica e l’analisi fattoriale, che, sebbene utilizzi sofisticati calcoli matematici, nei suoiprocessi piu intuitivi e logici segue le fasi da noi suesposte. Infatti il punto di partenza di questatecnica e una matrice delle correlazioni tra le variabili. Un indice di correlazione ci informasull’andamento concomitante di due variabili, non e pero possibile dire che, se A correla con B,allora A e causa di B oppure che B e causa di A. Vale a dire che un alto indice di correlazione cipermette di capire che al variare di una, varia contemporaneamente anche l’altra. E’ impossibiledire se una delle due sia responsabile del variare della seconda oppure se entrambe siano legatead una terza variabile (sconosciuta) che e responsabile del loro variare concomitante.

Questo stesso ragionamento puo essere esteso a tre, quattro o n variabili tutte tra loroaltamente correlate. Una di queste e responsabile del variare delle altre, oppure esiste un’ulteriorevariabile a cui imputare il variare concorde di tutte?

L’Analisi Fattoriale parte appunto dall’ipotesi che esista questa ulteriore variabile che inqualche modo influenza ed agisce su un gruppo di variabili fra loro altamente correlate. Questavariabile sottostante (definita fattore) agisce evidentemente su un particolare “tratto” comunea tutte le altre. L’Analisi fattoriale allora, si assume il compito d’individuare il o i fattori, cioele variabili sottostanti ad un gruppo di altre variabili.

Per questo, nell’interpretare i fattori, si procede nel modo da noi seguito in precedenza. Sicerca cioe di trovare il significato comune alle variabili che confluiscono in un fattore, tenendopresente che tali variabili non hanno lo stesso peso nel determinare il significato di questo fattore.Infatti, in base ai calcoli matematici che poi spiegheremo, ad ogni variabile viene attribuito unvalore, chiamato saturazione che ci indica l’importanza che ha quella variabile nel determinare ilsignificato del fattore. Allora, una variabile con una grande importanza in un fattore, ossia conun’alta saturazione in quel fattore, influira piu di una variabile con una saturazione piu bassa.

Possiamo quindi dire che, poiche l’analisi fattoriale si applica ad un’insieme di dati raccoltiattraverso osservazioni, test, questionari... e tutta la gamma di misurazioni che sono comune-mente utilizzate in psicologia, il suo scopo prioritario e quella di ridurre questa vasta quantitadi misurazioni o variabili, attraverso delle variabili-fattore che siano in numero inferiore allevariabili di partenza e che spieghino tutte le correlazioni delle variabili di quel raggruppamento.

L’analisi fattoriale e stata inizialmente proposta da Charles Spearman nel 1904 e succes-sivamente ampliata con il contributo di altri psicologi. Il contributo di alcuni matematici estato importante non tanto nello sviluppo teorico, quanto nell’affinamento di alcune tecniche dicalcolo.

Spearman sosteneva che tutte le misure di abilita mentale relative ad un test potevano esserespiegate come attribuibili ad un’abilita generale e ad un’abilita specifica. Ciascuna di questedue abilita dipende, per Spearman da un fattore: un fattore generale e un fattore specifico.

Applicando un test di Q.I. che comprenda una prova di abilita verbale, una di abilita numericae una di abilita spaziale, il punteggio finale ottenuto (secondo Spearman) sara determinato sia

11

dai risultati ottenuti grazie all’abilita specifica del soggetto nei tre campi (fattori specifici) siadal suo livello “generale” d’intelligenza (fattore generale).

Questa teoria, denominata teoria dei due fattori, ha orientato per vari anni le ricer-che psicologiche finche Thurstone (1945) non propose una modifica, conosciuta come teoriamultifattoriale.

Egli ritenne che non esistesse un unico fattore generale, ma piuttosto diversi fattori definiticomuni. Questi fattori vengono chiamati comuni in quanto raccolgono solo alcune delle variabiliin esame differenziandosi in tal modo dal fattore generale che era comune a tutte le variabilicontemporaneamente. Ogni fattore comune ha caratteristiche diverse dagli altri fattori e dallesingole variabili che lo definiscono. Cio che lo caratterizza in realta e l’esprimere un tratto chee comune ad ognuna delle variabili in esso raccolte.

Ritorniamo al primo esempio del capitolo: consideriamo i tre raggruppamenti che si sonoformati tra le prove di abilita e di apprendimento somministrate a ragazzi di Scuola Media. Inlinea di massima potremmo dire che il primo raggruppamento corrisponde ad abilita di tipoverbale-linguistico, il secondo ad abilita legate alle conoscenze numeriche e il terzo ad abilita ditipo percettivo.

Secondo la teoria di Thurstone il punteggio di un certo soggetto in una certa prova, adesempio, risoluzione di problemi geometrici sara dovuta in gran parte ad abilita numerica, maanche ad un piccolissimo contributo di tutte le altre abilita.

Anche ad un semplice livello intuitiva, si capisce che la capacita di una persona di risolvereproblemi geometrici e legata alla capacita soggettiva di saper risolvere quella specifica prova,ma anche alla sua abilita piu generale di tipo matematico, all’abilita di percepire gli elementicaratterizzanti la prova oltre che alla capacita di esprimere la soluzione in forma verbale o scrit-ta. Si vede chiaramente che il peso di ciascuna di queste abilita e diverso e dipende dal tipo diproblema; in questo caso l’abilita specifica e quella numerica saranno sicuramente piu determi-nanti di quella linguistica o percettiva. Al contrario in una prova, ad esempio di comprensionedi un brano letto, il peso dell’abilita linguistica sara molto piu determinante di quello dell’abilitamatematica.

Questa teoria e tuttora alla base di tutti i modelli matematici di analisi fattoriale.L’analisi fattoriale e ormai una metodologia usata con larga diffusione sia in psicologia come

anche, in generale, in tutte le scienze sociali. Essa si e rapidamente diffusa nei vari settoridella psicologia perche il problema che si incontra solitamente nella ricerca psicologica e quellodi cercare quali componenti sottostanno ad uno stesso comportamento globale oppure, anche,quello di trovare quali relazioni esistono fra comportamenti, reazioni, manifestazioni psicologichein generale emessi in determinate situazioni.

L’analisi fattoriale e stata ampiamente utilizzata in psicologia proprio perche permette:

a) di conoscere le relazioni che esistono tra le variabili relative ad un certo comportamento amanifestazione psicologica e su cui non e ancora possibile stabilire ipotesi di lavoro.Esempio:Quando si parla di comportamento sociale di bambini in eta prescolare s’intende riferirsi adun gruppo di comportamenti, abbastanza facilmente definibili, quali il contatto, il gioco,la comunicazione, l’aggressivita, che anche a livello intuitivo sono strettamente connessitra loro e reciprocamente influenzabili e interdipendenti. Se e facile comprendere tuttoquesto, e piu difficile capire fra quali comportamenti esiste realmente una relazione, qualisono invece indipendenti, qual e il “motivo” che fa mettere in rapporto alcuni comporta-menti invece di altri. Per sapere cio si ricorre all’analisi fattoriale. Raccolti i dati relativi alcomportamento sociale attraverso un’osservazione diretta del comportamento di un cam-pione di bambini, in cui vengono rilevati i comportamenti del tipo “giocare insieme ad

12 CAPITOLO 1. UN PUNTO DI VISTA INTUITIVO

altri bambini con un oggetto”, “giocare insieme ad altri bambini senza oggetto”, “giocarecon l’adulto”, “sorridere a qualcuno”, “picchiare un altro bambino”, “piangere”, “giocareda soli”, ecc. sara possibile vedere come, una serie di variabili indicanti i comportamentiosservati vengono a riunirsi insieme, dando origine ad una serie di raggruppamenti, che ciindicano il modo in cui vengono raggruppati i comportamenti di “gioco insieme con i coe-tanei”, di “sorriso”, “verbalizzazione”, escludendo invece comportamenti quali “contattoaggressivo”, “gioco da soli”...

b) la conferma di un’ipotesi specifica, da cui si e partiti, sulle relazioni esistenti tra alcunevariabili psicologiche.Esempio:In un questionario elaborato nel 1975 da Dan Olweus e relativo all’autovalutazione dell’ag-gressivita in preadolescenti, si era interessati a valutare le manifestazioni aggressive sottocerti particolari aspetti: le manifestazioni aggressive di tipo verbale, quelle di tipo fisico ele manifestazioni implicanti un’inibizione della risposta aggressiva. Si e quindi costruito unquestionario che contenesse una serie di item relativi a questi tre aspetti particolari: per lamanifestazione fisica dell’aggressivita, item tipo “Faccio a botte con gli altri ragazzi dellascuola”, per quella verbale “Quando un adulto e ingiusto con me, mi arrabbio e protesto”,per l’inibizione dell’aggressivita “Quando un adulto e irritato con me, generalmente misento in colpa”. L’ipotesi della ricerca era che ciascuno di questi item fosse relativo ad undiverso aspetto di un determinato tipo di aggressivita. Si e quindi sottoposto il questiona-rio, con gli item fra loro mischiati, a due gruppi di circa 80 soggetti l’uno. Ogni soggettodoveva giudicare su una scala da 1 a 5 se l’affermazione proposta dall’item era piu o menoappropriata a se stesso. L’uso dell’analisi fattoriale ha permesso di verificare l’esattezza diquest’ipotesi, infatti gli item da Olweus selezionati come indicativi di manifestazione fisicadell’aggressivita sono risultati appartenere ad un unico fattore. Analoghi risultati si sonoottenuti per gli altri due tipi di item.

Ribadiamo ulteriormente che l’analisi fattoriale e una metodologia statistico-matematica chepermette di esplicitare e formalizzare due modi di operare tipici della psicologia: o raggruppandoinsieme eventi o variabili che si manifestano o mutano congiuntamente, per cogliere il legameesistente tra loro, oppure individuando le influenze, piu o meno importanti, e i comportamentiche sottostanno ad ulteriori comportamenti o avvenimenti.

Abbiamo cercato di spiegare in questo capitolo in modo estremamente intuitivo cosa sial’analisi fattoriale, mentre i capitoli seguenti forniranno delle spiegazioni piu dettagliate e precise.Nel capitolo secondo analizziamo quelle nozioni di analisi fattoriale necessarie a chi, pur volendolaapplicare, non desidera approfondirne, immediatamente, gli aspetti matematici.

Capitolo 2

Come si esegue un’analisi fattoriale:indicazioni intuitive

2.1 Introduzione

In questo capitolo cercheremo di illustrare le varie fasi attraverso cui si passa nell’effettuareun’analisi fattoriale mantenendoci ancora ad un livello intuitivo e rimandando i dettagli mate-matici al successivo capitolo. Come abbiamo gia accennato lo scopo fondamentale di ogni teoriafattoriale e quello di cogliere le variabili latenti (i fattori) capaci di spiegare le relazioni comuniad un ampio gruppo di variabili, di solito rilevate mediante l’uso di una misura di correlazione.

Ricordiamo che per correlazione si intende la misura del grado di interdipendenza reciprocafra due variabili: se all’aumentare di una aumenta anche l’altra e al diminuire di una corrispondela diminuzione dell’altra si parlera di correlazione positiva; se all’aumentare di una corrispondeil diminuire dell’altra, si parlera di correlazione negativa.

Il punto di partenza di ogni analisi fattoriale e quindi l’insieme di tutte le correlazioni tra ungruppo n di variabili che, per facilitarne lo studio, viene disposto in una matrice delle correlazioni,cioe in una tabella a doppia entrata in cui all’incrocio fra una riga e una colonna si trova quelvalore che rappresenta la correlazioni tra le variabili indicate in quella stessa riga e colonna.

Ottenuta la matrice delle correlazioni, il passo successivo e quello di determinare quali equanti siano i fattori che spiegano tale matrice. Si tratta quindi di rispondere alla domanda:“Quanti fattori sono necessari per spiegare questa matrice delle correlazioni?”. A tale domandae possibile dare una risposta attraverso dei metodi matematici chiamati metodi di estrazione deifattori, che consentono di individuarli.

Tuttavia, se da un punto di vista matematico, il numero dei fattori che si possono estrarree ben determinato, per altri motivi, la loro determinazione non e per nulla semplice. Si devericorrere a dei metodi approssimati ed e spesso necessario utilizzare contemporaneamente piumetodi.

Una volta identificato il numero dei fattori e dopo averli determinati secondo uno dei diversimetodi di estrazione, si e risolto solo il primo problema fondamentale dell’analisi fattoriale,quello appunto di trovare una possibile soluzione fattoriale, cioe un insieme di K fattori chespieghino la matrice delle correlazioni tra le n variabili.

Tuttavia, trovato che da una particolare matrice sia possibile estrarre K fattori, questonon ci dice nulla circa il modo di identificarli. Bisogna infatti precisare che, sempre a livellomatematico, e possibile trovare infinite soluzioni di K fattori e ciascuna di queste soddisfa espiega, matematicamente, la stessa matrice delle correlazioni.

Si apre a questo punto una seconda questione (denominata problema dell’indeterminazione

13

14CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

fattoriale) e si tratta allora di cercare una risposta alla successiva domanda: “Quale fra le infinitesoluzioni scegliere?”.

La risposta non puo essere evidentemente di tipo matematico perche le soluzioni, da questopunto di vista, sono tutte ugualmente buone. Si dovranno invece, individuare dei criteri diordine diverso, che si adeguino in ogni caso allo scopo dell’analisi fattoriale. Se teniamo presenteche tale scopo e quello di individuare dei fattori che spieghino dei gruppi di variabili, si dovrannoprobabilmente cercare dei criteri del tipo “ogni fattore dovrebbe influenzare in maniera massimaun gruppo di variabili ed in maniera minima tutte le altre”.

I criteri fino ad oggi individuati si pongono proprio su questa linea e prendono il nome dicriteri per la individuazione della struttura semplice. Da un punto di vista storico, si trat-tava inizialmente di criteri del tutto empirici, che poi sono stati via via ricondotti a formulematematiche.

Il compito di questo capitolo e appunto quello di indicare le possibili risposte a queste duequestioni. In particolare, questi due problemi saranno meglio analizzati e spiegati, sempre inmodo intuitivo, nei paragrafi dedicati alla Determinazione dei fattori e in quella dedicato allaRotazione dei fattori. Ovviamente, in questo capitolo, si trattera anche di tutti i passagginecessari per poter giungere alla soluzione di tali problemi, partendo dai dati di cui si dispone.

Inoltre, poiche ormai l’analisi fattoriale viene effettuata con l’ausilio degli elaboratori elet-tronici, questo capitolo fara spesso riferimento al loro uso. Proprio per questo motivo, in alcunicasi, i termini italiani saranno accompagnati dalla relativa terminologia inglese. In questo modosi potranno piu facilmente leggere e capire i tabulati contenenti i risultati di un’analisi fattorialeeffettuata da un elaboratore.

2.2 Scelta del campione

Il problema e gia conosciuto all’interno della psicologia ma e importante sottolinearlo in relazionea questa metodologia. Si deve fare in modo di ridurre, al massimo, la possibilita di errore relativoal campione stesso e alle risposte date dal singolo soggetto, che costituiscono quella che in terminimatematici viene chiamata varianza dell’errore, la quale interviene nel determinare la precisionedelle saturazioni dei fattori estratti.

Gli aspetti da considerare nella scelta del campione sono la sua ampiezza rispetto ai trattimisurati e la sua rappresentativita rispetto alle caratteristiche che si ipotizzano correlate coni fattori. Se lo scopo della ricerca e semplicemente l’identificazione di fattori ire una nuovaarea di ricerca, e preferibile un campione molto ampio. “Se comunque i risultati devono esseregeneralizzati, a una popolazione accuratamente definita” (Fruchter, 1954), il campione deveessere rappresentativo delle caratteristiche studiate.

A tal fine e estremamente importante decidere sulla eterogeneita o sulla omogeneita delcampione rispetto alle variabili da studiare. Ad esempio, se si vogliono studiare delle variabilispecifiche di una particolare zona geografica, il campione da esaminare dovra essere rappre-sentativo di quella regione, vale a dire che nella selezione del campione bisognera rispettare laproporzione esistente nella popolazione a cui ci si riferisce per quanto riguarda le variabili piuimportanti quali il sesso, l’eta, il livello socio-economico, il livello culturale... rispetto alla o allevariabili specifiche studiate.

Se invece si cerca di determinare l’eventuale esistenza di fattori comuni, cioe se si ipotizzache, rispetto a dei compiti proposti esistono dei possibili raggruppamenti sottostanti la riusci-ta di essi, si dovra perseguire al massimo l’eterogeneita del campione in modo da eliminarel’importanza di differenze individuali attribuibili a piccoli gruppi di soggetti. Cosı se si vuolestandardizzare un test, un questionario, una scala o qualunque tipo di misura utilizzata in psi-cologia e necessario avere un campione estremamente eterogeneo comprendente cioe individui

2.3. DAI DATI ALLA MATRICE DI CORRELAZIONE. 15

appartenenti ai possibili livelli economici, sociali, di sesso, di eta, di zone geografiche... in mododa evitare che una qualunque di queste variabili influenzi ire modo determinante la standar-dizzazione del test. In questo caso la numerosita del campione e la sua eterogeneita servonoper poter eliminare l’influenza sulla misurazione di alcune variabili individuali che non possonoessere precedentemente controllate, misurate e neppure stimate quantitativamente.

In conclusione il campione da utilizzare nell’analisi fattoriale deve essere abbastanza numero-sa ed in genere si pub ritenere tale un campione formato da un numero di soggetti maggiore dellevariabili misurate. In particolare, Harris (1967) suggerisce di usare un campione pari almeno aldoppio delle variabili che si intendono analizzare.

Esempio:Nelle ricerche effettuate allo scopo di adattare il questionario di Olweus ad un campione

rappresentativo dei pre-adolescenti e degli adolescenti sono stati scelti una serie di campioniomogenei rispetto alle variabili eta e sesso, zone geografiche di residenza, eterogenei rispetto allevariabili livello socio-economico, e tipo di scuola frequentata. I campioni utilizzati sono stati iseguenti:

1. 91 soggetti (54 maschi e 37 femmine) di eta compresa fra i 14 e i 19 anni, frequentantiun Istituto Professionale (58 ss.) e un Liceo Scientifico (33 ss.) di una citta dell’ItaliaSettentrionale di livello economica basso ed elevato;

2. 100 soggetti (50 maschi e 50 femmine) di eta compresa fra i 17 e i 19 anni frequentantiun Istituto Magistrale (femmine) e un Istituto Tecnico (maschi) di una citta dell’ItaliaSettentrionale e di livello socio-economico medio-basso;

3. 202 soggetti di eta compresa fra i 10 e i 18 anni di entrambi i sessi, frequentanti le MedieInferiori (82 ss.) a il Liceo Scientifico (130 ss.) di un paese dell’Italia Settentrionale.

I campioni scelti presentano aspetti di omogeneita e di eterogeneita sia se considerati indi-vidualmente sia rispetto all’insieme di tutti i soggetti. Infatti le variabili sesso e zona geograficasono omogenee perche le abbiamo mantenute costanti nei vari campioni; ugualmente eterogeneesono le variabili eta, livello socia-economico e tipo di scuola che risultano diverse nelle variericerche.

2.3 Dai dati alla matrice di correlazione.

Il primo passo di un’analisi fattoriale e il passaggio dai dati alla matrice delle correlazioni. Inlinea di massima si utilizza la correlazione prodotto-momento di Pearson, in quanto soddisfa alcriterio di linearita che e una dei presupposti delle teorie fattoriali. E’ pero possibile utilizzarealtri tipi di misure di correlazione ed in particolare il coefficiente rho di Spearman, senza che cioinfluenzi in moda particolare i calcoli (Gorsuch, 1974).

Una misura di correlazione puo essere utilizzata per misurare il grado di associazione dellevariabili oppure dei soggetti, degli eventi...

Un’analisi fattoriale effettuata sulla matrice delle correlazioni fra variabili si chiami R-factor analysis, mentre quella effettuata sulla matrice delle correlazioni fra soggetti Q-factoranalysis. Nel corso di questo libro ci si e sempre riferiti ad una analisi R-fattoriale.

Se l’analisi viene effettuata tramite un elaboratore, e importante disporre i dati nel modiappropriato al tipo di analisi che si vuol ottenere. Nel caso di una R-analisi i dati devono esseredisposti cosı come appaiono nella tab. 1.1 del capitolo 1; vale a dire che, per ogni soggetto,bisognare elencare il punteggio da lui ottenuto in tutte le variabili.

Come abbiamo detto piu volte, il punto di partenza di un’analisi fattoriale e la matrice dellecorrelazioni. In questa matrice, lungo la diagonale principale devono essere inseriti dei parti-colari valori denominati “comunanze” (communality). Essi vengono individuati con particolariprocedimenti matematici di calcolo che saranno analizzati piu avanti e che, come si vedra nel

16CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

capitolo 3*, non possono essere calcolati in modo preciso ed e percio necessario effettuarne unastima.

Nella pratica, poiche l’analisi fattoriale viene generalmente effettuata tramite l’ausilio dielaboratori, la scelta della stima della comunanze, da parte nostra, non e sempre necessaria.Infatti, la maggior parte dei programmi di analisi fattoriale sceglie autonomamente la stimadella comunanza piu appropriata al metodo di analisi prescelto (cfr. Cap. 4*).

2.3.0.1 Analisi della matrice di correlazione

Perche un’analisi fattoriale possa produrre dei fattori rilevanti bisogna che la matrice di corre-lazione contenga valori elevati accanto ad altri di bassa entita. Un primo modo per scoprirlo equello di stampare e osservare la matrice di correlazione, ma la cosa non e facile se il numero divariabili e alto.

Il determinante della matrice di correlazione e un primo indice che si puo utilizzare. Quandoe elevato, possiamo dire che le correlazioni sono generalmente basse e viceversa.

Una seconda possibilita e tramite il test di sfericita di Bartlett che cerca di verificare se lamatrice di correlazione sia una matrice identito, ovvero se i valori fuori dalla diagonale principalesono zero e quelli lungo la diagonale sono 1. Si basa sul valore del determinante e si distribuiscecome un chi-quadro (cfr. la formula a p. 35). Se assume un valore elevato, R non e unamatrice identita. Ha il difetto di dipendere dalla numerosita del campione e quindi di tenderealla significativita all’aumentare del numero dei soggetti.

Una terza soluzione e l’indice di Kaiser-Meyer-Olkin (KMO). Si basa sulle correlazioni par-ziali di ogni variabile con ogni altra, parzializzando su tutte le restanti. Se ci sono variabilicorrelate fra loro (la base per ipotizzare un fattore comune), la loro correlazione parziale do-vrebbe essere molto bassa. Un valore di KMO maggiore di 0.60 indica che si puo effettuareun’AFE.

Infine si puo osservare la matrice anti-immagine, che contiene il complemento a 1 delle corre-lazioni parziali. Ovviamente funziona al contrario rispetto all’indice KMO e quindi cercheremoall’interno della matrice anti-immagine i valori elevati.

2.4 Determinazione dei fattori

2.4.1 Numero dei fattori da estrarre

Il numero dei fattori da estrarre dipende dal valore assunto dalle comunanze nel senso cheuna volta conosciute le comunanze, anche il numero dei fattori e esattamente determinato.Purtroppo, come abbiamo gia osservato, non e possibile conoscere i valori esatti delle comunanze,ma soltanto stimarli e questo comporta, come conseguenza, che non tutti i fattori teoricamenteestraibili siano dei fattori “veri” e non, invece, dei fattori di errore.

A questo primo problema si aggiunge i1 fatto che il numero esatto dei fattori puo esseredeterminato solo quando le correlazioni sono calcolate sull’intera popolazione, mentre nella realtaesse sono misurate in un campione e questo potrebbe condurre ad altri fattori di errore.

Un terzo tipo di problema che influenza il numero dei fattori riguarda un aspetto che potremodefinire di tipo psicologico: non sempre i fattori “significativi” da un punto di vista matematico,sono tali da un punto di vista “psicologico” e questo per varie e differenti ragioni. La piu evidentee che un fattore deve saturare in maniera elevata un certo numero di variabili affinche gli si possaattribuire un significato psicologico; puo accadere che un fattore “significativo” da un punto divista matematico non soddisfi a questa condizione.

2.4. DETERMINAZIONE DEI FATTORI 17

D’altra parte, proprio in relazione all’uso dei calcolatori e necessario, oggi, sapere in anticipoil numero dei fattori da estrarre oppure fornire al calcolatore un criterio che lo guidi nei calcolie su cui possa basarsi per arrestare l’estrazione dei fattori.

Nel paragrafo 10 del capitolo 3* saranno presentati i metodi empirici, matematici e statisticiche sono stati proposti per la determinazione del numero dei fattori. Alcuni di questi metodinon trovano oggi una loro utilizzazione pratica in quanto non e sempre possibile disporre dialcuni dati intermedi dei calcoli. Cerchiamo di descriverli qui di seguito in maniera intuitiva e,soprattutto, operativa.

Un primo criterio che si puo seguire e quello di basarsi sull’ipotesi di ricerca: la teoriao lo scopo della ricerca possono suggerire un numero di fattori,da estrarre; successivamentesara possibile verificarne l’effettiva significativita ed eventualmente rieffettuare l’analisi fattorialestessa. Ad esempio, nella ricerca che qui presentiamo, volendo confrontare i risultati ottenutisui dati del questionario italiano con quelli ottenuti sui dati della ricerca scandinava, si sonodirettamente chiesti 6 fattori, in quanto corrispondente al numero dei fattori interpretabili dellaricerca di confronto.

In alternativa a questo criterio e possibile utilizzare uno di questi altri:a) uso di un criterio interno, proposto da Guttman, con il quale si decide di estrarre tanti

fattori quanti sono gli eigenvalues maggiori o uguali a un numero prefissato che e generalmente1. Questa e la scelta adottata, in modo automatico, nei programmi per calcolatore presentatial capitolo 4*. L’uso di questo criterio conduce all’estrazione di un ampio numero di fattori cheviene, generalmente, considerato eccessivo rispetto al numero di variabili analizzate.

b) controllando la tabella della proporzione cumulativa della varianza totale e chiedendo unnumero di fattori tale da raggiungere almeno il 70/75% della varianza totale. Questo criteriorisulta particolarmente valido quando la matrice delle correlazioni contiene molti valori partico-larmente alti, mentre e del tutto inutile quando i valori della matrice di correlazione tendono adessere generalmente bassi. In questo caso infatti sono necessari molti fattori per poter raggiun-gere il 75% della varianza totale e la maggior parte di questi fattori spiega una parte piccolissimadi varianza. Il rischio di questo metodo e quello di estrarre come validi un numero di fattorimaggiore di quanti sarebbero effettivamente significativi.

c) utilizzando il metodo grafico proposto da Cattell (1966), conosciuto con il nome di screetest (test del ciottolo). Si rappresentano graficamente su un piano cartesiano gli eigenvalues(ordinata) relativi a ciascun fattore (ascissa) con dei punti che verranno poi collegati da una linea.In corrispondenza del punto in cui la curva tende a divenire uria retta si pone il limite dei fattorida estrarre che risulteranno probabilmente significativi. Il vischio di questo criterio e quello diestrarre meno fattori di quanti potrebbero essere effettivamente significativi. Un secondo rischioe legato alla scala con cui viene rappresentato il grafico; infatti a seconda dell’unita che si sceglieper distanziare i fattori, la linea diverra piatta piu o meno velocemente (cfr. Runyon & Haber,1976, cap. 1).

Normalmente l’analisi fattoriale viene effettuata in due passaggi: si effettua una prima analisifattoriale a carattere esplorativo. Se l’analisi e effettuata tramite l’ausilio di un elaboratore, siottengono tutti i fattori che e possibile estrarre secondo il criterio di Guttman. Una voltaottenuta questa prima matrice fattoriale si puo chiederne una seconda in cui invece, il numerodei fattori sara predeterminato utilizzando uno degli altri due criteri citati.

Esempio:Per illustrare i criteri per la scelta del numero dei fattori, analizziamo un’analisi fattoriale

che abbiamo effettuato sulle 62 variabili che formano il questionario di Olweus (1975) nella tra-duzione di Rossi e Venuti (1983) ? (?). La Tab. 2.1 riporta gli eigenvalues associati ai fattori.

18CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

Factor Variance Cumulative proportion Factor Variance Cumulative proportionexplained of total variance explained of total variance

1 7,15 0,115 32 0,64 0,8272 5,72 0,207 33 0,63 0,8373 3,07 0,257 34 0,59 0,8474 2,96 0,305 35 0,58 0,8565 2,39 0,343 36 0,56 0,8656 1,86 0,373 37 0,52 0,8747 1,78 0,402 38 0,50 0,8828 1,72 0,430 39 0,49 0,8909 1,61 0,456 40 0,45 0,897

10 1,49 0,480 41 0,44 0,90411 1,46 0,504 42 0,42 0,91112 1,39 0,526 43 0,41 0,91813 1,30 0,547 44 0,41 0,92414 1,23 0,567 45 0,39 0,93115 1,21 0,587 46 0,37 0,93716 1,16 0,606 47 0,35 0,94217 1,09 0,623 48 0,34 0,94818 1,07 0,641 49 0,33 0,95319 1,02 0,657 50 0,31 0,95820 0,99 0,673 51 0,30 0,96321 0,95 0,689 52 0,27 0,96822 0,93 0,704 53 0,26 0,97223 0,90 0,718 54 0,25 0,97624 0,84 0,732 55 0,23 0,98025 0,83 0,745 56 0,21 0,98326 0,80 0,759 57 0,18 0,98627 0,75 0,771 58 0,18 0,98928 0,75 0,783 59 0,17 0,99229 0,71 0,794 60 0,15 0,99530 0,68 0,805 61 0,15 0,99731 0,68 0,816 62 0,17 1,000

Tabella 2.1: Eigenvalues della matrice di correlazione

a) criterio di Guttman.Consiste nell’estrarre tanti fattori quanti sono gli eigenvalues maggiori o uguali a 1. In Tab.

2.1 bisogna controllare la colonna intestata “Variance explained”: sono 19 fattori.b) criterio della proporzione di varianza.Consiste nell’estrarre tanti fattori quanti sono gli eigenvalues compresi nel 70 o 75% di

percentuale cumulativa della varianza totale. Controlliamo, sempre in tabella 2.1, la colonna“Cumulative proportion of total variance”: sono 25 a 26 fattori. Questo puo essere giustificatodal fatto che la matrice delle correlazioni fra le variabili (che non riportiamo) presenta pochecorrelazioni elevate: ad esempio, 2 correlazioni superiori a .60, 6 fra .50 e .60, 19 fra .40 e .50,su un totale di 1860 valori.

c) scree test di Cattell.Costruiamo un grafico (Fig. 2.1) in cui in ascissa compaiono i fattori e in ordinata compaiono

i valori degli eigenvalues. Colleghiamo tra di loro i punti che rappresentano la varianza spiegatada ogni fattore. Dopo il fattore 6 la curva inizia a diventare piatta. Secondo lo scree test, percio,

2.4. DETERMINAZIONE DEI FATTORI 19

Figura 2.1: Scree test di Cattell

bisognerebbe estrarre 6 fattori.

2.4.2 Metodi di estrazione

Una volta stabilito il criterio per il numero dei fattori, il passo successivo consiste nell’otte-nere una prima soluzione fattoriale, chiamata matrice fattoriale non ruotata (unrotated factormatrix ).

Esistono diversi metodi per. ottenere l’estrazione dei fattori, ognuno dei quali presenta dellecaratteristiche particolari, dei vantaggi e degli svantaggi. La scelta del metodo e collegata ai mo-tivi specifici della ricerca, alla possibilita di utilizzare dei metodi automatici di calcolo, al numerodelle variabili che compongono la ricerca, alle caratteristiche della matrice di correlazione...

Elenchiamo e descriviamo brevemente i principali metodi disponibili su calcolatore, de-dicando un breve spazio ad alcuni dei metodi di importanza storica, anche se non piuutilizzati.

2.4.2.1 Metodi di estrazione dei fattori non disponibili su calcolatore

Esistono molti metodi sviluppati prima dell’introduzione dell’uso dei calcolatori, che oggi nonsono affatto utilizzati. La maggior parte di questi sono stati sviluppati da Thurstone (1931,1945) o da Burt (1937) nella prima meta del XX secolo. La tendenza generale di questi metodiconsiste nel tentativo di semplificare al massimo i calcoli a scapito della semplicita logica. Unatendenza del tutto opposta a quella ricercata dai metodi disponibili sui calcolatori.

Metodo diagonale (diagonal method) Questo metodo ha il privilegio di essere molto sem-plice e veloce, ma ha il difetto di necessitare, per i calcoli, dei valori della comunanza. Si puoutilizzare quando’si conosce, a priori, il valore delle comunalita. Cio pero e un evento molto raro,e proprio per questo, il metodo diagonale e usato solo come momento intermedio nell’ambito

20CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

di altri metodi di estrazione dei fattori. E’ un metodo che si puo teoricamente utilizzare conogni tipo di matrice di correlazione (singolare o non-singolare), ma e molto sensibile ai valoriscelti per la comunanza che deve percio essere accuratamente stimata (Fruchter, 1954; ?, ?, ?)(Fruchter, 1954; Metelli, s.d.; Lis, 1977).

Metodo centroide (centroid method) Il metodo centroide era tra i metodi piu usati untempo; infatti e abbastanza semplice nei calcoli, anche se non permette di giungere ad un’unicasoluzione fattoriale. E’ necessario utilizzare una stima della comunalita che andra a sostituire ilvalore lungo la diagonale della matrice di correlazione. Solitamente si usa, per, questo metodo,la correlazione piu alta (in valore assoluto) di ogni colonna (Fruchter, 1954; ?, ?, ?) (Fruchter,1954; Metelli, s.d.; Lis, 1977).

Metodo multigruppo (multiple-group method) Questo metodo e una variazione di quellocentroide. La differenza principale e che, anziche estrarre un fattore alla volta, vengono estrattipiu fattori assieme. E’ consigliabile inserire lungo la diagonale una buona stima della comunanza.Inoltre e necessario raggruppare le variabili in gruppi di almeno 3 a 4 variabili. Cio si puo ottenereo in base ad un’ipotesi teorica a priori o dopo aver effettuato qualche analisi dei cluster fra levariabili. Si aggiunga che le variabili incluse in un gruppo devono essere tra loro linearmentedipendenti. Con questo metodo si ottengono fattori obliqui (cfr. il paragrafo seguente) che sipossono, eventualmente, ortogonalizzare (Fruchter, 1954; ?, ?, ?) (Fruchter, 1954; Metelli, s.d.;Harman, 1967)

2.4.2.2 Metodi di estrazione dei fattori disponibili al calcolatore

Componenti principali (principal component) e Assi principali (principal axis) Laproprieta basilare di questo metodo di estrazione dei fattori e che ogni fattore estratto cerca diessere il piu possibile esplicativo rispetto ai dati di partenza. Al di la dei calcoli matematicicio significa che il primo fattore estratto avra la massima importanza, in quanto “spiega” unapercentuale maggiore di variabilita dei dati, rispetto agli altri fattori. Non significa pero cheavra le saturazioni maggiori. Il secondo fattore estratto spiega la massima varianza possibile diquanta ne e rimasta dopo il primo fattore... e cosı via fino all’ultimo fattore estratto.

Altre caratteristiche del metodo sono: vengono estratti pochi fattori che sono tra loro indi-pendenti (ortogonali, cioe non correlati); la soluzione fattoriale non ruotata e unica. Accantoa questi aspetti positivi vi e il fatto che richiede calcoli matematici lunghi, laboriosi e ripeti-tivi (Hotelling, 1935). Ma questo aspetto negativo e stato ampiamente superato dall’utilizzodell’elaboratore elettronico.

Quando lungo la diagonale principale della matrice delle correlazioni si pone, come stimadella comunalita, il valore 1, il metodo viene designato “componenti principali”. In questo casodovrebbero essere teoricamente estratti tanti fattori quanti sono le variabili implicate nell’analisi.Purtroppo per diversi problemi di calcolo, non tutti questi fattori sarebbero significativi da unpunto di vista psicologico. I fattori estratti, percio, sono in numero inferiore e il metodo prendeil nome di “componenti troncate”.

Quando invece, lungo la diagonale della matrice delle correlazioni si pone una stima dellacomunanza diversa dall’unita (il valore 1), allora il metodo prende il nome di “assi principali ofattori principali”. La maggior parte dei programmi per elaboratore, in questo caso, usano ilmetodo iterativo per la stima delle comunanze.

Il metodo degli assi principali, secondo Thurstone (1945, p. 509) permette di ottenere lasoluzione fattoriale migliore tra tutte quelle ottenibili con altri metodi, a parita di fattori estratti,proprio perche ogni fattore rende conto della massima percentuale possibile di varianza.

2.4. DETERMINAZIONE DEI FATTORI 21

Se all’epoca di Thurstone, e fino agli anni ’60, questo metodo era poco usato (Reuchlin, 1964),ora le possibilita offerte dagli elaboratori lo ha reso estremamente sfruttato anche a scapito dialtri metodi altrettanto validi.

Analisi fattoriale canonica (Rao’s canonical factoring) Questo metodo di estrazionedei fattori stato inizialmente sviluppato da Rao (1955) a partire dai procedimenti di calcolodella correlazione canonica, quindi ampliato da Harris (1962). Lo scopo e quello di trovareuna soluzione fattoriale in cui la correlazione fra i fattori e le variabili sia la massima possibile.E’ quanto fa il metodo della massima verosimiglianza, che ha infatti sostituito, nella praticastatistica, quello di Rao.

Massima verosimiglianza (maximum likelihood factor ) La teoria multifattoriale diThurstone, presuppone che si lavori sulla matrice delle correlazioni fra le variabili calcolate sul-l’intera popolazione mentre invece si utilizza una matrice che e stata calcolata su un campione.Questo metodo, al contrario, e ben consapevole di utilizzare misure effettuate su un campionee cerca percio di calcolare una stima delle correlazioni sulla popolazione. A tal fine, utilizzaun procedimento tipicamente matematico, chiamato “massima verosimiglianza”. Associato aquesto specifico metodo, e stato sviluppato un test di significativita sul numero di fattori daestrarre, basato su un’approssimazione alla funzione di chi-quadro e denominato “indice di ade-guamento al campione”. Per il suo utilizzo pratico bastera dire che se il valore di questo indicee significativamente elevato, e necessario un numero maggiore di fattori di quanti ne sono statiestratti.

Image factoring L’analisi fattoriale per immagine e stata proposta da Kaiser (1963) amplian-do alcuni suggerimenti di Guttman. Per l’identificazione della varianza comune, questo metodofa uso della “teoria dell’immagine”, che considera non la matrice delle correlazioni fra le variabili,ma una matrice che contiene le “proiezioni” di ogni variabile su tutte le altre. Questa matricechiamata “matrice immagine” perche contiene l’immagine che una variabile proietta sulle altre.Secondo Guttman la matrice immagine e quella che si avvicina maggiormente alla matrice dellecorrelazioni fra variabili una volta che sia stato eliminato il peso dei fattori specifici.

Il numero dei fattori teoricamente estraibili e generalmente pari alla meta delle variabili,anche se equivale ad ottenere un numero di fattori maggiore di quelli che il ricercatore si aspetta.E’ possibile che fra questi fattori ne compaiano alcuni banali e non significativi ed e anchepossibile che i fattori banali compaiano solo dopo una rotazione ortogonale (Kaiser, 1963).

Kaiser’s second generation little jiffy Nel tentativo di migliorare l’analisi fattoriale perimmagine, Kaiser (1970) ha sviluppato quest’altro metodo d’analisi che e sostanzialmente costi-tuito dal precedente, a cui viene applicata una rotazione particolare chiamata ortobliqua (Kaiser& Rice, 1974).

Alpha factoring Questo metodo cerca di ottenere fattori che abbiano il valore massimodi “9eneralizability”. Tale valore viene misurato tramite il coefficiente di fedelta di Kuder-Richardson o con il coefficiente alpha di Cronbach (Kaiser & Caffry, 1965).

Esempio:L’analisi fattoriale che interpreteremo al termine di questo capitolo e stata ottenuta con il

metodo delle componenti principali ed ha prodotto la matrice fattoriale non ruotata di Tab. 2.2.

22CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

Fattori1 2 3 4 5 6

1 0,467 0,171 -0,381 -0,006 0,013 0,1222 0,449 -0,026 0,210 0,354 -0,276 0,0893 0,207 0,144 0,241 0,230 -0,241 0,1474 0,394 0,247 0,047 0,109 0,147 -0,0555 0,477 -0,016 0,238 0,221 -0,061 0,1236 0,306 0,211 -0,161 -0,073 0,197 0,1707 -0,082 -0,103 0,146 0,094 -0,211 0,2598 0,585 -0,049 0,247 0,279 -0,017 0,1369 0,078 -0,019 0,070 -0,264 0,085 -0,167

10 -0,304 0,508 -0,100 -0,105 -0,080 0,10511 0,590 0,309 -0,216 0,089 -0,095 0,13712 -0,114 0,355 0,174 -0,363 -0,371 -0,27213 0,417 0,353 -0,414 -0,206 0,015 0,18414 0,213 0,357 0,121 -0,134 0,438 0,04915 0,569 -0,045 0,198 0,342 0,160 -0,06616 -0,037 0,036 0,177 0,072 0,020 -0,25317 0,537 0,295 -0,210 0,188 0,073 0,02418 -0,288 0,261 -0,039 0,073 0,127 0,06219 -0,187 0,195 -0,102 -0,205 -0,189 0,35020 -0,087 -0,129 0,234 0,464 0,281 -0,02621 0,320 0,185 0,344 -0,183 0,004 0,10122 0,027 0,219 -0,060 -0,036 0,396 0,15323 -0,022 0,236 -0,080 0,340 -0,197 -0,22324 0,437 0,224 -0,343 -0,221 0,057 0,07525 0,523 0,211 0,013 0,078 -0,036 -0,11726 0,118 0,294 0,001 -0,212 0,085 0,10427 0,100 0,308 0,347 -0,435 0,004 0,06028 -0,291 0,232 0,187 0,442 -0,002 0,00029 0,510 0,221 -0,286 -0,002 0,011 -0,37230 0,338 0,245 0,488 -0,219 0,047 -0,00931 -0,014 0,395 -0,104 0,326 -0,248 -0,17532 0,509 -0,100 0,195 0,232 -0,244 -0,22433 -0,141 0,031 0,074 0,017 0,266 -0,02334 0,523 0,279 -0,221 -0,052 0,045 -0,37135 -0,227 0,599 -0,226 0,045 -0,164 0,15236 -0,198 0,498 -0,007 -0,039 0,149 -0,02737 -0,348 0,375 0,022 0,255 0,089 -0,23538 0,014 0,370 0,514 0,006 0,139 0,15639 0,032 0,187 0,112 -0,093 0,527 0,16840 -0,322 0,323 0,068 0,357 -0,003 -0,02641 -0,046 0,372 0,435 -0,366 -0,235 0,02542 0,172 0,283 0,194 0,147 -0,155 0,53443 -0,581 0,261 0,039 0,135 -0,182 0,27044 -0,058 0,242 0,469 -0,082 0,082 -0,20045 -0,312 0,341 -0,228 0,179 -0,305 -0,17646 -0,040 0,363 0,207 -0,381 -0,284 -0,26247 -0,262 0,413 -0,056 0,446 0,054 0,08848 0,162 0,284 -0,037 0,113 0,149 0,15349 -0,409 0,585 -0,137 0,141 -0,112 -0,04850 0,594 0,386 -0,058 -0,008 0,009 0,03951 -0,407 0,536 -0,221 0,133 -0,050 -0,02952 -0,486 0,583 -0,080 -0,144 0,083 0,01953 -0,219 0,474 -0,050 0,049 0,318 -0,15954 -0,409 0,149 0,188 0,182 0,076 0,17655 0,152 0,354 0,002 0,075 0,149 -0,24056 0,047 0,465 0,409 -0,169 -0,164 -0,09957 0,500 0,080 0,098 0,303 -0,324 0,06358 0,241 0,224 0,010 0,013 -0,136 0,09759 -0,232 0,000 0,214 0,285 0,348 -0,18660 0,451 0,265 -0,304 -0,013 0,089 0,04461 -0,122 -0,016 0,092 0,108 0,336 -0,04062 0,467 0,301 0,229 0,006 0,137 -0,086

VP 7.155 5.727 3.070 2.967 2.395 1.865

2.5. ROTAZIONE DEI FATTORI 23

Tabella 2.2: Matrice fattoriale non ruotata

2.5 Rotazione dei fattori

Una volta ottenuta la prima soluzione fattoriale (matrice fattoriale non ruotata), si deve orapassare alla fase di rotazione dei fattori. Rotazioni si chiamano le operazioni che i calcolatorieffettuano alla ricerca di soluzioni fattoriali alternative a quella individuata, purche soddisfino,sia matematicamente che logicamente, al criterio della struttura semplice.

Al tempo in cui i calcoli venivano effettuati a mano, era piu comodo cercare di raggiungerela struttura semplice utilizzando un procedimento di rotazione di assi sulle rappresentazionigrafiche delle variabili e dei fattori. Proprio da questo procedimento deriva l’attuale nome dirotazione dei fattori.

Per meglio chiarire il meccanismo della rotazione della matrice fattoriale, anche noi useremoil metodo grafico su una matrice fattoriale a due fattori ottenuta da una matrice di correlazionedi 5 variabili (Tab. 2.3). Possiamo rappresentare graficamente le saturazioni delle 5 variabiliconsiderando i due fattori come gli assi di un piano cartesiano. Per ogni variabile avremouna coppia di valori (le saturazioni nel primo e nel secondo fattore), che puo essere perciorappresentata con un punto.

I II1 .92 .082 -.68 .763 .64 .604 .72 .485 -.40 .40

Tabella 2.3: Matrice fattoriale non ruotata

Proprio perche le variabili possono essere rappresentate come punti su un piano cartesiano (ele saturazioni costituiscono le coordinate di questi punti) e possibile anche spostare (o meglio ruo-tare) gli assi di riferimento e calcolare le coordinate di questo nuovo piano (che corrisponderannoa nuove saturazioni negli stessi fattori).

E’ possibile effettuare un numero infinito di rotazioni, ma solo alcune hanno importanza esignificato per i nostri scopi.

Nella Fig. 2.2 vediamo la rappresentazione grafica delle saturazioni della Tab. 2.4. Se spo-stiamo l’asse delle x (cioe il fattore I) in modo che passi esattamente sul punto n.3 e spostiamocoerentemente l’asse delle y (cioe il fattore II) e quindi calcoliamo le nuove coordinate, otterremole saturazioni di Tab. 2.4.

Anche se non staremo a spiegare il procedimento matematico necessario per effettuare unarotazione di assi cartesiani, si puo comunque empiricamente osservare (Fig. 2.3) che se il punton.3 (e quindi la variabile n.3) cade esattamente sull’ascissa, il valore che esprime la sua ordinatae 0. Tale sara percio la sua saturazione nel fattore II’ (rappresentato dall’asse delle y). Analo-gamente, la variabile n.2 la cui rappresentazione grafica cade molto vicino all’asse delle y, avrasaturazione quasi nulla con il fattore I’.

La differenza sostanziale fra le due soluzioni fattoriali e che nel primo caso (matrice fattorialenon ruotata) tutte le variabili erano spiegate in parti molto simili da entrambi i fattori (adeccezione della variabile 1), mentre nella seconda soluzione (matrice fattoriale ruotata), avendoreso massimo il contributo di un fattore e minimo quello dell’altro per ogni variabile, abbiamoche la terza e la quarta variabile sono spiegate principalmente dal primo fattore e la seconda ela quinta dal secondo fattore.

24CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

Figura 2.2: Rotazione

I II1 .72 -.572 .02 .963 .87 .004 .85 -.145 .01 .58

Tabella 2.4: Matrice fattoriale ruotata

Figura 2.3: Rappresentazione ruotata

2.5. ROTAZIONE DEI FATTORI 25

In questo modo ci si e avvicinati, quanto piu possibile, alla cosiddetta struttura semp1iceproposta da Thurstone, per cui ogni variabile dovrebbe appartenere ad un unico fattore comune,cioe dovrebbe essere molto satura in un fattore e debolmente o per niente satura in tutti gli altri.

Questo e il motivo per cui si effettua la rotazione della matrice dei fattori. Bisogna sottoli-neare che, dopo la rotazione, i fattori non sono piu necessariamente ordinati in modo decrescentedi importanza.

E’ possibile effettuare la rotazione in molti e diversi modi, che possono pero essere riassuntiin due categorie: i metodi ortogonali e quelli obliqui.

I metodi ortogonali presuppongono che fra i fattori non esista alcun legame e cioe che sianofra loro indipendenti e che quindi la loro correlazione sia sempre zero. Graficamente cio siesprime tramite un angolo retto e quindi la rotazione e stata chiamata “ortogonale”.

Al contrario, i metodi obliqui presuppongono che fra i fattori esista un certo legame di dipen-denza e che quindi la loro correlazione (in valore assoluto) sia compresa fra zero e uno. Grafi-camente cio si esprime tramite una serie di angoli non retti che non sono facilmente disegnabili,soprattutto se le dimensioni del grafico (cioe il numero dei fattori) sono molte.

Il problema relativo alla scelta del metodo di rotazione consiste proprio nella possibilita omeno di ipotizzare la dipendenza reciproca o l’indipendenza dei fattori che si intende estrarre.Purtroppo non esiste un metodo matematico sicuro per decidere tra un metodo obliquo e unaortogonale di rotazione. Anzi, Coleman (1964) afferma che l’ipotesi dell’ ortogonalita o menodei fattori riguarda esclusivamente l’interpretazione dei risultati.

I metodi ortogonali hanno il vantaggio di presentare fattori fra loro indipendenti, una strut-tura maggiormente stabile rispetto alla soluzione fattoriale che non e legata al campione, unamaggiore semplicita nei calcoli e nell’interpretazione dei fattori, nonche la possibilita di rappre-sentazioni grafiche della matrice fattoriale che permette una migliore visione della disposizionedelle variabili nello spazio fattoriale.

I metodi obliqui, proprio perche presuppongono una dipendenza di un fattore da un altro,sono piu aderenti alla realta dei dati e, quasi sempre, anche alla realta delle variabili stesse;inoltre permettono di sottoporre la matrice di correlazione tra fattori ad un’analisi fattoriale perindividuare i fattori di ordine superiore, cioe quanto hanno in comune fra loro i fattori comuni.

La decisione sulla scelta della rotazione dev’essere guidata soprattutto dall’ipotesi che epossibile formulare sulle variabili (Reuchlin, 1964, p. 69). Se si puo presumere che fra i fattoriche si estrarra ci possa essere una certa dipendenza, allora converra utilizzare una rotazioneobliqua. Ad esempio, se dobbiamo analizzare i dati ottenuti da un questionario psicosomatico eci aspettiamo che i fattori raggruppino fra loro item omogenei rispetto ai disturbi circolatori, aquelli respiratori, a quelli digestivi..., possiamo anche tranquillamente ipotizzare una dipendenzareciproca dei tre fattori in quanto le funzioni svolte da cuore, polmoni e stomaco sono sicuramentetra loro relate.

Anche gli scopi della ricerca possono influire sulla scelta. Se stiamo analizzando un test o unquestionario per una sua futura standardizzazione, abbiamo bisogno di una rotazione ortogonaleche ci isoli gli item molto saturi in un solo fattore. Nella ricerca sull’aggressivita di Olweus,ad esempio, il ricercatore ha utilizzato un metodo ortogonale di rotazione perche desideravaverificare una sua ipotesi di lavoro e cioe che un determinato item misurasse un certo tipo dimanifestazione aggressiva e non un altro tipo. Se invece avesse voluto semplicemente indagaresul piu ampio fenomeno dell’aggressivita, avrebbe potuto utilizzare un metodo obliquo, infattinon e possibile ipotizzare che fra diversi tipi di manifestazioni dell’aggressivita non esista alcunacorrelazione.

Reuchlin (1964) consiglia di effettuare dapprima una rotazione ortogonale e di procedereeventualmente in seguito ad effettuare delle rotazioni oblique. L’autore francese consiglia inquest’ultimo caso di effettuare anche un’analisi fattoriale di secondo ordine.

26CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

2.6 L’interpretazione dei fattori

Dopo la rotazione dei fattori, la matrice finale deve essere interpretata. Questa e una faseparticolarmente delicata in quanto non esistono specifiche indicazioni che guidino il lavoro in-terpretativo. Non e stato infatti possibile elaborare un test statistico per- la significativita dellesaturazioni. Dipende, percio, dalla capacita e dall’esperienza del ricercatore cogliere il significatocomune delle variabili confluite in un fattore, attenendosi alla realta delle singole variabili senzacostruire interpretazioni fantastiche.

Questa fase e importante soprattutto in quanto, sia la scelta del metodo di estrazione deifattori, sia il problema del numero dei fattori da estrarre e quello del metodo con cui effettuarela rotazione, rendono molto arbitraria l’interpretazione di un’unica soluzione fattoriale. Tuttiquesti aspetti e momenti in cui il ricercatore puo e deve scegliere fra diversi metodi contribuisconoa creare una situazione di indeterminazione e di dubbio sui risultati che si sono ottenuti. Alcuniautori consigliano addirittura di effettuare analisi diverse per metodi e numero dei fattori e discegliere come definitiva “quella che si adatta meglio ai dati osservati o che e piu aderente agliscopi del ricercatore” (Sadocchi, 1980, p. 147).

Si ricordi che, se e stata effettuata una rotazione ortogonale si otterra una sola matriceruotata (rotated factor matrix corrispondente alla composizione fattoriale) mentre se e stataeffettuata una rotazione obliqua si otterranno 2 matrici ruotate, la pattern matrix (composizionefattoriale) e la structure matrix (struttura fattoriale). In questo caso e la pattern che si usa perl’interpretazione.

Qui di seguito mostriamo i passaggi teorici necessari per interpretare una matrice fattorialeruotata mentre nel paragrafo seguente presentiamo un esempio pratico.

1) E’ necessario definire un livello arbitrario per le saturazioni che ci indichi il limite oltre ilquale non riteniamo le variabili sufficientemente importanti per caratterizzare quel deter-minato fattore. In linea di massima (come prassi e non come regola) il valore generalmenteprescelto e .40, ma e possibile usare livelli inferiori o superiori, come ad esempio, .35 a .50,a seconda che si abbia un numero ristretto o troppo ampio di variabili da interpretare.

Ripetere i passi da 2 a 4 per ogni fattore.

2) Ordinare le saturazioni delle variabili del fattore in ordine decrescente (in valore assoluto),fermandosi al livello prescelto.

3) Scrivere accanto ad ogni saturazione la denominazione della variabile corrispondente o iltesto dell’item se si tratta di un questionario.

4a) Si deve ora cercare quale tratto, caratteristica, aspetto... abbiano in comune queste varia-bili, in modo da poter attribuire una denominazione al fattore che definisce questo trattocomune. Si tenga presente che piu una variabile e satura piu essa contribuisce alla defini-zione del carattere comune del fattore e, viceversa, cio che e stato individuato come trattocomune delle variabili deve comparire in particolare e in maggior grado nelle variabili piusature.

4b) Nell’interpretazione dei fattori, si tenga conto che il segno negativo di una saturazioneindica solamente un’opposizione rispetto alle saturazioni positive. Il tratto comune allevariabili dovrebbe essere pensato come un continuum che passa dalla sua massima presenzaalla sua negazione o al suo opposto. Per procedere all’interpretazione conviene iniziare.dallevariabili il cui segno e piu frequente e considerarle come se fossero positive. Di conseguenza,le altre (siano esse di segno positivo o negativo) devono essere considerate di segno opposto.

4c) Nel caso in cui non si riesca a riscontrare nessun tratto comune alle variabili del fattore,si dovra concludere che il fattore non e interpretabile e che le variabili sono state tra loroassociate per un errore implicito nei calcoli e attribuibile o al campione o alla misurazione

2.7. ESEMPIO DI INTERPRETAZIONE 27

delle variabili stesse o perche, ancora, la varianza attribuibile al fattore e molto bassa.Normalmente i “primi” fattori estratti sono facilmente interpretabili mentre gli “ultimi”,soprattutto se ne sono stati estratti molti o se la matrice delle correlazioni iniziale fra levariabili contiene molti valori bassi, sono spesso difficilmente interpretabili o saturi di unasola variabile e quindi fattori specifici di quella variabile. In linea di massima se i fattorinon interpretabili sono molti converra riesaminare tutti i punti nodali che contribuisconoall’indeterminazione della soluzione fattoriale per vedere se non ci sia stato qualche erroredi impostazione. Quindi, se ci sono diversi fattori ininterpretabili e meglio non considerareaffatto i risultati dell’analisi fattoriale.

2.7 Esempio di interpretazione

Dimostriamo praticamente come e possibile procedere nell’interpretazione dei fattori; per questoscopo utilizzeremo la matrice di Fig. 2.5 ottenuta effettuando un tipo di rotazione, denominataVarimax, sulla matrice di Fig. 2.3. In questa tabella si possono vedere 6 colonne indicanti lesaturazioni di ogni variabile nei 6 fattori estratti.

I fattori vengono presentati nell’ordine a loro attribuito dal calcolatore, che dipende dallaloro importanza nello spiegare la matrice delle correlazioni o dei dati, relativamente alla matricefattoriale non ruotata. Per assicurarsene, basta sommare i quadrati delle saturazioni di ognivariabile in un determinato fattore. A partire dal primo fattore della Fig. 2.3, questi totalidovrebbero essere decrescenti (i valori cosı ottenuti sono presentati in fondo ad ogni fattore).

Partendo dal primo fattore incominciamo a definire un livello arbitrario delle saturazioni checi indichi il limite sotto il quale non riteniamo che le variabili siano sufficientemente significativeall’interno di quel fattore. Questo limite, che dev’essere uguale per tutti i fattori, e stabilito inmodo arbitrario.

Stabiliamo, per ora, il limite di .40.

Tabella 2.5: Matrice fattoriale ruotata (Varimax)

28CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

Fattori1 2 3 4 5 6

1 0,608 -0,050 0,100 -0,133 -0,062 0,0632 0,083 -0,072 0,646 -0,015 -0,163 -0,0103 0,012 0,098 0,458 0,129 -0,086 0,1044 0,347 0,017 0,266 0,102 0,162 -0,1635 0,145 -0,174 0,546 0,050 0,033 -0,0056 0,437 -0,037 0,038 0,018 0,182 0,0977 -0,207 -0,003 0,178 -0,013 -0,095 0,2748 0,193 -0,231 0,636 0,006 0,075 -0,0329 0,050 -0,181 -0,146 0,195 0,019 -0,146

10 0,097 0,486 -0,223 0,223 0,002 0,20811 0,634 0,023 0,335 0,009 -0,089 0,05712 -0,014 0,193 -0,167 0,567 -0,344 -0,09213 0,714 0,017 -0,053 0,038 -0,049 0,17314 0,322 0,016 0,003 0,272 0,468 -0,05415 0,210 -0,196 0,565 -0,066 0,187 -0,26616 -0,131 0,062 0,054 0,110 0,023 -0,25817 0,586 0,065 0,310 -0,068 0,053 -0,09618 -0,044 0,343 -0,138 0,014 0,182 0,07819 0,053 0,159 -0,161 0,125 -0,106 0,45020 -0,289 0,081 0,280 -0,225 0,354 -0,17121 0,149 -0,158 0,239 0,424 0,104 0,06022 0,218 0,074 -0,093 0,015 0,408 0,07323 0,038 0,388 0,178 -0,076 -0,177 -0,21524 0,631 -0,103 -0,053 0,035 -0,038 0,05325 0,412 -0,048 0,332 0,125 -0,045 -0,19826 0,266 0,045 -0,062 0,250 0,113 0,10827 0,097 -0,075 -0,043 0,617 0,095 0,10828 -0,266 0,475 0,216 -0,041 0,149 -0,03529 0,575 -0,015 0,077 0,006 -0,147 -0,41430 0,115 -0,160 0,263 0,571 0,160 -0,05531 0,128 0,502 0,188 -0,001 -0,199 -0,15032 0,102 -0,191 0,524 0,042 -0,238 -0,30233 -0,090 0,049 -0,098 0,004 0,273 -0,06134 0,587 -0,016 0,075 0,099 -0,096 -0,41635 0,225 0,612 -0,113 0,117 -0,071 0,24036 0,122 0,420 -0,161 0,227 0,206 0,00037 -0,121 0,551 -0,072 0,038 0,137 -0,21838 -0,075 0,158 0,255 0,465 0,351 0,09739 0,142 -0,023 -0,077 0,119 0,565 0,05840 -0,168 0,593 0,088 -0,021 0,116 -0,02841 -0,064 0,094 0,014 0,694 -0,083 0,13442 0,129 0,148 0,423 0,157 0,080 0,47943 -0,319 0,528 -0,109 0,031 -0,009 0,37244 -0,173 0,096 0,081 0,466 0,181 -0,20145 -0,011 0,564 -0,112 -0,036 -0,292 -0,05746 0,037 0,138 -0,142 0,593 -0,258 -0,11247 -0,019 0,619 0,132 -0,123 0,181 0,05148 0,268 0,156 0,146 0,025 0,208 0,07749 0,026 0,721 -0,160 0,112 -0,027 0,04850 0,609 0,001 0,307 0,196 0,025 -0,04851 0,061 0,685 -0,216 0,028 0,005 0,05752 0,021 0,589 -0,390 0,266 0,153 0,13153 0,118 0,443 -0,202 0,125 0,327 -0,17154 -0,318 0,332 0,000 0,027 0,224 0,18055 0,253 0,213 0,061 0,146 0,133 -0,28656 0,021 0,207 0,138 0,621 -0,022 -0,04557 0,228 -0,016 0,599 0,010 -0,236 -0,01458 0,244 0,066 0,201 0,137 -0,079 0,08459 -0,288 0,167 0,035 -0,077 0,379 -0,27460 0,604 0,005 0,093 -0,039 0,024 -0,02461 -0,116 0,035 -0,043 -0,067 0,340 -0,11462 0,336 -0,048 0,322 0,312 0,184 -0,193

VP 5,424 5,350 4,149 3,670 2,504 2,081

2.7. ESEMPIO DI INTERPRETAZIONE 29

Utilizzando la colonna FACTOR 1, sottolineiamo tutte le saturazioni superiori al limite cheabbiamo stabilito.

Ora trascriviamo, in ordine decrescente di saturazione, il numero della variabile e lasaturazione corrispondente.

Scriviamo accanto ad ogni variabile, la sua spiegazione per esteso.Si dovrebbe ottenere la seguente tabella:

Tabella 2.6: Fattore 1

49 .718 Quando un adulto e irritato con me, generalmente mi sento in colpa.51 .687 Dopo essere stato in disaccordo con un insegnante tendo a sentirmi in colpa.35 .613 Quando un adulto e adirato con me, io cerco di essere particolarmente

simpatico.47 .612 Sono spesso arrabbiato con me stesso per essermi comportato male.52 .595 Io penso che i ragazzi dovrebbero essere gentili e rispettosi con gli adulti.45 .583 Quando un insegnante mi critica, mi sento ridicolo e stupido.37 .541 Quando un adulto e ingiusto con me, sono dispiaciuto e depresso.43 .533 Mi piacerebbe essere simpatico con quelli che sono cattivi con me.40 .524 Tendo a rammaricarmi di essere stato troppo impetuoso.31 .492 Dico e faccio cose di cui poi mi rammarico sinceramente.10 .490 Vorrei cercare di obbedire agli adulti anche quando penso che siano in errore.28 .462 Mi sento spesso dispiaciuto per le persone che sono adirate con me.53 .436 Preferisco non ricordare le situazioni in cui ho avuto un disaccordo con un

adulto.

Le variabili che hanno le saturazioni piu elevate in questo fattore indicano “senso di colpa” daparte del soggetto quando si vengono a creare delle situazioni di disaccordo con persone adulte.Gli altri item indicano il desiderio di essere socialmente accettati, la tendenza a rammaricarsi deipropri atti impulsivi e delle proprie disobbedienze. Tali atteggiamenti manifestano un compor-tamento di totale accettazione del giudizio e dell’opinione dell’adulto e la tendenza a dispiacersidi non essere riusciti a controllare il proprio comportamento. La situazione descritta da questiitem implica, quindi, la totale assenza di comportamenti aggressivi e l’inibizione di qualunquetipo di comportamento o di risposta verbale che potrebbe essere interpretata come una forma diopposizione verso l’adulto. Per tali motivi abbiamo identificato questo fattore come RISPOSTEDI INIBIZIONE DELL’AGGRESSIVITA’.

Facciamo ora lo stesso lavoro sulla colonna intestata FACTOR 2.Tutti gli item confluiti nel secondo fattore rilevano la presenza di aggressivita fisica ma-

nifestata nei confronti dei coetanei (item 13, 24, 50, 60), nei confronti di oggetti (il, 17) ogenericamente rilevano la presenza di impulsi di tipo aggressivo (1, 34, 29). Tutti questi item siriferiscono a forme esplicite, anche se non sempre dirette, di aggressivita fisica. Per tale motivo,si puo senz’altro definirlo come fattore di AGGRESSIVITA’ FISICA.

Gli item raccolti nel fattore 3 esprimono delle forme di protesta e di opposizione nei confrontidi critiche, osservazioni e soprusi da parte di adulti. Le forme di aggressivita espresse in questofattore sono manifestate principalmente nei confronti di adulti che assumono un ruolo di autoritae sono esplicitate attraverso un canale di tipo verbale. Notiamo che in questo fattore compaionodue item “3-Generalmente ascolto musica” e “42-Mi piace viaggiare”) che sebbene non sembrinoattinenti con le manifestazioni dirette di aggressivita verbale, possono denotare un atteggiamentooppositivo dei giovani nei confronti del mondo degli adulti. Atteggiamento che si esplica nontanto in una forma violenta, quanto nell’esaltazione di valori tipicamente giovanili, che possono

30CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

Tabella 2.7: Fattore 2

13 .730 Faccio a batte con gli altri ragazzi della scuola.24 .642 Io ammira sinceramente quei ragazzi che fanno a botte con me.11 .623 Sono spesso tosi agitato che provo piacere fracassando oggetti.1 .617 Quando sono di malumore, provo piacere picchiando qualcuno.

60 .608 Gli altri ragazzi iniziano dei combattimenti con me.50 .594 Quando un ragazzo mi molesta, cerco di dargli una buona lezione.17 .562 Quando le cose non vanno come mi aspetto, sento piacere a spaccare

qualcosa.34 .528 E’ piacevole osservare che qualcuno che non ti piace, riceve una buona

lezione.29 .516 Attualmente, mi sento molto contento quando qualcuno che non mi piace si

prende una buona sgridata.6 .431 Mi piacerebbe diventare un pugile.

Tabella 2.8: Fattore 3

2 .652 Quando un adulto e ingiusto con me, mi arrabbio e protesto.8 .642 Quando un insegnante mi critica, sono portato a ribattere e protestare.

57 .600 Quando un adulto critica i miei abiti o i miei capelli gli dico che non sonofatti suoi.

15 .580 E’ giusto procurare del fastidio ad un insegnante irritante.32 .548 Quando un adulta cerca, con insistenza, di darmi ordini, mi oppongo

decisamente.5 .548 Quando un adulto cerca di prendere il mio posto in una fila, gli dica

decisamente che quel posto e mio.3 .452 Generalmente ascolto musica.

42 .413 Mi piace viaggiare.

percio rappresentare forme di aggressivita simili alla verbale (in quanto non fisica). Si giustifica,percio, la denominazione di AGGRESSIVITA’ VERBALE.

Tabella 2.9: Fattore 4

41 .687 Io mi sento sempre felice e tranquillo.56 .614 Io non mi sento mai triste o infelice.27 .610 Io non mi sento mai spaventato o ansioso.46 .579 Gli adulti non mi rimproverano mai.30 .565 Io ho sempre successo in qualsiasi cosa faccia12 .561 Io non vengo mai rimproverato dagli adulti.44 .465 I ragazzi a scuola non dicono mai cose cattive su di me.21 .415 Io so sempre cosa dire alla gente.38 .414 I ragazzi a scuola sono sempre simpatici con me.

Le variabili che formano il fattore 4 si riferiscono a situazioni in cui i soggetti manifestanostima e sicurezza di se stessi. Cio avviene sia con affermazioni relative ad uno stato di benesseree di tranquillita personale, sia con affermazioni che tendono a credere di essere valutati inmodo positivo nel giudizio espresso dalle altre persone. Per tali motivi il fattore stato definitoVALUTAZIONE POSITIVA DI SE’.

Il fattore 5 ha sature sole tre variabili che identificano quelle situazioni di sport e hobby che

2.7. ESEMPIO DI INTERPRETAZIONE 31

Tabella 2.10: Fattore 5

39 .554 Nel mio tempo libero gioco a scacchi.14 .415 Mi piace molto giocare al calcio.22 .411 Mi piace molto collezionare francobolli.

non sembrano avere nessuna apparente legame con l’aggressivita. Bisogna aggiungere che questiitem, nella logica del questionario, svolgevano la funzione di “riempitivi”. La loro funzione eraquella di verificare se le risposte dei soggetti avevano un senso oppure erano state attribuitein modo casuale. Il fatto che questi item appaiano in un fattore isolato, serve a dimostrare lavalidita dei dati raccolti. Si potrebbe chiamare questo fattore “Attivita del tempo libero”, maproprio per la sua funzione logica, preferiamo chiamarlo fattore RIEMPITIVO.

34 .498 E’ piacevole osservare che qualcuno che non ti piace, riceve una buonalezione

29 .493 Attualmente, mi sento molto contento quando qualcuno che non mi piacesi prende una buona sgridata.

42 -.476 Mi piace viaggiare.19 -.443 Mi piace disegnare.43 -.408 Mi piacerebbe essere simpatico con quelli che sono cattivi con me.

Tabella 2.11: Fattore 6

Di difficile interpretazione e invece il fattore 6 in cui risultano sature 5 variabili gia saturatenei precedenti fattori. Tali variabili vengono percio chiamate “bifattoriali” ed essendo le lorosaturazioni in questo fattore minori di quelle degli altri fattori, la loro importanza puo esseretrascurata. Volendo comunque tentare un’interpretazione di questo fattore si puo vedere chele variabili 34 e 29 si riferiscono a manifestazioni di impulsi aggressivi, cioe situazioni in cui ilsoggetto prova piacere nel vedere realizzato un proprio desiderio di aggressivita; in accordo contale interpretazione e la variabile 43 che, comparendo qui con una saturazione negativa, assumeun significato opposto a quello che aveva nel fattore 1. Essa esprime quindi, il desiderio di poteressere in grado di opporsi a chi commette ingiustizie. Gli ultimi due item sono da considerarsidei riempitivi e non trovano una loro esatta collocazione logica nell’ambito del fattore. Questofattore potrebbe, con molte riserve, essere definito come IMPULSI AGGRESSIVI.

Nella Fig. 2.4 si vede la matrice delle correlazioni tra le variabili in una particolare formagrafica. Le variabili sono state anche riordinate in modo che le correlazioni piu elevate compaianoin vicinanza della diagonale principale. Questo tipo di rappresentazione puo essere paragonatoa quanto e stato da noi fatto sulla matrice delle correlazioni fra le prove di apprendimento che estata presentata nel capitolo 1. In questa rappresentazione grafica un simbolo piu scuro equivalead una correlazione alta. Si possono allora ritrovare raggruppate fra loro le stesse variabili cherisultano essere maggiormente sature in ciascuno dei sei fattori sopra descritti. Si notano inparticolare quattro raggruppamenti corrispondenti rispettivamente al fattore di Inibizione, alfattore di Aggressivita Fisica, al fattore di Aggressivita Verbale e al fattore di Autovalutazione.

Per una migliore comprensione dei metodi di estrazione dei fattori presentati precedentemen-te e per dimostrare che cosa si intende per indeterminazione della soluzione fattoriale abbiamoeffettuato una seconda analisi. Abbiamo utilizzato le stesse variabili relative al questionario diOlweus questa volta pero abbiamo estratto i fattori con il metodo degli assi principali iterati,utilizzando come stima iniziale della comunanza la correlazione multipla al quadrato1.

1Intuitivamente, per correlazione multipla di una variabile con tutte le altre bisogna intendere il grado di

32CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

Figura 2.4: Matrice delle correlazioni in forma simbolica

Di questa seconda analisi presentiamo (Tab. 2.12) solo la matrice fattoriale ruotata (conil metodo Varimax) in una forma particolare definita “ sorted”. Le variabili, cioe, sono stateriordinate secondo la loro saturazione nei fattori e tutte le saturazioni inferiori a .25 sono stateeliminate per facilitare la lettura.

Si puo quindi vedere facilmente che, pur con qualche diversita nell’ordine dei fattori e dellesaturazioni delle variabili in ogni singolo fattore, l’interpretazione porta comunque a risultati

sovrapposizione di una variabile con tutte le altre. Per maggiori informazioni su questo concetto si puo consultareMulaik (1972) Mulaik (1972) e Gorsuch (1974) Gorsuch (1974).

2.7. ESEMPIO DI INTERPRETAZIONE 33

analoghi.

34CAPITOLO 2. COME SI ESEGUE UN’ANALISI FATTORIALE: INDICAZIONI

INTUITIVE

Fattori1 2 3 4 5 6

49 0,69551 0,65735 0,58547 0,57852 0,569 -0,397 0,27645 0,52237 0,5008 0,6192 0,596

15 0,59157 0,57132 0,5405 0,501

13 0,71724 0,59911 0,367 0,5861 0,566

60 0,53950 0,353 0,51717 0,360 0,51041 0,65456 0,56727 0,55846 0,52730 0,272 0,51912 0,513 -0,27529 0,314 0,66934 0,337 0,63323 0,33725 0,369 0,33031 0,458263328 0,4233 0,369

36 0,3967

38 0,428 0,31739 0,45540 0,48721 0,37242 0,305 -0,30343 0,491 -0,47544 0,3836 0,406

10 0,4534 0,297 0,287

4820 -0,272 0,306199

14 0,256 0,40953 0,412 0,31854 0,2975522 0,306165859 -0,306 0,33518 0,30461 0,26462 0,358 0,281

VP 4,630 3,983 3,847 3,076 1,957 1,820

2.8. PUNTEGGI FATTORIALI 35

Tabella 2.12: Seconda matrice fattoriale ruotata (Varimax)

2.8 Punteggi fattoriali

Dopo aver effettuato un’analisi fattoriale ed aver ottenuto un certo numero di fattori, ci potrebbeinteressare conoscere la posizione di ogni soggetto rispetto a quei fattori. Se, ad esempio, abbia-mo isolato un fattore di Aggressivita fisica, potremmo voler conoscere quali dei nostri soggettimanifesti molta aggressivita e quali non ne manifesti affatto. Ci interessa quindi il punteggio diogni soggetto nei singoli fattori. Tale punteggio e chiamato, appunto, punteggio fattoriale.

Esistono diversi metodi per calcolare i punteggi fattoriali di ogni soggetto nei fattoriindividuati, ma solo due vengono maggiormente utilizzati nella realta pratica.

Il primo metodo e quello della regressione multipla (cfr. cap. 3*). E’ il metodo matematicoper il calcolo dei punteggi fattoriali che viene generalmente utilizzato dai programmi di analisifattoriale per calcolatori ed e percio molto comodo. Il punteggio fattoriale, in questo caso,tiene conto di tutte le variabili, proporzionalmente alla loro importanza fattoriale. Il suo difettoprincipale e che non e facile da interpretare, non conoscendo la sua gamma di variazione.

Il secondo e un metodo approssimato (punteggi fattoriali compositi) e si usa quando si vuolcalcolare un punteggio fattoriale che non tenga conto di tutte le variabili sottoposte ad analisifattoriale, ma soltanto della variabile o delle variabili piu sature in un particolare fattore (mo-nofattoriali). In questo caso, si analizza la matrice di composizione fattoriale e, per ciascunodei fattori di cui si vogliono conoscere i punteggi fattoriali, si selezionano le variabili piu sature,vale a dire con le saturazioni piu alte. A questo punto si considera la somma dei punteggi grezziche ogni soggetto ha ottenuto in quelle variabili, oppure se ne calcola la media. In quest’ultimocaso, se (come capita spesso) tutte le variabili hanno la stessa gamma, anche i punteggi fattorialiavranno la stessa gamma e sono quindi di facile interpretazione.

Quest’ultimo metodo e molto semplice se le variabili selezionate hanno tutte saturazionicon lo stesso segno. Le cose, invece, si complicano un poco quando le saturazioni di alcunedelle variabili scelte hanno segno diverso, perche bisogna tenerne conto e il modo per farlo estrettamente legato al tipo di misurazione utilizzata inizialmente.

I punteggi fattoriali possono essere utilizzati per effettuare altre elaborazioni statistiche, comel’analisi della varianza o il t di Student e verificare determinate ipotesi formulabili su alcunecaratteristiche del campione rispetto ai fattori. Ad esempio, nella ricerca di Rossi e Venuti(1983) ? (?) di cui si e ampiamente parlato, si era ottenuto il fattore di Aggressivita fisica.Essendo il campione eterogeneo rispetto all’eta e al sesso, gli autori avevano ipotizzato che ilsottocampione femminile manifestasse minore aggressivita fisica rispetto a quello maschile e cheil sottocampione di eta minore (preadolescenti, 11-13 anni) manifestasse maggiore aggressivitafisica rispetto a quello di eta maggiore (17-18 anni). Un’analisi della varianza effettuata suipunteggi fattoriali (con il secondo metodo qui proposto) ha permesso di verificare queste ipotesi.

2.9 Appendice

Test di Sfericita di Bartlett

χ2 = −[n − 1 − 16(2p + 5)]ln|R|

con (p2 − p)/2 gradi di libertadove |R| e il determinante della matrice di correlazione, N e la numerosita del campione, e

p indica il numero delle variabili.