Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple...

58
Analisi delle Corrisponden- ze Multiple A. Iodice Definizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione del problema Formalizzazione MCA residui standardizzati Risultati analisi ACM Analisi delle Corrispondenze Multiple Strumenti quantitativi per l’economia e la finanza I Alfonso Iodice D’Enza [email protected] Universit` a degli studi di Cassino e del Lazio Meridionale A. Iodice () Analisi delle Corrispondenze Multiple Statistica 1 / 58

Transcript of Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple...

Page 1: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Analisi delle Corrispondenze MultipleStrumenti quantitativi per l’economia e la finanza I

Alfonso Iodice D’[email protected]

Universita degli studi di Cassino e del Lazio Meridionale

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 1 / 58

Page 2: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Outline

1 Definizione a matrice dei dati

2 Collegamento con il caso bivariato

3 Formalizzazione del problema

4 Formalizzazione MCA residui standardizzati

5 Risultati analisi ACM

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 2 / 58

Page 3: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Analisi Delle Corrispondenze

Analisi multidimensionale di dati qualitativi

L’Analisi delle Corrispondenze Multiple rappresenta unostrumento per lo studio delle relazioni tra p caratteri statisticiqualitativi, ognuno caratterizzato da mj modalita (j=1,. . . ,p).Un applicazione molto comune per l’ACM consiste nell’utilizzodi tale metodo per visualizzare i risultati di una indagine viaquestionario (domande in forma chiusa).

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 3 / 58

Page 4: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Analisi Delle Corrispondenze

La matrice dei datiSi considerino i seguenti risultati di un’indagine riguardante gli sbocchi occupazionali di un campione di 389laureati a cui sono state sottoposte 12 domande in forma chiusa.Si riporta un esempio delle prime 5 righe ed 8 colonne della matrice di dati

Genere Residenza Voto.di.laurea Eta.attuale1 maschio altre province voti tra 96 e 105 tra 26 e 30 anni2 femmina altre province voti tra 96 e 105 oltre 30 anni3 maschio Napoli voti tra 96 e 105 tra 26 e 30 anni4 maschio provincia di Napoli voti tra 96 e 105 tra 26 e 30 anni5 maschio altre province voti minori di 96 tra 26 e 30 anni

Diploma Voto.di.diploma Frequenza.ai.corsi Materia.della.tesi.di.laurea1 maturita scientifica voto tra 43 e 48 meno del 30% materie economiche2 maturita scientifica voto tra 36 e 42 meno del 30% altre materie3 maturita classica voto tra 43 e 48 tra il 30% ed il 50% materie economiche4 maturita scientifica voto tra 49 e 54 tra il 30% ed il 50% materie giuridiche5 maturit‡ scientifica voto tra 36 e 42 tra il 30% ed il 50% materie giuridiche

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 4 / 58

Page 5: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella in codifica ridotta

Un tipo di codifica di dati relativi a n unita statistiche su cuisono osservate p variabili qualitative consiste nella costruzionedella tabella di codifica ridotta R .

n righe corrispondenti alle unita

p colonne quante sono le variabili

il generico elemento rij della matrice R e tale che

rij → numero della modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 5 / 58

Page 6: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella in codifica ridotta

Genere Residenza Voto.di.laurea Eta.attuale1 1 3 2 22 2 3 2 33 1 1 2 24 1 2 2 25 1 3 1 2

Diploma Voto.di.diploma Frequenza.ai.corsi Materia.della.tesi.di.laurea1 2 2 2 12 2 1 2 53 1 2 3 14 2 3 3 25 2 1 3 2

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 6 / 58

Page 7: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella in codifica disgiuntiva completa

Un tipo di codifica di dati relativi a n unita statistiche su cuisono osservate p variabili qualitative consiste nella costruzionedella tabella di codifica disgiuntiva completa Z .

n righe corrispondenti alle unita

s colonne quante sono le modalita delle p variabili

il generico elemento zij della matrice Z e tale che zij = 1se l’unita i e caratterizzata dalla modalita associata allacolonna j; zij = 0 altrimenti

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 7 / 58

Page 8: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella in codifica disgiuntiva completa

maschio femmina Napoli provincia di Napoli altre province1 1 0 0 0 12 0 1 0 0 13 1 0 1 0 04 1 0 0 1 05 1 0 0 0 1

voti minori di 96 voti tra 96 e 105 voti tra 106 e 110 voto 110 e lode1 0 1 0 02 0 1 0 03 0 1 0 04 0 1 0 05 1 0 0 0

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 8 / 58

Page 9: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella di Burt

Ottenuta la tabella in codifica disgiuntiva completa Z e siricava la tabella di Burt B = ZTZ una tabella a blocchididimensioni s× s

blocchi diagonali: ciascun blocco diagonale e una matricediagonale i cui valori rappresentano le frequenze dellemodalita della variabile cui il blocco e associato.

blocchi extra-diagonali: ciascun blocco extra-diagonalerappresenta una tabella a doppia entrata che incrocia duedelle p variabili considerate

Tabella D

Si definisce inoltre D la matrice diagonale i cui elementicorrispondono agli elementi diagonali della tabella di Burt.

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 9 / 58

Page 10: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella di Burt

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 10 / 58

Page 11: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella di Burt

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 11 / 58

Page 12: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Tabella di Burt

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 12 / 58

Page 13: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Matrice diagonale D

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 13 / 58

Page 14: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

E possibile formalizzare il problema in maniera analoga al caso di due variabili, per fare questo occorredefinire opportunamente le matrici F, Dn, Ds.

Tabella F,Dn, Ds

F =1

n× pZ

dove n× p rappresenta il totale di tabella della matrice Z: la somma degli elementi di ciascunadelle n righe e infatti uguale a p.

Matrice diagonale dei marginali di riga della matrice F

Dn =1

nIn

dove In rappresenta la matrice identita di dimensioni n× n.

Matrice diagonale dei marginali di colonna della matrice F

Ds =1

n× pD

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 14 / 58

Page 15: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Matrice Fmaschio femmina Napoli provincia di Napoli altre province

1 0.0002 0.0000 0.0000 0.0000 0.00022 0.0000 0.0002 0.0000 0.0000 0.00023 0.0002 0.0000 0.0002 0.0000 0.00004 0.0002 0.0000 0.0000 0.0002 0.00005 0.0002 0.0000 0.0000 0.0000 0.0002

voti tra 96 e 105 voti tra 106 e 110 voto 110 e lode1 0.0002 0.0000 0.00002 0.0002 0.0000 0.00003 0.0002 0.0000 0.00004 0.0002 0.0000 0.00005 0.0000 0.0000 0.0000

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 15 / 58

Page 16: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Matrice Fminore di 26 anni tra 26 e 30 anni oltre 30 anni

1 0.0000 0.0002 0.00002 0.0000 0.0000 0.00023 0.0000 0.0002 0.00004 0.0000 0.0002 0.00005 0.0000 0.0002 0.0000

maturita classica maturita scientifica diploma tecnico altri diplomi1 0.0000 0.0002 0.0000 0.00002 0.0000 0.0002 0.0000 0.00003 0.0002 0.0000 0.0000 0.00004 0.0000 0.0002 0.0000 0.00005 0.0000 0.0002 0.0000 0.0000

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 16 / 58

Page 17: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Tabelle di dati

Matrice Fvoto tra 36 e 42 voto tra 43 e 48 voto tra 49 e 54 voto tra 55 e 60

1 0.0000 0.0002 0.0000 0.00002 0.0002 0.0000 0.0000 0.00003 0.0000 0.0002 0.0000 0.00004 0.0000 0.0000 0.0002 0.00005 0.0002 0.0000 0.0000 0.0000

solo per esami meno del 30% tra il 30% ed il 50% oltre il 50%1 0.0000 0.0002 0.0000 0.00002 0.0000 0.0002 0.0000 0.00003 0.0000 0.0000 0.0002 0.00004 0.0000 0.0000 0.0002 0.00005 0.0000 0.0000 0.0002 0.0000

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 17 / 58

Page 18: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Le tabelle dei profili

A questo punto e possibile ottenere le tabelle dei profili riga e colonna in maniera del tutto analoga al casodelle Corrispondenze semplici. In questo caso bisogna tenere conto che i profili riga fanno riferimento agliindividui, mentre i profili colonna fanno riferimento alle modalita delle p variabili.

profili riga: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) di riga

D−1n F

profili colonna: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) dicolonna,

FD−1s

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 18 / 58

Page 19: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione del problema: soluzione in Rs

Analogamente al caso bivariato

La soluzione nello spazio degli individui

Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione

FTD

−1n FD

−1s u = λu

La soluzione si ottiene diagonalizzando la seguente matrice (nello spazio delle modalita)

S = FTD

−1n FD

−1s

che puo essere espressa come segue

S = FTD

−1n FD

−1s =

(Z

n× p

)T

︸ ︷︷ ︸FT

1

1nIn︸ ︷︷ ︸

D−1n

(Z

n× p

)︸ ︷︷ ︸

F

n× p D−1︸ ︷︷ ︸

D−1s

=

=1

pZ

TZD

−1=

1

pBD

−1

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 19 / 58

Page 20: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione del problema: soluzione in Rn

Analogamente al caso bivariato

La soluzione nello spazio delle modalita

Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione

FTD

−1s FD

−1n v = λv

La soluzione si ottiene diagonalizzando la seguente matrice (nello spazio delle modalita)

S = FTD

−1s FD

−1n

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 20 / 58

Page 21: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione del problema: soluzione in Rn

Spazio modalita

il versore dell’asse principale e

u

La proiezione di un vettore sull’asse diversore u secondo la distanza delchi-quadro si ottiene moltiplicando ilvettore per il fattore principale

D−1s u

le coordinate principali dei profili rigasono date dal prodotto dalla matrice deiprofili e il fattore principale

c = D−1n F︸ ︷︷ ︸

matrice profili riga

× D−1s u︸ ︷︷ ︸

fattore principale

Spazio individui

asse principalev

fattore principale

D−1n v

coordinata principale

c = D−1s F

TD

−1n v

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 21 / 58

Page 22: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Autovalori

La matrice Z identifica s punti nello spazio Rn. Tuttavia ognuno dei p blocchi che compongono Z ecaratterizzato da un autovalore banale, analogamente a quanto accade nel caso bivariato.

Il numero di autovalori

Il numero di autovalori non nulli e

s1 + (s2 − 1) + (s3 − 1) + . . . + (sp − 1) = s− p + 1

Nell’analisi centrata (baricentro Della nube traslato nell’origine degli assi) il numero di autovalori non nulli

s− p

Dunque, la percentuale di variabilita spiegata e data da

λα∑s−pj=1 λα

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 22 / 58

Page 23: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Autovalori

La percentuale di variabilita spiegata

λα∑s−pj=1 λα

Rappresenta una misura pessimistica del potere esplicativo della sintesi ottenuta.

motivo: la codifica disgiuntiva completa impone una sfericita artificiale della nube dei punti.

correzione autovalori Benzecri

λ∗

=

(p

p− 1

)2 (λ−

1

p

)2

per λ > 1p

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 23 / 58

Page 24: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione MCA residui standardizzati

Per ottenere una soluzione della MCA, in maniera del tuttoanaloga a quanto detto per la CA, E’ possibile analizzare latabella dei residui standardizzati.

tabella delle contingenzeLa tabella delle frequenze relative (F) ottenuta a partire da Z

maschio femmina Napoli provincia di Napoli altre province1 0.0002 0.0000 0.0000 0.0000 0.00022 0.0000 0.0002 0.0000 0.0000 0.00023 0.0002 0.0000 0.0002 0.0000 0.00004 0.0002 0.0000 0.0000 0.0002 0.00005 0.0002 0.0000 0.0000 0.0000 0.0002

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 24 / 58

Page 25: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione MCA residui standardizzati

vettori dei marginali (totali)di riga

x1 0.00262 0.00263 0.00264 0.00265 0.0026

vettore dei marginali (totali)di colonna

xmaschio 0.0490femmina 0.0345

Napoli 0.0393provincia di Napoli 0.0249

altre province 0.0193

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 25 / 58

Page 26: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione MCA residui standardizzati

Per ottenere una soluzione della CA e possibile analizzare latabella dei residui standardizzati.

centraturala centratura della matrice F si ottiene sottraendo a ciascun valore il prodotto dei marginali di riga e dicolonna ad esso corrispondenti, formalmente fij − fi.f.j . Da un punto di vista algebrico questocorrisponde a

F − nsT=

maschio femmina Napoli provincia di Napoli altre province1 0.0001 -0.0001 -0.0001 -0.0001 0.00022 -0.0001 0.0001 -0.0001 -0.0001 0.00023 0.0001 -0.0001 0.0001 -0.0001 -0.00014 0.0001 -0.0001 -0.0001 0.0002 -0.00015 0.0001 -0.0001 -0.0001 -0.0001 0.0002

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 26 / 58

Page 27: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione MCA residui standardizzati

Per ottenere una soluzione della MCA e possibile analizzare latabella dei residui standardizzati.

standardizzazionedopo aver effettuato la centratura della matrice F si procede alla standardizzazione, formalmentefij−fi.f.j√

fi.f.j. Da un punto di vista algebrico questo corrisponde a

S = D−1/2n (F − nsT)D

−1/2s =

S = D−1/2n (F − nsT)D

−1/2s =

maschio femmina Napoli provincia di Napoli altre province1 0.0079 -0.0095 -0.0101 -0.0081 0.02352 -0.0113 0.0134 -0.0101 -0.0081 0.02353 0.0079 -0.0095 0.0113 -0.0081 -0.00714 0.0079 -0.0095 -0.0101 0.0189 -0.00715 0.0079 -0.0095 -0.0101 -0.0081 0.0235

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 27 / 58

Page 28: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione MCA residui standardizzati

Ottenuta la tabella S dei residui standardizzati, per ottenere lasoluzione si effettua la decomposizione in valori singolari,(SVD)

decomposizione in valori singolari

SV D(S) = UDαVT

dove U e l’autovettore di sinistra e rappresenta lo spazio delle righe, V e l’autovettore di destra erappresenta lo spazio delle colonne, Dα e la matrice diagonale dei valori singolari, che sono la radicequadrata degli autovalori.

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 28 / 58

Page 29: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione MCA residui standardizzati

Ottenuta la tabella S dei residui standardizzati, per ottenere lasoluzione si effettua la decomposizione in valori singolari,(SVD)

valori singolari

Dα=

1 2 3 4 51 0.4678 0.0000 0.0000 0.0000 0.00002 0.0000 0.3859 0.0000 0.0000 0.00003 0.0000 0.0000 0.3572 0.0000 0.00004 0.0000 0.0000 0.0000 0.3351 0.00005 0.0000 0.0000 0.0000 0.0000 0.3277

vettori singolari

U1 2 3 4 5

1 -0.0201 -0.0157 -0.0197 0.0661 0.00682 -0.0553 -0.0596 -0.0235 -0.0624 0.07863 -0.0037 0.0124 -0.0174 0.0805 -0.01384 0.0058 -0.0442 -0.0379 -0.0271 -0.06835 -0.0453 -0.0357 -0.0913 -0.0380 0.0639

vettori singolari

V1 2 3 4 5

1 -0.1569 0.1573 -0.1237 0.0155 -0.20512 0.1859 -0.1870 0.1441 -0.0195 0.24563 0.0662 0.1754 -0.1503 0.2020 0.03504 -0.0421 -0.0450 0.3146 -0.1087 -0.15705 -0.0481 -0.1982 -0.1479 -0.1657 0.1299

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 29 / 58

Page 30: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Formalizzazione MCA residui standardizzati

Calcolo delle coordinate dei profili riga e colonna

coordinate delle righe

standard coords = D−1/2n U

principal coords = D−1/2n UDα

coordinate delle colonne

standard coords = D−1/2s V

principal coords = D−1/2s VDα

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 30 / 58

Page 31: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi ACM

Autovalori

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 31 / 58

Page 32: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Coordinate modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 32 / 58

Page 33: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Contributi modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 33 / 58

Page 34: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Qualita della rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 34 / 58

Page 35: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 35 / 58

Page 36: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 36 / 58

Page 37: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 37 / 58

Page 38: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 38 / 58

Page 39: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 39 / 58

Page 40: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 40 / 58

Page 41: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 41 / 58

Page 42: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 42 / 58

Page 43: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 43 / 58

Page 44: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 44 / 58

Page 45: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 45 / 58

Page 46: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 46 / 58

Page 47: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 47 / 58

Page 48: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 48 / 58

Page 49: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Altra applicazione

Il data set e estratto dal sondaggio ISSP del 1993, si riferisce a rispondenti della Germania. Il numero diattributi considerati e p = 7, il numero di unita statistiche e n = 871.Ci sono quattro affermazioni rispetto alle quali si richiede agli intervistati di dare un giudizio. Ci sono inoltretre attributi di tipo demografico come genere, eta and titolo di studio.

Le affermazioni

A Crediamo troppo nella scienza e troppo poco in fede e sentimenti.

B In generale, la scienza moderna comporta piu problemi che vantaggi.

C Ogni intervento dell’uomo sulla natura non fa altro che peggiorare le cose.

D La scienza ci aiutera a risolvere i problemi ambientali determinando pochi cambiamenti nel nostrostile di vita.

Modalita degli attributi

A-D 1. condivido fortemente, 2. condivido abbastanza, 3. indifferente, 4. non condivido, 5. noncondivido affatto.

genere Due modalita.

eta Sei modalita.

titolo di studio Sei modalita.

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 49 / 58

Page 50: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 50 / 58

Page 51: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 51 / 58

Page 52: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 52 / 58

Page 53: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 53 / 58

Page 54: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 54 / 58

Page 55: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 55 / 58

Page 56: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 56 / 58

Page 57: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 57 / 58

Page 58: Analisi delle Corrispondenze Multiple - docente.unicas.it · Analisi delle Corrisponden-ze Multiple A. Iodice De nizione a matrice dei dati Collegamento con il caso bivariato Formalizzazione

Analisi delleCorrisponden-

zeMultiple

A. Iodice

Definizione amatrice deidati

Collegamentocon il casobivariato

Formalizzazionedel problema

FormalizzazioneMCA residuistandardizzati

Risultatianalisi ACM

Risultati analisi MCA

Rappresentazione delle modalita

A. Iodice () Analisi delle Corrispondenze Multiple Statistica 58 / 58