1 ANALISI DELLA COVARIANZA Per stabilire come varia la domanda di un bene in funzione non solo del...

Post on 01-May-2015

215 views 2 download

Transcript of 1 ANALISI DELLA COVARIANZA Per stabilire come varia la domanda di un bene in funzione non solo del...

1

ANALISI DELLA COVARIANZA

Per stabilire come varia la domanda di un bene in funzione non solo del reddito disponibile, ma

anche di fattori sociali o ambientali si può impiegare l’analisi della covarianza, che combina

il modello di regressione con l’analisi della varianza, consentendo di valutare gli effetti dei

fattori sia quantitativi che qualitativi.

2

Con l’analisi della covarianza si cerca di vedere se il consumo di un bene obbedisce alla stessa legge per

diversi gruppi di famiglie.

Scopo dell’ANCOVA

3

Il consumo del prodotto o del gruppo di prodotti in esame si può esprimere secondo il modello:

ijijiiij uxbay

i=1,2,…,q individua la modalità di raggruppamento delle famiglie;j=1,2,…,p individua la singola famiglia all’interno di ciascun gruppo;

Yij è spesa totale della famiglia j-

ma appartenente al

gruppo i-mo

xij è spesa per il consumo del prodotto

in esame della famiglia j-ma appartenente al

gruppo i-mo

uij è la componente erratica della famiglia j-ma

appartenente al gruppo i-mo

ai e bi sono i parametri incogniti

che dipendono dal gruppo i

4

In base ai valori che possono assumere i parametri

ai e bi nell’ambito dei vari gruppi, le situazioni che si

possono presentare sono sintetizzate nella seguente tabella:

5

ai = tra loro ai ≠ tra loro

 bi =tra loro 1 2

bi ≠ tra loro 3 4

6

ai

bi

Quadrante 1

7

ai

bi

ai bi

Quadrante 2

8

ai ai

bi bi

Quadrante 3

9

ai bi

ai bi

Quadrante 4

10

 

L’analisi consiste nel sottoporre a verifica se vi è convenienza a suddividere l’insieme delle famiglie in

gruppi. Si ipotizza che la suddivisione in gruppi delle famiglie non ha alcun effetto sulla variabile dipendente, cioè

all’interno di ciascun gruppo si assiste allo stesso andamento dei consumi in relazione a tutte le famiglie.

Tale ipotesi si verifica attraverso il test F di Fisher-Snedecor.

I TEST DI IPOTESI

11

La verifica del test si basa sulla seguente considerazione:

la variabilità della componente erratica nel modello di la variabilità della componente erratica nel modello di

regressione senza la suddivisione in gruppi è maggiore regressione senza la suddivisione in gruppi è maggiore

dell’analoga variabilità nel modello con suddivisione in dell’analoga variabilità nel modello con suddivisione in

gruppi.gruppi.

12

Per la proprietà della scomposizione della devianza si ha:

Devianza totaledell’errore

Devianza interna

Devianzaesterna

q

i

n

j

q

iijij

q

i

n

jij

jj

uuuuuu1 1 1

22

1 1

2)(

13

Essendo:

si ha che:

la devianza del modello senza suddivisione in gruppi è la devianza del modello senza suddivisione in gruppi è

maggiore di quella calcolata con la suddivisione.maggiore di quella calcolata con la suddivisione.

01

2

q

ii uu

q

i

n

jjij

q

i

n

jij

jj

uuuu1 1

2

1 1

2)(

14

Tale considerazione resta valida se dalle devianze si passa alle varianze.

Con le varianze è possibile effettuare il test di verifica utilizzando la F di Fisher-Snedecor, in cui viene ad essere testato l’incremento di varianza nel passare dal modello con suddivisione al modello senza, in corrispondenza di

due ipotesi.

15

H0 : b1 = b2 = b3 =…= bt

La suddivisione in gruppi è ininfluente, avendosi lo stesso andamento della spesa per il consumo del bene in analisi.

H1 : b1 b2 b3 ... bt

esiste un diverso andamento del consumo all’interno dei gruppi.

16

Per il calcolo delle varianze da utilizzare nel test F, si parte dal modello iniziale con la suddivisione in gruppi:

yij=ai+bixij+uij [1]

Si calcolano le medie del primo e del secondo membro ottenendosi:

iiiii uxbay

Modello con suddivisione

Sottraendo la prima equazione alla seconda si passa al modello centrato:

2iijiijiiij uuxxbyy

17

Il modello senza suddivisione in gruppi può essere così

formulato: yj=at+bt xj+uj

Modello senza suddivisione

...... uxbay tt

Sottraendo la prima equazione alla seconda si ottiene il modello centrato: 3uuxxbyy jjtj ......

Effettuando le medie, si ha:

In cui:

- y.. e x.. sono le medie delle rispettive variabili calcolate su tutte le famiglie;

- at e bt sono i coefficienti che si ottengono utilizzando nella stima

le osservazioni concernenti tutte le modalità di raggruppamento.

18

ESS2 =

Indicando con ESS2 la somma delle devianze di ciascun

gruppo, nota anche come devianza interna,

i j iij uu 2

e con ESS3 la devianza totale dell’errore del modello senza

suddivisione in gruppi, 2

jj uu ..ESS3 =

qkE

qEEF

SS

SSSS

2/

22/

2

231

q

iink

1

F1 è uguale a:

dove: (2q-2) e (k-2q) sono i gradi di libertà e

indica il numero complessivo delle osservazioni.

19

FF11<F<F11**

accetto H0: la suddivisione delle famiglie in gruppi è

perfettamente inutile, c’è omogeneità di comportamento.

FF11>F>F11**

rigetto H0: all’interno di ciascun gruppo di famiglie c’è una

relazione spesa totale-consumo diversa.

20

Accertata la significativa diversità dal modello senza

suddivisione in gruppi (F1>F1*) si possono avere due

possibilità: 

-le intercette dei modelli che descrivono le varie modalità sono tra loro diverse, ma i coefficienti angolari

sono statisticamente uguali fra loro, ma diversi da bt;

per cui le diversità nei comportamenti consistono in differenti livelli di consumo;

- oltre alle ai sono statisticamente diverse tra loro anche

le bi ; per cui le diverse modalità di raggruppamento

sottintendono comportamenti di consumo completamente diversi.

21

Al fine di verificare in quale delle 2 situazioni ci si trovi si può supporre che i coefficienti angolari siano

uguali ad un particolare valore bw (w sta per within)

comune a tutti i gruppi.

22

Per verificare tale ipotesi vanno considerate:

a) la devianza dei residui di tale modello, che può scriversi:

yij=ai+bwxij+uij

Calcolando le medie si ha:iiwii uxbay

Sottraendo membro a membro si perviene al relativo modello centrato:

iijiijwiiiij uuxxbaayy

b) la devianza del modello iniziale con suddivisione in gruppi opportunamente centrato, come nel caso visto in precedenza, che risulta inferiore alla devianza calcolata sub a).

23

Occorre verificare la significatività dell’incremento della varianza che si ha passando dal modello in cui i vari gruppi

presentano coefficienti angolari bi statisticamente uguali

tra loro a quello in cui i gruppi sono caratterizzati da coefficienti angolari statisticamente diversi tra loro.

Si calcola il test F:

H0 : b1=b2=b3=……=bw

H1 : b1b2b3……bw

24

Indicando con ESS2 la somma dei quadrati dei residui del

modello con suddivisione in gruppi e con ESS4 la devianza

totale dell’errore del modello con suddivisione in gruppi

caratterizzati da un coefficiente angolare comune bw.

qkE

qEEF

SS

SSSS

2/

1/

2

242

Dove (q-1) e (k-2q) sono i gradi di libertà e k indica il numero totale delle osservazioni.

25

FF22<F<F22**

si accetta H0: l’eterogeneità dei gruppi si traduce soltanto nelle

differenze fra le intercette

FF22>F>F22* *

Si accettata H1: il criterio di raggruppamento sottintende una

completa eterogeneità del comportamento di consumo nei gruppi di famiglie individuati dalle i modalità

26

ai = tra loro ai tra loro  

(1) Accettazione (2) Accettazione Ho di F1. Ho di F2 bi=

(3) Accettazione (4) Accettazione H1 di F1 H1 di F2 bi