Appunti econometria_2006

228
 Appunti di Econometria F.C. Bagliano, L. Benfratello, A. Sembenelli Dipartimento di Scienze Economiche e Finanziarie “G. Prato” Università di Torino Marzo 2006 c ° 2006 F.C. Bagliano-L. Benfratello-A. Sembenelli.

Transcript of Appunti econometria_2006

Page 1: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 1/228

 

Appunti di Econometria

F.C. Bagliano, L. Benfratello, A. Sembenelli

Dipartimento di Scienze Economiche e Finanziarie “G. Prato”Università di Torino

Marzo 2006

c° 2006 F.C. Bagliano-L. Benfratello-A. Sembenelli.

Page 2: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 2/228

 

2

Page 3: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 3/228

 

Indice

1 Natura e scopo dell’econometria 9

2 Cenni di calcolo delle probabilità e di inferenza statistica 13

2.1. Esperimento casuale, spazio campionario, evento . . . . . . . 132.2. Probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.1. Proprietà delle probabilità . . . . . . . . . . . . . . . . 152.2.2. Altre de…nizioni utili sulle probabilità . . . . . . . . . 16

2.3. Variabili casuali . . . . . . . . . . . . . . . . . . . . . . . . . . 172.4. Distribuzioni di probabilità . . . . . . . . . . . . . . . . . . . 202.5. Distribuzioni teoriche di probabilità . . . . . . . . . . . . . . 25

2.5.1. Distribuzione normale . . . . . . . . . . . . . . . . . . 252.5.2. Distribuzione normale standardizzata . . . . . . . . . 27

2.5.3. Distribuzione Â2 (Chi-quadrato) . . . . . . . . . . . . 282.5.4. Distribuzione t di Student . . . . . . . . . . . . . . . . 292.5.5. Distribuzione F  di Fisher . . . . . . . . . . . . . . . . 30

2.6. Inferenza statistica - Stimatori . . . . . . . . . . . . . . . . . 332.7. Inferenza statistica - Stimatore per intervalli e intervalli di

con…denza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.8. Inferenza statistica - Test di ipotesi . . . . . . . . . . . . . . . 412.9. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3 Modelli di Regressione - Introduzione e concetti di base 45

4 Modelli di Regressione - Regressione lineare bivariata 494.1. Metodo dei Minimi Quadrati Ordinari . . . . . . . . . . . . . 49

4.1.1. Assunzioni . . . . . . . . . . . . . . . . . . . . . . . . 494.1.2. Stima dei parametri . . . . . . . . . . . . . . . . . . . 504.1.3. Proprietà algebriche dei minimi quadrati . . . . . . . . 524.1.4. Il coe¢ciente di determinazione semplice . . . . . . . . 52

3

Page 4: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 4/228

 

4 INDICE 

4.1.5. Proprietà statistiche . . . . . . . . . . . . . . . . . . . 53

4.2. Intervalli di con…denza e test delle ipotesi . . . . . . . . . . . 604.3. Introduzione alla previsione . . . . . . . . . . . . . . . . . . . 634.4. Forme funzionali utili . . . . . . . . . . . . . . . . . . . . . . 654.5. Appendice : Stima econometrica della propensione marginale

al consumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.6. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5 Modelli di Regressione - Regressione lineare trivariata 775.1. Metodo dei Minimi Quadrati Ordinari . . . . . . . . . . . . . 77

5.1.1. Assunzioni . . . . . . . . . . . . . . . . . . . . . . . . 775.1.2. Stima dei parametri . . . . . . . . . . . . . . . . . . . 78

5.1.3. Proprietà algebriche dei minimi quadrati . . . . . . . . 805.1.4. Il coe¢ciente di determinazione multiplo (R2) . . . . . 805.1.5. Il coe¢ciente di determinazione multiplo “aggiustato”

(R2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825.1.6. Proprietà statistiche . . . . . . . . . . . . . . . . . . . 82

5.2. Interpretazione dei coe¢cienti e variabili omesse . . . . . . . 855.2.1. Il problema dell’omissione di variabili rilevanti . . . . 86

5.3. Test di Ipotesi . . . . . . . . . . . . . . . . . . . . . . . . . . 905.3.1. Ipotesi su singoli parametri . . . . . . . . . . . . . . . 915.3.2. Ipotesi congiunte su più parametri . . . . . . . . . . . 915.3.3. Restrizioni lineari sui parametri . . . . . . . . . . . . . 92

5.3.4. Stabilità strutturale dei parametri . . . . . . . . . . . 975.4. Previsione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1035.5. Appendice : Stima econometrica di una funzione di produ-

zione Cobb-Douglas . . . . . . . . . . . . . . . . . . . . . . . 1065.6. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

6 Elementi di algebra lineare 1136.1. De…nizioni di base . . . . . . . . . . . . . . . . . . . . . . . . 1136.2. Matrici notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . 1156.3. Operazioni fra matrici . . . . . . . . . . . . . . . . . . . . . . 117

6.3.1. Addizione . . . . . . . . . . . . . . . . . . . . . . . . . 117

6.3.2. Sottrazione . . . . . . . . . . . . . . . . . . . . . . . . 1176.3.3. Moltiplicazione per uno scalare . . . . . . . . . . . . . 1176.3.4. Moltiplicazione fra vettori e fra matrici . . . . . . . . 1176.3.5. Trasposizione di una matrice . . . . . . . . . . . . . . 1206.3.6. Inversione di una matrice . . . . . . . . . . . . . . . . 1206.3.7. Determinante . . . . . . . . . . . . . . . . . . . . . . . 120

Page 5: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 5/228

 

INDICE  5

6.4. Applicazioni utili del prodotto fra vettori e fra matrici . . . . 123

6.5. Dipendenza e indipendenza lineare di vettori . . . . . . . . . 1266.6. Forme lineari e forme quadratiche . . . . . . . . . . . . . . . . 1286.7. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

7 Il modello di regressione lineare multivariata: i Minimi Qua-drati Ordinari (OLS) 133

7.1. Notazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1337.2. Assunzioni classiche . . . . . . . . . . . . . . . . . . . . . . . 1357.3. Stima dei parametri: metodo dei Minimi Quadrati Ordinari . 1367.4. Interpretazione geometrica del metodo dei minimi quadrati . 1387.5. Proprietà algebriche dei minimi quadrati . . . . . . . . . . . . 139

7.6. Coe¢ciente di determinazione multiplo . . . . . . . . . . . . . 1397.7. Nota alle proprietà algebriche degli stimatori OLS . . . . . . 1417.8. Proprietà statistiche . . . . . . . . . . . . . . . . . . . . . . . 1427.9. Test di ipotesi . . . . . . . . . . . . . . . . . . . . . . . . . . . 1457.10. Esempio: il modello di regressione lineare bivariato . . . . . . 1477.11. Interpretazione dei coe¢cienti di regressione multipla . . . . . 1497.12. Omissione di variabili rilevanti e inclusione di variabili irrilevanti1517.13. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

8 Violazioni delle assunzioni classiche e modello di regressionelineare generalizzato 157

8.1. Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1578.2. Violazioni delle assunzioni su V ar (") . . . . . . . . . . . . . . 1598.3. Il modello di regressione lineare generalizzato e lo stimatore

GLS (Generalized Least Squares ) . . . . . . . . . . . . . . . . 161

9 Eteroschedasticità 1659.1. Minimi quadrati generalizzati (GLS) ed eteroschedasticità . . 1659.2. FGLS ed eteroschedasticità . . . . . . . . . . . . . . . . . . . 1679.3. OLS ed eteroschedasticità . . . . . . . . . . . . . . . . . . . . 1689.4. Test di eteroschedasticità . . . . . . . . . . . . . . . . . . . . 1699.5. Eteroschedasticità: un’applicazione . . . . . . . . . . . . . . . 1729.6. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

10 Autocorrelazione 17710.1. Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17710.2. Processi stocastici (cenni) . . . . . . . . . . . . . . . . . . . . 178

10.2.1. White noise . . . . . . . . . . . . . . . . . . . . . . . . 178

Page 6: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 6/228

 

6 INDICE 

10.2.2. Random walk . . . . . . . . . . . . . . . . . . . . . . . 180

10.2.3. Processo AR(1) . . . . . . . . . . . . . . . . . . . . . . 18110.2.4. Processo MA(1) . . . . . . . . . . . . . . . . . . . . . 183

10.3. GLS con termini di errore AR(1) . . . . . . . . . . . . . . . . 18510.4. FGLS con termini di errore AR(1) . . . . . . . . . . . . . . . 18810.5. Test di autocorrelazione . . . . . . . . . . . . . . . . . . . . . 18910.6. Autocorrelazione ed errata speci…cazione dinamica. . . . . . . 19110.7. Eteroschedasticità di tipo ARCH . . . . . . . . . . . . . . . . 19810.8. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

11 Violazione dell’assunzione di normalità 203

12 Variabili dummy  20512.1. De…nizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20512.2. Variabili dummy  additive . . . . . . . . . . . . . . . . . . . . 20612.3. Variabili dummy  moltiplicative . . . . . . . . . . . . . . . . . 20912.4. Variabili dummy  e test di stabilità dei parametri. . . . . . . . 21012.5. Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

13 Modelli dinamici 21313.1. Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21313.2. Modelli a ritardi distribuiti . . . . . . . . . . . . . . . . . . . 21413.3. Fondamenti economici dei modelli dinamici (I): modello con

aspettative adattive . . . . . . . . . . . . . . . . . . . . . . . 21613.4. Fondamenti economici dei modelli dinamici (II): modello con“aggiustamento parziale” . . . . . . . . . . . . . . . . . . . . 217

13.5. Modelli dinamici: cenno ai problemi di stima . . . . . . . . . 21813.6. Test di autocorrelazione in modelli autoregressivi (del primo

ordine) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

14 Tavole 22114.1. Distribuzione normale standardizzata . . . . . . . . . . . . . . 22214.2. Distribuzione Â2 . . . . . . . . . . . . . . . . . . . . . . . . . 22314.3. Distribuzione t . . . . . . . . . . . . . . . . . . . . . . . . . . 22414.4. Distribuzione F  . . . . . . . . . . . . . . . . . . . . . . . . . . 22514.5. Distribuzione Durbin-Watson . . . . . . . . . . . . . . . . . . 227

Page 7: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 7/228

 

Introduzione

Questi appunti sono stati preparati per facilitare la frequenza e lo studio delcorso di Econometria di base presso la Facoltà di Economia dell’Università diTorino. Il corso copre i fondamenti del modello classico di regressione linearee le sue principali estensioni. Nella prima parte del corso, dopo necessaririchiami di calcolo delle probabilità ed inferenza statistica (capitolo 2), vie-ne presentato il modello nelle versioni bivariata e trivariata senza utilizzarel’approccio matriciale (capitoli 3-5). Tale approccio viene adottato nella se-conda parte del corso per l’estensione al caso n-variato del modello classicodi regressione (capitolo 7), per l’introduzione del modello generalizzato di

regressione (capitolo 8) e per a¤rontare i problemi di stima dovuti ad ete-roschedasticità (capitolo 9), autocorrelazione (capitolo 10) e non normalità(capitolo 11). Le necessarie tecniche di calcolo matriciale sono sintetica-mente presentate nel capitolo 6. Chiudono il corso due capitoli dedicatiall’utilizzo di variabili dummy  (capitolo 12) e ad un’introduzione ai mo-delli dinamici (capitolo 13). Tavole statistiche delle principali distribuzioniutilizzate sono raccolte nel capitolo 14.

Page 8: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 8/228

 

8

Page 9: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 9/228

 

Capitolo 1

Natura e scopo

dell’econometria

De…nizione. Campo di studi in cui metodi matematici e statistici vengonoapplicati ai dati economici al …ne di dare contenuto empirico alla teoriaeconomica.Prerequisiti :

² Economia (macro e micro)

² Matematica

² Statistica

Ragione (pragmatica) per studiare econometria . L’econometria for-nisce la necessaria strumentazione per:

1. quanti…care grandezze economiche rilevanti per le imprese (es. elastici-tà dei prodotti al prezzo e al reddito), per gli investitori …nanziari (es.volatilità dei titoli azionari) e per le autorità pubbliche (es. elasticitàdel de…cit pubblico all’aliquota …scale);

2. fornire previsioni sull’andamento futuro di grandezze economiche rile-vanti per le imprese, gli investitori …nanziari e le autorità pubbliche(consumi, investimenti, tasso d’interesse, tasso di cambio,...).

Page 10: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 10/228

 

10 capitolo 1

Costruzione di un modello econometrico:

1. Teoria economica

2. Speci…cazione del modello econometrico

3. Dati economici

4. Stima del modello econometrico

5. Controllo della corretta speci…cazione del modello econometrico (edeventuale rispeci…cazione)

6. Utilizzo del modello per:

(a) veri…ca delle ipotesi

(b) previsione

(c) simulazione di scenari alternativi di politica economica.

Esempio (volutamente banale):

1. Teoria economica. Usualmente si ipotizza una relazione tra la quantità

domandata di un bene di consumo, il suo prezzo (negativa) e il redditodei consumatori (positiva)

q = f ( p;x;:::)

Ovviamente la teoria economica può suggerire variabili addizionali (es.prezzo dei beni sostituti e complementari, investimenti pubblicitari,...).

2. Speci…cazione del modello econometrico:

(a) selezione delle variabili indipendenti da includere nel modello

q = f ( p;x;:::)

(b) scelta della forma funzionale (lineare)

q  = ¯ 0 + ¯ 1 p + ¯ 2x

Page 11: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 11/228

 

Natura e scopo dell’econometria 11

(c) assunzioni sul termine di errore (o più semplicemente errore)

q  = ¯ 0 + ¯ 1 p + ¯ 2x + "

dove " è una variabile casuale di cui bisogna ipotizzare il valoreatteso, la varianza e (in alcuni casi) la distribuzione di probabilità;

(d) assunzioni sulla natura delle variabili indipendenti e sulla lororelazione con l’errore:

i. variabili deterministiche o variabili casuali?ii. se casuali, correlate con l’errore?

3. Dati economici. I parametri del modello ¯ 0

; ¯ 1

; ¯ 2

non sono noti. Èquindi necessario stimarli utilizzando dei dati campionari disponibili.

² Serie di tempo: dati di un individuo (paese, impresa, consuma-tore, lavoratore) osservati per più di un periodo (settimanali,mensili, trimestrali, annuali);

² Dati cross-sezionali : dati di più individui osservati per un soloperiodo;

² Dati panel : dati di più individui osservati per più di un periodo.

4. Stima del modello econometrico. Mediante l’applicazione di appropria-

ti metodi di stima ai dati economici si ottengono stime dei parametridel modello.

² Parametri del modello: ¯ 0; ¯ 1; ¯ 2

² Stime dei parametri: b0; b1; b2

5. Controllo della corretta speci…cazione del modello. Prima di utilizzareil modello stimato è necessario controllare che le assunzioni fatte nellafase (ii) non siano implausibili se confrontate con i dati economici chesono stati utilizzati per la stima. Ad esempio:

² sono state omesse delle variabili rilevanti?² la forma funzionale è corretta?

² le assunzioni sulla struttura stocastica del termine di disturbosono corrette?

² le assunzioni sulla natura dei regressori sono corrette?

Page 12: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 12/228

 

12 capitolo 1

6. Utilizzo del modello.

² Veri…ca di ipotesi : il segno di b2 è consistente con quanto sugge-rito dalla teoria economica?

² Previsione : conoscendo i valori previsti dei regressori è possibileprevedere il valore della variabile dipendente?

Page 13: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 13/228

 

Capitolo 2

Cenni di calcolo delle

probabilità e di inferenzastatistica

2.1. Esperimento casuale, spazio campionario, evento

Esperimento casuale (o esperimento stocastico). Esperimento che haalmeno due possibili esiti (o risultati) e per il quale c’è incertezza su qualeesito si veri…chi.

Esempio: lancio di una moneta, lancio di due monete, lancio di un dado,lancio di due dadi.

Spazio campionario (o popolazione). L’insieme dei possibili esiti di unesperimento casuale.

Esempio. Nell’esperimento “lancio di una moneta” lo spazio campionarioinclude due possibili esiti (T,C); nell’esperimento “lancio di due monete” lospazio campionario include quattro possibili esiti (TT, TC, CT, CC).

Evento. Un sottoinsieme dello spazio campionario.

Esempio. Nell’esperimento lancio di due monete: de…nendo con E 1 l’e-vento “esce almeno una testa” questo include gli esiti TT, CT e TC; de…nen-do con E 2 l’evento “esce una testa e una croce” questo include gli esiti CT eTC; de…nendo con E 3 l’evento “escono due teste” questo include l’esito TT.

Page 14: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 14/228

 

14 capitolo 2

Eventi mutuamente esclusivi. Due eventi sono mutuamente esclusivi se

il veri…carsi di uno dei due eventi preclude il veri…carsi dell’altro.Esempio. Nell’esperimento “lancio di due monete” gli eventi “escono

due teste” e “escono due croci” sono mutuamente esclusivi. Viceversa glieventi “esce almeno una testa” e “esce almeno una croce” non lo sono, dalmomento che gli esiti TC e CT sono compatibili con entrambi gli eventi.

Eventi equiprobabili. Due eventi sono equiprobabili se il primo evento hala stessa probabilità di veri…carsi del secondo (si veda oltre per la de…nizioneesatta di probabilità).

Esempio. Nell’esperimento “lancio di una moneta”, l’evento “esce testa”ha la stessa probabilità dell’evento “esce croce”.

Eventi collettivamente esaustivi. Un insieme di eventi è collettivamenteesaustivo se esaurisce tutti i possibili esiti di un esperimento.

Esempio. Nell’esperimento “lancio di due monete” vi sono quattro pos-sibili esiti (TT,TC,CT,CC) che collettivamente de…niscono un insieme dieventi esaustivi. Analogamente gli eventi “non esce nessuna testa”, “esceuna testa”, “escono due teste” sono collettivamente esaustivi.

Page 15: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 15/228

 

probabilità e statistica inferenziale 15

2.2. Probabilità

Probabilità di un evento: de…nizione classica o a priori. Se unesperimento ha n (con n …nito) esiti che sono equiprobabili e se m di questiesiti sono favorevoli all’evento A, allora P (A), cioè la probabilità che A siveri…chi, è de…nita dal rapporto m=n.

Esempio. La roulette ha 37 (o 38) possibili esiti equiprobabili; di questi,18 sono favorevoli all’evento “esce un numero rosso”. La probabilità chel’evento “esce un numero rosso” si veri…chi è quindi pari a 18=37 = 0; 4865(o 18=38 = 0; 4737).

Limite della de…nizione classica: cosa succede se gli esiti non sono …niti e/onon sono equiprobabili?

Probabilità di un evento: de…nizione frequentista o empirica . Sireplichi l’esperimento casuale n volte (con n abbastanza grande). Si de…niscacon m il numero di volte in cui l’esito dell’esperimento è favorevole all’eventoA. Allora P (A), cioè la probabilità che A si veri…chi, è de…nita dal rapportom=n.

Esempio. La roulette ha 37 (o 38) esiti. Assumiamo questa volta chegli esiti non siano equiprobabili perché la roulette è truccata. Allora perdeterminare la probabilità che si veri…chi l’evento “esce un numero rosso”non è possibile basarsi sulla nozione classica di probabilità. Viceversa è

possibile lanciare la pallina n volte e calcolare il numero m di volte in cuil’esito dell’esperimento è favorevole all’evento.

2.2.1. Proprietà delle probabilità

(i) La probabilità di un evento è compresa tra 0 e 1:

0 · P (A) · 1

(ii) Se A; B; C;::: sono eventi mutuamente esclusivi, la probabilità cheuno di questi si realizzi è pari alla somma delle rispettive probabilità:

P (A [B [C [ :::) = P (A) + P (B) + P (C ) + :::

(iii) Se A; B; C;::: sono eventi mutuamente esclusivi e collettivamenteesaustivi, la probabilità che uno di questi si realizzi è pari a 1:

P (A [B [C [ :::) = P (A) + P (B) + P (C ) + ::: = 1

Page 16: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 16/228

 

16 capitolo 2

2.2.2. Altre de…nizioni utili sulle probabilità

(i) Probabilità congiunta. Dati gli eventi A; B; C; ::: la probabilità che siveri…chino congiuntamente è detta probabilità congiunta:

P (A \B \C \ :::)

(ii) Probabilità marginale (o incondizionata). Dati gli eventi A; B; C; ::: leprobabilità che ciascuno di questi si veri…chi indipendentemente daglialtri sono dette probabilità marginali (o incondizionate)

P (A); P (B); P (C );

(iii) Indipendenza stocastica. Gli eventi A; B; C;::: sono stocasticamen-te indipendenti se la probabilità che si veri…chino congiuntamente èeguale al prodotto delle loro probabilità individuali:

P (A \B \C \ :::) = P (A)£ P (B)£ P (C )£ :::

(iv) Eventi non mutuamente esclusivi. Se A,B,C , ::: sono eventi non mu-tuamente esclusivi la proprietà (ii) deve essere modi…cata. Se ad esem-pio gli eventi A e B non sono mutuamente esclusivi la probabilità chealmeno uno di questi si realizzi è pari alla somma delle probabilitàmarginali meno la probabilità congiunta:

P (A [B) = P (A) + P (B)¡ P (A \B)

(v) Probabilità condizionata. La probabilità condizionata di un evento Arispetto ad un evento B si de…nisce come la probabilità che si veri…chiA condizionata a che si sia veri…cato B. Tale probabilità condizionata èdata dal rapporto tra la probabilità congiunta di A e B e la probabilitàmarginale di B:

P (A j B) =P (A \B)

P (B)

(vi) Probabilità condizionata e probabilità marginale. Usualmente la pro-

babilità marginale P (A) non coincide con la probabilità condizionataP (A j B) a meno che i due eventi siano stocasticamente indipendenti.In questo caso infatti

P (A j B) =P (A \B)

P (B)=

P (A)P (B)

P (B)= P (A)

Page 17: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 17/228

 

probabilità e statistica inferenziale 17

2.3. Variabili casuali

De…nizione di variabile casuale. È una variabile il cui valore numericoè determinato dall’esito di un esperimento casuale.

Esempio. Si consideri il lancio di due monete. La variabile casuale“numero di teste” può assumere tre valori: 0; 1; 2.

Le variabili casuali vengono usualmente de…niti con lettere maiuscole, men-tre i valori che possono assumere con lettere minuscole.

Esempio. P (X  = x1) indica la probabilità che la variabile casuale X possa assumere un valore pari a x1.

Variabili casuali discrete e continue. Una variabile casuale è de…nita

discreta se può assumere solo un numero …nito o un’in…nità numerabiledi valori (numero di teste,...). Una variabile casuale è viceversa de…nitacontinua se può assumere qualunque valore all’interno di un intervallo dato(peso, temperatura,...).

Funzione di densità (caso univariato). La funzione di densità associaad ogni valore (o intervalli di valori) che può assumere una variabile casualela rispettiva probabilità.

² Funzione di densità di una variabile casuale discreta . Sia X  una va-riabile casuale discreta; la funzione di densità indica la probabilità che

X  assuma valore x.

f (x) =

½P (X  = xi) per i = 1; 2; 3;:::;n

0 altrimenti

¾Esempio. Nell’esperimento lancio di due monete, la funzione di densità

della variabile casuale “X  = numero di teste” può essere rappresentatacome segue:

P (X  = 0) = 1=4; P (X  = 1) = 1=2; P (X  = 2) = 1=4

² Funzione di densità di una variabile casuale continua. Nel caso conti-

nuo la variabile casuale è de…nita in un intervallo e quindi la probabilitàche assuma un singolo valore (anche se interno all’intervallo) è nulla.Per questo motivo nel caso di variabili casuali continue la funzionedi densità assegna probabilità a intervalli di valori. Formalmente lafunzione di densità di una variabile continua è de…nita come segue.

f (x) ¸ 0

Page 18: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 18/228

 

18 capitolo 2

+1

Z ¡1

f (x)dx = 1

P (a · x < b) =

bZ a

f (x)dx

dove f (x)dx rappresenta la probabilità associata all’intervallo [x; x +dx] della variabile casuale continua.

Funzione di densità congiunta (caso bivariato).

²Variabili discrete . Siano X  e Y  due variabili casuali discrete; la funzio-ne di densità congiunta indica la probabilità (congiunta) che X assumavalore x e Y  valore y.

f (x; y) =

8<: P (X  = xi \ Y  = y j) per i = 1; 2; 3;:::;n per j = 1; 2; 3;:::;m

0 altrimenti

9=;² Variabili continue . Siano X  e Y  due variabili casuali continue, la

funzione di densità congiunta è de…nita come segue

f (x; y) ¸ 0

+1Z 

¡1

+1Z 

¡1

f (x; y)dxdy = 1

P (a · x < b \ c · y < d) =

bZ a

dZ c

f (x; y)dxdy

Funzioni di densità marginale (caso bivariato).

² Variabili discrete . Siano X  e Y  due variabili discrete, la funzione didensità marginale di X  (e analogamente di Y ) indica la probabilità

che la X  assuma valore x, indipendentemente dai valori assunti dallaY .

f (x) =X

y

f (x; y)

f (y) =X

x

f (x; y)

Page 19: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 19/228

 

probabilità e statistica inferenziale 19

²Variabili continue . Siano X  e Y  due variabili continue, la funzione di

densità marginale di X  (e analogamente di Y ) indica la probabilità chela X  assuma un intervallo di valori, indipendentemente dall’intervallodi valori assunti dalla Y .

f (x) =

+1Z y=¡1

f (x; y) dy

f (y) =

+1

Z x=¡1

f (x; y) dx

Funzioni di densità condizionata (caso bivariato).

² Variabili discrete . Siano X  e Y  due variabili discrete, la funzione didensità condizionata di X  (e analogamente di Y ) indica la probabilitàche la X  assuma valore x, dato che la Y  ha assunto valore y.

f (x j y) = P (X  = x j Y  = y) =f (x; y)

f (y)

Inoltre, se due variabili casuali sono stocasticamente indipendenti lafunzione di densità congiunta è eguale al prodotto delle funzioni didensità marginali. In questo caso.

f (x j y) =f (x; y)

f (y)=

f (x)f (y)

f (y)= f (x)

Page 20: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 20/228

 

20 capitolo 2

2.4. Distribuzioni di probabilità

Momenti della distribuzione. Le caratteristiche di una distribuzio-ne univariata di probabilità possono essere utilmente riassunte in alcunecaratteristiche, note come momenti della distribuzione:

² Momento primo = Valore atteso (o media)

² Momento secondo (intorno alla media) = Varianza (e deviazione stan-dard o scarto quadratico medio)

² Momento terzo (intorno alla media) = Asimmetria

² Momento quarto (intorno alla media) = CurtosiNel caso di distribuzioni congiunte di probabilità si fa inoltre riferimento atre ulteriori utili caratteristiche:

² Covarianza

² Coe¢ciente di correlazione

² Valore atteso condizionato

Valore atteso (media). Il momento primo costituisce la misura di cen-tralità di una distribuzione.

Il valore atteso di una VC discreta è:

E (X ) = ¹ =X

xf (x)

Il valore atteso di una VC continua è :

E (X ) = ¹ =

+1Z ¡1

xf (x) dx

Si osservi che il valore atteso (o media) di una distribuzione di probabilitàè un concetto diverso dalla media campionaria, che indica il valore mediodegli esiti di un esperimento casuale ripetuto n volte.

Proprietà del valore atteso . Siano a, b due costanti e X , Y  due variabilicasuali

E (a) = a

Page 21: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 21/228

 

probabilità e statistica inferenziale 21

E (aX + b) = aE (X ) + b

E h(aX )2i = a2E ¡X 2¢E (X + Y ) = E (X ) + E (Y )

Inoltre, se X e Y sono stocasticamente indipendenti

E (X £ Y ) = E (X )£E (Y )

Varianza (momento secondo intorno alla media). La varianza costi-tuisce la misura di dispersione intorno alla media di una distribuzione.

La varianza di una VC discreta è:

V ar (X ) = ¾2 = X (x¡ ¹)2 f (x)

Nel caso invece di una VC continua è :

V ar (X ) = ¾2 =

+1Z ¡1

(x¡ ¹)2 f (x) dx

La varianza può essere scritta anche come

V ar (X ) = ¾2 = E (X ¡ ¹)2 = E (X )2 ¡ ¹2

La radice quadrata della varianza viene de…nita scarto quadratico medio oalternativamente deviazione standard.

Proprietà della varianza. Siano a, b due costanti e X , Y  due variabilicasuali

V ar (a) = 0

V ar (aX + b) = a2V ar (X )

Inoltre, se X  e Y  sono stocasticamente indipendenti

V ar (X + Y ) = V ar (X ) + V ar (Y )

V ar (X ¡ Y ) = V ar (X ) + V ar (Y )V ar (aX + bY ) = a2V ar (X ) + b2V ar (Y )

Se viceversa X  e Y  non sono stocasticamente indipendenti (vedi oltre per lade…nizione di Cov(X; Y ))

V ar (X + Y ) = V ar (X ) + V ar (Y ) + 2Cov(X; Y )

Page 22: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 22/228

 

22 capitolo 2

V ar (X 

¡Y ) = V ar (X ) + V ar (Y )

¡2Cov(X; Y )

Asimmetria (momento terzo intorno alla media). Per de…nire laforma della distribuzione di probabilità è talvolta necessario utilizzare anchemomenti superiori al secondo. Il momento terzo (intorno alla media) ède…nito come:

E (X ¡ ¹)3

da cui si deriva il seguente indice di asimmetria, S  (dall’inglese skewness )

S (X ) =E (X ¡ ¹)3

¾3

Curtosi (momento quarto intorno alla media). Analogamente, ilmomento quarto (intorno alla media) è de…nito come:

E (X ¡ ¹)4

da cui si deriva il seguente indice di curtosi, K  (dall’inglese kurtosis )

K (X ) =E (X ¡ ¹)4

¾4

.0

.1

.2

.3

.4

.5

-5 -4 -3 -2 -1 0 1 2 3 4 5

Simmetrica

Left skewed Right skewed

x

f(x)

Page 23: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 23/228

 

probabilità e statistica inferenziale 23

Distribuzioni simmetriche, left e right skewed

.0

.1

.2

.3

.4

.5

.6

-5 -4 -3 -2 -1 0 1 2 3 4 5x

f(x)

platicurtica

mesocurtica

leptocurtica

Distribuzioni meso, plati e leptocurtiche

Covarianza. Siano date due variabili casuali X  e Y , con media ¹x e ¹y

rispettivamente. Sia inoltre f (x; y) la funzione di densità congiunta di X  eY . La covarianza tra le due variabili casuali è data da:

Cov (X; Y ) = E £(X ¡ ¹x) ¡Y  ¡ ¹y¢¤ = E (XY )¡ ¹x¹y

Nel caso di variabili casuali discrete può essere calcolata come:

Cov (X; Y ) =XX

(X ¡ ¹x)¡

Y ¡ ¹y

¢f (x; y) =

=XX

XY f (x; y)¡ ¹x¹y

Page 24: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 24/228

 

24 capitolo 2

e, analogamente, nel caso di variabili casuali continue come:

Cov (X; Y ) =

+1Z ¡1

+1Z ¡1

(X ¡ ¹x)¡

Y ¡ ¹y

¢f (x; y)dxdy =

=

+1Z ¡1

+1Z ¡1

XY f (x; y)dxdy ¡ ¹x¹y

Proprietà della covarianza . Siano a;b;c;d quattro costanti e X; Y  duevariabili casuali. Se X  e Y  sono stocasticamente indipendenti allora:

Cov (X; Y ) = E (XY )¡ ¹x¹y = E (X ) E (Y )¡ ¹x¹y = 0Inoltre

Cov (a + bX;c + dY ) = bdCov (X; Y )

Coe¢ciente di correlazione. La covarianza rappresenta una misura del-l’associazione lineare tra due variabili casuali. Ad esempio se a osservazionisopra la media di X  corrispondono osservazioni sopra la media di Y , gli scar-ti dalla media avranno lo stesso segno e quindi Cov(X; Y ) > 0. Se viceversaa osservazioni sopra la media di X  corrispondono osservazioni sotto la mediadi Y , gli scarti dalla media avranno segno diverso e quindi Cov(X; Y ) < 0. Ilproblema è che Cov(X; Y ) dipende dall’unità di misura delle due variabili ca-

suali. Per ovviare a questo problema si utilizza il coe¢ciente di correlazione(che varia tra ¡1 e +1), ½

½ =Cov (X; Y )p 

V ar (X ) V ar (Y )=

Cov (X; Y )

¾x¾y

Valore atteso condizionato. Il valore atteso condizionato esprime il valo-re atteso della variabile casuale X  per ogni possibile valore che può assumerela variabile casuale Y:

Il valore atteso di X  condizionato a Y  = y nel caso discreto è eguale a

E (X j

Y  = y) = Xxf (xj

Y  = y)

e nel caso continuo

E (X  j Y  = y) =

+1Z ¡1

xf (x j Y  = y) dx

Page 25: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 25/228

 

probabilità e statistica inferenziale 25

2.5. Distribuzioni teoriche di probabilità

2.5.1. Distribuzione normale

Una variabile casuale (continua) X  è “distribuita normalmente” se la suafunzione di densità di probabilità (PDF) ha la seguente forma:

f (x) =1

¾p 

2¼e¡

(x¡¹)2

2¾2 con ¡1 < x < 1

dove ¹ e ¾2, noti come i parametri della distribuzione normale, sono rispet-tivamente il valore atteso (o media) e la varianza:

E (X ) = ¹

V ar (X ) = E (X ¡ ¹)2 = ¾2

Una variabile casuale X , normalmente distribuita con valore atteso ¹ evarianza ¾2, viene usualmente rappresentata come

X » N ¡

¹; ¾2¢

La distribuzione normale è descritta in modo completo dai suoi primi duemomenti.

Proprietà della distribuzione normale

(i) Il momento terzo intorno alla media è pari a 0. Infatti la distribuzionenormale è simmetrica rispetto alla media.

E (X ¡ ¹)3 = 0

da cui

S (X ) ´ E (X ¡ ¹)3

¾3= 0

(ii) Il momento quarto intorno alla media è una funzione della varianza.Infatti:E (X ¡ ¹)4 = 3

¡¾2¢2

da cui

K (X ) ´ E (X ¡ ¹)4

¾4= 3

Page 26: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 26/228

 

26 capitolo 2

(iii) Relazione tra probabilità, ¹ e ¾ (scarto quadratico medio o deviazione

standard)P (¹¡ ¾ · X · ¹ + ¾) ¼ 0; 68

P (¹¡ 2 ¾ · X · ¹ + 2 ¾) ¼ 0; 95

P (¹¡ 3 ¾ · X · ¹ + 3 ¾) ¼ 0; 997

(iv) Date due variabili casuali normalmente distribuite e stocasticamenteindipendenti:

X 1 » N ¡

¹1; ¾21

¢e

X 2 » N  ¡¹2; ¾22¢

la variabile casuale Y  = aX 1 + bX 2 è distribuita normalmente:

Y  » N ¡

a¹1 + b¹2; a2¾21 + b2¾2

2

¢

.0

.1

.2

.3

.4

.5

µµ−σ

µ−2σ

µ−3σ µ+3σ

µ+2σ

µ+σ68%

95%

99,7%

Area sottesa dalla curva normale

Page 27: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 27/228

 

probabilità e statistica inferenziale 27

2.5.2. Distribuzione normale standardizzata

Per agevolare il calcolo della probabilità che una variabile casuale normal-mente distribuita sia compresa tra due valori dati, è utile convertire la X  inun’altra variabile normale, Z  con valore atteso pari a 0 e varianza pari a 1:

Z  =X ¡ ¹

¾

La funzione di densità (PDF) di una variabile casuale normale standardiz-zata Z » N (0; 1) ha la seguente forma

f (z) =1

p 2¼

e¡z2

2 con

¡1< z <

1

Teorema del limite centrale. Intuizione: questo teorema è alla basedell’ampio utilizzo della distribuzione normale nell’ambito dell’econometria.Dimostra che la media campionaria standardizzata di n variabili casuali(purché n sia abbastanza grande) segue una distribuzione normale stan-dardizzata anche se le variabili casuali originarie non sono distribuite nor-malmente. Nella sua versione più semplice può essere formalizzato comesegue:

Teorema. Siano X 1; X 2;:::;X n n variabili casuali indipendenti caratterizzatedalla stessa PDF (con media ¹ e varianza ¾2). Sia

X n =1

n

nXi=1

X i

la media campionaria, con

E (X n) = ¹

V ar(X n) =¾2

n

Al tendere di n all’in…nito

Z n =X n ¡ ¹

¾p n

=

p n³X n ¡¹´¾

!d

N (0; 1)

dove il segno !d

indica che la distribuzione (non nota) di Z n converge in

distribuzione ad una normale standardizzata.

Page 28: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 28/228

 

28 capitolo 2

2.5.3. Distribuzione Â2 (Chi-quadrato)

Siano Z 1; Z 2;:::;Z m, m variabili casuali con distribuzione normale standar-dizzata. La variabile

X  =mX

i=1

Z 2i

ha una distribuzione Â2 con k gradi di libertà, dove k (k · m) indica ilnumero di variabili indipendenti nella somma.

Proprietà della distribuzione Â2

(i) Il valore atteso di una variabile casuale con distribuzione Â2 con kgradi di libertà è pari a k.

(ii) La varianza di una variabile casuale con distribuzione Â2 con k gradidi libertà è pari a 2k.

(iii) La distribuzione Â2 è asimmetrica e il tasso di asimmetria dipende daigradi di libertà. Con pochi gradi di libertà la distribuzione è moltoasimmetrica, ma l’asimmetria si riduce progressivamente all’aumentaredei gradi di libertà. Per k > 100 la variabile

p 2Â2 ¡p 2k ¡ 1

può essere trattata come una variabile normale standardizzata.

(iv) Siano X 1 e X 2 due variabili indipendenti con distribuzione Â2, conrispettivamente k1 e k2 gradi di libertà. La variabile somma X 1 + X 2ha a sua volta distribuzione Â2, con k1 + k2 gradi di libertà.

Page 29: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 29/228

 

probabilità e statistica inferenziale 29

.00

.04

.08

.12

.16

.20

.24

.28

.32

5 10 15 20 25 30x

f(x)

k = 2

k = 5

k = 10

Funzione di densità di variabili Â2 con diversi gradi di libertà

2.5.4. Distribuzione t di Student

Sia Z  una variabile casuale con distribuzione normale standardizzata e siaX  una variabile casuale con distribuzione Â2 con k gradi di libertà e indi-pendente da Z . La variabile casuale

t =Z q 

X k

=Z p 

kp X 

ha una distribuzione t di Student con k gradi di libertà.

Proprietà della distribuzione t:

(i) Il valore atteso di una variabile casuale con distribuzione t con k gradidi libertà è pari a 0.

(ii) La varianza di una variabile casuale con distribuzione t con k gradi dilibertà è pari a k

k¡2 ed è de…nita per k > 2.

Page 30: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 30/228

 

30 capitolo 2

(iii) La distribuzione t è simmetrica ma più piatta (platicurtica) rispet-

to alla distribuzione normale standardizzata. All’aumentare di k ladistribuzione t tende ad approssimare la distribuzione normale stan-dardizzata.

.0

.1

.2

.3

.4

-4 -3 -2 -1 0 1 2 3 4

k = 3

k = 120

k = 10

x

f(x)

Funzione di densità di variabili t con diversi gradi di libertà

2.5.5. Distribuzione F  di Fisher

Siano X 1 e X 2 due variabili casuali, indipendentemente distribuite con di-stribuzione Â2 con gradi di libertà k1 e k2 rispettivamente. La variabilecasuale

F  =X 1=k1X 2=k2

ha una distribuzione F  di Fisher con k1 (al numeratore) e k2 (al denomina-tore) gradi di libertà.

Proprietà della distribuzione F 

(i) Il valore atteso di una variabile casuale con distribuzione F  con k1 ek2 gradi di libertà è pari a k2

k2¡2 ed è de…nita per k2 > 2.

Page 31: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 31/228

 

probabilità e statistica inferenziale 31

(ii) La varianza di una variabile casuale con distribuzione F  con k1 e k2

gradi di libertà è pari a

2k22 (k1 + k2 ¡ 2)

k1 (k2 ¡ 2)2 (k2 ¡ 4)

ed è de…nita per k2 > 4.

(iii) La distribuzione F  è asimmetrica. All’aumentare di k1 e k2 la distri-buzione F  tende ad approssimare la distribuzione normale.

(iv) Il quadrato di una variabile casuale con distribuzione t con k gradi dilibertà ha una distribuzione F  con 1 e k gradi di libertà:

t2 = F 

se t » tk e F » F 1;k.

(v) Se il numero di gradi di libertà al denominatore, k2 è su¢cientementegrande, allora esiste la seguente relazione tra la distribuzione F  e ladistribuzione Â2:

k1F  = Â2

se F » F k1;k2 e Â2 » Â2k1

.

Page 32: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 32/228

 

32 capitolo 2

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

0.0 0.5 1.0 1.5 2.0 2.5 3.0

x

f(x)

2,2

50,50

10,2

Funzione di densità di distribuzioni F  con diversi gradi di libertà

Page 33: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 33/228

 

probabilità e statistica inferenziale 33

2.6. Inferenza statistica - Stimatori

De…nizione. Si consideri la variabile casuale X  “ricchezza di una fami-glia residente in Italia” e si assuma di conoscere la funzione di densità diprobabilità (normale nel nostro caso) ma non il valore dei parametri dellafunzione (¹; ¾2). Quindi possiamo scrivere:

X » N (¹; ¾2)

Si noti che stiamo assumendo che ciascuna famiglia della popolazione diriferimento è caratterizzata dalla stessa funzione di densità. L’inferenzastatistica consente di ricavare delle informazioni (il valore dei parametri della

PDF) su una popolazione di interesse (le famiglie residenti in Italia) data ladisponibilità di un campione casuale di n famiglie estratte dalla popolazione.Dato un campione casuale (X 1; X 2;:::;X n) estratto da una popolazione

la cui PDF dipende da parametri ignoti (¹; ¾2), uno stimatore è de…nibilecome una regola che assegna ad ogni possibile esito dell’esperimento casuale“estrazione di un campione di n elementi” un valore per i parametri diinteresse. Ad esempio, uno stimatore naturale (e non distorto) di ¹ è lamedia del campione casuale

¡X =

1

n

nPi=1

X i

Analogamente uno stimatore naturale (ma distorto) di ¾2 è

S 2 =1

n

nPi=1

(X i¡¡

X )2

Il concetto di stimatore non va confuso con il concetto di stima, che fainvece riferimento alla n-pla di numeri reali (x1; x2;:::;xn), cioè alla ricchezzadelle n famiglie e¤ettivamente estratte. Applicando gli stimatori di ¹ e ¾2

ai dati campionari delle famiglie estratte otteniamo le corrispondenti stime

¡x =

1

n

n

Pi=1 xi

s2 =1

n

nPi=1

(xi¡ ¡x)2

Proprietà degli stimatori . Esistono diversi metodi per ottenere degli sti-matori (es. metodo dei momenti, metodo dei minimi quadrati, metodo della

Page 34: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 34/228

 

34 capitolo 2

massima verosimiglianza). È desiderabile che tali stimatori soddis…no alcune

proprietà statistiche. Tali proprietà vengono classi…cate in proprietà …nite e in proprietà asintotiche . Intuitivamente, le proprietà …nite valgono esatta-mente per campioni …niti (cioè per campioni di dimensione n per qualsiasin). Le proprietà asintotiche invece valgono esattamente solo per campioniin…nitamente grandi e solo approssimativamente per campioni …niti.

Proprietà …nite.

Stimatore non distorto. Uno stimatore

 bµ

è de…nito uno stimatore non distorto (o unbiased) di un parametro µ se ilsuo valore atteso è eguale al vero µ, cioè se:

E ³ bµ´ = µ

Se l’eguaglianza non è soddisfatta allora lo stimatore è distorto (biased) ela distorsione (bias) è pari a:

bias³ bµ´ = E 

³ bµ´¡ µ

Stimatore a varianza minima. Dato un insieme di stimatori

³ bµ1; bµ2;:::; bµ j´di un parametro µ, lo stimatore  bµ1è de…nito stimatore a varianza minima, se la sua varianza è non maggioredi quella di ogni altro stimatore di µ.

Stimatore e¢ciente. Lo stimatore

 bµ1

è uno stimatore e¢ciente di µ se è lo stimatore a varianza minima tra il

sottoinsieme di stimatori non distorti.

Stimatore lineare. Uno stimatore viene de…nito uno stimatore lineare se èuna funzione lineare del campione casuale. Ad esempio la media campionariaè uno stimatore lineare:

X  =1

n

nPi=1

X i

Page 35: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 35/228

 

probabilità e statistica inferenziale 35

Stimatore lineare, non distorto a varianza minima (BLUE). Uno stima-

tore lineare, non distorto e con varianza minima nella classe degli stimatorilineari e non distorti è de…nito BLUE (Best Linear Unbiased Estimator).

Stimatore a errore quadratico medio (MSE) minimo. La MSE (Mean-Squared Error) di uno stimatore è de…nita come:

MSE ³ bµ´ = E 

³ bµ ¡ µ´2

= E h bµ ¡E 

³ bµ´¡ µ + E ³ bµ´i2 =

= E h bµ ¡E 

³ bµ´i2 +h

E ³ bµ´¡ µ

i2+ 2E 

nh bµ ¡E ³ bµ´i hE 

³ bµ´¡ µio

=

= E h b

µ ¡E ³ b

µ´i2

+h

E ³ b

µ´¡ µi2

= V ar³ b

µ´

+ bias³ b

µ´2

Intuizione: la scelta di uno stimatore a errore quadratico medio minimo puòimplicare la scelta di uno stimatore distorto se la sua varianza è su¢ciente-mente piccola.

.0

.1

.2

.3

.4

f(θ 1) f(θ 2 )

E ( θ 1) =θ  E ( θ 2 

) =θ  ////

  

  

  

  

Stimatori distorti e non distorti

Page 36: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 36/228

 

36 capitolo 2

.0

.1

.2

.3

.4

.5

.6

.7

.8

θ 

f (

f (

f (

θ 

θ 

θ 

θ 

1

3

3

)

)

)

)

E (

  

  

  

  

Distribuzione di tre stimatori di µ

.0

.1

.2

.3

.4

.5

.6

.7

.8

.9

f (

f (θ 

θ 1

2 )

)

E (θ 1)=θ  E  (θ 2 )

  

  

   

Trade-o¤ tra distorsione e varianza

Page 37: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 37/228

 

probabilità e statistica inferenziale 37

Proprietà asintotiche. In alcuni casi non è possibile ottenere per uno

stimatore le proprietà …nite desiderate e ci si limita a considerare proprie-tà che valgono quando la dimensione del campione cresce inde…nitamente(proprietà asintotiche).

Stimatore consistente. Uno stimatore

 bµn

è de…nito uno stimatore consistente di un parametro µ se tende al valore veroal crescere della dimensione n del campione. Formalmente se la probabilitàche il valore assoluto della di¤erenza tra lo stimatore e il parametro siamaggiore di " (una quantità positiva piccola a piacere) tende a 0 al tendere

di n all’in…nito:limn!1

P ³¯ bµn ¡ µ

¯> "

´= 0

che può essere riscritta come

 plim³ bµn

´= µ

dove p lim indica il limite in probabilità. Condizione su¢ciente perché unostimatore sia consistente è che il bias e la varianza tendano a zero al tenderedi n all’in…nito.

Proprietà dell’operatore  plim

- Invarianza (proprietà di Slutski). Se:

 plim³ bµn

´= µ

allora plim

hh³ bµn

´i= h (µ)

dove h è una funzione continua dello stimatore.

- Se b è una costante plim (b) = b

cioè il limite in probabilità di una costante è la costante stessa.

- Dati due stimatori consistenti

 bµ1;n; bµ2;n

Page 38: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 38/228

 

38 capitolo 2

valgono le seguenti relazioni

 plim³ bµ1;n + bµ2;n

´= plim

³ bµ1;n´

+ plim³ bµ2;n

´ plim

³ bµ1;n bµ2;n

´= plim

³ bµ1;n  plim³ bµ2;n

´ plim

àbµ1;n bµ2;n

!=

 plim³ bµ1;n

´ plim

³ bµ2;n

´Si noti che la seconda e la terza relazione valgono indipendentementedal fatto che gli stimatori siano stocasticamente indipendenti. Questonon è vero invece nel caso del valore atteso.

- Stimatore asintoticamente e¢ciente . Uno stimatore è asintoticamentee¢ciente se è consistente e la sua varianza asintotica è non maggioredella varianza asintotica di qualunque altro stimatore consistente delparametro.

- Stimatore asintoticamente normale . Uno stimatore è de…nito asinto-ticamente normale se la sua distribuzione campionaria tende a distri-buirsi normalmente al crescere della dimensione del campione.

0.0

0.2

0.4

0.6

0.8

1.0

f (

f (

f (

f (

) n = 100

) n = 80

) n = 50

) n = 25

θ 

θ 

θ 

θ 

θ θ 

  

  

  

  

  

La distribuzione di bµ al crescere della numerosità campionaria

Page 39: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 39/228

 

probabilità e statistica inferenziale 39

2.7. Inferenza statistica - Stimatore per intervalli e intervalli di con…-

denza

Introduzione. Una stima puntuale basata su un particolare campione os-servato non fornisce informazioni su¢cienti per veri…care delle ipotesi sugge-rite dalla teoria economica o per dare un contributo signi…cativo al dibattitodi politica economica. Sapere che basandosi su un campione casuale di nuoviassunti, un ricercatore ha stimato che la laurea in economia ha l’e¤etto diaumentare il salario di ingresso del 10% non ci dice nulla su quanto questastima sia vicina al valore vero del parametro. La costruzione degli intervallidi con…denza contribuisce a rispondere a questa domanda.

Esempio. Supponiamo che l’altezza degli uomini residenti in Italia sia

rappresentabile dalla variabile casuale

X » N (¹; ¾2)

Dato un campione casuale di 100 uomini (n = 100), uno stimatore di ¹ è lamedia campionaria

X  =1

100

100Pi=1

X i

Conoscendo la distribuzione di X  sappiamo anche che

X » N (¹;¾2

n)

e

Z  =X ¡ ¹

¾=p 

n» N (0; 1)

A questo punto siamo in grado di costruire un intervallo che includa  ¹ con una data probabilità  (detta livello di con…denza ). Pre…ssato un livello dicon…denza del 95% possiamo infatti scrivere che

P r

µ¡1; 96 · X ¡ ¹

¾=p 

n· 1; 96

¶= 0; 95

e, dopo alcuni passaggi algebrici

P rµ

X ¡ 1; 96¾p 

n· ¹ · X + 1; 96

¾p n

¶= 0; 95

Formalmente l’ultima espressione indica che l’intervallo

[X ¡ 1; 96¾p 

n; X + 1; 96

¾p n

]

Page 40: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 40/228

 

40 capitolo 2

contiene ¹ con il 95% di probabilità. In altri termini prima che il campione

casuale sia estratto vi è il 95% di probabilità che ¹ sia compresa tra ilvalore inferiore, X ¡1; 96 ¾p 

ne il valore superiore, X +1; 96 ¾p 

ndell’intervallo.

Possiamo pensare all’intervallo come ad uno stimatore per intervalli, cioèad uno stimatore che fornisce i limiti entro i quali è contenuto il valore delparametro ad un dato livello di probabilità.

Una volta che abbiamo estratto il campione e calcolato la stima di ¹

x =1

100

100Pi=1

xi = 1; 70

possiamo costruire una stima per intervalli detta anche intervallo di con…-

denza al 95%. Nel nostro caso, assumendo ¾ = 0; 5

[1; 70¡ 1; 960; 5p 100

; 1; 70 + 1; 960; 5p 100

]

[1; 602; 1; 798]

Nel linguaggio del test delle ipotesi l’intervallo di con…denza è de…nitoregione di accettazione , gli estremi superiore e inferiore della regione di accet-tazione sono de…niti valori critici , e l’area esterna all’intervallo di con…denzaè de…nita regione di ri…uto (o di non accettazione).

Page 41: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 41/228

 

probabilità e statistica inferenziale 41

2.8. Inferenza statistica - Test di ipotesi

Introduzione. Il test delle ipotesi consiste nel rispondere alla seguentedomanda: è lo stimatore bµ “compatibile” con un valore numerico ipotizzato(nel nostro caso spesso suggerito dalla teoria economica) µ¤ del parametroµ? L’ipotesi µ = µ¤ è de…nita ipotesi nulla (H 0) ed è testata contro un’i-potesi alternativa (H 1), che a sua volta può essere semplice, se speci…ca ilvalore alternativo, o composta, nel caso in cui il valore alternativo non siaspeci…cato.

Esempio. Ipotesi alternativa composta

H 0 : ¹ = ¹¤ = 1; 75

H 1 : ¹ 6= ¹¤

Per testare la validità dell’ipotesi nulla contro l’ipotesi alternativa si co-struisce la statistica del test che è una funzione del campione casuale. Dellastatistica del test si conosce la distribuzione sotto l’ipotesi nulla. Nel nostrocaso, se ¹ = ¹¤ allora

Z  =X ¡ ¹¤

¾=p 

n» N (0; 1)

In ogni applicazione ¹¤e n sono noti. Si supponga per semplicità che anche ¾sia noto (ma cosa succede se non lo è?). Il problema è che noi non conosciamo

X  ma solamente x. Sostituendo X  con x, otteniamo la cosiddetta statisticadel test calcolata

z =

¡x ¡¹¤

¾=p 

n=

1; 70¡ 1; 75

0; 5=10= ¡1

Intuitivamente, la domanda a cui intendiamo rispondere è se x = 1; 70sia “signi…cativamente” diverso dal valore pre…ssato 1; 75. Ciò equivale achiedersi se z = ¡1 è signi…cativamente diverso da 0.

Per rispondere alla domanda è necessario veri…care se il valore di z cadeall’interno dell’intervallo di con…denza per un dato livello di signi…catività(il complemento a 1 del livello di con…denza). Ad esempio, nel caso di unlivello di signi…catività del 5%, i valori critici sono rispettivamente

¡1; 96

(inferiore) e +1; 96 (superiore) al cui interno cade z = ¡1.

Livello esatto di signi…catività (p valore). L’approccio che confrontala statistica calcolata con i valori critici, al …ne di veri…care se la statisticacade dentro la regione di accettazione o meno, presenta lo svantaggio di do-vere ricalcolare la regione di accettazione per ogni livello di signi…catività.

Page 42: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 42/228

 

42 capitolo 2

Un approccio alternativo (ma perfettamente equivalente in termini di risul-

tati) è basato sul confronto tra il p valore (o livello esatto di signi…catività)della statistica calcolata e il livello di signi…catività prescelto dal ricercatore.Il p valore è de…nito come la probabilità di ottenere, sotto l’ipotesi nulla, unvalore della statistica del test più sfavorevole all’ipotesi nulla stessa. In pra-tica, il p valore de…nisce il più basso livello di signi…catività ® che conducea ri…utare l’ipotesi nulla; pertanto, se il p valore è minore (maggiore) dellivello di signi…catività prescelto, l’ipotesi nulla verrà ri…utata (non ri…uta-ta). Nel nostro esempio, il p valore di 1 vale - dalle tavole della distribuzionenormale standardizzata - 0; 32 per cui l’ipotesi nulla sarà rigettata solo pervalori di ® ¸ 32%. In particolare, pre…ssando ® = 5%, otteniamo il mede-simo risultato (non ri…uto dell’ipotesi nulla H 0 : ¹ = ¹¤ = 1; 75) ottenuto

in precedenza veri…cando che la statistica del test ricadeva nella regione diaccettazione.

Errori del I e del II tipo. Si noti che con la decisione di ri…utare o nonri…utare l’ipotesi nulla si incorre nel rischio di commettere due tipi di errori:

² Errore del I tipo: ri…utare l’ipotesi nulla H 0 quando è vera;

² Errore del II tipo: non ri…utare l’ipotesi nulla H 0 quando è falsa.

Approccio classico. Data la dimensione del campione (n) non è possibileminimizzare entrambi gli errori. Si sceglie un livello di signi…catività basso(® = 0; 05 o ® = 0; 01) per ottenere un basso livello di probabilità di com-mettere un errore del I tipo e, data la probabilità di commettere tale errore,si cerca di minimizzare la probabilità di commettere un errore del II tipo.De…nita con ¯  la probabilità di commettere un errore del secondo tipo, side…nisce con (1¡ ¯ ) la potenza del test.

Page 43: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 43/228

 

probabilità e statistica inferenziale 43

2.9. Esercizi

1. Dato un mazzo di 52 carte:

(a) Qual è la probabilità di estrarre una carta di quadri in una singolaestrazione?

(b) Qual è la probabilità di estrarre una carta di cuori in una singolaestrazione?

(c) Qual è la probabilità di estrarre un asso in una singola estrazione?

(d) Qual è la probabilità di estrarre una carta di quadri o una cartadi cuori in una singola estrazione?

(e) Qual è la probabilità di estrarre una carta di quadri o un asso inuna singola estrazione?

(f) Qual è la probabilità di estrarre due carte di quadri in due suc-cessive estrazioni (con reinserimento)?

(g) Qual è la probabilità di estrarre un carta di quadri in una singolaestrazione sapendo di aver estratto una …gura?

2. Variabile casuale univariata discreta : l’esperimento consiste nel lanciodi due dadi. De…niamo la variabile casuale “somma dei numeri sullefacce dei due dati”. Calcolarne la funzione di densità.

3. Variabile casuale univariata continua: data la seguente funzione

f (x) =1

9x2 0 · x · 3

(a) veri…care che integri a uno;

(b) calcolare la probabilità che la variabile casuale X  sia compresanell’intervallo [0; 1];

(c) calcolare la probabilità che la variabile casuale X  sia compresanell’intervallo [1; 2];

(d) calcolare la probabilità che la variabile casuale X  sia compresanell’intervallo [2; 3].

Page 44: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 44/228

 

44 capitolo 2

4. Variabili casuali bivariate discrete. Data la seguente funzione di den-

sità congiunta

X  = ¡2 X  = 0 X  = 2 X  = 3

Y  = 3 0; 27 0; 08 0; 16 0; 00

Y  = 6 0; 00 0; 04 0; 10 0; 35

(a) Calcolare la probabilità dell’evento X  = ¡2 \ Y  = 3;

(b) Calcolare la funzione di densità marginale per X  e per Y ;

(c) Calcolare la funzione di densità condizionata per X  e per Y .

5. Variabili casuali bivariate continue. Data la seguente funzione didensità congiunta

f (x; y) = 2¡ x¡ y

0 · x · 1

0 · y · 1

(a) Veri…care che integri a 1;

(b) Calcolare la funzione di densità marginale per X  e per Y ;

(c) Calcolare la funzione di densità condizionata per X  e per Y 

6. Variabile casuale univariata discreta. L’esperimento consiste nel lanciodi due dadi. De…niamo la variabile casuale “somma dei numeri sullefacce dei due dadi”. Calcolarne la media e la varianza.

7. Variabile casuale univariata continua. Sia data una variabile aleatoriaX  con la seguente funzione di densità

f (x) =1

9x2 0 · x · 3

Calcolarne il valore atteso E (X ), il momento secondo E (X 2) e la

varianza V ar(X ).

Page 45: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 45/228

 

Capitolo 3

Modelli di Regressione -

Introduzione e concetti di base

Modelli uni-equazionali e modelli multi-equazionali. Nel corso cioccuperemo (quasi) esclusivamente di stima di modelli economici compostida una sola equazione, rappresentabile come:

y = f (x1; x2;:::;xk; ")

dove:y è la variabile dipendente;x1; x2;:::;xk sono k variabili indipendenti (o variabili esplicative o regres-

sori);" è il termine d’errore (o più semplicemente errore)

Motivi per includere il termine d’errore:

1. incompletezza della teoria sottostante alla speci…cazione del modello;

2. non-osservabilità dei dati o approssimazioni nei dati osservati;

3. parsimonia nella speci…cazione del modello con esclusione di alcunevariabili meno importanti (variabili secondarie);

4. forma funzionale non corretta;

5. casualità nel comportamento umano.

Page 46: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 46/228

 

46 capitolo 3

Selezione delle variabili da includere nel modello. Per semplici-

tà inizieremo analizzando il modello di regressione bivariato. Studiere-mo poi il modello trivariato e in…ne (con l’aiuto dell’algebra delle matrici)generalizzeremo al caso multivariato.

² Modello bivariato: modello con un’unica variabile indipendente:

y = f (x1; ")

² Modello trivariato: modello con due variabili indipendenti:

y = f (x1; x2; ")

² Modello multivariato: modello generico con k variabili indipendenti:

y = f (x1; x2;:::;xk; ")

Scelta della forma funzionale. Nel corso ci occuperemo esclusivamen-te di modelli lineari nei parametri (ma non necessariamente lineari nellevariabili). Ad esempio, nel caso trivariato

y = ¯ 0 + ¯ 1x1 + ¯ 2x2 + "

è un modello lineare sia nei parametri, sia nelle variabili. Viceversa

y = e¯ 0x¯ 11 x

¯ 22 e"

è un modello non lineare nelle variabili, che tuttavia può essere reso linearenei parametri (e quindi rientra nel nostro campo di studi) trasformando levariabili in logaritmi:

log y = ¯ 0 + ¯ 1 log x1 + ¯ 2 log x2 + "

Il modello seguente invece è non lineare nei parametri

y = ¯ 0 +¯ 1

(x1 + x2)

¡¯ 2

+ "

e non rientra nel nostro campo di studio.

Assunzioni sulla natura del termine d’errore. Si supponga di disporredi n osservazioni su y e su x1; x2;:::;xk. Il modello può essere scritto come

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

Page 47: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 47/228

 

regressione - concetti di base 47

Inizialmente lavoreremo utilizando le cosiddette assunzioni classiche :

E ("i) = 0 per i = 1; 2;:::;n

V ar("i) = ¾2 per i = 1; 2;:::;n

Cov("i; " j) = 0 per i 6= j

Inoltre, per poter sottoporre a test le ipotesi sui parametri del modelloassumeremo anche che:

"i » N (0; ¾2) per i = 1; 2;:::;n

Considerate congiuntamente le quattro assunzioni possono essere riassuntecome segue:

"i » IN (0; ¾2) per i = 1; 2;:::;n

dove la I  (independent) indica che i termini di errore sono indipendente-mente distribuiti.

Assunzioni sulla natura delle variabili indipendenti . Assumeremoprevalentemente che le variabili indipendenti siano variabili deterministiche.Ne consegue che per de…nizione:

Cov(xhj; "i) = 0 per i; j = 1; 2;:::;n; h = 1; 2;:::;k

Un’assunzione meno restrittiva che consenta di preservare il risultato sullacovarianza è che le variabili indipendenti siano stocastiche ma distribui-te indipendentemente dal termine d’errore. Infatti, sotto l’assunzione diindipendenza e ricordando che E ("i) = 0 si può scrivere

E (xhj"i) = E (xhj)E ("i) = 0 per i; j = 1; 2;:::;n; h = 1; 2;:::;k

Segue che:

Cov(xhj; "i) = E f[xhj ¡E (xhj)]["i ¡E ("i)]g = 0

per i; j = 1; 2;:::;n; h = 1; 2;:::;k

Si osservi in…ne che, con variabili indipendenti non stocastiche, dall’assun-zione E ("i) = 0 deriva che il valore atteso di y è pari a:

E (yi) = ¯ 0 + ¯ 1x1i + ¯ 2x2i

Page 48: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 48/228

 

48

Page 49: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 49/228

 

Capitolo 4

Modelli di Regressione -

Regressione lineare bivariata

4.1. Metodo dei Minimi Quadrati Ordinari

4.1.1. Assunzioni

1. Modello lineare bivariato:

yi = ¯ 0 + ¯ 1xi + "i per i = 1; 2;:::;n

2. Assunzioni classiche:

E ("i) = 0 per i = 1; 2;:::;n

V ar("i) = ¾2 per i = 1; 2;:::;n

Cov("i; " j) = 0 per i

6= j

Cov(x j; "i) = 0 per i; j = 1; 2;:::;n

3. Assunzione sulla normalità dei termini d’errore:

"i » N (0; ¾2) per i = 1; 2;:::;n

Page 50: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 50/228

 

50 capitolo 4

4.1.2. Stima dei parametri

Intuizione: i parametri ¯ 0, ¯ 1 e ¾2 non sono noti. Il metodo dei minimiquadrati de…nisce degli stimatori di ¯ 0 e ¯ 1, che chiameremo b0 e b1, talida minimizzare la somma del quadrato dei residui (RSS , Residual Sum of Squares).

De…nizione di residuo:

ei = yi ¡ b0 ¡ b1xi per i = 1; 2;:::;n

e quindi

RSS  =n

Xi=1e2i =

n

Xi=1(yi ¡ b0 ¡ b1xi)2

Scriviamo il programma di minimizzazione

M inb0;b1

nXi=1

(yi ¡ b0 ¡ b1xi)2

Le condizioni del primo ordine sono:

@RSS 

@b0=

nXi=1

¡2 (yi ¡ b0 ¡ b1xi) = 0

@RSS @b1

=

nXi=1

¡2xi (yi ¡ b0 ¡ b1xi) = 0

La prima condizione del primo ordine può essere riscritta come segue

nXi=1

¡2 (yi ¡ b0 ¡ b1xi) = 0

nXi=1

(yi ¡ b0 ¡ b1xi) = 0

nXi=1

yi ¡ nb0 ¡ b1

nXi=1

xi = 0

y = b0 + b1x

dove y = 1n

nPi=1

yi e x = 1n

nPi=1

xi. L’espressione …nale viene de…nita prima 

equazione normale .

Page 51: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 51/228

 

regressione bivariata 51

Analogamente la seconda condizione del primo ordine può essere riscritta

come segue: nXi=1

¡2xi (yi ¡ b0 ¡ b1xi) = 0

nXi=1

xi (yi ¡ b0 ¡ b1xi) = 0

nXi=1

xiyi = b0

nXi=1

xi + b1

nXi=1

x2i

dove l’espressione …nale viene de…nita seconda equazione normale .

Gli stimatori b0 e b1 rappresentano la soluzione al sistema composto dalledue equazioni normali

y = b0 + b1x

nXi=1

xiyi = b0

nXi=1

xi + b1

nXi=1

x2i

De…niamo ora

S xx =nX

i=1

(xi ¡ x)2 =nX

i=1

x2i ¡ nx2

S yy =

nXi=1

(yi ¡ y)2

=

nXi=1

y2i ¡ ny

2

S xy =nX

i=1

(xi ¡ x) (yi ¡ y) =nX

i=1

xiyi ¡ nx y

Sostituiamo ora la prima equazione normale nella seconda

nXi=1

xiyi = (y ¡ b1x)nX

i=1

xi + b1

nXi=1

x2i

nXi=1

xiyi ¡ nxy = b1Ã nXi=1

x2i ¡ nx2!b1 =

nPi=1

xiyi ¡ nx y

nPi=1

x2i ¡ nx2

=S xy

S xx

Page 52: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 52/228

 

52 capitolo 4

e in…ne

b0 = y ¡ S xyS xx

x = y ¡ b1x

Lo stimatore b1 è quindi dato dal rapporto tra la codevianza tra x e y, S xy

e la devianza di x, S xx.

4.1.3. Proprietà algebriche dei minimi quadrati

1. La somma dei residui è pari a zero. Questa proprietà deriva diretta-mente dalla prima equazione normale. Infatti:

n

Xi=1 ei =n

Xi=1 (yi

¡b0¡

b1xi) = 0

2. La somma dei prodotti  xiei è pari a zero. Questa proprietà derivadirettamente dalla seconda equazione normale. Infatti:

nXi=1

xiei =nX

i=1

xi (yi ¡ b0 ¡ b1xi) = 0

4.1.4. Il coe¢ciente di determinazione semplice

Partiamo dalla de…nizione già incontrata di somma del quadrato dei residui:

RSS  =nX

i=1

e2i =nX

i=1

(yi ¡ b0 ¡ b1xi)2 =nX

i=1

(yi ¡ y ¡ b1 (xi ¡ x))2 =

=nX

i=1

(yi ¡ y)2 + b21

nXi=1

(xi ¡ x)2 ¡ 2b1

nXi=1

(yi ¡ y) (xi ¡ x) =

= S yy + b21S xx ¡ 2b1S xy = S yy +

µS xy

S xx

¶2

S xx ¡ 2S xy

S xxS xy =

= S yy

¡

(S xy)2

S xx

= S yy

¡b1S xy

Denotando con:S yy = somma totale dei quadrati degli scarti della variabile dipendente

rispetto alla media (T SS , Total Sum of Squares)b1S xy = somma dei quadrati spiegata dal modello di regressione (ES S ,

Explained Sum of Squares)

Page 53: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 53/228

 

regressione bivariata 53

possiamo scrivere:

T SS  = ESS + RSS 

Il coe¢ciente di determinazione semplice  è de…nito dal rapporto tra lasomma dei quadrati spiegata e la somma totale dei quadrati. In formula:

r2 =ES S 

T SS = 1 ¡ RSS 

T SS 

e viene utilizzato per valutare la bontà (il “…t”) di una regressione.Si noti che

0 · r2 · 1

Valori elevati di r2 indicano che una parte rilevante della somma totale dei

quadrati degli scarti è spiegata dalla retta di regressione. Si osservi in…neche il quadrato del coe¢ciente di correlazione campionario coincide con ilcoe¢ciente di determinazione semplice.

4.1.5. Proprietà statistiche

Teorema di Gauss-Markov . Date le assunzioni classiche gli stimatoriOLS b0 e b1 sono:

(a) lineari;

(b) non distorti;(c) a varianza minima nella classe degli stimatori lineari non distorti (BLUE ).

Teorema di Rao.

(d) Se inoltre si assume la normalità dei termini di errore, gli stimatoriOLS b0 e b1 sono gli stimatori a varianza minima nella classe deglistimatori (lineari e non-lineari) non distorti (BUE ).

Distribuzione degli stimatori OLS .

(e) Data l’assunzione di normalità dei termini di errore, gli stimatori OLSb0 e b1 sono a loro volta distribuiti normalmente con le seguenti mediee varianze:

b0 » N 

µ¯ 0; ¾2

µ1

n+

x2

S xx

¶¶

Page 54: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 54/228

 

54 capitolo 4

b1»

N µ¯ 1

;¾2

S xx¶Cov (b0; b1) = ¾2

µ¡ x

S xx

¶La conoscenza delle varianze di b0 e b1 (e della loro covarianza) èovviamente utile. Tuttavia, di¢cilmente possono essere calcolate di-rettamente dal momento che ¾2 non è noto.

(f) La seguente statistica (la cui radice è nota come errore standard della regressione )

s2 =RSS 

n¡ 2

è uno stimatore non distorto di ¾2. Inoltre:RSS 

¾2

ha una distribuzione Â2 con n ¡ 2 gradi di libertà. Ne deriva in…neche le seguenti statistiche

b0¡¯ 0r ¾2³1n+ x2

Sxx

´q RSS 

(n¡2)¾2

=b0 ¡ ¯ 0r 

RSS (n¡2)

³1n + x2

S xx

´ =b0 ¡ ¯ 0r 

s2³1n + x2

S xx

´ =b0 ¡ ¯ 0se (b0)

b1¡¯ 1q ¾2Sxxq RSS 

(n¡2)¾2

= b1 ¡ ¯ 1q RSS 

(n¡2)S xx

= b1 ¡ ¯ 1q s2

S xx

= b1 ¡ ¯ 1se (b1)

dove se (bk) indica l’errore standard dello stimatore bk, hanno unadistribuzione t con n¡2 gradi di libertà e possono essere utilizzate percostruire intervalli di con…denza o e¤ettuare test di ipotesi su ¯ 0 e ¯ 1.

Dimostrazione del teorema di Gauss-Markov . Consideriamo persemplicità un modello lineare con un solo parametro ¯ :

yi = ¯xi + "i per i = 1; 2;:::;n

doveE ("i) = 0 per i = 1; 2;:::;n

V ar("i) = ¾2 per i = 1; 2;:::;n

Cov("i; " j) = 0 per i 6= j

Cov(x j; "i) = 0 per i; j = 1; 2;:::;n (con x j deterministiche)

Page 55: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 55/228

 

regressione bivariata 55

²Prova linearità. Lo stimatore a minimi quadrati di ¯  è:

b =

nPi=1

xiyi

nPi=1

x2i

=nX

i=1

ciyi

dove ci = xinPi=1

x2i

.

Quindi b è uno stimatore lineare dal momento che è una funzione linearedelle osservazioni campionarie yi.

² Prova non-distorsione. Il valore atteso di b può essere scritto come:

E (b) =nX

i=1

ciE (yi) =nX

i=1

0BB@ xinP

i=1x2

i

1CCA¯xi = ¯ 

Quindi b è uno stimatore non distorto del parametro ¯ .

² Prova varianza minima nella classe degli stimatori lineari non-distorti.Lo stimatore a minimi quadrati può essere scritto come:

b =nX

i=1

ciyi

Si consideri uno stimatore lineare alternativo

ba =nX

i=1

diyi

A¢nché lo stimatore alternativo sia non distorto deve essere vero che:

E (ba) =nX

i=1

diE (yi) =nX

i=1

di¯xi = ¯ 

e quindi:nX

i=1

dixi = 1

Page 56: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 56/228

 

56 capitolo 4

Dal momento che gli yi sono indipendenti con varianza costante pari

a ¾2, possiamo scrivere che:

V ar(ba) =nX

i=1

d2i ¾2

Per trovare lo stimatore lineare non-distorto a varianza minima dob-biamo risolvere il seguente problema di minimizzazione vincolata:

Mindi

nXi=1

d2i

connX

i=1dixi = 1

Scriviamo il problema di minimizzazione vincolata

M indi;¸

nXi=1

d2i ¡ ¸

ÃnX

i=1

dixi ¡ 1

!dove ¸ è il moltiplicatore di Lagrange. Si derivi rispetto a di e sieguagli a zero:

2di ¡ ¸xi = 0

che equivale a

di = ¸xi2

Si moltiplichino ora entrambi i membri per xi e si sommi rispetto a i:nX

i=1

dixi =¸

2

nXi=1

x2i

Derivando rispetto a ¸ si ottienenP

i=1dixi = 1, da cui il moltiplicatore

di Lagrange è eguale a:

¸ =2

n

Pi=1 x2

i

da cui deriva che

di =¸xi

2=

xinP

i=1x2

i

= ci

che completa la dimostrazione del teorema.

Page 57: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 57/228

 

regressione bivariata 57

Varianza dello stimatore a minimi quadrati :

V ar(b) =nX

i=1

c2i ¾2 =nX

i=1

0BB@ xinP

i=1x2

i

1CCA2

¾2 =¾2

nPi=1

x2i

Distribuzione campionaria degli stimatori a minimi quadrati  b0 eb1: Si consideri il seguente modello

yi = ¯ 0 + ¯ 1xi + "i per i = 1; 2;:::;n

"i » IN (0; ¾2) per i = 1; 2;:::;n

Gli stimatori a minimi quadrati sono:

b0 = y ¡ S xy

S xxx

b1 =S xy

S xx

Le n variabili y1; y2;:::;yn sono distribuite come segue:

yi » IN (¯ 0 + ¯ 1xi; ¾2) per i = 1; 2;:::;n

De…niamo due nuove variabili, somma di variabili distribuite normalmente:

L1 =nX

i=1

ciyi

L2 =nX

i=1

diyi

Queste sono a loro volta distribuite normalmente

L1 » N Ã nX

i=1

ci (¯ 0 + ¯ 1xi) ; ¾2nX

i=1

c2i

!

L2 » N 

ÃnX

i=1

di (¯ 0 + ¯ 1xi) ; ¾2nX

i=1

d2i

!

Page 58: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 58/228

 

58 capitolo 4

Cov (L1; L2) = ¾

2n

Xi=1 cidi

Scriviamo ora b0 e b1 in funzione di yi

S xy =nX

i=1

(xi ¡ x) (yi ¡ y) =nX

i=1

(xi ¡ x) yi¡ynX

i=1

(xi ¡ x) =nX

i=1

(xi ¡ x) yi

da cui

b1 =S xy

S xx=

nPi=1

(xi ¡ x) yi

S xx=

n

Xi=1ciyi

conci =

(xi ¡ x)

S xx

e

b0 = y ¡ S xy

S xxx =

nPi=1

yi

n¡ x

nPi=1

(xi ¡ x) yi

S xx=

nXi=1

diyi

con

di =1

n¡ x (xi ¡ x)

S xx

Calcoliamo ora le varianze dei due stimatori

V ar (b1) =nX

i=1

c2i ¾2 =¾2

S 2xx

nXi=1

(xi ¡ x)2 =¾2

S xx

V ar (b0) =nX

i=1

d2i ¾2 = ¾2nX

i=1

·1

n¡ x (xi ¡ x)

S xx

¸2=

= ¾2nX

i=1

"1

n2+

µx

S xx

¶2

(xi ¡ x)2 ¡ 2

n

x (xi ¡ x)

S xx

#= ¾2

µ1

n+

x2

S xx

dato che: nXi=1

(xi ¡ x) = 0

nXi=1

(xi ¡ x)2 = S xx

Page 59: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 59/228

 

regressione bivariata 59

n

Xi=1 1

n2 =

1

n

Calcoliamo in…ne la loro covarianza

Cov (b0; b1) =nX

i=1

cidi¾2 =

= ¾2nX

i=1

µxi ¡ x

S xx

¶µ1

n¡ x (xi ¡ x)

S xx

¶= ¾2

µ¡ x

S xx

¶Naturalmente il valore atteso dei due stimatori è eguale a:

E (b1) =nX

i=1

ciE (yi) =nX

i=1

ci (¯ 0 + ¯ 1xi) = ¯ 1

eE (b0) = E (y)¡ ¯ 1x = (¯ 0 + ¯ 1x)¡ ¯ 1x = ¯ 0

dal momento che:nP

i=1ci¯ 0 = 0 e

nPi=1

cixi = 1.

Page 60: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 60/228

 

60 capitolo 4

4.2. Intervalli di con…denza e test delle ipotesi

Date le usuali assunzioni classiche e l’assunzione sulla normalità dei terminid’errore, le statistiche

b0 ¡ ¯ 0se (b0)

b1 ¡ ¯ 1se (b1)

hanno una distribuzione t di Student con n¡ 2 gradi di libertà.Inoltre la statistica

RSS 

¾2

ha una distribuzione Â2 con n¡ 2 gradi di libertà.È quindi agevole costruire intervalli di con…denza o e¤ettuare test di

ipotesi sui parametri del modello lineare bivariato.

Intervalli di con…denza . Pre…ssato un livello di con…denza (1 ¡ ®)l’appropriato intervallo di con…denza per ¯ 1 (e analogamente per ¯ 0) è ilseguente:

P r

µ¡t®

2 ;n¡2 ·b1 ¡ ¯ 1se (b1)

· t®2 ;n¡2

¶= 1 ¡ ®

dove

¡t®2 ;n¡2 rappresenta il valore critico inferiore con n¡ 2 gradi di libertà

t®2 ;n¡2 rappresenta il valore critico superiore con n¡ 2 gradi di libertà

da cui

P r³

b1 ¡ t®2 ;n¡2 se (b1) · ¯ 1 · b1 + t®

2 ;n¡2 se (b1)´

= 1 ¡ ®

Quindi, in (1¡ ®)100 su 100 casi l’intervallo

b1 § t®2 ;n¡2 se (b1)

contiene il vero ¯ 1.Analogamente, pre…ssato l’usuale livello di signi…catività, nel caso del

parametro ¾2:

P r

µÂ2®2

;n¡2 ·(n¡ 2) s2

¾2· Â2

1¡®2

;n¡2

¶= 1 ¡ ®

Page 61: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 61/228

 

regressione bivariata 61

dove

Â2®2 ;n¡2 rappresenta il valore critico inferiore con n¡ 2 gradi di libertà

Â21¡®

2;n¡2 rappresenta il valore critico superiore con n¡ 2 gradi di libertà

da cui

P r

Ã(n¡ 2)

s2

Â21¡®

2 ;n¡2· ¾2 · (n¡ 2)

s2

Â2®2 ;n¡2

!= 1 ¡ ®

Quindi, in (1¡ ®)100 su 100 casi l’intervallo

"(n¡ 2)

s2

Â21¡®

2 ;n¡2; (n¡ 2)

s2

Â2®2 ;n¡2

#contiene il vero ¾2.

Test di ipotesi . I test di ipotesi sono procedure che consentono di veri…-care se un’ipotesi nulla sia vera o falsa utilizzando dei dati campionari. Adesempio, nel caso del parametro ¯ 1 (e analogamente per ¯ 0)

H 0 : ¯ 1 = ¯ ¤1

H 1 : ¯ 1 6= ¯ ¤1

Se H 0 è vera, la statisticab1 ¡ ¯ ¤1se (b1)

ha una distribuzione t di Student con n¡2 gradi di libertà. Pre…ssato quindil’usuale livello di con…denza (1 ¡ ®), appropriati intervalli di con…denzapossono essere costruiti.

P r

µ¡t®

2 ;n¡2 ·b1 ¡ ¯ ¤1se (b1)

· t®2 ;n¡2

¶= 1 ¡ ®

e, dopo opportuni passaggi,

P r³

¯ ¤1 ¡ t®2

;n¡2 se (b1) · b1 · ¯ ¤1 + t®2

;n¡2 se (b1)´

= 1¡®

L’ipotesi nulla è ri…utata a favore dell’ipotesi alternativa se b1 “cade” al difuori dell’intervallo di con…denza (regione di accettazione).

Page 62: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 62/228

 

62 capitolo 4

Analogamente, i test di ipotesi possono essere applicati anche a ¾2. Data

la seguente ipotesi nulla:

H 0 : ¾2 = ¾2¤

H 1 : ¾2 6= ¾2¤

Se H 0 è vera, la statistica

RSS 

¾2¤=

(n¡ 2) s2

¾2¤

ha una distribuzione Â2 con n¡2 gradi di libertà. Pre…ssato (1¡®), possiamoscrivere l’intervallo di con…denza come:

P r

µÂ2®2

;n¡2 ·(n¡ 2) s2

¾2¤· Â2

1¡®2

;n¡2

¶= 1 ¡ ®

e, dopo gli opportuni passaggi, come

P r

µÂ2®2

;n¡2¾2¤

(n¡ 2)· s2 · Â2

1¡®2

;n¡2¾2¤

(n¡ 2)

¶= 1 ¡ ®

L’ipotesi nulla è ri…utata a favore dell’ipotesi alternativa se s2 “cade” al difuori dell’intervallo di con…denza (regione di accettazione).

Page 63: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 63/228

 

regressione bivariata 63

4.3. Introduzione alla previsione

Dopo aver stimato i parametri del modello lineare bivariato (¯ 0; ¯ 1, ¾2) èpossibile utilizzarli per prevedere il valore di y per ogni valore dato di x. Siax0 il valore dato di x, la previsione del corrispondente valore di y, de…nitocome by0, è data da:  by0 = b0 + b1x0

mentre il valore “vero” è

y0 = ¯ 0 + ¯ 1x0 + "0

dove "0 è l’usuale termine d’errore.

Possiamo quindi de…nire l’errore di previsione come: by0 ¡ y0 = (b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x0 ¡ "0

che ha valore atteso nullo, dal momento che:

E ( by0 ¡ y0) = [E (b0)¡ ¯ 0] + [E (b1)¡ ¯ 1] x0 ¡E ("0)

e varianza pari a:

V ar ( by0 ¡ y0) = V ar [(b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x0 ¡ "0] =

= V ar (b0 ¡ ¯ 0) + x20V ar (b1 ¡ ¯ 1) + 2x0Cov (b0 ¡ ¯ 0; b1 ¡ ¯ 1) + V ar ("0) =

= ¾2µ1

n +x2

S xx¶+ ¾2 x2

0S xx ¡ 2x0¾2 x

S xx + ¾2

=

= ¾2

Ã1 +

1

n+

(x0 ¡ x)2

S xx

!Si osservi che la varianza dell’errore di previsione:

(a) è una funzione negativa del numero di osservazioni n;

(b) è una funzione positiva della distanza tra x0 e la media delle osserva-zioni sulla cui base sono stati stimati i parametri del modello linearebivariato, x.

Nota la varianza dell’errore di previsione è possibile costruire un interval-lo di previsione per y0 tale che, dato x0, in (1¡®)100 su 100 casi l’intervallocontiene il vero y0:

P r

µ¡t®

2;n¡2 ·

by0 ¡ y0se ( by0 ¡ y0)

· t®2

;n¡2

¶= 1 ¡ ®

Page 64: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 64/228

 

64 capitolo 4

P r0BB@¡t®2

;n¡2 · by0 ¡ y0

s

r ³1 + 1

n + (x0¡x)2

S xx

´ · t®2

;n¡21CCA = 1 ¡ ®

P r

0@ by0 ¡ t®2

;n¡2s

v uutÃ1 +1

n+

(x0 ¡ x)2

S xx

!· y0 ·

·

by0 + t®

2 ;n¡2s

v uut

Ã1 +

1

n+

(x0 ¡ x)2

S xx

!1

A= 1¡ ®

Alternativamente, invece di prevedere il valore di y0, dato x0, è possibileprevedere il valore atteso di y0, cioè E (y0). Dato che:

E (y0) = ¯ 0 + ¯ 1x0

la previsione è ancora  by0 = b0 + b1x0

Tuttavia, l’errore di previsione è diverso. Infatti:

 by0 ¡E (y0) = (b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x0

Inoltre, il valore atteso dell’errore di previsione è sempre nullo, mentre lasua varianza è eguale a:

V ar ( by0 ¡E (y0)) = V ar [(b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x0] =

= V ar (b0 ¡ ¯ 0) + x20V ar (b1 ¡ ¯ 1) + 2x0Cov (b0 ¡ ¯ 0; b1 ¡ ¯ 1) =

= ¾2

µ1

n+

x2

S xx

¶+ ¾2 x2

0

S xx¡ 2x0¾2 x

S xx=

= ¾2

Ã1

n+

(x0 ¡ x)2

S xx

!

Page 65: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 65/228

 

regressione bivariata 65

4.4. Forme funzionali utili

Si è già osservato in precedenza che il modello lineare implica linearità neiparametri ma non necessariamente nelle variabili (originarie). Ne derivala possibilità di de…nire una vasta gamma di forme funzionali che, dopoopportune trasformazioni, rientrano nella classe dei modelli lineari.

Modello log-lineare (o modello log-log ):

yi = e¯ 0x¯ 1i e"i

che può essere riscritto come

ln yi = ¯ 0 + ¯ 1 ln xi + "i

Tale modello è lineare nei parametri, lineare nei logaritmi delle variabili epuò quindi esser stimato con il metodo dei minimi quadrati ordinari. Lasua popolarità (non solo nel contesto bivariato) è dovuta al fatto che ilparametro ¯ 1 misura direttamente l’elasticità (costante) di y rispetto a x.Infatti, de…nita con ²yx l’elasticità

²yx =dy

dx

x

y=

d ln y

d ln x= ¯ 1

Esempio:

log yt = ¯ 0 + ¯ 1 log xt + "t per t = 1; 2;:::;T 

"t » IN (0; ¾2)

dove xt indica il prezzo del ca¤è al dettaglio e yt il consumo di ca¤è (tazzeper persona al giorno) nel medesimo periodo. I risultati della stima sono:

dlog yt = 0; 77(0;02)

¡ 0; 25(0;05)

log xt

r2 = 0; 74

Interpretazione del parametro ¯ 1: un aumento di 1% del prezzo del ca¤édetermina una riduzione del consumo di ca¤è di 0; 25% (domanda inelastica).

¯ 1 =d log yt

d log xt=

dytyt

dxtxt

= ¡0; 25

Page 66: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 66/228

 

66 capitolo 4

Modelli semilog-lineari :

² Modello log-lin:yt = y0 (1 + r)t e"t

dove y0 è il valore iniziale della variabile, r è il tasso di crescita (co-stante) di y, e t rappresenta il tempo. L’espressione può essere riscrittacome:

ln yt = ln y0 + t ln (1 + r) + "t

e quindiln yt = ¯ 0 + ¯ 1t + "t

dove

¯ 0 = ln y0 e ¯ 1 = ln (1 + r)

Il modello viene de…nito log-lin perché solo la variabile dipendente èespressa in forma logaritmica, mentre la variabile indipendente t indicail tempo (t = 1; 2; 3;:::;T ). La sua popolarità è dovuta al fatto che ilparametro ¯ 1 misura direttamente il tasso costante di crescita di y.Esempio:

log yt = ¯ 0 + ¯ 1t + "t per t = 1; 2;:::;T 

"t » IN (0; ¾2)

dove t rappresenta un trend lineare e yt il PIL (Prodotto Interno Lordo)a prezzi costanti. I risultati della stima sono:dlog yt =8; 02(0;01)

+ 0; 025t(0;009)

con r2 = 0; 97

Interpretazione del parametro ¯ 1: il tasso di crescita (costante) delPIL è pari a 2,5%.

¯ 1 =d log yt

dt=

dyt

yt

1

dt= 2; 5%

²Modello lin-log:

yt = ¯ 0 + ¯ 1 ln xt + "t

In questo modello il parametro ¯ 1 misura la variazione assoluta di y afronte di una variazione relativa di x. Infatti,

¯ 1 =dyt

d ln xt=

dyt

dxtxt

Page 67: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 67/228

 

regressione bivariata 67

Il modello viene de…nito lin-log perché solo la variabile indipendente è

espressa in forma logaritmica.Esempio:

yt = ¯ 0 + ¯ 1 log xt + "t per t = 1; 2;:::;T 

"t » IN (0; ¾2)

dove xt rappresenta l’o¤erta di moneta e yt il PIL (Prodotto InternoLordo). I risultati della stima sono:

yt =¡16; 3(0;70)

+ 2584(93;80)

log xt con r2 = 0; 98

Interpretazione del parametro ¯ 1: un aumento di 1% dell’o¤erta dimoneta determina un aumento del PIL di 2584 Euro.

¯ 1 =dyt

d log xt=

dyt

dxtxt

= 2584

² Modello reciproco:

yt = ¯ 0 + ¯ 11

xt+ "t

L’assunzione implicita in questo modello è che al crescere di x, y tendea ¯ 0 (si osservi che ¯ 1 è una costante).Esempio:

yt = ¯ 0 + ¯ 11

xt+ "t per t = 1; 2;:::;T 

"t » IN (0; ¾2)

dove xt rappresenta il tasso di disoccupazione e yt il tasso di variazionepercentuale dei salari nominali (curva di Phillips originaria). I risultatidella stima sono:

yt =¡1; 42(2;07)

+ 8; 27(2;85)

1xt

con r2 = 0; 38

Interpretazione del parametro ¯ 1: ¯ 1 > 0 implica una relazione nega-tiva tra in‡azione (tasso di variazione percentuale dei salari nominali)e disoccupazione.

Page 68: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 68/228

 

68 capitolo 4

4.5. Appendice : Stima econometrica della propensione marginale al

consumo

² Modello lineare bivariato

yt = ¯ 0 + ¯ 1xt + "t

"t » IN (0; ¾2) per t = 1; 2;:::;T 

² Metodo dei minimi quadrati ordinari 

² Periodo 1950-1984 (T  = 35)

²De…nizione delle variabili:

yt = Spese di consumo pro capite (1972 USD)

xt = Reddito disponibile pro capite (1972 USD)

Page 69: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 69/228

 

regressione bivariata 69

Tabella 1 - I dati

Anno Osservazione  yt xt

1950 1 2224 23921951 2 2214 24151952 3 2230 24411953 4 2277 25011954 5 2278 24831955 6 2384 25821956 7 2410 26531957 8 2416 26601958 9 2400 26451959 10 2487 27091960 11 2501 27091961 12 2511 27421962 13 2583 28131963 14 2644 28651964 15 2751 30261965 16 2868 31711966 17 2979 32901967 18 3032 33891968 19 3160 34931969 20 3245 3564

1970 21 3277 36651971 22 3355 37521972 23 3511 38601973 24 3623 40801974 25 3566 40091975 26 3609 40511976 27 3774 41581977 28 3924 42801978 29 4057 44411979 30 4121 45121980 31 4093 4487

1981 32 4131 45611982 33 4146 45551983 34 4303 46701984 35 4490 4941Media 3131 3445  

Page 70: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 70/228

 

70 capitolo 4

Tabella 2 - Calcolo di S yy, S xx, S xy

Anno Osservazione  (yt ¡ ¹y)2 (xt ¡ ¹x)2 (yt ¡ ¹y)(xt ¡ ¹x)1950 1 822079 1108207 9544811951 2 840313 1060312 9439241952 3 811235 1007442 9040311953 4 728779 890597 8056351954 5 727073 924894 8200401955 6 557540 744276 6441761956 7 519388 626812 5705771957 8 510776 615777 5608241958 9 533902 639543 5843401959 10 414331 541276 4735691960 11 396504 541276 4632691961 12 384010 493807 4354621962 13 299960 399063 3459811963 14 236863 336069 2821391964 15 144161 175322 1589801965 16 69004 74920 719011966 17 23009 23937 234681967 18 9739 3104 54981968 19 859 2332 14151969 20 13068 14229 13636

1970 21 21408 48526 322311971 22 50317 94425 689291972 23 144639 172462 1579391973 24 242373 403588 3127601974 25 189499 318418 2456421975 26 228785 367582 2899951976 27 413853 508777 4588671977 28 629348 697702 6626441978 29 858058 992585 9228741979 30 980722 1139099 10569481980 31 926049 1086360 1003006

1981 32 1000629 1246094 11166371982 33 1030863 1232734 11272891983 34 1374321 1501325 14364201984 35 1847735 2238871 2033923S.. 17981190 22271739 19989450  

Page 71: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 71/228

 

regressione bivariata 71

Tabella 3 - Riassunto valori rilevanti e calcolo coe¢cienti

Media y 3131Media x 3445S yy 17981190S xx 22271739S xy 19989450

Coe¢ciente b0 38,967Coe¢ciente b1 0,898

Page 72: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 72/228

 

72 capitolo 4

Tabella 4 - Valori osservati, stimati e residui

Anno Osservazioni  yt yt et

1950 1 2224 2186 381951 2 2214 2206 81952 3 2230 2230 01953 4 2277 2284 -71954 5 2278 2268 101955 6 2384 2356 281956 7 2410 2420 -101957 8 2416 2426 -101958 9 2400 2413 -131959 10 2487 2470 171960 11 2501 2470 311961 12 2511 2500 111962 13 2583 2564 191963 14 2644 2610 341964 15 2751 2755 -41965 16 2868 2885 -171966 17 2979 2992 -131967 18 3032 3081 -491968 19 3160 3174 -141969 20 3245 3238 7

1970 21 3277 3328 -511971 22 3355 3406 -511972 23 3511 3503 81973 24 3623 3701 -781974 25 3566 3637 -711975 26 3609 3675 -661976 27 3774 3771 31977 28 3924 3880 441978 29 4057 4025 321979 30 4121 4089 321980 31 4093 4066 27

1981 32 4131 4133 -21982 33 4146 4127 191983 34 4303 4230 731984 35 4490 4474 16

Page 73: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 73/228

 

regressione bivariata 73

Tabella 5 - Coe¢ciente di determinazione

T SS  17981190 1ESS  17941037 0; 998

RSS  40152 0; 002

1. Calcolo dell’errore standard della regressione:

s =

r RSS 

n¡ 2=

r 40152

33= 34; 9

2. Calcolo dell’errore standard di b0 :

se (b0) =s 

s2µ 1

n+

x2

S xx

¶=s 

1216; 7µ 1

35+

34452

22271739

¶= 26; 135

3. Calcolo dell’errore standard di b1 :

se (b1) =

s s2

S xx=

r 1216; 7

22271739= 0; 0074

4. Calcolo della covarianza tra b0 e b1

Cov (b0

; b1

) = s2µ¡ x

S xx¶ = 1216; 7µ¡ 3445

22271739¶ =¡

0; 1882

Tabella 6 - Output standard di una regressione

T SS  = 17981190

ESS  = 17941037

RSS  = 40152

r2 = 0; 998

s = 34; 9

Variabile dipendente yt

Coe¢ciente Errore standard Statistica t

Costante 38; 967 26; 135 1; 491

xt 0; 898 0; 007 128; 286

Page 74: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 74/228

 

74 capitolo 4

4.6. Esercizi

1. Si supponga di aver stimato il modello lineare bivariato

yi = ¯ 0 + ¯ 1xi + "i per i = 1; 2;:::;n

"i » IN (0; ¾2)

con un campione di 20 osservazioni e di aver ottenuto i seguenti risul-tati

yi = 3; 6(2;09)

+ 0; 75(0;26)

xi

s2 = 1; 83

(a) si costruiscano gli intervalli di con…denza al 95% per ¯ 0, ¯ 1, ¾2.

(b) si sottopongano disgiuntamente a test le seguenti ipotesi ad unlivello di signi…catività del 5%:

H 0 : ¯ 0 = 0 contro H 1 : ¯ 0 6= 0

H 0 : ¯ 1 = 1 contro H 1 : ¯ 1 6= 1

H 0 : ¾2 = 1 contro H 1 : ¾2 6= 1

2. Si supponga di aver stimato il modello lineare bivariato

yt = ¯ 0 + ¯ 1xt + "t per t = 1; 2;:::;T "t » IN (0; ¾2)

(dove xt indica le spese pubblicitarie di una impresa in un determinatomese e yt le vendite dell’impresa nel medesimo periodo. Entrambe levariabili sono espresse in migliaia di Euro) con un campione di 20osservazioni (quindi 20 mesi) e di aver ottenuto i seguenti risultati

yt = 2; 4(1;43)

+ 1; 25(0;18)

xt

RSS  = 16

¹x = 8

S xx = 28

(a) Qual è la previsione di vendita con un budget pubblicitario di12.000 Euro? Qual è la varianza stimata dell’errore di previsione?Si costruisca inoltre un intervallo di con…denza del 95% per questaprevisione.

Page 75: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 75/228

 

75

(b) Qual è la previsione media di vendita nei prossimi 12 mesi con un

budget pubblicitario di 12.000 Euro? Qual è la varianza stimatadell’errore di previsione? Si costruisca inoltre un intervallo dicon…denza del 95% per questa previsione.

Page 76: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 76/228

 

76

Page 77: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 77/228

 

Capitolo 5

Modelli di Regressione -

Regressione lineare trivariata

5.1. Metodo dei Minimi Quadrati Ordinari

5.1.1. Assunzioni

1. Modello lineare trivariato:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i per i = 1; 2;:::;n

2. Assunzioni classiche:

E ("i) = 0 per i = 1; 2;:::;n

V ar("i) = ¾2 per i = 1; 2;:::;n

Cov("i; " j) = 0 per i

6= j

Cov(xkj ; "i) = 0 per i; j = 1; 2;:::;n; k = 1; 2

3. Assunzione sulla normalità dei termini d’errore:

"i » N (0; ¾2) per i = 1; 2;:::;n

Page 78: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 78/228

 

78 capitolo 5

5.1.2. Stima dei parametri

Intuizione: i parametri ¯ 0, ¯ 1, ¯ 2 e ¾2 non sono noti. Analogamente al casobivariato, il metodo dei minimi quadrati de…nisce degli stimatori di ¯ 0, ¯ 1 e¯ 2, che chiameremo b0, b1 e b2, tali da minimizzare la somma del quadratodei residui (RSS , Residual Sum of Squares).

De…nizione di residuo:

ei = yi ¡ b0 ¡ b1x1i ¡ b2x2i per i = 1; 2;:::;n

e quindi

RSS  =n

Xi=1e2i =

n

Xi=1(yi ¡ b0 ¡ b1x1i ¡ b2x2i)2

Scriviamo il programma di minimizzazione

Minb0;b1;b2

nXi=1

(yi ¡ b0 ¡ b1x1i ¡ b2x2i)2

Le condizioni del primo ordine sono:

@RSS 

@b0=

nXi=1

¡2 (yi ¡ b0 ¡ b1x1i ¡ b2x2i) = 0

@RSS 

@b1=

n

Xi=1 ¡2x1i (yi ¡ b0 ¡ b1x1i ¡ b2x2i) = 0

@RSS 

@b2=

nXi=1

¡2x2i (yi ¡ b0 ¡ b1x1i ¡ b2x2i) = 0

Analogamente al caso bivariato queste possono essere riscritte in forma diequazioni normali:

y = b0 + b1x1 + b2x2

nXi=1

x1iyi = b0

nXi=1

x1i + b1

nXi=1

x21i + b2

nXi=1

x1ix2i

n

Xi=1 x2iyi = b0

n

Xi=1 x2i + b2

n

Xi=1 x2

2i

+ b1

n

Xi=1 x1ix2i

Si sostituisca ora la prima equazione normale nella seconda e nella terza. Siottengono le seguenti due equazioni

nXi=1

x1iyi = nx1 (y ¡ b1x1 ¡ b2x2) + b1

nXi=1

x21i + b2

nXi=1

x1ix2i

Page 79: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 79/228

 

regressione trivariata 79

n

Xi=1 x2iyi = nx2 (y ¡ b1x1 ¡ b2x2) + b2

n

Xi=1 x

2

2i + b1

n

Xi=1 x1ix2i

che possono essere sempli…cate utilizzando la notazione:

S 11 =nX

i=1

(x1i ¡ x1)2 =nX

i=1

x21i ¡ nx1

2

S 12 =nX

i=1

(x1i ¡ x1) (x2i ¡ x2) =nX

i=1

x1ix2i ¡ nx1x2

S 22 =n

Xi=1 (x2i

¡x2)2 =

n

Xi=1 x2

2i

¡nx2

2

S 1y =nX

i=1

(yi ¡ y) (x1i ¡ x1) =nX

i=1

x1iyi ¡ nx1y

S 2y =nX

i=1

(yi ¡ y) (x2i ¡ x2) =nX

i=1

x2iyi ¡ nx2y

S yy =nX

i=1

(yi ¡ y)2 =nX

i=1

y2i ¡ ny2

Ne deriva che

nXi=1

x1iyi = nx1 (y ¡ b1x1 ¡ b2x2) + b1

nXi=1

x21i + b2

nXi=1

x1ix2i

può essere riscritta come

S 1y = b1S 11 + b2S 12

en

Xi=1x2iyi = nx2 (y ¡ b1x1 ¡ b2x2) + b2

n

Xi=1x22i + b1

n

Xi=1x1ix2i

comeS 2y = b1S 12 + b2S 22

Risolvendo il sistema si ottengono gli stimatori b1 e b2

b1 =S 22S 1y ¡ S 12S 2y

S 11S 22 ¡ S 212

Page 80: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 80/228

 

80 capitolo 5

b2 =S 11S 2y ¡ S 12S 1y

S 11S 22 ¡ S 212

e, dopo opportune sostituzioni, lo stimatore b0

b0 = y ¡ b1x1 ¡ b2x2

5.1.3. Proprietà algebriche dei minimi quadrati

Analogamente al caso bivariato:

1. La somma dei residui è pari a zero. Questa proprietà deriva diretta-mente dalla prima equazione normale. Infatti:

nXi=1

ei =nX

i=1

(yi ¡ b0 ¡ b1x1i ¡ b2x2i) = 0

2. La somma dei prodotti  x1iei e  x2iei è pari a zero. Questa proprietàderiva direttamente dalla seconda e dalla terza equazione normale.Infatti:

nXi=1

x1iei =nX

i=1

x1i (yi ¡ b0 ¡ b1x1i ¡ b2x2i) = 0

n

Xi=1 x2i

ei

=n

Xi=1 x2i

(yi ¡

b0 ¡

b1

x1i ¡

b2

x2i

) = 0

5.1.4. Il coe¢ciente di determinazione multiplo (R2)

RSS  =nX

i=1

e2i = S yy ¡ b1S 1y ¡ b2S 2y

Dimostrazione 

RSS  =n

Xi=1 (yi

¡b0¡

b1x1i

¡b2x2i)2

=nX

i=1

[yi ¡ y ¡ b1 (x1i ¡ x1)¡ b2 (x2i ¡ x2)]2

=nX

i=1

(yi ¡ y)2 + b21

nXi=1

(x1i ¡ x1)2 + b22

nXi=1

(x2i ¡ x2)2 +

Page 81: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 81/228

 

regressione trivariata 81

¡ 2b1

n

Xi=1 (yi ¡ y) (x1i ¡ x1)¡ 2b2

n

Xi=1 (yi ¡ y) (x2i ¡ x2)

+ 2b1b2

nXi=1

(x1i ¡ x1) (x2i ¡ x2)

= S yy + b21S 11 + b22S 22 ¡ 2b1S 1y ¡ 2b2S 2y + 2b1b2S 12

= S yy ¡ b1S 1y ¡ b2S 2y

L’ultima eguaglianza è ottenuta utilizzando la seconda e la terza equazionenormale:

S 1y = b1S 11 + b2S 12

S 2y = b1S 12 + b2S 22

Infatti, moltiplicando la seconda per b1 e la terza per b2 e sommando membroa membro si ottiene

b21S 11 + b22S 22 + 2b1b2S 12 = b1S 1y + b2S 2y

Denotando (si osservi l’analogia con il caso bivariato) con:S yy la somma totale dei quadrati degli scarti della variabile dipendente

rispetto alla media (T SS , Total Sum of Squares)b1S 1y + b2S 2y la somma dei quadrati spiegata (ESS , Explained Sum of 

Squares)

possiamo scrivere:T SS  = ESS + RSS 

Il coe¢ciente di determinazione multiplo è de…nito dal rapporto tra la som-ma dei quadrati spiegata e la somma totale dei quadrati. In formula

R2 =ES S 

T SS = 1¡ RSS 

T SS 

e viene utilizzato per valutare la bontà (il “…t”) di una regressione.Si noti che

0 · R2

· 1Analogamente al coe¢ciente di determinazione semplice r2 nel caso dellaregressione bivariata, valori elevati di R2 indicano che una parte rilevantedella somma totale dei quadrati (T SS ) è spiegata dal piano di regressio-ne (ESS ). Si osservi in…ne che il quadrato del coe¢ciente di correlazionemultiplo è il coe¢ciente di determinazione multiplo.

Page 82: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 82/228

 

82 capitolo 5

5.1.5. Il coe¢ciente di determinazione multiplo “aggiustato” (R2)

Il coe¢ciente di determinazione multiplo R2 è una funzione non decrescentedel numero di regressori (cioè di variabili esplicative) inclusi nel modello.Infatti, T SS  non dipende dal numero di regressori mentre mentre RSS  èuna funzione non crescente del numero di regressori. In altri termini aggiun-gendo un’ulteriore variabile esplicativa ad un modello preesistente RSS  nonpuò aumentare. Ne consegue che il coe¢ciente di determinazione multiplonon può costituire un buon criterio per selezionare il numero di variabi-li esplicative da includere in un modello (o per confrontare equazioni conun diverso numero di variabili esplicative), dal momento che un eventualecriterio di scelta basato esclusivamente su R2 condurrebbe all’inclusione di

un numero molto elevato di regressori, anche se non signi…cativamente di-versi da zero. Per ovviare a questo inconveniente in letteratura sono statecostruite numerose statistiche alternative. L’intuizione sottostante è mol-to semplice: correggere il coe¢ciente di determinazione multiplo per tenerconto della perdita di gradi di libertà conseguente all’introduzione di varia-bili esplicative addizionali. Un esempio è il coe¢ciente di determinazionemultiplo “aggiustato”, R2 che è de…nito dalla seguente relazione:

1¡R2 =¡

1¡R2¢ n¡ 1

n¡ k=

µRSS 

T SS 

¶n¡ 1

n¡ k

e quindi

R2 = 1 ¡µRSS T SS 

¶ n¡ 1n¡ k

dove n è il numero delle osservazioni e k il numero dei parametri ¯  nelmodello stimato (3 nel caso del modello di regressione trivariato, costantecompresa).

Si osservi in…ne che, anche se comunemente utilizzato, non esiste unconsenso generalizzato sulla superiorità del coe¢ciente di determinazionemultiplo “aggiustato” rispetto ad altre misure analoghe.

5.1.6. Proprietà statistiche

Teorema di Gauss-Markov . Date le assunzioni classiche gli stimatoriOLS b0, b1 e b2 sono (come nel caso bivariato):

a) lineari;

b) non distorti;

Page 83: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 83/228

 

regressione trivariata 83

c) a varianza minima nella classe degli stimatori lineari non distorti (BLUE).

Teorema di Rao.

d) Se inoltre si assume la normalità dei termini di errore, gli stimatoriOLS b0, b1 e b2 sono (come nel caso bivariato) gli stimatori a varianzaminima nella classe degli stimatori (lineari e non lineari) non distorti(BUE)

Distribuzione degli stimatori OLS .

e) Inoltre, sempre data l’assunzione di normalità dei termini di errore glistimatori OLS b0, b1 e b2 sono (come nel caso bivariato) a loro voltadistribuiti normalmente con le seguenti medie e varianze:

b0 » N 

µ¯ 0;

¾2

n+ x1

2V ar (b1) + 2x1 x2Cov (b1; b2) + x22V ar (b2)

b1 » N 

ï 1;

¾2

S 11¡

1¡ r212¢!

b2 » N Ã¯ 2; ¾2

S 22¡

1¡ r212¢!

Cov (b0; b1) = ¡ [x1V ar (b1) + x2Cov (b1; b2)]

Cov (b0; b2) = ¡ [x2V ar (b2) + x1Cov (b1; b2)]

Cov (b1; b2) = ¡ ¾2r212S 12

¡1¡ r212

¢dove

r12 =S 12p 

S 11S 22

è il coe¢ciente di correlazione semplice tra x1 e x2. Si noti che se r12è elevato, anche V ar (b1) e V ar (b2) sono elevati e quindi b1 e b2 nonpossono essere stimati con precisione (multicollinearità). Come nelcaso bivariato, la conoscenza delle varianze di b0, b1 e b2 (e delle lorocovarianze) è ovviamente utile. Tuttavia, di¢cilmente possono esserecalcolate direttamente dal momento che ¾2 non è noto.

Page 84: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 84/228

 

84 capitolo 5

f) Nel caso trivariato, la seguente statistica (la cui radice è nota come

errore standard della regressione )

s2 =RSS 

n¡ 3

è uno stimatore non distorto di ¾2. Inoltre:

RSS 

¾2

ha una distribuzione Â2 con n¡ 3 gradi di libertà.

Ne deriva (trascuriamo per semplicità b0) che le seguenti statistiche

b1¡¯ 1r ¾2

S11(1¡r212)q RSS 

(n¡3)¾2

=b1 ¡ ¯ 1q 

RSS 

(n¡3)S 11(1¡r212)

=b1 ¡ ¯ 1r 

s2

S 11(1¡r212)

=b1 ¡ ¯ 1se (b1)

b2¡¯ 2r ¾2

S22(1¡r212)q RSS 

(n¡3)¾2

=b2 ¡ ¯ 2q 

RSS 

(n¡3)S 22(1¡r212)

=b2 ¡ ¯ 2r 

s2

S 22(1¡r212)

=b2 ¡ ¯ 2se (b2)

hanno una distribuzione t con n¡3 gradi di libertà e possono essere utilizzateper costruire intervalli di con…denza o e¤ettuare test di ipotesi (disgiunti)su ¯ 1 e ¯ 2.

Page 85: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 85/228

 

regressione trivariata 85

5.2. Interpretazione dei coe¢cienti e variabili omesse

I coe¢cienti come derivate parziali . Dato il modello lineare trivariatovero:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

"i » IN (0; ¾2)per i = 1; 2;:::;n

il modello stimato è

yi = b0 + b1x1i + b2x2i + ei per i = 1; 2;:::;n

dove:

b1 = S 22S 1y ¡ S 12S 2yS 11S 22 ¡ S 212

b2 =S 11S 2y ¡ S 12S 1y

S 11S 22 ¡ S 212

I coe¢cienti b1 e b2 possono essere interpretati come derivate parziali : unpiccolo movimento di x1 (x2) a parità di x2 (x1) ha un e¤etto su y pari alcoe¢ciente stimato b1 (o b2). Si supponga di stimare invece separatamentedue modelli bivariati:

yi = b0 + b1yx1i + ei

eyi = b0 + b2yx2i + ei

dove

b1y =S 1y

S 11e

b2y =S 2y

S 22

Qual è la relazione tra b1 (b2) e b1y (b2y)? Per rispondere a questa domandaintroduciamo due regressioni aggiuntive:

x2i = b0 + b12x1i + ei

dove

b12 =S 12S 11

ex1i = b0 + b21x2i + ei

Page 86: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 86/228

 

86 capitolo 5

dove

b21 = S 21S 22

= S 12S 22

Riscriviamo adesso b1 (lo stesso ragionamento si applica a b2) dividendonumeratore e denominatore per S 11S 22

b1 =S 22S 1y ¡ S 12S 2y

S 11S 22 ¡ S 212=

S 1yS 11

¡ S 12S 2yS 11S 22

1¡ S 212S 11S 22

=b1y ¡ b12b2y

1¡ b12b21

Analogamente:

b2 =b2y ¡ b21b1y

1¡ b12b21

Ne deriva che b1 = b1y solo se b12 = 0 e b2 = b2y solo se b21 = 0. Dalmomento che il coe¢ciente di correlazione semplice tra x1 e x2 è de…nitodalla seguente espressione:

r12 =S 12p 

S 11S 22

da cuiS 12 = r12

p S 11S 22

possiamo riscrivere b12 e b21 come segue:

b12 =S 12

S 11=

r12p 

S 11S 22

S 11= r12r S 22

S 11

b21 =S 12S 22

=r12p 

S 11S 22S 22

= r12

r S 11S 22

Quindi b12 e b21 sono entrambi eguali a zero solo se il coe¢ciente di cor-relazione semplice tra x1 e x2 è eguale a zero, cioè se x1 e x2 non sonocorrelati.

5.2.1. Il problema dell’omissione di variabili rilevanti

Si supponga che il modello vero sia

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

"i » IN (0; ¾2)per i = 1; 2;:::;n

Tuttavia invece di stimare l’equazione

yi = b0 + b1x1i + b2x2i + ei per i = 1; 2;:::;n

Page 87: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 87/228

 

regressione trivariata 87

viene stimata l’equazione (in cui viene omessa la variabile x2)

yi = b0 + b1yx1i + ei per i = 1; 2;:::;n

La domanda a cui dobbiamo rispondere è se b1y sia uno stimatore nondistorto di ¯ 1. Lo è solamente se r12 = 0. Infatti è agevole dimostrareche:

E (b1y) = ¯ 1 + ¯ 2b12 = ¯ 1 + ¯ 2r12

r S 22S 11

dove ¯ 2b12 rappresenta il “bias” dello stimatore b1y.

Dimostrazione:

b1y =S 1y

S 11=

nPi=1

(x1i¡ ¡x1)yi

S 11

=

nPi=1

(x1i¡ ¡x1)(¯ 0 + ¯ 1x1i + ¯ 2x2i + "i)

S 11

=

¯ 1n

Pi=1

(x1i¡ ¡x1)2 + ¯ 2

n

Pi=1

(x1i¡ ¡x1)x2i +

n

Pi=1

(x1i¡ ¡x1)"i

S 11

= ¯ 1 + ¯ 2S 12S 11

+

nPi=1

(x1i¡ ¡x1)"i

S 11

E (b1y) = ¯ 1 + ¯ 2S 12S 11

= ¯ 1 + ¯ 2b12

= ¯ 1 + ¯ 2r12

r S 22S 11

Tale “bias” è nullo solo se r12 è eguale a zero. Viceversa la distorsione èpositiva (cioè b1y sovrastima il vero valore di ¯ 1) se ¯ 2 e r12 hanno lo stessosegno. Se viceversa hanno segno opposto la distorsione è negativa. Inoltre:

V ar (b1y) =¾2

S 11

Page 88: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 88/228

 

88 capitolo 5

mentre

V ar (b1) = ¾2

S 11¡

1¡ r212¢

Ne consegue che b1y, pur essendo uno stimatore distorto di ¯ 1, è caratte-rizzato da una varianza minore rispetto a b1, che viceversa è uno stimatorecorretto. Si osservi tuttavia che ciò non implica necessariamente che l’errorestandard (stimato) di b1y sia minore rispetto a quello di b1. Questo è verosolo se

s2u¡1¡ r212

¢ > s2b

cioè ses2

us2b

> ¡1¡ r212¢dove su è l’errore standard (stimato) della regressione

yi = b0 + b1x1i + b2x2i + ei

e sb quello della regressione

yi = b0 + b1yx1i + ei

Un’applicazione del problema delle variabili omesse: la curva di 

Phillips. La curva di Phillips originaria può essere descritta dall’equazione:

yt = ¯ 0 + ¯ 1x1t + ²t

dove yt rappresenta il tasso d’in‡azione e¤ettivo al tempo t e xt il tasso didisoccupazione sempre al tempo t. ¯ 1 negativo e signi…cativamente diversoda zero sembrerebbe indicare che i paesi possano scegliere tra diverse com-binazioni di disoccupazione e in‡azione (così almeno venivano interpretatinegli anni ’60 i risultati di Phillips per il Regno Unito e di Samuelson e Solowper gli Stati Uniti). La stima OLS della curva di Phillips originaria su datiUS nel periodo 1970-82 fornisce evidenza empirica contraria all’esistenza di

un trade-o¤  tra in‡azione e disoccupazione. Infatti:

yt =6; 13(4;29)

+ 0; 25(0;63)

x1t; r2 = 0; 01

Una possibile spiegazione di questo risultato anomalo è che la curva di Phil-lips originaria sia un modello non correttamente speci…cato dal momento

Page 89: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 89/228

 

regressione trivariata 89

che non tiene conto delle aspettative di in‡azione. La curva di Phillips

modi…cata (o corretta per le aspettative) è rappresentabile da:

yt = ¯ 0 + ¯ 1x1t + ¯ 2x2t + ²t

dove x2t misura il tasso d’in‡azione atteso al tempo t. I segni attesi sono¯ 1 < 0 e ¯ 2 > 0 (con ¯ 2 = 0 otteniamo la curva di Phillips originaria). L’ideasottostante è che, data l’in‡azione attesa, un aumento della disoccupazioneporti a una riduzione dell’in‡azione e¤ettiva. I risultati della stima sono:

yt =7; 19(1;59)

¡ 1; 39(0;31)

x1t+ 1; 47(0;18)

x2t; R2 = 0; 88

Per analizzare la relazione algebrica tra le stime dei due modelli è necessariauna terza equazione, dove il tasso d’in‡azione atteso (x2t) viene regreditosul tasso di disoccupazione (x1t)

x2t =0; 73(2;73)

+ 1; 11(0;40)

x1t r2 = 0; 41

Infatti, sapendo cheb1y = b1 + b2b12

possiamo scrivere0; 25 = ¡1; 39 + 1; 47£ 1; 11

Stima del tasso di disoccupazione naturale. Il tasso naturale di disoccupazio-ne (x1n) è quel tasso di disoccupazione per cui l’in‡azione e¤ettiva è eguale aquella attesa. Se l’ipotesi ¯ 2 = 1 non è ri…utata dai dati (ma lo è nel nostrocaso?), è possibile riscrivere la curva di Phillips modi…cata come segue:

yt ¡ x2t = ¯ 0 + ¯ 1x1n + ²t

da cui, imponendo yt ¡ x2t = 0

0 = ¯ 0 + ¯ 1x1n + ²t

e quindix1n = ¡b0

b1=¡7; 19

¡1; 39= 5; 17

Page 90: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 90/228

 

90 capitolo 5

5.3. Test di Ipotesi

Dopo aver stimato i parametri di un modello di regressione lineare classicomultivariato (di cui il modello trivariato rappresenta il caso più semplice)

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

"i » IN (0; ¾2)per i = 1; 2;:::;n

è possibile veri…care una molteplicità di ipotesi sui parametri utilizzandostatistiche che hanno distribuzioni t di Student o F  di Fisher:

(a) Ipotesi su singoli parametri

¯ 1 = 1

¯ 2 = 0

(b) Ipotesi (congiunte) su più parametri

¯ 1 = ¯ 2 = 0

(c) Restrizioni lineari sui parametri

¯ 1 ¡ ¯ 2 = 0

¯ 1 + ¯ 2 = 1

Esempio. Nel contesto di una funzione di produzione Cobb-Douglasla prima restrizione implica che le elasticità al fattore lavoro (x1) e alfattore capitale (x2) siano eguali, mentre la seconda implica che la lorosomma sia pari a 1, cioè che i ritorni di scala siano costanti.

(d) Stabilità dei parametri¯  pre1 = ¯  post

1

¯  pre2 = ¯  post

2

Esempio. Nel contesto di una funzione di domanda di un bene è im-

portante veri…care se l’introduzione di un bene sostituto (cambiamen-to strutturale) ha modi…cato le elasticità al prezzo (¯ 1) e al reddito(¯ 2) del bene già esistente. Supponendo che il bene sostituto sia sta-to introdotto in un dato periodo, si può quindi veri…care se le stimecondotte su osservazioni precedenti il cambiamento strutturale (pre)siano eguali alle stime condotte su osservazioni successive (post).

Page 91: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 91/228

 

regressione trivariata 91

5.3.1. Ipotesi su singoli parametri

Data un’ipotesi nulla su un generico parametro ¯  j ( j = 0; 1; 2)

H 0 : ¯  j = ¯ ¤ jH 1 : ¯  j 6= ¯ ¤ j

la statistica:

t =b j ¡ ¯ ¤ jse (b j )

ha sotto l’ipotesi nulla una distribuzione t di Student con n ¡ 3 gradi dilibertà dove n è il numero di osservazioni e 3 il numero di parametri ¯ 

da stimare nel modello e quindi di equazioni normali. Si osservi che ogniequazione normale implica infatti una restrizione sui residui.

Analogamente, in un modello multivariato con k parametri ¯  da stimarei gradi di libertà della statistica t sono pari a n ¡ k dove n è il numero diosservazioni e k il numero di parametri ¯  da stimare nel modello (e quindidi equazioni normali).

5.3.2. Ipotesi congiunte su più parametri

Si consideri la seguente identità

T SS  = ESS + RSS 

Già sappiamo che nel modello trivariato la statistica

RSS 

¾2

ha una distribuzione Â2 con (n¡3) gradi di libertà (e, più generalmente, conn¡ k gradi di libertà in un modello multivariato con k parametri ¯ , dove nè il numero delle osservazioni e k è il numero dei parametri ¯  da stimare nelmodello).

Si può dimostrare inoltre che, sotto l’ipotesi nulla H 0 : ¯ 1 = ¯ 2 = 0, nel

modello trivariato la statistica:ESS 

¾2

ha una distribuzione Â2 con 2 gradi di libertà (e più generalmente con k¡ 1gradi di libertà dove k è il numero dei parametri ¯  da stimare nel modello).

Page 92: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 92/228

 

92 capitolo 5

Dal momento che le due statistiche sono distribuite in modo indipendente,

la statistica (sempre sotto l’ipotesi nulla H 0 : ¯ 1 = ¯ 2 = 0):

F  =ES S ¾22

RSS ¾2(n¡3)

=ES S 2

RSS n¡3

ha una distribuzione F  di Fisher con 2 (al numeratore) e n¡ 3 (al denomi-natore) gradi di libertà.

Analogamente, in un modello multivariato con k parametri ¯  da stimarei gradi di libertà della statistica F  sono pari a k¡1 (al numeratore) e n¡k(al denominatore) dove n è il numero delle osservazioni e k il numero deiparametri ¯  da stimare nel modello.

È quindi possibile utilizzare la statistica F  per sottoporre a test l’ipotesiche tutti i parametri del modello (con l’eccezione della costante) non sianosigni…cativamente diversi da zero, cioè che

H 0 : ¯ 1 = ¯ 2 = 0

Se non è possibile ri…utare l’ipotesi nulla, allora y non è una funzione linearedi x1 e x2. Questo test viene spesso de…nito test di signi…catività della regressione .

Modi alternativi di calcolare la statistica  F :

(a) In funzione di S 11, S 12 e S 22

F  =ESS 2

RSS n¡3

=ESS 

2s2=

b1S 1y + b2S 2y

2s2=

b21S 11 + 2b1b2S 12 + b22S 222s2

(b) Evidenziando il legame con R2

F  =ESS 2

RSS n¡3

=

ESSTSS

2RSSTSS

n¡3

=R2

21¡R2

n¡3

5.3.3. Restrizioni lineari sui parametri

Le restrizioni lineari sui parametri possono essere sottoposte a test utiliz-zando due diversi approcci:

(a) il primo approccio si basa sulla costruzione di un test t e richiedela stima di un solo modello (il modello non ristretto). Questo ap-proccio tuttavia non consente di veri…care congiuntamente più di unarestrizione lineare sui parametri;

Page 93: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 93/228

 

regressione trivariata 93

(b) il secondo approccio si basa invece sulla costruzione di un test F . È più

complesso dal momento che per la sua implementazione devono esserestimati due modelli (il modello non ristretto e il modello ristretto).Tuttavia è più generale. Consente infatti di veri…care congiuntamentepiù di una restrizione lineare sui parametri.

Esempio 1. Si consideri il seguente modello di regressione lineare classicotrivariato:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

"i » IN (0; ¾2)per i = 1; 2;:::;n

La restrizione che si vuole sottoporre a test è la seguente:

H 0 : ¯ 1 = ¯ 2

che equivale aH 0 : ¯ 1 ¡ ¯ 2 = 0

² Approccio basato sul test  t: La seguente statistica

t =(b1 ¡ b2)¡ (¯ 1 ¡ ¯ 2)

se (b1 ¡ b2)

ha una distribuzione t di Student con n

¡3 gradi di libertà (e più

generalmente con n ¡ k gradi di libertà). Quindi, se l’ipotesi nulla èvera:

t =(b1 ¡ b2)¡ 0

se (b1 ¡ b2)

segue anch’essa una distribuzione t di Student con n¡3 gradi di libertà.Infatti, dal momento che b1 e b2 sono variabili distribuite normalmente,la loro di¤erenza è ancora distribuita normalmente. Inoltre la varianza(stimata) della loro di¤erenza è pari a:

V ar (b1 ¡ b2) = V ar (b1) + V ar (b2)¡ 2Cov (b1; b2)

da cui deriva che:

t =(b1 ¡ b2)

se (b1 ¡ b2)=

(b1 ¡ b2)p V ar (b1) + V ar (b2)¡ 2Cov (b1; b2)

Se il valore calcolato della statistica t eccede il valore critico della distri-buzione t al livello di signi…catività pre…ssato, allora si deve ri…utarel’ipotesi nulla, altrimenti non è possibile ri…utare la restrizione.

Page 94: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 94/228

 

94 capitolo 5

²Approccio basato sul test  F: L’intuizione è molto semplice. Stimiamo

sia il modello originale (non ristretto), sia il modello che tiene contodella restrizione (modello ristretto). Se la restrizione è “ragionevole”allora la somma dei quadrati dei residui del modello ristretto non do-vrebbe essere “troppo” più grande della somma dei quadrati dei residuidel modello non ristretto.

Modello non ristretto:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

Modello ristretto:

yi = ¯ 0 + ¯ 1x1i + ¯ 1x2i + "i = ¯ 0 + ¯ 1 (x1i + x2i) + "i

De…niamo con:URSS  la somma del quadrato dei residui del modello non ristretto(Unrestricted Residual Sum of Squares),RRSS  la somma del quadrato dei residui del modello ristretto (Re-stricted Residual Sum of Squares),n = numero di osservazioni,k = numero di parametri nel modello non ristretto (3 nel modello tri-variato),m = numero di restrizioni (1 nel nostro caso).Sotto ipotesi nulla la statistica:

F  =RRSS ¡URSS 

mURSS 

n¡k

=RRSS ¡URSS 

1URSS 

n¡3

ha una distribuzione F  con m (al numeratore) e n¡k (al denominatore)gradi di libertà. Se il valore calcolato della statistica F  eccede il valorecritico della distribuzione F  al livello di signi…catività pre…ssato, allorasi deve ri…utare l’ipotesi nulla, altrimenti non è possibile ri…utare larestrizione.

Esempio 2 . Si consideri il solito modello di regressione lineare classicotrivariato:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

"i » IN (0; ¾2)per i = 1; 2;:::;n

Page 95: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 95/228

 

regressione trivariata 95

La restrizione che si vuole sottoporre a test è:

H 0 : ¯ 1 + ¯ 2 = 1

² Approccio basato sul test  t. La seguente statistica

t =(b1 + b2)¡ (¯ 1 + ¯ 2)

se (b1 + b2)

ha una distribuzione t di Student con n ¡ 3 gradi di libertà (e piùgeneralmente con n ¡ k gradi di libertà). Quindi, se l’ipotesi nulla èvera:

t =(b1 + b2)¡ 1

se (b1 + b2)segue una distribuzione t di Student con n¡3 gradi di libertà. Infatti,dal momento che b1 e b2 sono variabili distribuite normalmente, la lorosomma è ancora distribuita normalmente. Inoltre la varianza (stimata)della loro somma è pari a:

V ar (b1 + b2) = V ar (b1) + V ar (b2) + 2Cov (b1; b2)

da cui deriva che:

t =(b1 + b2)¡ 1

se (b1 + b2)=

(b1 + b2)¡ 1

p V ar (b1) + V ar (b2) + 2Cov (b1; b2)

Come nel caso precedente, se il valore calcolato della statistica t eccedeil valore critico della distribuzione t al livello di signi…catività pre…s-sato, allora si deve ri…utare l’ipotesi nulla, altrimenti non è possibileri…utare la restrizione.

² Approccio basato sul test  F . L’intuizione del test è la stessa di quelladell’esempio 1.

Modello non ristretto:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

Modello ristretto:

yi = ¯ 0 + ¯ 1x1i + (1¡ ¯ 1) x2i + "i

da cuiyi ¡ x2i = ¯ 0 + ¯ 1 (x1i ¡ x2i) + "i

Page 96: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 96/228

 

96 capitolo 5

La costruzione del test procede poi come nell’esempio 1.

Esempio 3  (con m > 1). Si consideri il modello non ristretto

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + ¯ 3x3i + ¯ 4x4i + "i; i = 1;:::; 23

dove y rappresenta il consumo pro capite di pollo (in libbre), x1 il redditodisponibile pro capite, x2, x3, x4 il prezzo al dettaglio (sempre in libbre)della carne di pollo, di suino e di bovino. Tutte le variabili sono espresse inlogaritmi. L’ipotesi che si vuole sottoporre a test è se il consumo di carnedi pollo non dipenda dai prezzi della carne di suino e di bovino, cioè secarne di pollo, suino e bovino non siano prodotti sostituti (o eventualmente

complementari). In breveH 0 : ¯ 3 = ¯ 4 = 0

Il modello ristretto è quindi

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

Le stime del modello non ristretto e ristretto sono le seguenti

yi = 2; 19(0;16)

+ 0; 34(0;08)

x1i¡ 0; 50(0;11)

x2i+ 0; 15(0;10)

x3i+ 0; 09(0;10)

x4i

R2U  = 0; 9823

yi = 2; 03(0;12)

+ 0; 45(0;02)

x1i¡ 0; 38(0;06)

x2i

R2R = 0; 9801

A questo punto possiamo sottoporre a test l’ipotesi nulla calcolando lastatistica del test:

F  =RRSS ¡URSS 

mURSS 

n¡k

=

RRSS¡URSSTSS

mURSSTSS

n¡k

=

=

R2U ¡R2

R

m

1¡R2U n¡k

=

0;9823¡0;98012

1¡0;982318 = 1; 12

Dato che il valore critico della distribuzione (con ® = 0; 05) è:

F 2;18 = 3; 55

l’ipotesi nulla non è ri…utata.

Page 97: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 97/228

 

regressione trivariata 97

5.3.4. Stabilità strutturale dei parametri

Test di Chow . Consideriamo il seguente modello (non ristretto)

yi = ¯  pre0 + ¯  pre

1 x1i + ¯  pre2 x2i + "i con i = 1; 2;:::;n1

e

yi = ¯  post0 + ¯  post

1 x1i + ¯  post2 x2i + "i con i = n1 + 1; n1 + 2;:::;n1 + n2

dove la prima equazione si applica alle prime n1 osservazioni (periodo “pre”)e la seconda alle successive n2 osservazioni (periodo “post”).

Inoltre si assuma che:" pre

i » N (0; ¾2)

" posti » N (0; ¾2)

e che " prei e " post

i siano indipendentemente distribuiti. Un cambiamentostrutturale può implicare siano diverse:

(a) le intercette,

(b) le pendenze (o almeno una coppia di queste),

(c) le intercette e le pendenze (o almeno una coppia di queste).

Se non vi è cambiamento strutturale allora le due equazioni possonoessere combinate in un’unica equazione (modello ristretto):

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

Per sottoporre a test l’ipotesi nulla di assenza di cambiamento strutturale:

H 0 : ¯  pre0 = ¯  post

0

¯  pre1 = ¯  post

1

¯  pre

2

= ¯  post

2

contro l’ipotesi alternativa di cambiamento strutturale, si può utilizzare unapproccio basato sulla costruzione di un test F , analogo a quanto già vistonel caso di restrizione lineare sui parametri.

De…niamo con:URSS  pre la somma del quadrato dei residui nella prima equazione del

Page 98: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 98/228

 

98 capitolo 5

modello non ristretto (n1 osservazioni):

yi = ¯  pre0 + ¯  pre

1 x1i + ¯  pre2 x2i + " pre

i

URSS  post la somma del quadrato dei residui nella seconda equazionedel modello non ristretto (n2 osservazioni):

yi = ¯  post0 + ¯  post

1 x1i + ¯  post2 x2i + " post

i

RRSS  la somma del quadrato dei residui nel modello ristretto (n1 + n2

osservazioni):

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

La statistica:

F  =RRSS ¡(URSS pre+URSS post)

kURSS pre+URSS post

n1+n2¡2k

=RRSS ¡(URSS pre+URSS post)

3URSS pre+URSS post

n1+n2¡6

ha - sotto l’ipotesi nulla di assenza di cambiamento strutturale - una distri-buzione F  con k (al numeratore) e n1 + n2 ¡ 2k (al denominatore) gradi dilibertà. Se il valore calcolato della statistica F  eccede il valore critico delladistribuzione F  al livello di signi…catività pre…ssato, allora si deve ri…utare

l’ipotesi nulla, altrimenti non è possibile ri…utare la restrizione di assenza dicambiamento strutturale.L’intuizione è semplice: se l’ipotesi di assenza di cambiamento strut-

turale è “ragionevole” allora la somma dei quadrati del modello ristretto(RRSS ) non dovrebbe essere “troppo” più grande della somma dei quadratidei residui del modello non ristretto (URRS  pre + URRS  post).

Esempio.

yt = ¯  pre0 + ¯  pre

1 xt + "t; t = 1946;:::; 1954

yt = ¯  post0 + ¯  post

1 xt + "t; t = 1955;:::; 1963

dove y rappresenta il risparmio pro capite e x il reddito disponibile procapite. Il modello è stimato su dati inglesi per il periodo 1946-63 e l’obiettivoè veri…care se la relazione tra risparmio e reddito si è modi…cata tra la fase diricostruzione del II dopoguerra (pre: 1946-54) e il periodo successivo (post:1955-63).

Page 99: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 99/228

 

regressione trivariata 99

Stima del modello non ristretto

^yt = ¡0; 26

(0;31)+ 0; 05xt

(0;03); t = 1946;:::; 1954

RSS  = 0; 140^yt = ¡1; 75

(0;36)+ 0; 15xt

(0;02); t = 1955;:::; 1963

RSS  = 0; 193

Stima del modello ristretto

^yt = ¡1; 08

(0;15)

+ 0; 12xt

(0;01)

; t = 1946;:::; 1963

RSS  = 0; 572

Test di Chow

F  =RRSS ¡(URSS pre+URSS post)

kURSS pre+URSS post

n1+n2¡2k

=0;572¡(0;193+0;140)

20;193+0;140

9+9¡4= 5; 02

Dato che il valore critico della distribuzione (con ® = 0; 05) è:

F 2;14 = 3; 74

l’ipotesi nulla di assenza di cambiamento strutturale è ri…utata.

Test di stabilità con stime ricorsive (Cusum e Cusumsq). L’im-plementazione del test di Chow richiede la conoscenza della data in cui si èveri…cato il cambiamento strutturale. Vi sono altri test di stabilità dei para-metri che possono essere applicati anche in situazioni in cui non sia possibile(o non si voglia) …ssare esogenamente la data in base alla quale partizionareil campione. Questi test si basano sul metodo delle stime ricorsive.

Stime ricorsive. Dato il seguente modello

yt = ¯ 0 + ¯ 1x1t + ¯ 2x2t + "t; t = 1; 2; 3;:::;n

de…niamo conb30; b31; b32

gli stimatori OLS ottenuti utilizzando le prime 3 osservazioni. Analogamen-te, de…niamo con

b40; b41; b42

Page 100: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 100/228

 

100 capitolo 5

gli stimatori OLS ottenuti utilizando le prime 4 osservazioni. Procedendo in

questo modo per ogni parametro saranno disponibili n¡ 2 stime OLS.Residui ricorsivi. De…niamo con

 byt = bt¡10 + bt¡1

1 x1t + bt¡12 x2t

la previsione “un passo avanti” di yt. L’errore di previsione “un passo avanti”(detto anche residuo ricorsivo) è quindi

vt = byt ¡ yt = (bt¡10 ¡ ¯ 0) + (bt¡1

1 ¡ ¯ 1)x1t + (bt¡12 ¡ ¯ 2)x2t ¡ "t

De…niamo la varianza dell’errore di previsione (o del residuo ricorsivo) come

V ar(vt) = V ar( byt ¡ yt)

= ¾2(1 +1

t¡ 1+

(x1t ¡ x1)2

S 11¡

1¡ r212¢ +

(x2t ¡ x2)2

S 22¡

1¡ r212¢ +

¡2r212 [(x1t ¡ x1) (x2t ¡ x2)]

S 12¡

1¡ r212¢ ) = ¾2V 

dove tutte le variabili campionarie utilizzate nel calcolo delle varianze e co-varianze degli stimatori (x1; x2; S 11; S 22; S 12; r212) sono calcolate utilizzandole prime t¡ 1 osservazioni.

Residui ricorsivi “standardizzati”. I residui ricorsivi “standardizzati”sono de…niti comewt =

vtp V 

sotto l’ipotesi nulla che i parametri siano costanti nel tempo wt s N (0; ¾2).Inoltre i residui ricorsivi “standardizzati” sono tra loro indipendenti.

Test Cusum. La statistica Cusum è semplicemente

W t =tP

 j=k+1

w j

s; t = k + 1;:::;n

s = r RSS n¡ k

Sotto l’ipotesi nulla di stabilità strutturale, E (W t) = 0 e varianza approssi-mativamente eguale al numero di residui ricorsivi nella somma. Se viceversai parametri non sono costanti, W t tenderà a divergere da 0. Il test è realiz-zato costruendo degli intervalli di con…denza per E (W t) e plottando W t e

Page 101: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 101/228

 

regressione trivariata 101

gli estremi dell’intervallo di con…denza rispetto a t. La signi…catività della

distanza da 0 viene veri…cata utilizzando due linee rette che passano daiseguenti punti

(k;§ap 

n¡ k)

(n;§3ap 

n¡ k)

dove il parametro a dipende dal livello di signi…catività scelto per il test.

® = 0; 01 ! a = 1; 143

® = 0; 05 ! a = 0; 948

® = 0; 10

!a = 0; 850

Se i valori di W t sono esterni all’intervallo, vi è evidenza contraria all’ipotesidi stabilità dei parametri.

Test Cusumsq. La statistica Cusumsq è

S t =

tP j=k+1

w2 j

nP j=k+1

w2 j

; t = k + 1;:::;n

Sotto l’ipotesi nulla di stabilità strutturale ciascuno dei due termini è ap-prossimativamente una somma di variabili chi-quadrato, ciascuna con ungrado di libertà. Quindi E (S t) = t¡k

n¡k . Come nel caso precedente, il testè realizzato costruendo degli intervalli di con…denza per E (S t) e plottandoS t e gli estremi dell’intervallo di con…denza rispetto a t. Se i valori di S tsono esterni all’intervallo, vi è evidenza contraria all’ipotesi di stabilità deiparametri.

Page 102: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 102/228

 

102 capitolo 5

-30

-20

-10

0

10

20

1970 1975 1980 1985 1990 1995

Cusum

Esempio relativo al test Cusum

-0.4

0.0

0.4

0.8

1.2

1970 1975 1980 1985 1990 1995

Cusumsq

Esempio relativo al test Cusumsq

Page 103: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 103/228

 

regressione trivariata 103

5.4. Previsione

Analogamente al modello bivariato, dopo aver stimato i parametri del mo-dello lineare trivariato

¡¯ 0; ¯ 1; ¯ 2; ¾2

¢è possibile utilizzarli per prevedere il

valore di y per ogni coppia di valori dati (x1; x2). Sia x10 il valore dato dix1 e sia x20 il valore dato di x2, la previsione del corrispondente valore diy0, de…nito come by0, è data da:

 by0 = b0 + b1x10 + b2x20

mentre il “vero” valore è

y0 = ¯ 0 + ¯ 1x10 + ¯ 2x20 + "0

dove "0 è l’usuale termine d’errore.Possiamo quindi de…nire l’errore di previsione come:

 by0 ¡ y0 = (b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x10 + (b2 ¡ ¯ 2) x20 ¡ "0

che ha valore atteso nullo, dal momento che:

E ( by0 ¡ y0) = [E (b0)¡ ¯ 0]+[E (b1)¡ ¯ 1] x10+[E (b2)¡ ¯ 2] x20¡E ("0) = 0

Ricordando che

V ar(b0) =¾2

n+ x1

2V ar (b1) + 2x1 x2Cov (b1; b2) + x22V ar (b2)

V ar(b1) =¾2

S 11¡

1¡ r212¢

V ar(b2) =¾2

S 22¡

1¡ r212¢

V ar("0) = ¾2

Cov (b0; b1) = ¡ [x1V ar (b1) + x2Cov (b1; b2)]

Cov (b0; b2) =

¡[x2V ar (b2) + x1Cov (b1; b2)]

Cov (b1; b2) = ¡ ¾2r212S 12

¡1¡ r212

¢la varianza dell’errore di previsione

V ar ( by0 ¡ y0) = V ar [(b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x10 + (b2 ¡ ¯ 2) x20 ¡ "0]

Page 104: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 104/228

 

104 capitolo 5

può essere riscritta, come

V ar ( by0 ¡ y0) =¾2

n+ x1

2V ar (b1) + 2x1 x2Cov (b1; b2) + x22V ar (b2)

+x210V ar (b1) + x2

20V ar (b2) + ¾2

¡2x10 [x1V ar (b1) + x2Cov (b1; b2)]

¡2x20 [x2V ar (b2) + x1Cov (b1; b2)]

+2x10x20Cov (b1; b2)

e quindi

V ar ( by0 ¡ y0) = ¾2 +¾2

n+(x2

10 + x12 ¡ 2x10x1) V ar (b1)

+(x220 + x2

2 ¡ 2x20x2) V ar (b2)

+2 (x10x20 + x1 x2 ¡ x10x2 ¡ x20x1) Cov (b1; b2)

In…ne

V ar (

 by0 ¡ y0) = ¾2

"1 +

1

n+

(x10 ¡ x1)2

S 11¡

1¡ r212¢ +

(x20 ¡ x2)2

S 22¡

1¡ r212¢

¡2r212

[(x10 ¡

x1

) (x20 ¡

x2

)]

S 12¡1¡ r212

¢ #Si osservi che la varianza dell’errore di previsione:

(a) è una funzione negativa del numero di osservazioni (n) come nel casobivariato ma

(b) non è necessariamente una funzione positiva della distanza tra x10 ex20 e le media delle osservazioni sulla cui base sono stati stimati iparametri del modello lineare trivariato (x1 e x2).

Nota la varianza dell’errore di previsione è possibile costruire un inter-vallo di previsione per y0, tale che dati x10 e x20, in (1¡ ®)100 su 100 casi,l’intervallo contiene il vero y0:

P r

µ¡t®

2;n¡3 ·

by0 ¡ y0se ( by0 ¡ y0)

· t®2

;n¡3

¶= 1 ¡ ®

Page 105: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 105/228

 

regressione trivariata 105

Alternativamente, invece di prevedere il valore di y0, dati x10 e x20, è

possibile prevedere il valore atteso di y0, cioè E (y0). Dato che:

E (y0) = ¯ 0 + ¯ 1x10 + ¯ 2x20

la previsione è ancora

 by0 = b0 + b1x10 + b2x20

Tuttavia, l’errore di previsione è diverso. Infatti:

 by0 ¡E (y0) = (b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x10 + (b2 ¡ ¯ 2) x20

Inoltre, il valore atteso dell’errore di previsione è sempre nullo, mentre lasua varianza è eguale a:

V ar [ by0 ¡E (y0)] = V ar [(b0 ¡ ¯ 0) + (b1 ¡ ¯ 1) x10 + (b2 ¡ ¯ 2) x20] =

= ¾2

Ã1

n+

(x10 ¡ x1)2

S 11¡

1¡ r212¢ +

(x20 ¡ x2)2

S 22¡

1¡ r212¢ ¡ 2

r212 [(x10 ¡ x1) (x20 ¡ x2)]

S 12¡

1¡ r212¢ !

Page 106: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 106/228

 

106 capitolo 5

5.5. Appendice : Stima econometrica di una funzione di produzione

Cobb-Douglas

² Modello lineare trivariato:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

"i » IN (0; ¾2)per i = 1; 2;:::;n

² Metodo dei minimi quadrati ordinari 

² Imprese 1-23  (n = 23)

² De…nizione delle variabili:

y = ln(output)

x1 = ln(lavoro)

x2 = ln(capitale)

² Informazioni campionarie (già predigerite):

n = 23

x1 = 10

x2 = 5y = 12

S 11 = 12

S 12 = 8

S 22 = 12

S 1y = 10

S 2y = 8

S yy = 10

² Domande a cui rispondere:

(a) Stimare i parametri ¯ 0, ¯ 1 e ¯ 2

(b) Calcolare il coe¢ciente di determinazione multiplo R2

(c) Stimare il parametro ¾2 e calcolare l’errore standard della regres-sione

Page 107: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 107/228

 

regressione trivariata 107

(d) Stimare le varianze e le covarianze degli stimatori b0, b1 e b2

(e) Calcolare gli errori standard di b0, b1 e b2.(f) Sottoporre a test disgiunto le seguenti ipotesi (livello di signi…ca-

tività del 5%)

H 0 : ¯ 0 = 0 contro H 1 : ¯ 0 6= 0

H 0 : ¯ 1 = 0 contro H 1 : ¯ 1 6= 0

H 0 : ¯ 2 = 0 contro H 1 : ¯ 2 6= 0

(g) Sottoporre a test l’ipotesi (utilizzando sia l’approccio basato sultest t, sia quello basato sul test F ; livello di signi…catività 5%)

H 0 : ¯ 1 + ¯ 2 = 1 contro H 1 : ¯ 1 + ¯ 2 6= 1

(h) Calcolare il coe¢ciente di determinazione multiplo “aggiustato”R2.

(i) Sottoporre a test la signi…catività della regressione (livello disigni…catività del 5%)

Soluzione

(a) Date le equazioni normali per b1 e b2

S 1y = b1S 11 + b2S 12

S 2y = b1S 12 + b2S 22

possiamo scrivere10 = b1 (12) + b2 (8)

8 = b1 (8) + b2 (12)

da cui:b1 = 0; 7

b2 = 0; 2

b0 = y ¡ b1x1 ¡ b2x2 = 4

(b) Utilizzando la de…nizione del coe¢ciente di determinazione multiplo

R2 = 1 ¡ RSS 

T SS =

ESS 

T SS =

b1S 1y + b2S 2y

S yy=

0; 7 (10) + 0; 2(8)

10= 0; 86

Page 108: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 108/228

 

108 capitolo 5

(c) Ricordando la de…nizione dell’errore standard della regressione

s =

r RSS 

n¡ 3=

r 1; 4

23¡ 3=p 

0; 07 = 0; 2646

(d) Calcoliamo prima il coe¢ciente di correlazione semplice tra x1 e x2:

r12 =S 12p 

S 11S 22=

8p 12 (12)

=8

12= 0; 666

È ora possibile calcolare tutte le varianze e covarianze (stimate) (siosservi che ¾2 è stato rimpiazzato da s2)

 \ V ar (b1) =s2

S 11¡

1¡ r212¢ =

0; 07

12(1¡ 0; 444)= 0; 0105

 \ V ar (b2) =s2

S 22¡

1¡ r212¢ =

0; 07

12(1¡ 0; 444)= 0; 0105

 \ Cov (b1; b2) = ¡ s2r212S 12

¡1¡ r212

¢ = ¡ 0; 07(0; 444)

8 (1¡ 0; 444)= ¡0; 0070

 \ V ar (b0) =

s2

n + x12\ 

V ar (b1) + 2x1x2\ 

Cov (b1; b2) + x22\ 

V ar (b2) =

=0; 07

23+ 102 (0; 0105) + 2 (10) (5) (¡0; 0070) + 52 (0; 0105) = 0; 6155

 \ Cov (b0; b1) = ¡h

x1\ V ar (b1) + x2

\ Cov (b1; b2)i

= ¡10(0; 0105)¡5 (¡0; 0070) = ¡0; 07

 \ Cov (b0; b2) = ¡h

x2\ V ar (b2) + x1

\ Cov (b1; b2)i

= ¡5 (0; 0105)¡10 (¡0; 0070) = 0; 0175

(e) Gli errori standard di b0, b1 e b2 sono calcolabili semplicemente come:

se (b0) = q \ V ar (b0) = p 0; 6155 = 0; 7846

se (b1) =

q \ V ar (b1) =

p 0; 0105 = 0; 1025

se (b2) =

q \ V ar (b2) =

p 0; 0105 = 0; 1025

Page 109: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 109/228

 

regressione trivariata 109

(f) Le seguenti statistiche hanno tutte - sotto le ipotesi nulle - distribu-

zione t di Student con n¡ 3 gradi di libertàb0 ¡ 0

se (b0)=

4; 0

0; 7846= 5; 10

b1 ¡ 0

se (b1)=

0; 7

0; 1025= 6; 83

b2 ¡ 0

se (b2)=

0; 2

0; 1025= 1; 95

Dato che il valore critico della distribuzione è:

t®2 ; n¡3 = t0;025; 20 = 2; 086

l’ipotesi nulla è ri…utata per b0 e b1 ma non per b2.

(g) La seguente statistica ha - sotto l’ipotesi nulla - distribuzione t diStudent con n¡ 3 gradi di libertà

b1 + b2 ¡ 1

se (b1 + b2)=

(0; 2 + 0; 7)¡ 1p 0; 0105 + 0; 0105 + 2 (¡0; 0070)

= ¡ 0; 1p 0; 007

= ¡1; 195

L’ipotesi nulla di ritorni costanti di scala non è quindi ri…utata. Datoil modello non ristretto

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

imponiamo la restrizioneyi = ¯ 0 + ¯ 1x1i + (1¡ ¯ 1)x2i + "i

yi ¡ x2i = ¯ 0 + ¯ 1(x1i ¡ x2i) + "i

Dopo aver stimato anche il modello ristretto

^yi ¡ x2i = 3; 15

(0;75)+ 0; 77

(0;08)(x1i ¡ x2i)

RSS  = 1; 5

possiamo sottoporre a test l’ipotesi nulla utilizzando l’approccio basatosul test F 

F  =RRSS 

¡URSS 

mURSS 

n¡k

=1;5¡1;4

11;420

= 1; 43

Dato che il valore critico della distribuzione (con ® = 0; 05) è:

F 1;20 = 4; 35

l’ipotesi nulla non è ri…utata.

Page 110: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 110/228

 

110 capitolo 5

(h) Utilizzando la de…nizione del coe¢ciente di determinazione multiplo

“aggiustato”

R2 = 1 ¡µ

RSS 

T SS 

¶n¡ 1

n¡ k= 1¡ 0; 14£ 22

20= 0; 846

(i) La seguente statistica ha - sotto ipotesi nulla - distribuzione F  diFisher con k¡ 1 gradi di libertà al numeratore e n¡k gradi di libertàal denominatore:

F  =ESS k¡1RSS n¡

k

=

ESSTSS

k¡1RSSTSS

n¡k

=R2

k¡11¡R2

k

=0;862

0;1420

= 61; 43

Dato che il valore critico della distribuzione (con ® = 0; 05) è:

F 2;20 = 3; 49

l’ipotesi nulla è ri…utata.

Page 111: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 111/228

 

regressione trivariata 111

5.6. Esercizi

1. Data la seguente stima a minimi quadrati ordinari condotta su uncampione di 123 osservazioni si sottoponga a veri…ca l’ipotesi nullache ¯ 1 + ¯ 2 = 1.

 byi = 1; 12 + 0; 70x1i + 0; 60x2i

Matrice di covarianza stimatab0 b1 b2

b0 0; 33 ¡0; 08 0; 13b1 ¡0:08 0; 15 0; 10

b2 0; 13 0; 10 0; 12

2. Un econometrico vuole stimare l’e¤etto della spesa per studente inattrezzature (biblioteche, laboratori, ecc.) sul voto medio che gli stu-denti di diverse scuole medie hanno ottenuto ad un esame comune. Atal …ne prevede di stimare la seguente equazione:

yi = ¯ 0 + ¯ 1x1i + "i

dove y rappresenta il voto medio e x1 la spesa media per studente.Un altro econometrico critica tale procedimento e sostiene invece chel’e¤etto della spesa media per studente sul voto medio deve essere

stimata basandosi sulla seguente regressione:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

dove x2 misura il tasso di povertà degli studenti iscritti a ciascunascuola. In caso contrario, commenta, si otterrebbe una stima distortadi ¯ 1.

(a) Qual è la fondatezza di tale critica?

(b) Se è vera ci si può aspettare che la distorsione sia positiva onegativa?

3. Dato il modello non ristretto:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + ¯ 3x3i + ¯ 4x4i + "i

ad un econometrico viene richiesto di sottoporre a test congiunto leseguenti due restrizioni: ¯ 1 = 2 ¯ 2 e ¯ 3 = 0; 5 ¯ 4.

Page 112: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 112/228

 

112 capitolo 5

(a) Si scriva il modello ristretto.

(b) Supponendo inoltre che: n = 45, URSS = 130, RRSS  = 165 sisottopongano a test congiunto le due restrizioni (® = 0; 05).

4. La relazione tra consumo di prodotti alimentari (y), prezzo reale deiprodotti alimentari (x1i) e reddito dei consumatori (x2i) è stata stima-ta per il periodo 1927/41-1948/62 e poi separatamente per il periodoche precede e per quello che segue la seconda guerra mondiale. Sisottoponga a test l’ipotesi di assenza di “break strutturale” tra i dueperiodi.Stima sull’intero periodo

yi =4; 05(0;14)

¡0; 12(0;01)

x1i+ 0; 24(0;10)

x2i; RSS  = 0; 287

Stima sul periodo 1927/41

yi =3; 56(0;20)

¡ 0; 10(0;05)

x1i+ 0; 30(0;02)

x2i; RSS  = 0; 115

Stima sul periodo 1948/62

yi =5; 05(0;90)

¡ 0; 16(0;06)

x1i+ 0; 14(0;05)

x2i; RSS  = 0; 054

Page 113: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 113/228

 

Capitolo 6

Elementi di algebra lineare

6.1. De…nizioni di base

Matrice : insieme rettangolare di elementi disposti in righe e colonne. Inparticolare, una matrice A di ordine  N £K è una matrice di N £K  elementi,disposti su N  righe e K  colonne:

A(N £K )

=

0B@ a11...

aN 1

:::...

:::

a1K 

...aN K 

1CA = [aij]

dove aij è il generico elemento della matrice (i-esima riga e j-esima colonna).

Vettore colonna  (di ordine N ): matrice di ordine N £ 1

x =

0

B@x1...

xN 

1

CAVettore riga  (di ordine K ): matrice di ordine 1£K 

y = (y1 y2 ::: yK )

Page 114: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 114/228

 

114 capitolo 6

Matrice trasposta : la matrice trasposta A0 di una matrice A di ordine

N £K  è una matrice di ordine K £N  ottenuta sostituendo le colonne (o lerighe) con le righe (o le colonne) di A.

A = (a1 a2 ::: aK ) ! A0 =

0BBB@a01a02...

a0K 

1CCCANe consegue che la matrice trasposta di un vettore colonna x è un vettoreriga:

x0 = (x1 x2 ::: xN )

Sottomatrici : data una matrice A di ordine N £ K , se tutte le righe ecolonne sono cancellate con l’eccezione di r righe e s colonne, la matricerisultante è de…nita una sottomatrice di A di ordine r £ s.

Page 115: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 115/228

 

algebra lineare 115

6.2. Matrici notevoli

Matrice quadrata : una matrice A di ordine N £ N  è de…nita matricequadrata

A =

0BBB@a11a21

...aN 1

a12a22

...aN 2

::::::...

:::

a1N 

a2N 

...aNN 

1CCCAMatrice diagonale: una matrice quadrata con almeno un elemento nonnullo sulla diagonale principale e tutti elementi nulli al di fuori di essa ède…nita matrice diagonale

A =

0BBB@a11

0...0

0a22

...0

::::::...

:::

00...

aNN 

1CCCAdove almeno un elemento aij con i = j è diverso da zero.

Matrice scalare: una matrice diagonale i cui elementi sulla diagonaleprincipale sono tutti uguali è de…nita matrice scalare

A = 0BBB@a

0...0

0

a...0

:::

:::...:::

0

0...a

1CCCAMatrice identità : una matrice diagonale i cui elementi sulla diagonaleprincipale sono tutti uguali a 1 è de…nita matrice identità I (quindi la matriceidentità è anche una matrice scalare)

I =

0

BBB@10...

0

01...

0

::::::...

:::

00...

1

1

CCCAMatrice simmetrica : una matrice quadrata è de…nita simmetrica se l’e-lemento aij è uguale all’elemento a ji per ogni i e j. In questo caso A0= A.

Matrice nulla : una matrice A di ordine N £ K  è de…nita matrice nulla0 se tutti i suoi elementi sono nulli (segue naturalmente la de…nizione di

Page 116: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 116/228

 

116 capitolo 6

vettore nullo)

0 =

[email protected]

00...0

::::::...

:::

00...0

1CCCAUguaglianza fra matrici : due matrici A e B sono uguali se: i ) sono dellostesso ordine, ii ) aij = bij per tutti gli i e j.

Page 117: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 117/228

 

algebra lineare 117

6.3. Operazioni fra matrici

6.3.1. Addizione

Sia A = [aij] e B = [bij]. Se A e B sono dello stesso ordine, allora la matriceaddizione C è de…nita da

C = A + B

dove C è dello stesso ordine di A e B e cij = aij + bij.

6.3.2. Sottrazione

Sia A = [aij] e B = [bij]. Se A e B sono dello stesso ordine, allora la matrice

sottrazione C è de…nita daC = A¡B

dove C è dello stesso ordine di A e B e cij = aij ¡ bij.

6.3.3. Moltiplicazione per uno scalare

Data una matrice A e uno scalare ¸, il loro prodotto è una matrice B dellostesso ordine di A, dove

bij = ¸ aij

6.3.4. Moltiplicazione fra vettori e fra matriciProdotto interno fra vettori : de…niti due vettori colonna

a =

0B@ a1...

aN 

1CA e b =

0B@ b1...

bN 

1CAil prodotto interno (inner product) dei vettori è dato da uno scalare:

a0b =N 

Xi=1 aibi = a1b1 + a2b2 + ::: + aN bN 

Da notare:

1. a0b = b0a

2. a0a =PN 

i=1 a2i

Page 118: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 118/228

 

118 capitolo 6

Prodotto fra matrici : date una matrice A di ordine N 

£K  e una matrice

B di ordine K £ M , il loro prodotto AB (A è postmoltiplicata da B) ècostituito da una matrice C di ordine N £M  tale che

cij =K X

k=1

aik bkj

Si osservi che il prodotto AB esiste perchè il numero delle colonne di A èuguale al numero delle righe di B (le due matrici sono conformabili  per lamoltiplicazione). Viceversa, il prodotto BA (B è postmoltiplicata da A)non esiste.

Date le seguenti due matrici conformabili per la moltiplicazione (NB:dato l’ordine delle matrici la matrice prodotto risulta quadrata):

A(N £K )

=

0B@ a11...

aN 1

:::...

:::

a1K 

...aNK 

1CA e B(K £N )

=

0B@ b11...

bK 1

:::...

:::

b1N 

...bKN 

1CApossiamo vedere il loro prodotto in due modi utili.

(a) Riscriviamo le due matrici utilizzando vettori riga e vettori colonna:

A(N £K )

= 0B@ a1

...aN 

1CA e B(K £N )

= (b1 ::: bN )

dove ai denota la i -esima riga  di A e b j la j -esima colonna  di B:Abbiamo:

C(N £N )

=

0BBB@

c11c21

...cN 1

c12c22

...cN 2

::::::...

:::

c1N 

c2N 

...cN N 

1CCCA

=

0BBB@

a1b1

a2b1...

aN b1

a1b2

a2b2...

aN b2

::::::...

:::

a1bN 

a2bN 

...aN bN 

1CCCACiascun elemento della matrice C è ottenuto come prodotto interno

di un vettore riga di A e di un vettore colonna di B:

(b) Esprimiamo entrambe le matrici utilizzando vettori colonna:

A(N £K )

= (a1 ::: aK ) e B(K £N )

= (b1 ::: bN )

Page 119: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 119/228

 

algebra lineare 119

Anche la matrice prodotto C sarà espressa mediante vettori colonna:

C(N £N )

= (c1 ::: cN )

dove ogni colonna di C è ottenuta come combinazione lineare delle K colonne di A utilizzando come coe¢cienti gli elementi della corrispon-dente colonna di B. Ad esempio, per la prima colonna della matriceprodotto c1 abbiamo:

c1 = a1b11 + a2b21 + ::: + aK bK 1 ) c1 = A b1

Complessivamente:

C(N £N )

= (A b1 A b2 ::: A bN )

Proprietà del prodotto fra matrici :

(i) La moltiplicazione fra matrici non è necessariamente commutativa;generalmente, infatti, AB 6= BA.

(ii) Anche se AB e BA esistono entrambe, non saranno dello stesso ordinea meno che A e B siano entrambe matrici quadrate.

(iii) Anche se A e B sono entrambe quadrate, AB e BA, pur essendo dellostesso ordine, non sono necessariamente uguali.

(iv) Il prodotto fra un vettore colonna (N £ 1) e un vettore riga (1£N ) èuna matrice (N £N ).

(v) Il prodotto fra una matrice (N £ N ) e un vettore colonna (N £ 1) èun vettore colonna (N £ 1).

(vi) Il prodotto fra un vettore riga (1 £ N ) e una matrice (N £ N ) è unvettore riga (1£N ).

(vii) La moltiplicazione fra matrici è associativa: date tre matrici A (N £K ), B (K £M ) e C (M £ P ), vale che (AB) C = A (BC).

(viii) La moltiplicazione fra matrici è distributiva rispetto all’addizione: da-te tre matrici A (N  £ K ), B (K £ M ) e C (K £ M ), vale cheA(B + C) = AB + AC.

Page 120: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 120/228

 

120 capitolo 6

6.3.5. Trasposizione di una matrice

(i) La trasposta di una matrice trasposta è la matrice originale: (A0)0 =A.

(ii) La trasposta di una somma è uguale alla somma delle trasposte: seC = A + B allora C0 = (A + B)0 = A0 + B0.

(iii) La trasposta di un prodotto è uguale al prodotto delle trasposte inordine inverso: (AB)0 = B0A0. Questa proprietà è generalizzabilecome segue: (ABCD)0 = D0C0B0A0.

(iv) La trasposta della matrice identità è la matrice identità: I0 = I.

(v) La trasposta di uno scalare è lo scalare stesso: ¸0 = ¸.

(vi) La trasposta di (¸A)0 = ¸A0.

6.3.6. Inversione di una matrice

L’inversa di una matrice quadrata A è de…nita A¡1. Se esiste, è una matricequadrata tale che

AA¡1 = A¡1A = I

dove I è una matrice identità dello stesso ordine di A.

Proprietà della matrice inversa :

(i) L’inversa del prodotto di due matrici è uguale al prodotto delle inversein ordine inverso: (AB)¡1 = B¡1A¡1.

(ii) La trasposta dell’inversa di A è uguale all’inversa della trasposta diA: (A¡1)0 = (A0)¡1.

6.3.7. Determinante

Ad ogni matrice quadrata è associato uno scalare, noto come determinante della matrice, det A o jAj. Se la matrice quadrata è di ordine 2£ 2:

jAj = a11a22 ¡ a12a21

Se la matrice quadrata è di ordine 3£ 3:

jAj = a11a22a33¡ a11a23a32 + a12a23a31¡ a12a21a33 + a13a21a32¡ a13a22a31

Proprietà del determinante:

Page 121: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 121/228

 

algebra lineare 121

(i) Una matrice il cui determinante è zero è de…nita matrice singolare .

L’inversa di una matrice singolare non esiste. Se invece il determinanteè diverso da zero, la matrice è de…nita non-singolare .

(ii) Se tutti gli elementi di una riga o una colonna sono uguali a zero allorail determinante è zero.

(iii) Il determinante di una matrice è uguale al determinante della traspo-sta: jAj = jA0j

(iv) Se due righe o due colonne di una matrice sono uguali allora il deter-minante è zero.

(v) Se una riga o una colonna è combinazione lineare di altre righe ocolonne allora il determinante è zero.

(vi) Il determinante del prodotto di due matrici è uguale al prodotto deideterminanti: jABj = jAj jBj.

Rango di una matrice: il rango di una generica matrice A è l’ordine dellapiù grande sottomatrice quadrata il cui determinante non è uguale a zero.Ad esempio, il rango di una matrice A di ordine N £K  (con K · N ) è K se il determinante di almeno una delle sottomatrici K £K  non è uguale a

zero.Minori : data una matrice quadrata A di ordine N £N , si cancellino la rigai-esima e la colonna j-esima. Il determinante della risultante sottomatricequadrata di ordine (N ¡ 1)£ (N ¡ 1) è de…nito minore dell’elemento aij edè scritto come jMijj.Cofattori : il cofattore di un elemento aij di una matrice quadrata A diordine N £N  è scritto come cij ed è calcolato come

cij = (¡1)i+ j jMijj

Matrice dei cofattori : data una matrice A, la matrice dei cofattori di  A,cof (A), si ottiene sostituendo gli elementi aij con i corrispondenti cij

Matrice aggiunta : la matrice aggiunta di  A, adj (A), è la trasposta dellamatrice dei cofattori:

adj (A) = (cof (A))0

Page 122: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 122/228

 

122 capitolo 6

Calcolo dell’inversa : se A è quadrata e non singolare la sua inversa può

essere calcolata come segue:

A¡1 =1

jAj adj (A)

Page 123: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 123/228

 

algebra lineare 123

6.4. Applicazioni utili del prodotto fra vettori e fra matrici

1. Somma e media . De…niamo un vettore colonna i interamente com-posto da elementi pari ad 1. Dato un vettore x della stessa dimensionepossiamo ottenere la somma degli elementi di x mediante il prodotto

i0x =N X

i=1

xi

e quindi la media aritmetica degli elementi di x, ¹x , può essere espressacome

¹x = 1n

N Xi=1

xi = 1n

i0x

2. Cross products. Somme di quadrati e somme di prodotti incrociati(cross products ) possono essere espresse facilmente usando prodotti fravettori. Dati i vettori x e y (entrambi con N  elementi) abbiamo

N Xi=1

x2i = x0x

N Xi=1

xiyi = x0y

3. Matrice di cross products . Data una matrice X di dimensione N £K  costruiamo il prodotto X0X, una matrice quadrata di dimensioneK :

X0X =

0BBB@x01x02...

x0K 

1CCCA0@ x1 x2 ::: xK 

1A =

0BBB@x01x1

x02x1...

x0K x1

x01x2

x02x2...

x0K x2

::::::...

:::

x01xK 

x02xK 

...x0K xK 

1CCCA

= 0BBB@ PN i=1 x2

i1

PN i=1 xi2xi1

...PN i=1 xiK xi1

PN i=1 xi1xi2

PN i=1 x2

i2

...PN i=1 xiK xi2

::::::

...:::

PN i=1 xi1xiK 

PN i=1 xi2xiK 

...PN i=1 x2

iK 

1CCCA4. Deviazioni dalla media . Partendo da un vettore di N  dati origi-

nari, per costruire il corrispondente vettore di deviazioni dalla media 

Page 124: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 124/228

 

124 capitolo 6

possiamo utilizzare la relazione:

i ¹x = i1

ni0 x =

0BBB@¹x¹x...¹x

1CCCA =1

nii0 x

notando che ii0 è una matrice con tutti gli elementi pari ad 1 e quindi1n ii0 è una matrice con tutti gli elementi pari a 1

n . Il vettore di devia-zioni dalla media può essere espresso (ricordando che x = Ix; dove I èla matrice identità):

0BBB@x1 ¡ ¹x

x2 ¡ ¹x...xN ¡ ¹x

1CCCA = x¡ i ¹x = x¡ 1n

ii0 x

= Ix¡ 1

nii0 x =

·I¡ 1

nii0¸

  | { z } M0

x

= M0 x

dove M0 è la seguente matrice simmetrica

M0 = 0BBB@1

¡1n

¡ 1n...¡ 1

n

¡1n

1¡ 1n...¡ 1

n

:::

:::...:::

¡1n

¡ 1n...

1¡ 1n

1CCCAche, moltiplicata per un vettore x, permette di ottenere il corrispon-dente vettore di deviazioni dalla media degli elementi di x.

5. Utilizzo e proprietà di  M0. La matrice M0 è utilizzabile percostruire direttamente somme di quadrati delle deviazioni dalla media:

Xi=1(xi ¡ ¹x)2 =

¡M0x

¢0

¡M0x

¢= x0 M0 M0 x

ricordando che M0 è simmetrica. Inoltre, M0 è una matrice idempo-tente , possedendo la seguente proprietà: M0 M0 = M0 (veri…care).Quindi otteniamo:

N Xi=1

(xi ¡ ¹x)2 = x0 M0 x

Page 125: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 125/228

 

algebra lineare 125

Estendendo l’applicazione, dati due vettori di N  elementi x e y, la

matrice che contiene i quadrati delle deviazioni dalle medie e i prodottiincrociati di tali deviazioni si ottiene utilizzando M0:Ã PN 

i=1(xi ¡ ¹x)2PN i=1(yi ¡ ¹y)(xi ¡ ¹x)

PN i=1(xi ¡ ¹x)(yi ¡ ¹y)PN 

i=1(yi ¡ ¹y)2

!=

µx0 M0 x

y0 M0 x

x0 M0 y

y0 M0 y

¶Combinando i due vettori in una matrice Z = [x y] (di dimensioni N £2) possiamo riscrivere lo stesso risultato nella forma seguente:¡

M0Z¢0 ¡

M0Z¢

= Z0 M0 M0 Z = Z0 M0 Z

6. Altri esempi di matrici idempotenti  (oltre a M0). Data unamatrice A (di ordine N £ K ) le matrici B e C (di ordine N £ N )de…nite come

B = A¡

A0A¢¡1

A0

C = I¡A¡

A0A¢¡1

A0

sono idempotenti. Esercizio: veri…care che le due matrici B e C sonoidempotenti; veri…care inoltre che CB = 0).

Page 126: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 126/228

 

126 capitolo 6

6.5. Dipendenza e indipendenza lineare di vettori

Un insieme di vettori è detto linearmente dipendente se ciascuno dei vettoripuò essere espresso come combinazione lineare degli altri vettori. Ad esem-pio, tre vettori a, b e c sono linearmente dipendenti se è possibile costruireuna loro combinazione lineare

k1a + k2b + k3c = 0

con coe¢cienti k non tutti nulli. In questo caso è possibile esprimere adesempio il vettore c (se k3 6= 0 ) come combinazione lineare di a e b: c =¡k1

k3a ¡ k2

k3b. Se invece per soddisfare l’equazione k1a + k2b + k3c = 0

tutti i coe¢cienti k devono essere nulli, allora i vettori si dicono linearmenteindipendenti.Nel caso di vettori con due  elementi, questi concetti hanno una semplice

interpretazione geometrica. I due elementi di ciascun vettore sono rappresen-tabili come coordinate di un punto in uno spazio bidimensionale (collegatoall’origine degli assi in un piano cartesiano). Moltiplicando un vettore peruno scalare k si ottiene un “allungamento” o “accorciamento” del vettorelungo la medesima direzione; la somma di due vettori è data da un nuovovettore che ha come coordinate le somme delle rispettive coordinate dei duevettori. Nella Figura 1 sono rappresentati due vettori, a e b, il vettore 2b eil vettore somma a + b.

Figura 1

Page 127: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 127/228

 

algebra lineare 127

Nel caso bidimensionale, due vettori sono linearmente dipendenti se giac-

ciono sulla stessa retta uscente dall’origine: ciascuno di essi può quindi essereespresso come semplice multiplo dell’altro, come nel caso dei vettori b e 2b

in …gura. Se invece due vettori non giacciono sulla stessa retta, come nelcaso di a e b, allora l’uno non può essere espresso come multiplo dell’altroe l’unica soluzione dell’equazione k1a + k2b = 0 è k1 = k2 = 0. In questocaso i due vettori sono linearmente indipendenti e ogni altro vettore a dueelementi può essere costruito mediante una combinazione lineare di a e b.

Costruendo la matrice A = (a b) è possibile ottenere un’intuizione geo-metrica della relazione fra il determinante di A e la dipendenza o indipen-denza lineare dei vettori colonna che la compongono. Come rappresentatonella Figura 2, il determinante della matrice A (più rigorosamente, il valo-

re assoluto del determinante di A) ha l’interpretazione geometrica di areadel parallelogramma formato dalle sue colonne. Se i due vettori a e b so-no linearmente dipendenti (cioè giacciono sulla stessa retta) allora l’area ènulla ) det(A) = 0. Se invece, come in …gura, le colonne della matriceA sono linearmente indipendenti, allora il determinante è diverso da zero.Come ulteriore prova di questa relazione, notiamo che det(A) = a1b2¡b1a2.Quindi

det(A) = 0 ) a1b2 ¡ b1a2 = 0 ) a1a2

=b1b2

cioè le due colonne di A sono l’una un multiplo dell’altra (geometricamentegiacciono sulla stessa retta).

Figura 2

Page 128: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 128/228

 

128 capitolo 6

6.6. Forme lineari e forme quadratiche

Dati due vettori a e x di ordine N £1 e una matrice A simmetrica di ordineN £N 

L = a0x =N X

i=1

ai xi

è de…nita forma lineare in  x, e

Q = x0A x

è de…nita forma quadratica in  x.

Matrici de…nite positive e de…nite negative . Data una matrice qua-drata simmetrica A di ordine N £ N  e un vettore non nullo x di ordineN £ 1, e de…nita la forma quadratica Q = x0A x, la matrice A è:

de…nita positiva  se Q > 0, semide…nita positiva  se Q ¸ 0

de…nita negativa  se Q < 0, semide…nita negativa  se Q · 0

Si de…nisca ora una matrice non quadrata A di ordine K £N . Sia AA0 siaA0A sono matrici quadrate simmetriche di ordine rispettivamente K £K  eN £ N . Si può dimostrare che entrambe queste matrici sono semide…nitepositive. De…niamo B = A0A. Quindi

x0B x = x0A0A x

De…niamo oray = A x

possiamo quindi scrivere che

x0B x = x0A0A x = y0y =K X

i=1

y2i ¸ 0:

Esempio di forma quadratica per matrice X0X. De…niamo la seguentematrice X di ordine N £ 2 e la sua trasposta:

X = (x1 x2) ; X0 = µ x01x02¶

da cui otteniamo la matrice prodotto X0X simmetrica di ordine 2£ 2:

X0X =

µx01x02

¶( x1 x2) =

µx01x1

x02x1

x01x2

x02x2

Page 129: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 129/228

 

algebra lineare 129

Dato un vettore a = µ a1

a2 ¶, costruiamo la forma quadratica di X0X:

a0(X0X) a = (a1 a2)

µx01x1

x02x1

x01x2

x02x2

¶ µa1a2

= (a1 a2)

µ(x01x1) a1 + (x01x2) a2(x02x1) a1 + (x02x2) a2

¶= (x01x1) a21 + (x01x2) a2a1 + (x02x1) a1a2 + (x02x2) a22

= a

2

1

Xi=1 x

2

i1 + 2a1a2

Xi=1 xi1xi2 + a

2

2

Xi=1 x

2

i2

Ad esempio, nel caso in cui N  = 2, si ottiene

a0(X0X) a = (a1x11 + a2x12)2 + (a1x21 + a2x22)2

Forme quadratiche con matrici idempotenti . Come già visto, unamatrice A è de…nita idempotente se A2 = A. Sia

x =

0@

x1

:::xN 

1A

un vettore di N  variabili casuali normali indipendenti con valore atteso 0 evarianza 1. La forma quadratica x0x ha una distribuzione Â2 con N  gradidi libertà. Si può dimostrare inoltre che:

(i) se A è una matrice idempotente di ordine N £N  e di rango r allora laforma quadratica x0A x ha una distribuzione Â2 con r gradi di libertà;

(ii) se A e B sono due matrici idempotenti di ordine N £N  e di rango re s rispettivamente e se AB = 0, allora le forme quadratiche x0A x ex0B x sono distribuite in modo indipendente, con distribuzioni Â2 con

r e s gradi di libertà.

Esempio: dato il vettore x »N (0; I) di ordine n£ 1,

nXi=1

(xi ¡ ¹x)2 = x0 M0 x

Page 130: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 130/228

 

130 capitolo 6

con

M0 =

0BBB@1¡ 1

n

¡ 1n

...¡ 1

n

¡ 1n

1¡ 1n

...¡ 1

n

::::::...

:::

¡ 1n

¡ 1n

...1¡ 1

n

1CCCAmatrice singolare  di ordine n £ n e rango n ¡ 1 (poichè le colonne di M0

sono linearmente dipendenti: m1 + m2 + ::: + mn = 0), abbiamo

n

Xi=1(xi ¡ ¹x)2 » Â2(n¡ 1)

Page 131: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 131/228

 

algebra lineare 131

6.7. Esercizi

1. Confrontate i risultati ottenuti dalla moltiplicazione di una matricequadrata A per:

(a) uno scalare ¸

(b) una matrice così ottenuta: ¸I

(c) una matrice (dello stesso ordine di A)

¤ =

0

BBB@¸¸..

.

¸¸..

.

::::::..

.:::

¸¸..

.

1

CCCA2. Dato un vettore x con N  elementi, veri…cate la relazione algebrica

esistente fra:

(a) la somma del quadrato degli scarti dalla media ¹x, e

(b) la somma dei quadrati degli elementi di x.

3. Considerate il vettore x »N (0; I) di ordine n £ 1, dove gli elementisono variabili casuali indipendenti. Utilizzando la relazione algebrica

fra x0M0

x e x0x (dalla risposta all’Esercizio 2 ):(a) veri…cate che x0x è una forma quadratica costruita con una ma-

trice idempotente;

(b) esprimete x0x come somma di due forme quadratiche costruitecon matrici idempotenti;

(c) caratterizzate le distribuzioni di tali forme quadratiche veri…can-done l’indipendenza e speci…candone i gradi di libertà.

Page 132: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 132/228

 

132

Page 133: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 133/228

 

Capitolo 7

Il modello di regressione lineare

multivariata: i Minimi QuadratiOrdinari (OLS)

7.1. Notazione

De…niamo:

y =

0BB@y1y2:::yn

1CCAvettore colonna contenente le n osservazioni campionarie della variabiledipendente, y;

xk =

0BB@

x1k

x2k

:::

xnk

1CCA

vettore colonna contenente le n osservazioni campionarie della variabileindipendente, xk, con k = 1; 2;:::;K ;

X(n£K )

= ( x1 x2 ::: xK )

Page 134: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 134/228

 

134 capitolo 7

= 0BBB@x11

x21...

xn1

x12

x22...

xn2

:::

:::...:::

x1K 

x2K ...

xnK 

1CCCAmatrice n £ K  contenente le n osservazioni campionarie delle K  variabiliindipendenti (il vettore x1 è una colonna di 1);

" =

0BB@

"1"2:::"n

1CCAvettore colonna contenente gli n termini di errore.

Il modello lineare multivariato può quindi essere scritto nel modo se-guente:0BBB@

y1y2...

yn

1CCCA =

0BBB@x11

x21...

xn1

1CCCA ¯ 1 +

0BBB@x12

x22...

xn2

1CCCA ¯ 2 + ::: +

0BBB@x1K 

x2K 

...xnK 

1CCCA ¯ K  +

0BBB@"1"2...

"n

1CCCAIn maniera più compatta possiamo scrivere:

y = X¯ + "

dove

¯ =

0BB@¯ 1¯ 2:::

¯ K 

1CCAè il vettore colonna dei K  parametri.

Si richiede inoltre che la matrice X sia di rango K . Ciò implica che lecolonne di X sono linearmente indipendenti e che n ¸ K:

Page 135: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 135/228

 

OLS multivariato 135

7.2. Assunzioni classiche

Assunzione sui valori attesi dei termini di errore:

E ("i) = 0 per i = 1; 2;:::;n quindi E (") = 0

Assunzione sulle varianze e covarianze dei termini di errore:

V ar ("i) = ¾2 per i = 1; 2;:::;n

Cov ("i; " j) = 0 per i 6= j

Dal momento che:Cov ("i; " j) = E ("i " j)

le due assunzioni possono essere scritte congiuntamente come segue:

E ¡""0¢

= E 

0BB@"1"2:::"n

1CCA¡ "1 "2 ::: "n

¢= E 

0BB@"21 "1"2 ::: "1"n

"2"1 "22 ::: "2"n

::: ::: ::: :::"n"1 "n"2 ::: "2n

1CCA

=

0BB@

E ¡

"21¢

E ("1"2) ::: E  ("1"n)E ("2"1) E 

¡"22¢

::: E  ("2"n)::: ::: ::: :::

E ("n"1) E ("n"2) ::: E  ¡"2n¢

1CCA

=

0BB@

¾2 0 ::: 00 ¾2 ::: 0::: ::: ::: :::0 0 ::: ¾2

1CCA

= ¾2I

Assunzione sulla natura della matrice dei dati  X:

Cov (x jk; "i) = 0 per i; j = 1; 2;:::;n e per k = 1; 2;:::;K 

Questa assunzione è ovviamente veri…cata se la matrice X è non stocastica.

Assunzione sulla normalità del termine di errore: (utile per testareipotesi):

"i » N 

¡0; ¾2

¢per i = 1; 2;:::;n

)"

»N  ¡0; ¾2I¢

Page 136: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 136/228

 

136 capitolo 7

7.3. Stima dei parametri: metodo dei Minimi Quadrati Ordinari

I parametri ¯ 1; ¯ 2;:::;¯ K  e ¾2 non sono noti. Con il metodo dei minimiquadrati de…niamo degli stimatori b1; b2;:::;bK  tali da minimizzare la sommadei quadrati dei residui (RSS, Residual Sum of Squares ).

De…niamo il vettore dei residui

e = y¡X b

e quindi

RSS  =n

Xi=1e2i = e0e = (y¡Xb)0 (y¡Xb)

Scriviamo ora il programma di minimizzazione della somma dei quadrati deiresidui stimati e, la cui soluzione è il vettore dei parametri stimato b:

minb

RSS  = (y¡Xb)0(y¡Xb)

= y0y¡ b0X0y¡ y0Xb + b0X0Xb

= y0y¡2 b0X0y + b0X0Xb

Le K  condizioni del primo ordine sono:

@ (RSS )@ b

´0BBB@@ (RSS )

@b1

@ (RSS )@b2

:::@ (RSS )

@bK

1CCCA = 0BB@0

0:::0

1CCAIn termini matriciali tali condizioni si possono scrivere come:

@ (RSS )

@ b= ¡2 X0y + 2 X0X b = 0

e esprimere in forma di sistema di equazioni normali :

X0X b = X

0y

Se l’inversa di (X0X) esiste (condizione garantita dalla assunzione di rangopieno), allora la soluzione del sistema di equazioni normali (e quindi delprogramma di minimizzazione) è:

b = (X0X )¡1X0y

Page 137: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 137/228

 

OLS multivariato 137

Esempio con K  = 2. Deriviamo i singoli termini dell’espressione di RSS 

che dipendono da b:- termine 2 b0X0y :

b0X0y = (b1 b2)

µx01x02

¶y

= (b1 b2)

µx01y

x02y

¶= b1x01y + b2x02y

Derivando rispetto a b1 e b2:

@ (b0X0y)

@b1= x01y ;

@ (b0X0y)

@b2= x02y

) @ (b0X0y)

@ b=

µx01y

x02y

¶= X0y

- termine b0X0Xb :

b0X0Xb = (b1 b2)

µx01x1 x01x2

x02x1 x02x2

¶µb1b2

= (b1 b2)µ x01x1b1 + x01x2b2x02x1b1 + x02x2b2 ¶

= x01x1b21 + 2x01x2b1b2 + x02x2b22

Derivando rispetto a b1 e b2:

@ (b0X0Xb)

@b1= 2 b1x01x1 + 2 b2x01x2 ;

@ (b0X0Xb)

@b2= 2 b1x01x2 + 2 b2x02x2

) @ (b0X0Xb)

@ b= 2

µx01x1 x01x2

x02x1 x02x2

¶µb1b2

¶= 2 X0Xb

Il sistema di equazioni normali è quindi il seguente:½x01x1 b1 + x01x2 b2 = x01y

x02x1 b1 + x02x2 b2 = x02y

da cui si ottengono gli stimatori b1 e b2:

Page 138: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 138/228

 

138 capitolo 7

7.4. Interpretazione geometrica del metodo dei minimi quadrati

Ci limitiamo qui ad una intuizione geometrica del metodo OLS nel caso divettori a tre elementi, con due vettori x1 e x2 linearmente indipendenti edun vettore y che, come rappresentato nella Figura 3, non giace sullo stessopiano di x1 e x2. In termini del modello di regressione abbiamo una matriceX di regressori composta da due colonne linearmente indipendenti; tutti ivettori che giacciono sullo stesso piano di x1 e x2 sono ottenibili come com-binazione lineare delle colonne di X. Il metodo dei minimi quadrati consistenel trovare quella combinazione lineare delle colonne di X (vettore giacentesullo stesso piano di x1 e x2), Xb, che minimizza la “distanza” da y. Comesi può notare dalla …gura, tale combinazione lineare è “perpendicolare” al

piano determinato dalle colonne di X; i vettori x1 e x2 (e la loro combina-zione lineare Xb) devono quindi essere “ortogonali” al vettore e = y¡Xb:Formalmente, questo requisito è espresso dal sistema di equazioni lineari:

X0e = 0

che dà origine al sistema di equazioni normali X0Xb = X0y, da cui si ottieneil valore OLS di b.

Figura 3

Page 139: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 139/228

 

OLS multivariato 139

7.5. Proprietà algebriche dei minimi quadrati

Date le K  equazioni normali:

X0y = X0Xb

da cuiX0 (y¡Xb) = X0e = 0

è possibile derivare gli usuali risultati. Infatti per ogni colonna xk di X

x0k e = 0

e, dal momento che la prima colonna di X è una colonna di 1:

x01e = i0e =nX

i=1

ei = 0

7.6. Coe¢ciente di determinazione multiplo

Le deviazioni delle osservazioni y dalla loro media campionaria sono ottenutecome

y¡y = M0y

dove M0

è una matrice simmetrica e idempotente (già de…nita nel capitoloprecedente) che trasforma le osservazioni in deviazioni dalla media:

M0 =

0BBB@1¡ 1

n

¡ 1n

...¡ 1

n

¡ 1n

1¡ 1n

...¡ 1

n

::::::...

:::

¡ 1n

¡ 1n

...1¡ 1

n

1CCCAda cui otteniamo:

T SS  =n

Xi=1(yi ¡ y)2 =

¡M0y

¢0

¡M0y

¢= y0M0M0y = y0M0y

Sappiamo inoltre chey = Xb + e = by + e

Sottraendo ora y da entrambi i membri

y¡ y = by¡ y + e

Page 140: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 140/228

 

140 capitolo 7

che può essere riscritta in deviazioni dalla media come

M0y = M0 by + e = M0Xb + e

da cui, premoltiplicando il membro di sinistra per¡

M0y¢0 e quello di destra

per¡

M0Xb + e¢0, si ottiene:¡

M0y¢0 ¡

M0y¢

M0Xb + e¢0 ¡

M0Xb + e¢

= b0X0 M0M0

 | {z } M0

Xb + b0 X0 M0e

 |{z} e

 | {z } 0

+ e0M0Xb

 | {z } b0X0M0e

 | {z } 0

+e0e

da cuiy 0M0y = b0X0M0Xb + e0e

che equivale a:T SS  = ES S + RSS 

Ne deriva in…ne che

R2 =ESS 

T SS =

b0X0M0Xb

y0M0y= 1 ¡ e0e

y0M0y

e ancora

¹R2 = 1 ¡ e0e= (n¡K )y0M0y= (n¡ 1)

NB : Si può esprimere RSS  = e0e in altro modo, partendo da

e0e = y0y¡2 b0 X0y |{z} X0Xb

+b0X0Xb

) e0e = y0y ¡ b0X0 Xb |{z} y¡e

) e0e = y0y ¡ b0X0y poiché b0X0e = 0

Page 141: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 141/228

 

OLS multivariato 141

7.7. Nota alle proprietà algebriche degli stimatori OLS

Dato il modello di regressione stimato

y = Xb + e ´ y + e con X0e = 0

possiamo esprimere la somma dei quadrati della variabile dipendente come

y0y = (Xb + e)0 (Xb + e)

= b0X0Xb + e0e+ e0Xb |{z} 0

+ b0X0e | {z } 0

) y0y = b0X0Xb + e0e

che si può anche scrivere come:Xy2i = X y2i +X e2i

dove tutte le sommatorie si intendono per i = 1;:::;n.Esprimendo tutto in deviazioni dalla media:

y¡ ¹y = (y¡ ¹y) + e

dove ¹y = i ¹y è un vettore di n elementi tutti pari alla media dei valori dellavariabile dipendente, ¹y =

Pyi=n. La somma dei quadrati delle deviazioni

dalla media (TSS) è quindi:

(y¡ ¹y)0 (y¡ ¹y) = [(y¡ ¹y) + e]0 [(y¡ ¹y) + e]

= (y¡

¹y)0(y¡

¹y) + e0e+ e0(y¡

¹y) | {z } 0

+ (y¡

¹y)0e | {z } 0

) (y¡ ¹y)0 (y¡ ¹y) = (y¡ ¹y)0 (y¡ ¹y) + e0e

L’ultima espressione è equivalente a:X(yi ¡ ¹y)2 =

X(yi ¡ ¹y)2 +

Xe2i

T SS  = ESS + RSS 

La somma totale delle deviazioni delle osservazioni della variabile dipendentedalla loro media (T SS ) è stata scomposta nella parte “spiegata” dalla re-gressione (ESS ) e nella parte “non spiegata” (RSS ). Sviluppando i prodottivettoriali è possibile riscrivere la scomposizione nel modo seguente:

y0y¡ ¹y0¹y =¡

y0y¡ ¹y0¹y¢

+ e0e

equivalente a Xy2i ¡ n¹y2 =

³Xy2i ¡ n¹y2

´+X

e2i

T SS  = ESS + RSS 

Page 142: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 142/228

 

142 capitolo 7

7.8. Proprietà statistiche

Teorema di Gauss-Markov : date le assunzioni classiche il vettore b

degli stimatori OLS è (come nei casi bivariato e trivariato): a) lineare, b)non distorto, c) a varianza minima nella classe degli stimatori lineari nondistorti (BLUE).

Teorema di Rao: se inoltre si assume la normalità dei termini di errore,il vettore b degli stimatori OLS è (come nei casi bivariato e trivariato) lostimatore a varianza minima nella classe degli stimatori (lineari e non lineari)non distorti (BUE).

Inoltre, sempre data l’assunzione di normalità del vettore dei termini di

errore, il vettore b degli stimatori OLS è (come nei casi bivariato e trivariato)a sua volta distribuito normalmente.

Non distorsione del vettore b. Riscriviamo il vettore b come segue:

b =¡

X0X¢¡1

X0y =¡

X0X¢¡1

X0 (X¯ + ")

X0X¢¡1

X0X¯ +¡

X0X¢¡1

X0"

= ¯ +¡

X0X¢¡1

X0"

e calcoliamone ora il valore atteso:

E (b) =E ³¯ + ¡X0X¢¡1 X

0"´ = ¯ + ¡X

0X¢¡1 X

0E (") = ¯

Matrice di varianza e covarianza di  b. Calcolando la varianza di b

otteniamo:

V ar (b) = E £

(b¡ ¯) (b¡ ¯)0¤

= E 

·³¯ +

¡X0X

¢¡1X0"¡ ¯

´³¯ +

¡X0X

¢¡1X0"¡ ¯

´0¸=

¡X0X

¢¡1X0E 

£""0¤

X0X¢¡1

X0X¢¡1

X0 ¡¾2I¢

X0X¢¡1

= ¾2

¡X0X

¢¡1

Per esteso, la matrice di varianze e covarianze di b è:

V ar

0BB@b1b2:::bK 

1CCA =

0BB@var(b1) cov(b1; b2) ::: cov(b1; bK )

cov(b2; b1) var(b2) ::: cov(b2; bK )::: ::: ::: :::

cov(bK ; b1) cov(bK ; b2) ::: var(bK )

1CCA

Page 143: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 143/228

 

OLS multivariato 143

=

0BB@ ¾2S 11 ¾2S 12 ::: ¾2S 1K 

¾2S 21 ¾2S 22 ::: ¾2S 2K 

::: ::: ::: :::¾2S K 1 ¾2S K 2 ::: ¾2S KK 

1CCA= ¾2

¡X0X

¢¡1Normalità del vettore b Data l’ipotesi di normalità sul vettore deitermini di errore:

" » N 

¡0; ¾2I

¢il vettoreb

è a sua volta distribuito normalmenteb » N 

³¯; ¾2

¡X0X

¢¡1´e per ciascuno degli elementi di b vale

bk » N ³

¯ k; ¾2¡

X0X¢¡1

kk

´dove ¡

X0X¢¡1

kk= S kk

è l’elemento sulla diagonale principale all’incrocio tra la k-esima riga e la

k-esima colonna della matrice (X0X)¡1

.Lo stimatore di  ¾2 Come nei casi bivariato e trivariato, la conoscen-za della matrice di varianza e covarianza del vettore b è ovviamente uti-le. Tuttavia, di¢cilmente i termini della matrice possono essere calcolatidirettamente dal momento che ¾2 non è noto.

La seguente statistica (la cui radice quadrata è de…nita errore standard della regressione )

s2 =RSS 

n¡K =

e0en¡K 

è uno stimatore non distorto di ¾2. Inoltre:

RSS ¾2 = e0e

¾2 = "0M"¾2 = ³"

¾´0 M³"

¾´

ha una distribuzione Â2 con n ¡ K  gradi di libertà dove M è una matricesimmetrica e idempotente di ordine n£ n (e rango n¡K )

M = I¡X¡

X0X¢¡1

X0

Page 144: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 144/228

 

144 capitolo 7

Infatti:

e = y¡Xb = y¡X¡

X0X¢¡1

X0y = My = M (X¯ + ") = M"

Matrice di varianza e covarianza stimata di  b. Sostituendo ¾2 con s2

nella matrice di varianza e covarianza di b si ottiene la matrice di varianzae covarianza stimata  di b:

Est:V ar (b) = s2¡

X0X¢¡1

da cui è possibile ricavare l’errore standard di bk, per k = 1; 2;:::;K 

se (bk) = hs2 ¡X0X¢¡1kk i 12

Page 145: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 145/228

 

OLS multivariato 145

7.9. Test di ipotesi

Test  t di signi…catività di singoli parametri .La seguente statistica ha una distribuzione normale standardizzata:

zk =bk ¡ ¯ kp 

¾2S kk | {z } errore standard di bk

» N (0; 1)

Dal momento che ¾2 è tuttavia non nota, viene stimata con s2. Inoltre

RSS 

¾2´ e0e

¾2» Â2(n¡K )

Quindi la statistica

tk =(bk ¡ ¯ k) =

p ¾2S kkq ¡

e0e¾2

¢=(n¡K )

» N (0; 1)q Â2(n¡K )

n¡K 

=bk ¡ ¯ kp 

s2S kk» t(n¡K ) NB: s2 =

e0en¡K 

segue una distribuzione t di Student con n ¡ K  gradi di libertà. Questorisultato è ottenuto grazie all’indipendenza delle variabili casuali a nume-

ratore (normale standardizzata) e a denominatore (Â2

divisa per i gradi dilibertà) della statistica t. Tale indipendenza può essere veri…cata utilizzandola seguente proprietà statistica:

² una forma lineare e una forma quadratica in x » N (0; I), rispetti-vamente Ax e x0Bx (con B matrice simmetrica e idempotente) sonoindipendenti se AB = 0.

Nel nostro caso x ´ "=¾ e la forma lineare e la forma quadratica in x sono:

b¡¯

¾= ¡X0X¢

¡1X0

  | { z }  A ³"

¾´e

RSS 

¾2=³"

¾

´0M |{z} B

³"¾

´con M = I¡X(X0X)¡1X0, da cui è immediato veri…care che (X0X)¡1 X0M = 0:

Page 146: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 146/228

 

146 capitolo 7

Test  F  di signi…catività della regressione. Per veri…care la capacità

esplicativa dell’insieme dei regressori (in aggiunta alla costante) si può co-struire la seguente statistica, che mette in relazione la parte della variabilitàdella variabile dipendente (intorno alla sua media) “spiegata” dall’insiemedei regressori, ESS , con la parte di variabilità residua, RSS :

F  =ESS=(K ¡ 1)

RSS=(n¡K )=

¡b0X0M0Xb

¢=(K ¡ 1)

e0e=(n¡K )

=

h"0

¾

¡I¡MZ 

¢"¾

i=(K ¡ 1)

£"0¾ M

"

¾¤ =(n¡K )

»Â2(K ¡1)

K ¡1Â2(n

¡K )

n¡K 

» F (K ¡ 1; n¡K )

dove i termini ES S  e RSS  sono stati riespressi come forme quadratiche nelvettore dei termini di errore standardizzati "=¾ per mezzo delle matrici sim-metriche e idempotenti I¡MZ  (che non de…niamo ulteriormente qui) e M,di rango, rispettivamente, K ¡ 1 e n¡K . A¢nché la statistica abbia unadistribuzione F  è necessario che le variabili casuali a numeratore e denomi-natore (con distribuzioni Â2) siano indipendenti. L’indipendenza è garantita

dal fatto che ¡I¡M

Z ¢M = 0 (si veda la sezione 6.6).Si noti in…ne che la statistica F si può scrivere come

F  =[ESS=(K ¡ 1)] =TSS 

[RSS=(n¡K )] =TSS =

R2=(K ¡ 1)

(1¡R2) =(n¡K )

Page 147: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 147/228

 

OLS multivariato 147

7.10. Esempio: il modello di regressione lineare bivariato

Consideriamo il semplice caso di modello bivariato con y vettore della va-riabile dipendente e X matrice n £ 2 dei regressori, formata dalla costantee da una serie di n osservazioni della variabile x1:

X = (i x1)

Per ottenere gli stimatori OLS e la matrice di varianze e covarianze deiparametri del modello lineare

y = ¯ 0i + ¯ 1x1 + "

= X¯ + "

costruiamo X0X e X0y:

X0X =

µi0

x0

1

¶(i x1) =

µi0i

x01i

i0x1

x01x1

¶=

µnPxi1

Pxi1Px2

i1

¶X0y =

µi0

x0

1

¶y =

µi0y

x0

1y

¶=

µ PyiP

xi1yi

¶La matrice (X0X)¡1 è quindi:

¡X0X¢¡1 =

1

nPx2i1 ¡ (Pxi1)2 µ Px2

i1

¡Pxi1 ¡Pxi1

n ¶e le stime dei parametri possono essere calcolate come (utilizzando le rela-zioni

Pxi1 = n¹x1 e

Pyi = n¹y):

b =

µb0b1

¶=¡

X0X¢¡1

X0y =

0BB@P

x2i1P

yi¡P

xi1P

xi1yi

nP

x2i1¡(P

xi1)2

nP

xi1yi¡P

xi1P

yi

nP

x2i1¡(P

xi1)2

1CCA

= 0BB@¹y

Px2i1¡¹x1

Pxi1yi

P x2i1¡

n¹x21Pxi1yi¡n¹x1¹yP

x2i1¡n¹x21

1CCA = 0B@¹y ¡

Pxi1yi¡n¹x1¹y

P x2i1¡n¹x21¹X 1

Pxi1yi¡n¹x1¹yP

x2i1¡n¹x21

1CARicordando che (si veda la sezione 4.1.2):

S x1x1 =X

x2i1 ¡ n¹x2

1 ; S yy =X

y2i ¡ n¹y2 ; S x1y =X

xi1yi ¡ n¹x1¹y

Page 148: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 148/228

 

148 capitolo 7

si ottiene: µ b0b1

¶=0B@ ¹y ¡

S x1y

S x1x1 ¹x1

S x1yS x1x1

1CALa matrice di varianze e covarianze di b è data da:

Var(b) = ¾2¡

X0X¢¡1

=¾2

nP

x2i1 ¡ (

Pxi1)2

0@ Px2

i1

¡Pxi1

¡Pxi1

n

1Adove ¾2 denota la varianza del termine di errore "i. In…ne, dopo gli opportunipassaggi (si veda la sezione 4.1.5):

Var(b) =

0B@ ¾2³1n

+¹x21

S x1x1

´¡ ¹x1

S x1x1¾2

¡ ¹x1S x1x1

¾2

¾2

S x1x1

1CA

Page 149: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 149/228

 

OLS multivariato 149

7.11. Interpretazione dei coe¢cienti di regressione multipla

Consideriamo il modello di regressione lineare multivariata

y = X¯ + "

con lo stimatore OLSb = (X0X)¡1X0y

I valori stimati della variabile dipendente y e i residui stimati e sono espri-mibili come:

y = Xb = X(X0X)¡1X0y

e = y¡Xb = y¡X(X0X)¡1X0y

I¡X(X0X)¡1X0¤  | {z }  M

y = My

dove M è una matrice (idempotente) con le seguenti proprietà:

MX = 0 Me = e

Riscriviamo ora lo stesso modello utilizzando la seguente “partizione” della

matrice dei regressori:

X = (X1 x2) ) y = X1¯1 + x2¯ 2 + "

Vogliamo confrontare le stime del coe¢ciente ¯ 2 (che misura l’e¤etto su yattribuibile al regressore x2 dopo aver tenuto conto dell’e¤etto dei regresso-ri nella sottomatrice X1, avendo così l’interpretazione di derivata parziale)ottenute in due modi diversi: (i) mediante una procedura che preliminar-mente “depura” sia la variabile dipendente sia il regressore che ci interessax2 dall’e¤etto degli altri regressori in X1; (ii) mediante una regressione di y

su X1 e x2 simultaneamente.

(i ) Utilizzando l’equivalente della matrice (idempotente) M introdottasopra possiamo esprimere direttamente i residui stimati dalle due seguentiregressioni:

regressione di y su X1 ) residui stimati u = M1y

regressione di x2 su X1 ) residui stimati v = M1x2

Page 150: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 150/228

 

150 capitolo 7

dove

M1 = I¡X1(X01X1)¡1X01

con la proprietà M1X1 = 0. Dopo aver “depurato” la variabile dipendentee il regressore x2 dall’e¤etto delle variabili in X1 e¤ettuiamo la regressionedei residui u sui residui v, ottenendo lo stimatore b2:

b2 =¡

v0v¢¡1

v0u

(x02M1)M1x2

¤¡1x02M1M1y

x02M1x2

¢¡1x02M1y

(utilizzando il fatto che M1 è idempotente, per cui M1M1 = M1).

(ii ) Una stima del parametro ¯ 2 è ovviamente ottenibile mediante la re-gressione multivariata di y simultaneamente su X1 e x2. Lo stimatore b2 siottiene come al solito dalla soluzione del sistema di equazioni normali (con-dizioni del primo ordine della minimizzazione di RSS). Il modello stimato èquindi:

y = X1b1 + x2b2 + e

Per confrontare lo stimatore b2 ottenuto con questo metodo con quello ricava-to in precedenza, anzichè risolvere esplicitamente il sistema di equazioni nor-mali, possiamo premoltiplicare entrambi i lati della precedente espressioneper la matrice M1 de…nita sopra, ottenendo

M1y = M1X1 | {z } 0

b1 + M1x2b2+ M1e |{z} e

) M1y = M1x2b2 + e

ricordando che per de…nizione M1X1 = 0 e M1e = e: Premoltiplicando oraentrambi i lati dell’ultima espressione per x02 possiamo esprimere lo stimatoreb2 come segue:

x02M1y = x02M1x2b2+ x02e

 |{z} 0

) b2 = ¡x02M1x2¢¡1 x02M1y

Il valore di b2 ottenuto dalla regressione multivariata è quindi identico aquello ricavato con il metodo indiretto illustrato in precedenza.

Page 151: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 151/228

 

OLS multivariato 151

7.12. Omissione di variabili rilevanti e inclusione di variabili irrilevanti

Esaminiamo ora gli e¤etti sui coe¢cienti stimati di due problemi di spe-ci…cazione dei modelli di regressione. Iniziamo dal caso di omissione  dalmodello stimato di un regressore “rilevante ”, cioè appartenente al “vero”modello che ha generato i dati. Esprimiamo i due modelli come segue:

modello “vero” : y = X1¯1 + x2¯ 2 + "

modello stimato : y = X1b¤1 + e

Nella stima del modello sono (correttamente) inclusi k ¡ 1 regressori maviene omesso il k-esimo regressore x2. La stima del vettore di coe¢cienti

¯1, che denotiamo con b¤1, è ottenuta come:b¤1 =

¡X0

1X1

¢¡1X0

1y

X01X1

¢¡1X0

1 (X1¯1 + x2¯ 2 + ")

X01X1

¢¡1X0

1X1¯1 +¡

X01X1

¢¡1X0

1x2¯ 2 +¡

X01X1

¢¡1X0

1"

= ¯1 +¡

X01X1

¢¡1X0

1x2¯ 2 +¡

X01X1

¢¡1X0

1"

ed ha il seguente valore atteso (poiché E (") = 0):

E (b¤1) = ¯1+

¡X0

1X1

¢¡1

X01x2¯ 2

  | {z }  distorsione

b¤1 è quindi uno stimatore distorto del “vero” vettore di coe¢cienti ¯1. Ladistorsione dipende sia dal parametro ¯ 2 (che misura l’e¤etto di x2 su y)sia dalla correlazione esistente fra i regressori misurata dai k¡ 1 coe¢cientistimati da una regressione OLS di x2 sulle variabili in X1, raccolti nel vettoreb21:

b21 =¡

X01X1

¢¡1X0

1x2

Il valore atteso dei coe¢cienti in b¤1 risulta quindi:

E (b¤1) = ¯1 + b21¯ 2

Prendiamo ora in considerazione il problema dell’inclusione  nel model-lo stimato di variabili “irrilevanti ”, cioè che non appartengono al modello“vero”. In questo caso abbiamo:

modello “vero” : y = X1¯1 + "

modello stimato : y = X1b¤1 + x2b¤2 + e

Page 152: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 152/228

 

152 capitolo 7

Qui x2 rappresenta una variabile che non ha alcun e¤etto su y ma che viene

comunque inclusa nel modello stimato, insieme al blocco di regressori “rile-vanti” X1. Denotando con X la matrice completa dei regressori utilizzati:X = (X1 x2), il vettore dei coe¢cienti stimati dalla regressione è:

b¤ ´µ

b¤1b¤2

¶=¡

X0X¢¡1

X0y

X0X¢¡1

X0·

(X1 x2)

µ¯1

0

¶+ "

¸=

µ¯1

0

¶+

¡X0X

¢¡1

X0"

Il valore atteso dei coe¢cienti risulta quindi

µb¤1b¤2

¶=

µ¯1

0

¶senza alcuna distorsione dovuta alla presenza di un regressore irrilevante.L’inclusione di tale regressore (tranne che nel caso di assenza di correlazionecon le variabili in X1) ha invece l’e¤etto di aumentare la varianza dellostimatore di ¯1 rispetto a quella ottenibile dalla stima del modello “vero”(senza x2).

Page 153: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 153/228

 

OLS multivariato 153

7.13. Esercizi

1. Dimostrate che R2 è uguale al quadrato del coe¢ciente di correlazionefra i valori osservati di yi e quelli stimati yi, cioè:

R2 = r2y;y ´[Pn

i=1 (yi ¡ ¹y) (yi ¡ ¹y)]2hPni=1 (yi ¡ ¹y)2

i hPni=1 (yi ¡ ¹y)2

i2. Esprimete la statistica F  utilizzata per sottoporre a test la signi…cati-

vità di tutti i regressori (diversi dalla costante) utilizzando le sommedel quadrato dei residui di due modelli (da de…nire con precisione):“non ristretto” e “ristretto”.

3. Supponete che si voglia investigare la dipendenza di una variabile eco-nomica y dal tasso di in‡azione , che denotiamo con ¼, e dal tassodi interesse reale , che denotiamo con r. Il modello “vero” che vieneipotizzato è il seguente:

yi = ¯ 0 + ¯ 1¼i + ¯ 2ri + "i

Viene invece stimato il seguente modello, contenente il tasso di inte-resse nominale , che chiamiamo n:

yi = ° 0

+ ° 1

¼i + ° 2

ni + vi

Dalla stima otteniamo i seguenti risultati (fra parentesi gli errori stan-dard delle stime):

° 1 = 0:1 (0:15)

° 2 = 0:8 (0:20)

Inoltre cov(° 1; ° 2) = ¡0:002. Ricordando la relazione che lega tassi diinteresse e tasso di in‡azione (r = n¡ ¼):

(a) ricavate la relazione fra i parametri ¯ 0, ¯ 1 ,¯ 2 e ° 0, ° 1, ° 2; è pos-

sibile concludere dai risultati del modello stimato che variazionidel tasso di in‡azione ¼ a parità di tasso di interesse reale  nonsono rilevanti per la spiegazione di y?

(b) costruite un test di signi…catività dell’e¤etto del tasso di in‡a-zione su y a parità di tasso di interesse reale e commentatene ilrisultato.

Page 154: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 154/228

 

154 capitolo 7

4. Considerate il seguente modello con solo due regressori:

yi = ¯ 1xi1 + ¯ 2xi2 + "i

in cui tutte le variabili hanno media campionaria uguale a zero: ¹y =¹x1 = ¹x2 = 0 (non viene quindi inserita nel modello la costante). Assu-miamo inoltre (per sempli…care i calcoli) che la varianza campionariadi x1 e x2 sia pari a 1:Pn

i=1 x2i1

n=

Pni=1 x2

i2

n= 1

Ciò implica che la covarianza campionaria fra x1 e x2 è uguale al

coe¢ciente di correlazione r12:

cov(x1; x2) =

Pni=1 xi1xi2

n= r12

Denotando con ¾2 la varianza del termine di errore "i:

(a) calcolate la matrice di varianze e covarianze degli stimatori b1 eb2 ottenuti con OLS

NB: data una matrice della formaµ

¸ ¸a¸a ¸

¶, la sua inversa è

una matrice della forma seguente:

1

¸

1

1¡ a2

µ1 ¡a¡a 1

¶(b) valutate l’e¤etto del grado di correlazione fra x1 e x2 sulle stati-

stiche t costruite per valutare le ipotesi che i singoli parametri ¯ 1e ¯ 2 siano ciascuno uguale a zero;

(c) calcolate la varianze di due combinazioni lineari dei parametristimati: b1 + b2 e b1 ¡ b2;

(d) ipotizzando r12 > 0, valutate l’e¤etto del grado di correlazione frai regressori sulla varianza delle due combinazioni lineari costruite;quali conclusioni si possono trarre sulla possibilità di sottoporrea test ipotesi su combinazioni lineari dei parametri?

5. Considerate tre variabili (tutte con media zero) x, y e z. Siamo inte-ressati a stimare l’e¤etto “puro” di x su y, eliminando l’e¤etto dellaterza variabile z, la quale in‡uenza sia x sia y.

Page 155: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 155/228

 

OLS multivariato 155

(a) Supponiamo di procedere ad una regressione di x su z, da cui

ricaviamo lo stimatore bxz ed i residui stimati u. Successivamentestimiamo la seguente regressione di y su u:

y = ± u u + v

Derivate lo stimatore du del parametro ± u da quest’ultima regres-sione.

(b) Confontate du con lo stimatore dx del parametro ± x nel seguentemodello trivariato:

y = ± x x + ± z z + "

(c) Che cosa cambierebbe rispetto al caso (a) se, invece di y, si re-gredissero su u i residui ottenuti da una precedente regressione diy su z (e¤ettuata per “depurare” anche y dall’e¤etto di z)?

6. Ipotizziamo che la “vera” relazione fra due variabili x e y (entrambecon media pari a zero) sia data dal seguente modello lineare:

yi = ¯ xi + "i

dove "i » IN (0; ¾2") e non è correlato con xi. Le due variabili sono

misurate con errore ; invece di x e y vengono osservate x¤ e y¤, de…nitecome segue:

x¤i = xi + ui e y¤i = yi + vi

dove u e v sono gli “errori di misurazione”, con media zero e noncorrelati con x e y e fra di loro (quindi: E (u) = E (v) = E (uv) =E (ux) = E (uy) = E (vx) = E (vy) = 0). Inoltre E (u2) = ¾2

u e E (v2) =¾2

v.

(a) Scrivete il modello da stimare in termini delle variabili osserva-te. E’ possibile applicare il metodo dei minimi quadrati ordinari(OLS) per la stima di ¯  e perché?

(b) Lo stimatore bOLS  fornisce una sovrastima o una sottostima delvero parametro ¯ ? (fornire una risposta in termini solo intuitivi).

Page 156: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 156/228

 

156

Page 157: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 157/228

 

Capitolo 8

Violazioni delle assunzioni

classiche e modello diregressione linearegeneralizzato

8.1. Introduzione

Nel capitolo precedente, dato il modello di regressione lineare

y = X¯ + "

si sono introdotte alcune assunzioni, qui riassunte per comodità.

Assunzioni sulla matrice X: X è una matrice non stocastica di ordinen£K  (con n ¸ K ) e di rango K . Ciò implica che le colonne della matrice X

sono linearmente indipendenti. In subordine, se X è una matrice stocastica,

gli elementi della matrice X sono indipendenti o almeno non correlati congli elementi del vettore ".

Assunzioni sul vettore ":

E (") = 0

Page 158: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 158/228

 

158 capitolo 8

V ar (") = E (""0) = 0BB@¾2 0 ::: 0

0 ¾2 ::: 0::: ::: ::: :::0 0 ::: ¾2

1CCA = ¾2I

Inoltre, per essere in grado di fare inferenza, si assume anche che

" » N (0; ¾2I)

Date le assunzioni classiche, lo stimatore OLS del vettore di parametri¯

b = (X0X)¡1X0y

è BLUE (best linear unbiased estimator ), con

E (b) = ¯

V ar (b) = ¾2(X0X)¡1

In…ne, se aggiungiamo alle assunzioni classiche l’ipotesi di normalità , lostimatore OLS del vettore ¯ è BUE (best unbiased estimator ), con

b » N 

¡¯; ¾2(X0X)¡1

¢

Page 159: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 159/228

 

GLS 159

8.2. Violazioni delle assunzioni su V ar (")

L’assunzioneV ar (") = E (""0) = ¾2I

è detta di sfericità degli errori  ed implica la duplice condizione di costanzadella varianza dei termini di errore "i (omoschedasticità ) e di nullità dellacovarianza per ogni coppia di termini di errore "i e " j con i 6= j (assenza di autocorrelazione ).

Dato che la matrice X è non stocastica, (ricordando semplicemente chela varianza di una costante è nulla) vale anche che:

V ar (y) = ¾

2

I

Eteroschedasticità  (cenni). Se le osservazioni campionarie sono relative,ad esempio, a famiglie o imprese in un’analisi cross-sezionale , può esserepoco plausibile assumere che solo il valore atteso, ma non la varianza di y,dipenda dalla matrice X. Si ricordi che nel modello di regressione lineareclassico:

E (y) = X¯

La rimozione della condizione di costanza della varianza dei termini di errore"i viene de…nita con il termine di eteroschedasticità . Ad esempio, in un

modello di regressione bivariato dove la variabile dipendente è rappresentatadal risparmio familiare e la variabile indipendente dal reddito familiare, nonsolo il valore atteso del risparmio ma anche la sua varianza sembra aumentareal crescere del reddito.

Se si rimuove l’ipotesi di omoschedasticità la matrice di varianza e cova-rianza dei termini di errore deve essere scritta nel modo seguente:

V =

0BB@

¾21 0 ::: 0

0 ¾22 ::: 0

::: ::: ::: :::0 0 ::: ¾2

n

1CCASi osservi …n d’ora che se la matrice V non è nota, sarà necessario imporre

delle restrizioni dal momento che non è possibile stimare n parametri (cioèle n varianze) con solo n osservazioni campionarie.

Autocorrelazione (cenni). Se le osservazioni sono relative a una singolafamiglia o impresa osservata nel tempo (analisi temporale ) è possibile (per

Page 160: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 160/228

 

160 capitolo 8

motivi che saranno spiegati in seguito) che la matrice di varianza e covarianza

dei termini di errore possa assumere la seguente struttura:

¾2 = ¾2

0BBBB@1 ½1 ::: ½n¡2 ½n¡1

½1 1 ::: ::: ½n¡2::: ::: ::: ::: :::

½n¡2 ::: ::: 1 ½1½n¡1 ½n¡2 ::: ½1 1

1CCCCAdove

::: = Cov ("t¡2; "t¡1) = Cov ("t¡1; "t) = Cov ("t; "t+1) = ::: = ¾2½1

::: = Cov ("t¡2; "t) = Cov ("t¡1; "t+1) = Cov ("t; "t+2) = ::: = ¾2½2

:::

::: = Cov ("t¡2; "t¡2+s) = Cov ("t¡1; "t¡1+s) = Cov ("t; "t+s) = ::: = ¾2½s

Anche nel caso di autocorrelazione, se la matrice ¾2 non è nota, sarànecessario imporre delle restrizioni dal momento che non è possibile stimaren parametri (cioè ¾2 e gli n¡1 coe¢cienti di correlazione) con n osservazionicampionarie.

Domande a cui rispondere. La possibile violazione delle assunzioni

classiche del modello di regressione lineare pone alcuni importanti problemi:(a) quali sono le conseguenze per lo stimatore OLS quando l’assunzione

classica sulla matrice di varianza e covarianza dei termini di errore èviolata?

(b) quali procedimenti (test) possono essere sviluppati per veri…care la“ragionevolezza” dell’assunzione classica?

(c) quali procedure di stima devono essere utilizzate nei casi in cui l’as-sunzione classica risulta violata?

Page 161: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 161/228

 

GLS 161

8.3. Il modello di regressione lineare generalizzato e lo stimatore GLS

(Generalized Least Squares)

Se viene abbandonata l’assunzione di sfericità dei termini di errore, allora ilmodello di regressione lineare deve essere riscritto come segue:

y = X¯ + "

E (") = 0

V ar (") = E (""0) = ¾2

Questo modello prende il nome di modello di regressione lineare generaliz-zato.

Sappiamo che lo stimatore OLS

bOLS  = (X0X)¡1X0y

pur essendo non distorto non è più e¢ciente (non è più BLUE). Inoltresappiamo che la sua varianza è pari a

V ar (bOLS ) = ¾2(X0X)¡1(X0 X)(X0X)¡1

Derivazione dello stimatore e¢ciente per il modello lineare gene-ralizzato. Per derivare lo stimatore e¢ciente nel modello generalizzato,

supponiamo di conoscere la matrice , che è simmetrica e de…nita positi-va. L’inversa di (anch’essa matrice de…nita positiva) ammette la seguenterappresentazione:

¡1 = P0P

da cui

P0P¢¡1

= P¡1P0¡1

) P = P0¡1

) P P0 = I

Per ricavare lo stimatore a minimi quadrati generalizzati (GLS) moltipli-chiamo il modello originario per la matrice P:

P y = (PX)¯ + P"

Page 162: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 162/228

 

162 capitolo 8

Il modello può essere riscritto nel modo seguente:

y¤ = X¤ ¯ + "¤

dove Py = y¤, PX = X¤ e P" = "¤. Dal momento che

E ("¤) = 0

la matrice di varianza e covarianza dei termini di errore (trasformati) puòessere scritta come

V ar ("¤) = E ("¤"¤0) = E (P""0P0) = ¾2P P0 = ¾2I

Possiamo quindi riscrivere il modello di regressione lineare generalizzato informa di modello di regressione classico (trasformato):

y¤ = X¤¯ + "¤

E ("¤) = 0

V ar ("¤) = E ("¤"¤0) = ¾2I

Lo stimatore GLS è semplicemente lo stimatore OLS del modello trasformato

bGLS  = (X¤0X¤)¡1X¤0y¤

= (X0P0PX)¡1

X0P0P y= (X0 ¡1X)¡1X0 ¡1 y

In…ne, ricaviamo la matrice di varianza e covarianza dello stimatore bGLS .Da

bGLS  = ¯+¡

X¤0X¤¢¡1 X¤0"¤

otteniamo:

V ar (bGLS ) = E £

(bGLS ¡ ¯) (bGLS ¡ ¯)0¤

= E h¡X¤0X¤¢¡1 X¤0"¤"¤0X¤(X¤0

X¤)¡1i

X¤0X¤¢¡1 X¤0 E ¡"¤"¤0

¢  | {z } ¾2I

X¤(X¤0X¤)¡1

= ¾2¡

X¤0X¤¢¡1 = ¾2¡

X0 ¡1X¢¡1

Page 163: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 163/228

 

GLS 163

Lo stimatore OLS è ancora uno stimatore non distorto nel modello di

regressione lineare generalizzato. Infatti:

bOLS  = ¯+¡

X0X¢¡1

X0"

da cuiE (bOLS ) = ¯+

¡X0X

¢¡1X0E (") = ¯

Tuttavia, la matrice di varianza e covarianza del vettore b diventa:

V ar (bOLS ) = E £

(bOLS ¡¯) (bOLS ¡ ¯)0¤

= E h¡X0X¢¡1 X0""0X(X0

X)¡1i= ¾2

¡X0X

¢¡1 ¡X0 X

¢(X0X)¡1

Implicazioni . La usuale formula ¾2 (X0X)¡1 non rappresenta più la ma-trice di varianza e covarianza del vettore b e quindi ogni sua applicazione incampo inferenziale è fuorviante. Inoltre, lo stimatore OLS non è più quelloa varianza minima nella classe degli stimatori non distorti. In altre parole,pur non essendo distorto, lo stimatore OLS non è il più e¢ciente nella classedegli stimatori non distorti.

Potenziali soluzioni .

(a) se la matrice è conosciuta, uno stimatore più e¢ciente di quello OLSè disponibile. Tale stimatore è detto stimatore dei minimi quadratigeneralizzati (GLS, generalized least squares ), bGLS ;

(b) se la matrice non è nota ma è ragionevole fare delle ipotesi sullasua struttura allora è possibile utilizzare una versione modi…cata dellostimatore GLS, lo stimatore FGLS (  feasible generalized least squares );

(c) se la matrice non è nota e non è ragionevole fare ipotesi sulla suastruttura allora l’unica soluzione è procedere con il metodo dei minimi

quadrati ordinari (OLS), stimando direttamente V ar (bOLS ).

Page 164: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 164/228

 

164

Page 165: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 165/228

 

Capitolo 9

Eteroschedasticità

9.1. Minimi quadrati generalizzati (GLS) ed eteroschedasticità

Consideriamo il modello di regressione lineare generalizzato:

y = X¯ + "

E (") = 0

V ar (") = V

In presenza di eteroschedasticità la matrice di varianza e covarianza deitermini di errore ha la seguente struttura:

V =

0BB@¾21 0 ::: 0

0 ¾22 ::: 0

::: ::: ::: :::0 0 ::: ¾2

n

1CCAPer stimare il vettore ¯ in modo e¢ciente è necessario conoscere V. Nor-malmente si ipotizza che le varianze siano funzione di un’unica variabile

osservabile, z (che può essere o meno parte della matrice X dei regressori).Sviluppiamo ora due esempi, in cui le varianze sono rispettivamente fun-zione lineare e quadratica della variabile z (opportunamente normalizzata):

(i) nel primo caso si ipotizza che

¾2i = ¾2zi con i = 1; 2;:::;n

Page 166: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 166/228

 

166 capitolo 9

e Pni=1 zi

n= 1

In questo caso

V = ¾2 = ¾2

0BB@z1 0 ::: 00 z2 ::: 0::: ::: ::: :::0 0 ::: zn

1CCAe la matrice P assume la seguente forma:

P =

0BBB@

1p z1

0 ::: 0

0 1p z2

::: 0

::: ::: ::: :::0 0 ::: 1p 

zn

1CCCA

(ii) nel secondo caso si ipotizza che

¾2i = ¾2z2i con i = 1; 2;:::;n

ePn

i=1 z2in

= 1

e di conseguenza

V = ¾2 = ¾20BB@z21 0 ::: 0

0 z22 ::: 0::: ::: ::: :::0 0 ::: z2n

1CCAIn questo caso la matrice P assume invece la seguente forma:

P =

0BB@1

z10 ::: 0

0 1z2

::: 0

::: ::: ::: :::0 0 ::: 1

zn

1CCAIn entrambi i casi l’unico elemento non noto è ¾2, che può essere stimato

utilizzando i residui dell’equazione trasformata:

s2 =e¤0e¤

n¡K 

Si osservi in…ne che la stima di ¾2 serve esclusivamente alla stima dellamatrice di varianza e covarianza di b.

Page 167: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 167/228

 

eteroschedasticità 167

9.2. FGLS ed eteroschedasticità

Qualora le varianze siano una funzione di più di una variabile osservabile (equeste a loro volta possono essere o meno parte della matrice X), si pone ilproblema di stimare i parametri (non noti) che esprimono la relazione tra levarianze e le variabili.

Supponiamo per semplicità che le varianze dipendano linearmente dadue variabili osservabili, z1 e z2, nel modo seguente:

¾2i = ± 0 + ± 1z1i + ± 2z2i

La matrice di varianza e covarianza dei termini di errore ha la seguenteforma:

V =0BB@ ± 0 + ± 1z11 + ± 2z21 0 ::: 0

0 ± 0 + ± 1z12 + ± 2z22 ::: 0::: ::: ::: :::0 0 ::: ±  0 + ± 1z1n + ± 2z2n

1CCAe quindi, per costruire il modello di regressione lineare classico (trasformato),è necessario moltiplicare y, X e " per la seguente matrice P:

P =

0BBB@

1p ± 0+± 1z11+± 2z21

0 ::: 0

0 1p ± 0+± 1z12+± 2z22

::: 0

::: ::: ::: :::0 0 ::: 1p 

± 0+± 1z1n+± 2z2n

1CCCAIl problema è che ± 0, ± 1 e ± 2 sono parametri ignoti che a loro volta devono es-

sere stimati. Il metodo dei minimi quadrati generalizzati “fattibili” (FGLS)consente di a¤rontare il problema. I passi necessari sono i seguenti:

(a) stimare il modello originale y = X¯ + " con OLS al …ne di ottenere ilvettore dei residui stimati e;

(b) stimare la seguente equazione ausiliaria:

e2i = ± 0 + ± 1z1i + ± 2z2i + ui

dove ui indica il disturbo i-esimo;

(c) costruire la matrice P stimata, sostituendo a ± 0, ± 1 e ± 2 le corrispon-denti stime d0, d1 e d2;

(d) stimare il modello trasformato

y¤ = X¤¯ + "¤

con OLS al …ne di ottenere il vettore delle stime bFGLS .

Page 168: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 168/228

 

168 capitolo 9

9.3. OLS ed eteroschedasticità

Lo stimatore GLS è e¢ciente. Tuttavia, per applicarlo è necessario speci…-care il modello che descrive la struttura delle varianze nella matrice . Inalcuni casi, per evitare di sbagliare la speci…cazione di , può essere oppor-tuno continuare ad usare gli stimatori OLS, stimando in modo appropriatola matrice di varianza e covarianza di bOLS :

V ar (bOLS ) = ¾2(X0X)¡1(X0 X)(X0X)¡1

L’approccio suggerito da White consiste in:

(a) stimare il modello originale y = X¯ + " con OLS al …ne di ottenere ilvettore dei residui stimati e;

(b) utilizzare il quadrato dei residui ei per stimare la matrice X0VX,utilizzando per la stima di V:

V =

0BB@e21 0 ::: 00 e22 ::: 0::: ::: ::: :::0 0 ::: e2n

1CCAda cui

Est V ar (bOLS ) = (X0X)¡1

(X0^V X)(X0X)¡

1

Page 169: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 169/228

 

eteroschedasticità 169

9.4. Test di eteroschedasticità

Esistono numerosi test statistici costruiti con l’obiettivo di veri…care la pre-senza di eteroschedasticità. Pur se diversi nell’impostazione, tutti utilizzanoil vettore dei residui e ottenuto stimando il modello originario con il metodoOLS. L’idea è di sfruttare e2i come stima di ¾2

i . I test più comunemente utiliz-zati sono: (a) test di Goldfeld-Quandt; (b) test di Breusch-Pagan-Godfrey;(c) test di White.

Test di Goldfeld-Quandt  (GQ). Questo test può essere utilizzato qualorasi sospetti che le varianze siano funzione di una singola variabile osservabilez (inclusa o meno nella matrice X). La procedura del test è la seguente:

(a) riordinare le osservazioni in base al valore di zi (dal più piccolo al piùgrande);

(b) omettere c osservazioni centrali (è consigliato c = n=3);

(c) stimare separatamente il modello originale con OLS per le prime n¡c2

e le ultime n¡c2 osservazioni;

(d) calcolare i RSS  delle due regressioni. Si de…niscano RSS 1 e RSS 2rispettivamente i valori del RSS  più piccolo e più grande;

(e) la statistica

GQ =RSS 2RSS 1

ha, sotto l’ipotesi nulla di assenza di eteroschedasticità, una distribu-zione F  con (n ¡ c ¡ 2K )=2 gradi di libertà sia al numeratore sia aldenominatore. Pre…ssato un livello di signi…catività, se il valore dellastatistica eccede il valore critico della distribuzione F , allora si ri…utal’ipotesi nulla di assenza di eteroschedasticità.

Test di Breusch-Pagan-Godfrey  (BPG). Questo test costituisce un’e-stensione del test GQ, dal momento che le varianze possono essere espressecome funzione (non necessariamente lineare) di più di una variabile. Per

semplicità, si consideri la seguente relazione lineare:¾2

i = ®0 + ®1z1i + ®2z2i + ::: + ®m¡1zm¡1;i + ui

dove ui indica il disturbo i-esimo. L’intuizione è che per sottoporre a testse le varianze sono omoschedastiche è su¢ciente sottoporre a test l’ipotesinulla H 0 : ®1 = ®2 = ::: = ®m¡1 = 0. La procedura del test è la seguente:

Page 170: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 170/228

 

170 capitolo 9

(a) stimare il modello originale con OLS;

(b) costruire la seguente variabile

 pi =e2i¹s2

dove ¹s2 è RSS=n e RSS è la somma dei quadrati dei residui del modellooriginale;

(c) stimare la seguente equazione ausiliaria:

 pi = ®0 + ®1z1i + ®2z2i + ::: + ®m¡1zm¡1;i + ui

dove ui è il residuo i-esimo della regressione ausiliaria;(d) ottenere gli ESS  della equazione ausiliaria e calcolare la seguente

statistica:BP G =

1

2ES S 

Sotto l’ipotesi nulla di assenza di eteroschedasticità, BP G ha una di-stribuzione asintotica Â2 con m ¡ 1 gradi di libertà. Pre…ssato unlivello di signi…catività, se il valore della statistica eccede il valore cri-tico della distribuzione Â2, allora si ri…uta l’ipotesi nulla di assenza dieteroschedasticità.

Test di White (W). Il test di White è ancora più generale. Non solo nonrichiede di identi…care a priori la variabile a cui si sospetta siano associatele varianze ma adotta anche una forma funzionale ‡essibile. Applichiamoper semplicità questo test direttamente ad una regressione trivariata:

yi = ¯ 0 + ¯ 1x1i + ¯ 2x2i + "i

La procedura di e¤ettuazione del test è la seguente:

(a) stimare il modello trivariato con OLS al …ne di ottenere i residui ei;

(b) stimare una regressione ausiliaria dove i residui al quadrato sono re-

grediti sulle variabili originarie, i loro quadrati ed i loro prodotti in-crociati:

e2i = ®0 + ®1x1i + ®2x2i + ®3x21i + ®4x2

2i + ®5x1ix2i + ui

e calcolare da questa regressione il coe¢ciente di determinazione mul-tiplo R2;

Page 171: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 171/228

 

eteroschedasticità 171

(c) la statistica

W  = n R2

sotto l’ipotesi nulla di assenza di eteroschedasticità ha una distribuzio-ne asintotica Â2 con un numero di gradi di libertà pari al numero deiregressori (con l’esclusione della costante) inclusi nell’equazione ausi-liaria. Pre…ssato un livello di signi…catività, se il valore della statisticaeccede il valore critico della distribuzione Â2, allora si ri…uta l’ipotesinulla di assenza di eteroschedasticità.

Page 172: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 172/228

 

172 capitolo 9

9.5. Eteroschedasticità: un’applicazione

Consideriamo un campione composto da 1000 individui estratti casualmentedalla popolazione censita USA del 1988. Il fenomeno da spiegare consistenel livello del salario (WAGE ) degli individui. Le variabili esplicative dispo-nibili sono: il livello di istruzione  (EDU ) e gli anni di esperienza lavorativa (EXP ).

Statistiche descrittive su WAGE  e LNWAGE  = ln(WAGE )

0

40

80

120

160

200

240

10 20 30 40 50 60

 

Series: WAGESample 1 1000

Observations 1000

Mean 11.4169Median 9.99999Maximum 64.9999Minimum 2.60000Std. Dev. 6.97076Skewness 1.93864Kurtosis 9.79030

Jarque-Bera 2547.56Probability 0.00000

0

20

40

60

80

100

1.0 1.5 2.0 2.5 3.0 3.5 4.0

 

Series: LNWAGESample 1 1000Observations 1000

Mean 2.27549Median 2.30258Maximum 4.17438Minimum 0.95551Std. Dev. 0.56346Skewness 0.07757Kurtosis 2.64064

Jarque-Bera 6.38339Probability 0.04110

Page 173: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 173/228

 

eteroschedasticità 173

Regressione OLS  di LNWAGE  su una costante, EDU  e EXP 

Campione: n = 1000 osservazioni. Equazione stimata:

LNWAGE i = ¯ 0 + ¯ 1EDU i + ¯ 2EX P i + "i

Risultati della stima:

Varabile dipendente: LNWAGE 

Regressore b s(b) t p

cost. 0.601 0.086 6.957 0.00EDU 0.102 0.006 17.246 0.00EXP 0.019 0.001 15.502 0.00

R2 0.303 s(LNWAGE ) 0.563¹R2 0.302 s 0.471

RSS  221.0 F  216.92

Gra…co dei residui stimati al quadrato (LNWRES2 ) e dei valori stimatidi LNWAGE  (LNWAGEFIT ):

0

1

2

3

4

0.8 1.2 1.6 2.0 2.4 2.8 3.2 3.6

L N W A G E F IT

L N W R E S 2

Page 174: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 174/228

 

174 capitolo 9

Test di eteroschedasticità 

(a) Test di Goldfeld-Quandt Ordinamento delle osservazioni secondo EXP ; due campioni di 350

osservazioni (eliminate le 300 osservazioni centrali)

Risultato delle regressioni sui sottocampioni:

Campione: 1¡ 350

Regr. b s(b) t

cost. 0.01 0.14 0.06EDU 0.12 0.01 11.52EXP 0.07 0.007 8.88

R2 0.396 s(v.dip.) 0.55¹R2 0.392 s 0.43

RSS 1 64.62 F  113.7

Campione: 651 ¡ 1000

Regr. b s(b) t

cost. 1.37 0.21 6.59EDU 0.07 0.01 7.32EXP 0.005 0.004 1.35

R2 0.136 s(v.dip.) 0.54¹R2 0.131 s 0.50

RSS 2 87.06 F  27.3

GQ =RSS 2=(350¡ 3)

RSS 1=(350¡ 3)=

87:06

64:62= 1:35 > F 0:05(347; 347)

) l’ipotesi nulla di assenza di eteroschedasticità è ri…utata al 5%

(b) Test Breusch-Pagan-Godfrey Ipotesi: varianza residui dipendente linearmente dai due regressori EDU

e EXP. Regressione ausiliaria di e2i¹s2 sui regressori originali.

Risultati della regressione ausiliaria:

Regressore ® s(®) t

cost. -0.49 0.28 -1.71EDU 0.09 0.02 4.68EXP 0.016 0.004 4.09

R2 0.030 s(v. dip.) 1.57¹R2 0.028 s 1.55

RSS  2385.7 F  15.6

BP G =ESS 

2=

1

2

R2

1¡R2RSS  = 38:5 > Â2

0:05(2)

) l’ipotesi nulla di assenza di eteroschedasticità è ri…utata al 5%

Page 175: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 175/228

 

eteroschedasticità 175

(c) Test di White 

Regressione ausiliaria:

e2i = d0 + d1EDU i + d2EX P i + d3EDU 2i+d4EXP 2i + d5(EDU  ¤EX P )i + ui

Risultati della regressione ausiliaria:

Regressore d s(d) t

cost. 0.49 0.24 2.09EDU -0.04 0.03 -1.39EXP -0.02 0.006 -3.54

EDU2 0.002 0.001 1.75

EXP2 0.001 0.0002 4.49EDU*EXP 0.001 0.0004 2.67

R2 0.052 s(v. dip.) 0.347¹R2 0.047 s 0.339

W  = nR2 = 52 > Â20:05(5)

) l’ipotesi nulla di assenza di eteroschedasticità è ri…utata al 5%

Stima OLS con correzione per eteroschedasticità  (White). StimaOLS con correzione di White della matrice di varianze e covarianze deicoe¢cienti. Risultati:

Variabile dipendente: LNWAGE 

Regressore b s(b) t

cost. 0.601 0.091 6.630EDU 0.102 0.006 16.107EXP 0.019 0.001 13.869

R2 0.303 s(v. dip.) 0.563¹R2 0.302 s 0.471

RSS  221.0 F  216.92

Page 176: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 176/228

 

176

9.6. Esercizi

1. Considerate il semplice modello di regressione lineare:

yi = ¯ 0 + "i

dove le varianze dei termini di errore sono funzione dei valori di unavariabile zi secondo la relazione:

¾2i = ¾2 z2i con

Pni=1 z2in

= 1

(a) derivate lo stimatore OLS di ¯ 0 e la sua varianza in presenza di

eteroschedasticità nei termini di errore "i;(b) trasformate appropriatamente il modello originario e derivate lo

stimatore GLS di ¯ 0, confrontandolo con quello OLS;

(c) dimostrate che lo stimatore GLS non è distorto e calcolatene lavarianza.

2. Il modello “vero” che descrive la relazione, per ogni impresa i, fra costototale di produzione ci e quantità prodotta q i è il seguente:

ci = ® + ¯ q i + "i

con varianza del termine di errore non costante: E ("2i ) = ¾2i e E ("i" j) =0 per i 6= j.

(a) Quale ipotesi è necessario introdurre per giusti…care la stima deiparametri ® e ¯  da una regressione che abbia come variabiledipendente il costo unitario di produzione?

(b) Descrivete la procedura di trasformazione delle variabili coerentecon l’ipotesi formulata in (a), speci…cando la forma della matriceP e interpretando i coe¢cienti del modello trasformato.

Page 177: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 177/228

 

Capitolo 10

Autocorrelazione

10.1. Introduzione

Consideriamo il modello di regressione lineare generalizzato:

y = X¯ + "

E (") = 0

V ar (") = ¾2

Assunzioni :

1. Le osservazioni campionarie sono ordinate rispetto al tempo (serietemporali) con t = 1; 2;:::T 

2. Assenza di eteroschedasticità:

V ar ("t) = ¾2"

3. Le covarianze (chiamate anche autocovarianze ) fra "t e "t¡s sono unafunzione della distanza jt¡ sj ma non di t e di s:

::: = Cov ("t¡1; "t¡1¡s) = Cov ("t; "t¡s) = Cov ("t+1; "t+1¡s) = ::: = ¾2"½s

dove ½s è il coe¢ciente di correlazione fra "t e "t¡s (e fra "t¡1 e "t¡1¡s,ecc.). Più precisamente:

Corr ("t; "t¡s) ´ ½s =Cov ("t; "t¡s)p 

V ar ("t) V ar ("t¡s)

Page 178: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 178/228

 

178 capitolo 10

da cui

½s = Cov ("t; "t¡s)¾2

"

e quindiCov ("t; "t¡s) = ¾2

" ½s

La matrice di varianza e covarianza dei termini di errore (chiamata anchematrice delle autocovarianze ) può quindi essere scritta come segue:

V ar (") = ¾2" = ¾2

"

0BBBB@

1 ½1 ::: ½T ¡2 ½T ¡1½1 1 ::: ::: ½T ¡2::: ::: ::: ::: :::

½T ¡2 ::: ::: 1 ½1½T ¡1 ½T ¡2 ::: ½1 1

1CCCCA

In questo contesto la matrice viene anche de…nita matrice di autocorrela-zione (e spesso denotata con R) dal momento che raccoglie i T ¡1 coe¢cientidi autocorrelazione.

Qualora la matrice non sia nota, sarà ovviamente necessario imporredelle restrizioni. Non è infatti possibile stimare, con T  osservazioni, T ¡ 1coe¢cienti di correlazione, la varianza comune dei termini di errore ¾2

" e iK  parametri del modello.

10.2. Processi stocastici (cenni)

Un processo stocastico è una sequenza di variabili casuali ordinate rispettoal tempo:

f"tg ; t = ¡1; +1Analizziamo alcuni esempi di semplici processi stocastici.

10.2.1. White noise

Un processo stocastico

fut

gè de…nito white noise  (“rumore bianco”) se

E (ut) = 0

var(ut) = ¾2u 8t

cov(ut; us) = 0 8t 6= s

Esempio per ut » N (0; 1), campione di 50 osservazioni (1951-2000):

Page 179: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 179/228

 

autocorrelazione 179

-3

-2

-1

0

1

2

3

55 60 65 70 75 80 85 90 95 00

u (white noise)

Utili informazioni sulla natura del processo stocastico possono esserefornite dal calcolo dei coe¢cienti di correlazione ½s a varie distanze s. L’in-sieme di tali coe¢cienti forma il cosiddetto correlogramma  della serie. Peril processo white noise  u il correlogramma mostra una serie di coe¢cien-

ti di (auto)correlazione (AC) prossimi a zero, confermando la natura nonautocorrelata della serie.

Correlogrammadi processo stocastico white noiseSample: 1952 2000Included observations: 49

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

. | . | . | . | 1 -0.012 -0.012 0.0077 0.930**| . | **| . | 2 -0.193 -0.193 1.9787 0.372.*| . | .*| . | 3 -0.075 -0.083 2.2843 0.516. |*. | . |*. | 4 0.190 0.157 4.2977 0.367

.*| . | .*| . | 5 -0.109 -0.140 4.9680 0.420. | . | . |*. | 6 0.052 0.116 5.1255 0.528**| . | **| . | 7 -0.237 -0.282 8.4641 0.293. | . | . | . | 8 0.030 0.033 8.5186 0.385.*| . | .*| . | 9 -0.107 -0.187 9.2398 0.415. | . | .*| . | 10 -0.050 -0.127 9.4012 0.494

Page 180: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 180/228

 

180 capitolo 10

10.2.2. Random walk

Un processo stocastico f"tg è de…nito random walk  (“passeggiata casuale”)se evolve nel tempo come segue:

"t = "t¡1 + ut

) "t = ut + ut¡1 + ::: =1X

i=0

ut¡i

dove futg è un processo white noise . Continuando nell’esempio (utilizzandole realizzazioni di ut viste nella …gura precedente):

-10

-8

-6

-4

-2

0

2

4

55 60 65 70 75 80 85 90 95 00

epsilon (random walk)

il correlogramma del processo stocastico mostra un elevato grado di per-sistenza, con coe¢cienti di autocorrelazione inizialmente vicini all’unità e chesolo lentamente (all’aumentare della distanza fra le osservazioni) tendono adiminuire.

Page 181: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 181/228

 

autocorrelazione 181

Correlogramma di processo stocastico random walk

Sample: 1952 2000Included observations: 49

Autocorrelation Partial Correlatio AC PAC Q-Stat Prob

. |*******| . |*******| 1 0.93 0.93 45.29 0.00

. |*******| . | . | 2 0.86 -0.01 85.31 0.00. |****** | . | . | 3 0.81 0.02 120.9 0.00. |****** | . | . | 4 0.75 0.01 152.9 0.00. |***** | **| . | 5 0.67 -0.23 179.1 0.00. |***** | .*| . | 6 0.59 -0.061 199.9 0.00. |**** | **| . | 7 0.501-0.20 214.8 0.00. |*** | . |*. | 8 0.43 0.18 226.5 0.00.|*** | . | . | 9 0.37 0.01 235.3 0.00

. |** | . | . | 10 0.31 0.00 241.8 0.00

10.2.3. Processo AR(1)

Un processo stocastico f"tg è de…nito autoregressivo di ordine 1 (AR(1)) seevolve nel tempo come segue:

"t = ½ "t¡1 + ut

) "t = ut + ½ut¡1 + ½2ut¡2 + ::: =1

Xi=0½i ut¡i

dove futg è un processo white noise . Si osservi che "t è funzione di tuttala storia degli ut. Imponendo la restrizione j½j < 1, le osservazioni piùlontane nel tempo sono pesate meno delle osservazioni più recenti. Dopoaver imposto tale restrizione, possiamo calcolare il valore atteso e la varianzadi "t:

E ("t) = E (ut) + ½E (ut¡1) + ½2E (ut¡2) + ::: = 0

V ar ("t) = V ar (ut) + ½2 V ar (ut¡1) + ½4 V ar (ut¡2) + ::: =¾2

u

1¡ ½2= ¾2

"

Analogamente si può procedere al calcolo delle covarianze tra "t e gli altrielementi del processo stocastico

Cov ("t; "t¡1) = E ("t "t¡1) = E ((½ "t¡1 + ut) "t¡1) = ½¾2

u

1¡ ½2= ½ ¾2

"

Cov ("t; "t¡2) = E ("t "t¡2) = ½2¾2

u

1¡ ½2= ½2 ¾2

"

Page 182: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 182/228

 

182 capitolo 10

:::

Cov ("t; "t¡s) = E ("t "t¡s) = ½s ¾2u

1¡ ½2= ½s ¾2

"

Se i termini di errore del modello di regressione seguono un processo sto-castico autoregressivo di ordine 1, la matrice di varianza e covarianza puòessere scritta come segue:

V ar (") = ¾2"

0BBBB@1 ½ ½2 ::: ½T ¡1

½ 1 ½ ::: ½T ¡2

½2 ½ 1 ::: ½T ¡3

::: ::: ::: ::: :::½T ¡1 ½T ¡2 ½T ¡3 ::: 1

1CCCCA = ¾2"

dove i parametri da stimare sono ridotti a due: ¾2" e ½. Presentiamo ora tre

esempi di processo AR(1) ottenuti dalle medesime realizzazioni del processowhite noise  f"tg utilizzate in precedenza ma caratterizzati da diversi valoridel parametro autoregressivo ½: ½ = 0:9, ½ = 0:5 e ½ = ¡0:7.

-10

-8

-6

-4

-2

0

2

4

55 60 65 70 75 80 85 90 95 00

AR(1) rho = 0.9

Correlogrammadi AR(1) con rho=0.9Sample: 1952 2000Included observations: 49

Autocorrelatio Partial Correlati AC PAC

. |****** | . |****** | 1 0.83 0.83

. |***** | . | . | 2 0.69 -0.04

. |***** | . |*. | 3 0.60 0.12

. |**** | . |*. | 4 0.56 0.10

. |*** | **| . | 5 0.44 -0.22

. |*** | . | . | 6 0.35 0.04

. |** | **| . | 7 0.23 -0.22

. |** | . |** | 8 0.20 0.22

. |*. | . | . | 9 0.17 -0.05

. |*. | . |*. | 10 0.1810.16

Page 183: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 183/228

 

autocorrelazione 183

-10

-8

-6

-4

-2

0

2

4

55 60 65 70 75 80 85 90 95 00

AR(1) rho = 0.5

Correlogrammadi AR(1) con rho=0.5Sample: 1952 2000Included observations: 49

Autocorrelation Partial Correlatio AC PAC

. |*** | . |*** | 1 0.40 0.40. | . | .*| . | 2 0.03 -0.15. | . | . | . | 3 -0.00 0.05. |*. | . |*. | 4 0.10 0.10.*| . | **| . | 5 -0.06 -0.19.*| . | . | . | 6 -0.08 0.04**| . | **| . | 7 -0.25 -0.29.*| . | . |*. | 8 -0.14 0.08

.*| . | .*| . | 9 -0.16 -0.18.*| . | . | . | 10 -0.07 0.05

-10

-8

-6

-4

-2

0

2

4

55 60 65 70 75 80 85 90 95 00

AR(1) rho = - 0.7

Correlogramma di AR(1) con rho= -0.7Sample: 1952 2000Included observations: 49

Autocorrelation Partial Correlati AC PAC

******| . | ******| . | 1 -0.72 -0.72. |**** | . | . | 2 0.53 0.01

****| . | **| . | 3 -0.541-0.31. |**** | . |*. | 4 0.56 0.161

****| . | .*| . | 5 -0.54 -0.09. |**** | . |*. | 6 0.51 0.08

****| . | .*| . | 7 -0.51 -0.10. |*** | .*| . | 8 0.42 -0.161***| . | . | . | 9 -0.36 -0.001. |** | **| . | 10 0.27 -0.23

10.2.4. Processo MA(1)

Un processo stocastico f"tg è de…nito a media mobile di ordine 1 (MA(1))se evolve nel tempo come segue:

"t = ut ¡ µut¡1

dove futg è un processo white noise . Il valore atteso e la varianza di "t sono:

E ("t) = E (ut)¡ µE (ut¡1) = 0

V ar ("t) = V ar (ut) + µ2 V ar (ut¡1) = (1 + µ2)¾2u = ¾2

"

Page 184: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 184/228

 

184 capitolo 10

Come nei casi precedentemente illustrati, è possibile calcolare le covarianze

tra "t e gli altri elementi del processo stocastico:

Cov ("t; "t¡1) = E ("t "t¡1) = E ((ut ¡ µut¡1) (ut¡1 ¡ µut¡2)) = ¡µ ¾2u

Cov ("t; "t¡2) = E ("t "t¡2) = E ((ut ¡ µut¡1) (ut¡2 ¡ µut¡3)) = 0

:::

Cov ("t; "t¡s) = E ("t "t¡s) = E ((ut ¡ µut¡1) (ut¡s ¡ µut¡s¡1)) = 0 8s ¸ 2

Se i termini di errore del modello di regressione seguono un processo sto-castico a media mobile di ordine 1, la matrice di varianza e covarianza puòessere scritta come segue:

V ar (") = ¾2u

0BBBB@1 + µ2 ¡µ 0 ::: 0¡µ 1 + µ2 ¡µ ::: 00 ¡µ 1 + µ2 ::: 0::: ::: ::: ::: :::0 0 0 ::: 1 + µ2

1CCCCAdove i parametri da stimare sono ridotti a due: ¾2

u e µ. Nell’esempio seguenteil valore di µ è …ssato pari a 0:7:

-10

-8

-6

-4

-2

0

2

4

55 60 65 70 75 80 85 90 95 00

MA(1) theta = 0.7

Correlogramma di MA(1) con theta =

Sample: 1952 2000Included observations: 49

Autocorrelatio Partial Correlat AC PAC

***| . | ***| . | 1 -0.38 -0.38.*| . | ***| . | 2 -0.15 -0.35.*| . | ***| . | 3 -0.07 -0.38. |** | . | . | 4 0.26 -0.01**| . | **| . | 5 -0.22 -0.23. |** | . |*. | 6 0.21 0.14**| . | **| . | 7 -0.26 -0.210. |*. | . | . | 8 0.18 0.01.*| . | .*| . | 9 -0.09 -0.09. | . | **| . | 10 0.00 -0.21

Page 185: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 185/228

 

autocorrelazione 185

10.3. GLS con termini di errore AR(1)

De…niamo ora il seguente modello di regressione lineare generalizzato contermini di errore che seguono un processo stocastico di tipo AR(1):

y = X¯ + "

con "t = ½ "t¡1 + ut e ¾2" =

¾2u

1¡ ½2

Come visto in precedenza, la matrice di varianza e covarianza è:

E (""0) =¾2u

1¡ ½20BB@

1 ½ ::: ½T ¡1

½ 1 ::: ½T ¡2::: ::: ::: :::

½T ¡1 ½T ¡2 ::: 1

1CCA = ¾2u

Se il coe¢ciente di (auto)correlazione ½ è noto, allora sia il vettore

bGLS  =¡

X0 ¡1X¢¡1

X0 ¡1y

sia la matrice di varianza e covarianza di bGLS 

V ar(bGLS ) = ¾2u

¡X0 ¡1X

¢¡1

possono essere calcolati invertendo la matrice :

¡1 =

0BBBB@1 ¡½ 0 ::: 0¡½ 1 + ½2 ¡½ ::: 00 ¡½ 1 + ½2 ::: 0::: ::: ::: ::: :::0 0 0 ::: 1

1CCCCALa matrice ¡1 ammette la rappresentazione

¡1 = P0P

con

P =

0BBBB@p 

1¡ ½2 0 0 ::: 0¡½ 1 0 ::: 00 ¡½ 1 ::: 0::: ::: ::: ::: :::0 0 0 ::: 1

1CCCCA

Page 186: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 186/228

 

186 capitolo 10

Trasformazione delle variabili per la stima GLS . Il vettore della

variabile dipendente, la matrice dei regressori ed il vettore dei termini dierrore vengono ora premoltiplicati per la matrice P:

P y =

0BBBB@p 

1¡ ½2 0 0 ::: 0¡½ 1 0 ::: 00 ¡½ 1 ::: 0::: ::: ::: ::: :::0 0 0 ::: 1

1CCCCA

0BBBBBB@y1y2y3:::

yT ¡1yT 

1CCCCCCA

=

0BBBBBB@p 1¡ ½2 y1

y2 ¡ ½ y1y3 ¡ ½ y2

:::yT ¡1 ¡ ½ yT ¡2

yT  ¡ ½ yT ¡1

1CCCCCCA = y¤

P X = 0BBBB@ p 1¡ ½2 0 0 ::: 0

¡½ 1 0 ::: 0

0 ¡½ 1 ::: 0::: ::: ::: ::: :::0 0 0 ::: 1

1CCCCA0BBBB@x11 x12 x13 ::: x1K 

x21 x22 x23 ::: x2K 

x31 x32 x33 ::: x3K 

::: ::: ::: ::: :::xT 1 xT 2 xT 3 ::: xT K 

1CCCCA

=

0BBBB@p 

1¡ ½2x11

p 1¡ ½2x12

p 1¡ ½2x13 :::

p 1¡ ½2x1K 

x21 ¡ ½ x11 x22 ¡ ½x12 x23 ¡ ½ x13 ::: x2K ¡ ½ x1K 

x31 ¡ ½ x21 x32 ¡ ½ x22 x33 ¡ ½ x23 ::: x3K ¡ ½ x2K 

::: ::: ::: ::: :::xT 1 ¡ ½ xT ¡1;1 xT 2 ¡ ½ xT ¡1;2 xT 3 ¡ ½ xT ¡1;3 ::: xT K ¡ ½ xT ¡1;K 

1CCCCA

= 0BBBB@ p 1¡ ½2 x1

x2

¡ ½x1

x3 ¡ ½ x2

:::xT  ¡ ½ xT ¡1

1CCCCA = X¤ NB. denotiamo con xi la riga i-esima di X

Le variabili trasformate y¤ e X¤ sono de…nite di¤erenze parziali ( o quasi-

Page 187: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 187/228

 

autocorrelazione 187

di¤erenze  o pseudo-di¤erenze ). In…ne, per i termini di errore:

P" =

0BBBB@p 

1¡ ½2 0 0 ::: 0¡½ 1 0 ::: 00 ¡½ 1 ::: 0::: ::: ::: ::: :::0 0 0 ::: 1

1CCCCA0BBBBBB@

"1"2"3:::

"T ¡1"T 

1CCCCCCA

=

0

BBBB@

p 1¡ ½2 "1

"2 ¡ ½ "1"3 ¡ ½ "2

:::"T  ¡ ½ "T ¡1

1

CCCCA= "¤ ´

0

BBBB@

p 1¡ ½2 "1

u2

u3

:::uT 

1

CCCCAOra:

E ¡"¤"¤0

¢= E 

0BBBBB@(1¡ ½2)"21

p 1¡ ½2"1u2

p 1¡ ½2"1u3 :::

p 1¡ ½2"1uT p 

1¡ ½2"1u2 u22 u2u3 ::: u2uT p 

1¡ ½2"1u3 u3u2 u23 ::: u3uT 

::: ::: ::: ::: :::p 1¡ ½2"1uT  uT u2 uT u3 ::: u2

1CCCCCA

=0BBBB@

¾2u 0 0 ::: 0

0 ¾2u 0 ::: 0

0 0 ¾2u ::: 0

::: ::: ::: ::: :::0 0 0 ::: ¾2

u

1CCCCA = ¾2u I

Il modello trasformatoy¤ = X¤ ¯ + "¤

presenta quindi errori non  autocorrelati; gli stimatori GLS bGLS  sono rica-vabili da una semplice stima OLS del modello trasformato.

Page 188: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 188/228

 

188 capitolo 10

10.4. FGLS con termini di errore AR(1)

Se la matrice non è nota ma si assume che i termini di errore seguanoun processo AR(1), per stimare il vettore b è necessario stimare ½. I passinecessari sono i seguenti:

(a) stimare il modello originale y = X¯ + " con OLS al …ne di ottenere ilvettore dei residui stimati e;

(b) calcolare il coe¢ciente di (auto)correlazione campionario r:

r =

PT t=2 et et¡1

PT 

t=1e2

t

(c) calcolare la matrice ^¡1 stimata, sostituendo a ½ la corrispondentestima r:

^¡1 =

0BBBB@1 ¡r 0 ::: 0¡r 1 + r2 ¡r ::: 00 ¡r 1 + r2 ::: 0::: ::: ::: ::: :::0 0 0 ::: 1

1CCCCA(d) stimare il modello trasformato

y¤ = X¤¯ + "¤

con OLS al …ne di ottenere il vettore delle stime bFGLS , dove

y¤ = P y =

0BBBBBB@

p 1¡ r2 y1

y2 ¡ r y1y3 ¡ r y2

:::yT ¡1 ¡ r yT ¡2

yT  ¡ r yT ¡1

1CCCCCCAe

X¤ = P X =

0BBBB@p 1¡ r2 x1

x2 ¡ r x1

x3 ¡ r x2

:::xT  ¡ r xT ¡1

1CCCCA

Page 189: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 189/228

 

autocorrelazione 189

10.5. Test di autocorrelazione

Esistono numerosi test statistici costruiti con l’obiettivo di veri…care la pre-senza di autocorrelazione. Qui esaminiamo il classico test di Durbin-Watson(DW).

Test di autocorrelazione di Durbin-Watson  (per processi AR(1)).L’intuizione del test è di utilizzare il vettore dei residui stimati e, otte-nuto stimando il modello originario con il metodo OLS, per veri…care segli elementi di e seguono un processo autoregressivo del primo ordine. Lastatistica del test è la seguente:

DW  = PT t=2 (et ¡ et¡1)2PT t=1 e2t

Per comprenderne il signi…cato è opportuno valutare la relazione fra lastatistica DW  e il coe¢ciente di correlazione campionario r, dato da

r =

PT t=2 et et¡1PT 

t=1 e2t

Sviluppando la formula di DW  otteniamo:

DW  =

PT t=2 (et ¡ et¡1)2

PT t=1 e2t

=

PT t=2

¡e2t ¡ 2 et et¡1 + e2t¡1

¢P

T t=1 e2t

=PT 

t=2 e2t ¡ 2 PT t=2 et et¡1 +PT 

t=2 e2t¡1PT t=1 e2t

=

PT t=2 e2t  z } | { 

T Xt=1

e2t ¡ e21 ¡2PT 

t=2 et et¡1+

PT t=2 e2t¡1  z } | {  

T Xt=1

e2t ¡ e2T PT t=1 e2t

= 2¡ 2 PT t=2 et et¡1

PT 

t=1 e

2

t  | { z }  r

¡ e21 + e2T 

PT 

t=1 e

2

t | {z } ' 0

' 2 (1¡ r)

Conseguentemente, se r è pari a zero, cioè in assenza di (auto)correlazionecampionaria, DW  è circa pari a 2, mentre se r è pari a 1 (¡1), cioè inpresenza di perfetta (auto)correlazione positiva (negativa), DW  è circa paria 0 (4).

Page 190: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 190/228

 

190 capitolo 10

La statistica DW  non ha una distribuzione standard. Durbin e Wat-

son hanno comunque derivato dei valori critici inferiori (DW L) e superiori(DW U ) tali che se DW  è esterno a tali valori è possibile ri…utare l’ipotesinulla di assenza di autocorrelazione del primo ordine ad un livello pre…ssatodi signi…catività In dettaglio:

se 0 · DW < DW L ) H 0 è ri…utata (evidenza di autoc. positiva)

se DW L · DW · DW U  ) zona di “indecisione”

se DW U  < DW < 4¡DW U  ) H 0 accettata

se 4¡DW U  · DW · 4¡DW L ) zona di “indecisione”

se 4¡DW L < DW · 4 ) H 0 è ri…utata (evidenza di autoc. negativa)

I valori critici dipendono inoltre dal numero di osservazioni (n) e dal nu-mero di regressori (con l’esclusione della costante) presenti nel modello. Ènecessario ricordare che il test DW  è appropriato solo quando la matrice X

è non stocastica.

Page 191: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 191/228

 

autocorrelazione 191

10.6. Autocorrelazione ed errata speci…cazione dinamica.

La presenza di autocorrelazione nei residui stimati  (e) non sempre è sinto-mo di autocorrelazione nei termini di errore  (") del modello “vero” che hagenerato i dati. L’autocorrelazione può invece essere dovuta ad una errata speci…cazione  dell’equazione stimata.

Consideriamo il seguente modello dinamico per la variabile dipendenteyt:

yt = ¯ 0 + ¯ 1xt + ¯ 2xt¡1 + ¯ 3yt¡1 + "t

con E ("t"t¡

s) = ½ ¾2 per s = 0

0 per s 6= 0 ¾I termini di errore " non sono autocorrelati e hanno varianza costante.

Supponiamo ora che il modello stimato per yt abbia la forma di unasemplice relazione fra yt e xt, senza elementi dinamici (sono cioè assenti ivalori ritardati di un periodo delle due variabili). Viene anche formulatal’ipotesi che gli errori seguano un processo di tipo AR(1), con parametro ½.Il modello stimato è quindi il seguente:

yt = ° 0 + ° 1xt + vt con vt = ½vt¡1 + ut

dove il termine ut ha varianza costante e non è autocorrelato (white noise ).Il modello stimato può essere riespresso nel modo seguente:

da yt¡1 = ° 0 + ° 1xt¡1 + vt¡1½yt¡1 = ½° 0 + ½° 1xt¡1 + ½vt¡1

) yt ¡ ½yt¡1 = ° 0 ¡ ½° 0 + ° 1xt ¡ ½° 1xt¡1+ vt ¡ ½vt¡1  | {z } ut

ottenendo

yt =° 0(1¡ ½)

 | {z } ¯ 0

+ ° 1

 |{z} ¯ 1

xt ¡½° 1

 | {z } ¯ 2

xt¡1+ ½

 |{z} ¯ 3

yt¡1 + ut

In questa forma il modello stimato ha la stessa struttura dinamica del model-lo “vero”, ma con l’imposizione di una restrizione  non lineare sui parametri(nota come: common factor restriction ):

¯ 1¯ 3 + ¯ 2 = 0

Page 192: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 192/228

 

192 capitolo 10

Solo se questa restrizione non è ri…utata dai dati è possibile ipotizzare che il

modello appropriato da stimare è rappresentato da una semplice relazionefra yt e xt con un processo AR(1) per l’errore. Altrimenti, la presenza diautocorrelazione dei residui stimati da questo modello deve essere interpre-tata come segno di errata speci…cazione dinamica (dynamic misspeci-

 …cation ) del modello stesso (in questo caso dovuta all’omissione di xt¡1 eyt¡1 dall’insieme dei regressori). Una procedura di stima corretta richiedequindi la stima di un modello generale dinamico e il test delle restrizio-ni common factor  prima di procedere all’analisi dell’autocorrelazione e adeventuali trasformazioni delle variabili sulla base del parametro ½ ottenuto.

Esempio: Costruiamo le seguenti variabili per un campione di 50 osserva-

zioni (considerando il periodo 1951-2000 e ipotizzando nullo il valore inizialedi y : y1951 = 0):

xt » N (10; 25)

yt = 5 + 2 xt ¡ 0:5 xt¡1 + 0:7 yt¡1 + "t

"t » N (0; 16)

Il modello dinamico che genera i dati per yt include il valore corrente di xe i valori ritardati di x e y, con il termine di errore " non autocorrelato.Le osservazioni di y generate per il campione 1952-2000 sono mostrate nelgra…co:

20

30

40

50

60

70

80

90

100

55 60 65 70 75 80 85 90 95 00

Serie y per ilcampione 1952-2000

Page 193: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 193/228

 

autocorrelazione 193

Iniziamo dalla stima OLS del modello con dinamica correttamen-

te speci…cata (cioè includendo fra i regressori i valori ritardati di un periododi x e y). Risultato:

Modello con corretta specificazione dinamicaDependent Variable: YMethod: Least SquaresSample: 1952 2000Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

C 5.2734 2.2787 2.3142 0.0253X 1.9322 0.1089 17.7446 0.0000

X(-1) -0.3393 0.1245 -2.7257 0.0091

Y(-1) 0.6827 0.0373 18.2826 0.0000

R-squared 0.9368 Mean dependent var 59.9438Adjusted R-squared 0.9326 S.D. dependent var 14.2185S.E. of regression 3.6923 Akaike info criterion 5.5285Sum squared resid 613.4746 Schwarz criterion 5.6829Log likelihood -131.4473 F-statistic 222.2691Durbin-Watson stat 2.3254 Prob(F-statistic) 0.0000

Come ci si aspetta, i residui stimati non mostrano segni di autocorrela-zione, come si rileva dal correlogramma …no al decimo ritardo:

-8

-4

0

4

8

12

20

40

60

80

100

55 60 65 70 75 80 85 90 95 00

 

Residui Y Y stimati

Page 194: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 194/228

 

194 capitolo 10

Correlogramma dei residuidel modellocorrettamente specificato

Sample: 1952 2000Included observations: 49

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

.*| . | .*| . | 1 -0.165 -0.165 1.4254 0.233

. | . | .*| . | 2 -0.043 -0.072 1.5219 0.467

. | . | . | . | 3 0.051 0.033 1.6630 0.645**| . | **| . | 4 -0.265 -0.262 5.5499 0.235. |*. | . | . | 5 0.114 0.034 6.2916 0.279. | . | . | . | 6 0.036 0.031 6.3676 0.383**| . | **| . | 7 -0.209 -0.198 8.9632 0.255. |*. | . | . | 8 0.175 0.059 10.831 0.211. |*. | . |** | 9 0.136 0.216 11.993 0.214

**| . | .*| . | 10 -0.217 -0.185 15.004 0.132

Stimiamo ora un modello con errata speci…cazione dinamica, dalmomento che omette i valori ritardati di x e y come regressori:

yt = ° 0 + ° 1xt + vt

Risultati:

Modello con errata specificazione dinamicaDependent Variable: YMethod: Least SquaresSample: 1952 2000Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

C 43.0361 3.4418 12.5038 0.0000X 1.8174 0.3278 5.5446 0.0000

R-squared 0.3954 Mean dependent var 59.9438Adjusted R-squared 0.3826 S.D. dependent var 14.2185S.E. of regression 11.1723 Akaike info criterion 7.7047Sum squared resid 5866.5939 Schwarz criterion 7.7819Log likelihood -186.7656 F-statistic 30.7425

Durbin-Watson stat 0.3753 Prob(F-statistic) 0.0000

Page 195: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 195/228

 

autocorrelazione 195

Residui e correlogramma:

-60

-40

-20

0

20

20

40

60

80

100

55 60 65 70 75 80 85 90 95 00

Residui Y Y stimati

Correlogramma dei residui del modello con errata specificazionedinamicaSample: 1952 2000Included observations: 49

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

. |***** | . |***** | 1 0.653 0.653 22.184 0.000. |*** | .*| . | 2 0.357 -0.121 28.957 0.000. |** | . |*. | 3 0.223 0.072 31.657 0.000. | . | .*| . | 4 0.055 -0.169 31.826 0.000. | . | . | . | 5 -0.045 -0.002 31.940 0.000. | . | . |*. | 6 -0.018 0.081 31.958 0.000. | . | .*| . | 7 -0.045 -0.087 32.080 0.000.*| . | . | . | 8 -0.096 -0.051 32.638 0.000.*| . | .*| . | 9 -0.116 -0.059 33.478 0.000.*| . | . | . | 10 -0.144 -0.051 34.804 0.000

Stimiamo ora il modello con dinamica omessa e con errori AR(1).Interpretando i risultati dei test di autocorrelazione dei residui dalla stimadel modello statico come evidenza di un processo AR(1) per gli errori, ilmodello è stimato imponendo una struttura autoregressiva del primo ordinesul termine di errore (stimando il parametro autoregressivo ½):

yt = ° 0 + ° 1xt + vt con vt = ½vt¡1 + ut

Page 196: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 196/228

 

196 capitolo 10

Risultati:

Modello con dinamica omessa eerrori AR(1)Dependent Variable: YMethod: Least SquaresSample: 1952 2000Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

C 50.0804 2.8556 17.5377 0.0000X 1.4493 0.1228 11.8001 0.0000

AR(1) 0.6932 0.0538 12.8832 0.0000

R-squared 0.8656 Mean dependent var 59.9438Adjusted R-squared 0.8598 S.D. dependent var 14.2185S.E. of regression 5.3245 Akaike info criterion 6.2418Sum squared resid 1304.1123 Schwarz criterion 6.3576Log likelihood -149.9237 F-statistic 148.1431Durbin-Watson stat 1.5738 Prob(F-statistic) 0.0000

Anche in questo caso il gra…co dei residui stimati e il correlogramma dellaserie non mostrano evidenti segni di autocorrelazione nei residui stimati:

-12

-8

-4

0

4

8

12

0

20

40

60

80

100

55 60 65 70 75 80 85 90 95 00

Residui Y Y stimati

Page 197: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 197/228

 

autocorrelazione 197

Correlogramma dei residui del modello senza dinamica con errori ASample: 1952 2000Included observations: 49

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

. |** | . |** | 1 0.210 0.210 2.2884

. |*. | . |*. | 2 0.140 0.100 3.3252 0.068

. |** | . |*. | 3 0.230 0.193 6.2025 0.045

.*| . | .*| . | 4 -0.058 -0.160 6.3861 0.094

. |*. | . |*. | 5 0.067 0.072 6.6386 0.156

. | . | . | . | 6 0.058 0.008 6.8354 0.233

.*| . | .*| . | 7 -0.087 -0.070 7.2808 0.296

. | . | . | . | 8 0.022 0.010 7.3116 0.397

.*| . | .*| . | 9 -0.066 -0.067 7.5819 0.475

.*| . | . | . | 10 -0.071 -0.008 7.9013 0.544

Da ultimo, procediamo al test della restrizione (common factor )implicitamente imposta sul modello dinamico:

¯ 1¯ 3 + ¯ 2 = 0

ottenendo il seguente risultato, da cui si conclude che tale restrizione deveessere ri…utata:

Wald Test:

Null hypothesis: beta(1)*beta(3)+beta(2)=0

Test Statistic Value df Probabilit

F-statistic 50.32 (1, 45) 0.00

Il test (correttamente) segnala che la restrizione implicitamente impostasul modello dalla stima statica con errori AR(1) non può essere applicabi-le ai dati utilizzati e favorisce la speci…cazione dinamica del modello (chesappiamo essere quella corretta).

Page 198: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 198/228

 

198 capitolo 10

10.7. Eteroschedasticità di tipo ARCH

Un tipo particolare di eteroschedasticità riguarda le serie storiche, special-mente quelle …nanziarie quali indici azionari, tassi di cambio, indici dei prez-zi, caratterizzate dall’alternarsi di periodi di maggiore e minore volatilità.Lo studio di queste serie ha portato alla formulazione di metodologie ingrado di stimare congiuntamente la media e la varianza condizionale dellevariabili economiche e …nanziarie.

Dato un semplice modello per yt del tipo

yt = ¯ 0 + ¯ 1yt¡1 + "t con j¯ 1j < 1

la media e la varianza condizionale  di yt sono date da:

E (yt j yt¡1; yt¡2;:::) = ¯ 0 + ¯ 1yt¡1

var(yt j yt¡1; yt¡2;:::) = E h

(yt ¡ ¯ 0 ¡ ¯ 1yt¡1)2 j yt¡1; yt¡2;:::

i= E ("2t j yt¡1; yt¡2;:::) = ¾2

t

dove si ipotizza che la varianza non sia costante nel tempo. Una speci…-ca ipotesi sul tipo di eteroschedasticità presente nei dati è quella detta diautoregressive  conditional  heteroscedasticity (ARCH), secondo la quale lavarianza dell’errore al tempo t dipende dalla grandezza degli errori veri…ca-

tisi in uno o più periodi passati. Formalmente, nel caso generale in cui glierrori di p periodi passati in‡uenzano la varianza condizionale in t, abbiamola seguente relazione:

¾2t = ®0 + ®1"2t¡1 + ®2"2t¡2 + ::: + ® p"2t¡ p

che descrive un processo autoregressivo di ordine p, ARCH(p), per la va-rianza condizionale di y.

Considerando il caso più semplice di un processo ARCH(1), notiamo chela relazione lineare fra ¾2

t e "2t¡1 deriva dalla seguente de…nizione del terminedi errore del modello:

"t = utq ®0 + ®1"2t¡1

dove ut è un processo white noise  con ¾2u = 1, ut e "t¡1 sono processi

stocastici indipendenti e ®0 > 0, 0 < ®1 < 1.Possiamo derivare le proprietà statistiche del processo "t, iniziando da

quelle non condizionali :

Page 199: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 199/228

 

autocorrelazione 199

- media non condizionale:

E ("t) = E µ

ut

q ®0 + ®1"2t¡1

¶= E (ut) | {z } 

0

µq ®0 + ®1"2t¡1

¶= 0

dove si è utilizzata l’ipotesi di indipendenza fra ut e "t¡1.- autocovarianze non condizionali:

E ("t"t¡1) = E 

·µut

q ®0 + ®1"2t¡1

¶µut¡1

q ®0 + ®1"2t¡2

¶¸= E (ut) | {z } 

0

E µq ®0 + ®1"2t¡1 ut¡1q ®0 + ®1"2t¡2¶ = 0

e, più in generaleE ("t"t¡i) = 0 8i 6= 0

- varianza non condizionale:

E ("2t ) = E 

"µut

q ®0 + ®1"2t¡1

¶2#

= E £u2

t

¡®0 + ®1"2t¡1

¢¤= E (u

2

t ) | {z } 1

E ¡®0 + ®1"

2

t¡1¢ = ®0 + ®1E ("

2

t¡1)

e poiché E ("2t ) = E ("2t¡1) otteniamo

E ("2t ) =®0

1¡ ®1

Le proprietà non condizionali  del processo di errore "t non sono quindi in-‡uenzate dalla particolare struttura ipotizzata: la media e le autocovarianzesono tutte nulle e la varianza è costante nel tempo.

Veniamo ora alle proprietà condizionali :

- media condizionale:

E ("t j "t¡1; "t¡2;:::) = E 

µut

q ®0 + ®1"2t¡1 j "t¡1; "t¡2;:::

¶= E (ut) | {z } 

0

µq ®0 + ®1"2t¡1

¶= 0

Page 200: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 200/228

 

200 capitolo 10

- varianza condizionale:

E ("2t j "t¡1; "t¡2;:::) = E 

"µut

q ®0 + ®1"2t¡1

¶2

j "t¡1; "t¡2;:::

#

= E (u2t ) | {z } 

1

¡®0 + ®1"2t¡1

¢= ®0 + ®1"2t¡1

Quindi la varianza condizionale di "t non è costante nel tempo ma dipendedal quadrato dell’errore veri…catosi nel periodo precedente, "2t¡1. Una rea-lizzazione di "2 elevata al tempo t

¡1 determina un aumento della varianza

dell’errore nel successivo periodo t. Pur essendo non autocorrelati  (infattiE ("t"t¡i) = 0), gli errori " non sono indipendenti . L’autocorrelazione misu-ra la dipendenza lineare  fra gli errori in periodi diversi, mentre il processoipotizzato lega le varianze degli errori (una forma non lineare di dipendenza).

Esempio (dati simulati).

Su un campione di 100 osservazioni (periodo 1901-2000) sono stati costruitii seguenti processi stocastici:

ut » N (0; 1)"t = ut

q 1 + 0:8 "2t¡1

Inoltre, per valutare gli e¤etti di una struttura ARCH  del termine di erro-re sull’andamento di una variabile y che rappresenta il fenomeno economi-co che si vuole descrivere, sono state costruite le seguenti due serie per yt

(ipotizzando y1901 = 0):

yt = 0:2 yt¡1 + "t ; yt = 0:8 yt¡1 + "t

Entrambi sono processi AR(1) con il termine di errore che segue un processoARCH(1), ma sono caratterizzati da diversi parametri che misurano il gradodi autocorrelazione della serie: 0:2 e 0:8. Un coe¢ciente su yt¡1 più elevatoampli…ca la persistenza nel tempo dell’e¤etto sulla volatilità di y dovutoall’errore ARCH .

Page 201: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 201/228

 

autocorrelazione 201

-15

-10

-5

0

5

10

15

10 20 30 40 50 60 70 80 90 00

E

-15

-10

-5

0

5

10

15

10 20 30 40 50 60 70 80 90 00

U

-15

-10

-5

0

5

10

15

10 20 30 40 50 60 70 80 90 00

Y (AR coeff. 0.2)

-15

-10

-5

0

5

10

15

10 20 30 40 50 60 70 80 90 00

Y (AR coeff. 0.8)

Page 202: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 202/228

 

202 capitolo 10

10.8. Esercizi

1. Considerate il seguente modello che descrive la “vera” relazione fra ye x nel tempo:

yt = ¯ 0 + ¯ 1 xt + "t

con V ar("t) = ¾2I. Le serie storiche a disposizione dell’econometricosono invece y¤t e x¤t , de…nite come:

y¤t = yt + yt¡1x¤t = xt + xt¡1

Nel tentativo di ottenere stime dei parametri ¯ 0 e ¯ 1, viene stimato ilmodello:

y¤t = ° 0 + ° 1 x¤t + vt

(a) Ricavate la relazione fra i parametri ¯ 0, ¯ 1 e ° 0, ° 1 e fra i terminidi errore "t e vt;

(b) individuate il tipo di processo stocastico seguito dai termini dierrore del modello stimato vt e derivatene la matrice di varianzee covarianze.

2. La relazione fra due serie storiche xt e yt è descritta dal modello “vero”

yt = ® + ¯ 0 xt + "t

dove "t è white noise  con E ("2t ) = ¾

2" e non è correlato con xt.Inoltre, la variabile xt è generata dal seguente processo stocastico

autoregressivo AR(1), con parametro 0 < ¯ 1 < 1 :

xt = ¯ 1 xt¡1 + vt

dove vt è white noise  con E (v2t ) = ¾2v e E ("tvt) = 0.

(a) Supponiamo che, al …ne di descrivere la relazione fra x e y, sistimi un modello dinamico della forma

yt = ± 0 + ± 1 xt¡1 + ut

Interpretate i parametri del modello stimato e la varianza del

termine di errore ut in funzione dei parametri dei modelli “veri”per xt e yt.

(b) Quali sono le conseguenze sulle stime di ± 0 e ± 1 di una variazionenel tempo del parametro ¯ 1 e quale interpretazione economicasuggeriscono riguardo alla relazione fra x e y?

Page 203: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 203/228

 

Capitolo 11

Violazione dell’assunzione di

normalità

Dato il modello di regressione lineare

y = X¯ + "

si è dimostrato che il vettore degli stimatori b ha una distribuzione normale

multivariata. Tale risultato è stato ottenuto assumendo che il vettore deitermini di errore " abbia a sua volta una distribuzione normale multivariata(teorema del limite centrale).

Dal momento che i test utilizzati per procedere all’inferenza statistica(test t e test F ) sono fondati sull’assunzione di normalità del vettore deitermini di errore, è importante disporre di un test che consenta di veri…carequesta ipotesi utilizzando la controparte campionaria del vettore ", cioè ilvettore dei residui e.

Misure di asimmetria e curtosi . Per analizzare la forma della distri-buzione dei residui stimati - in particolare il suo grado di asimmetria  e di

“appiattimento” (curtosi ) - vengono utilizzati il terzo ed il quarto momentointorno alla media. Per una generica variabile casuale X  con media ¹, talimomenti sono rispettivamente

E (X ¡ ¹)3

E (X ¡ ¹)4

Page 204: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 204/228

 

204

Per misurare il grado di asimmetria e di curtosi vengono utilizzate le seguenti

misure (denotate con S  - dall’inglese skewness  - e K - dall’inglese kurtosis ):

S  =E (X ¡ ¹)3

¾3

K  =E (X ¡ ¹)4

¾4

dove ¾ denota lo scarto quadratico medio della variabile (e ovviamente ¾2

denota il suo momento secondo dalla media, cioè la varianza). Nel caso incui la variabile X  sia distribuita normalmente:

S  = 0

K  = 3

Test di normalità Jarque-Bera  (JB). L’intuizione del test è semplice:se i dati osservati (nel nostro caso i residui stimati) sono generati da unadistribuzione normale, allora sia S  sia K ¡ 3 calcolati sui dati osservatidovrebbero essere prossimi a zero. Il test JB è costruito come segue:

JB = n

·S 2

6+

(K ¡ 3)2

24

¸Sotto l’ipotesi nulla di normalità la statistica JB ha una distribuzione asin-totica Â2 con 2 gradi di libertà. Pre…ssato un livello di signi…catività, se ilvalore della statistica JB eccede il valore critico della distribuzione, allorasi ri…uta l’ipotesi nulla di distribuzione normale. Per implementare il test èquindi necessario procedere prima al calcolo di S  e K  e successivamente alcalcolo della statistica JB.

Page 205: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 205/228

 

Capitolo 12

Variabili dummy

12.1. De…nizione

Alcune variabili esplicative possono aver natura qualitativa : sesso, localizza-zione (centro-nord/sud), titolo di studio (diploma di scuola media inferiore,scuola media superiore, laurea). L’e¤etto di queste variabili esplicative sullavariabile dipendente può essere valutato nel contesto del modello di regres-sione attraverso l’utilizzo di variabili dummy . Tipicamente una variabiledummy  (D) assume valore 1 se si veri…ca una condizione e 0 altrimenti.

Esempi:

D = 1 se un individuo è maschio, D = 0 se è femmina

oppure

D = 1 se un’impresa è localizzata nel centro-nord, D = 0 se nel sud

oppure

D1 = 1 se un individuo ha un dipl. di scuola media sup., D1 = 0 se non lo ha;

D2 = 1 se un individuo è laureato, D2 = 0 se non lo è.

Page 206: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 206/228

 

206 capitolo 12

12.2. Variabili dummy additive

Si consideri il seguente modello composto da due equazioni, dove la prima siriferisce agli individui femmine (F ) e la seconda agli individui maschi (M ):

yi = ¯ F 0 + ¯ 1 xi + "i

yi = ¯ M 0 + ¯ 1 xi + "i

Le due equazioni possono essere combinate in una singola equazione validaper tutti gli individui:

yi = ¯ F 0 + (¯ M 

0 ¡ ¯ F 0 ) Di + ¯ 1 xi + "i

dove Di è una variabile dummy  pari a 0 se l’individuo è femmina e 1 se èmaschio. Supponendo che yi misuri lo stipendio e xi il numero di anni lavo-rativi, il coe¢ciente (¯ M 

0 ¡ ¯ F 0 ) quanti…ca l’e¤etto del sesso sullo stipendio

a parità di anni lavorativi.

Forma matriciale. Possiamo esprimere il modello con variabili dummy  informa matriciale come segue:µ

yF 

yM 

¶= ¯ F 

0

µi

0

¶+ ¯ M 

0

µ0

i

¶+ ¯ 1

µxF 

xM 

¶+

µ"F 

"M 

) µ yF 

yM  ¶ = ¯ F 0 µ i

i ¶+ (¯ M 0 ¡ ¯ F 0 ) µ 0

i ¶+ ¯ 1 µ xF 

xM  ¶+µ "F 

"M  ¶) y = ¯ F 

0 i + (¯ M 0 ¡ ¯ F 

0 ) D + ¯ 1 x + "

con D =

µ0

i

Caso di tre modalità qualitative . Consideriamo ora il seguente modellocomposto da tre equazioni, dove la prima si riferisce agli individui che nonhanno un diploma di scuola media superiore (I ), la seconda agli individui

che hanno un diploma di scuola media superiore ma non la laurea (S ) e laterza agli individui laureati (L):

yi = ¯ I 0 + ¯ 1 xi + "i

yi = ¯ S 0 + ¯ 1 xi + "i

yi = ¯ L0 + ¯ 1 xi + "i

Page 207: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 207/228

 

variabili dummy 207

Le tre equazioni possono essere combinate in una singola equazione valida

per tutte le osservazioni:

yi = ¯ I 0 + (¯ S 

0 ¡ ¯ I 0) D1i + (¯ L0 ¡ ¯ I 

0) D2i + ¯ 1 xi + "i

con

D1i =

½1 per media super.0 altrimenti

D2i =

½1 per laurea0 altrimenti

Continuando a supporre che y misuri lo stipendio e x il numero di annilavorativi, il coe¢ciente (¯ S 

0¡¯ I 0) misura l’e¤etto sullo stipendio del diploma

di scuola media superiore mentre il coe¢ciente (¯ L0¡

¯ I 0) misura l’e¤etto della

laurea, sempre a parità di anni lavorativi.

Test di ipotesi . La stima della regressione lineare con due variabili dummy 

yi = ± 0 |{z} ¯ I 0

+ ± 1 |{z} ¯ S0¡¯ I 0

D1i+ ± 2 |{z} ¯ L0¡¯ I 0

D2i + ¯ 1 xi + "i

fornisce stime per i parametri ± 0, ± 1 e ± 2, interpretabili nei termini dei pa-rametri ¯  del modello originario. È possibile a questo punto condurre deitest per sottoporre a veri…ca ipotesi sui coe¢cienti stimati. Ad esempio,supponiamo di voler veri…care l’ipotesi che, a parità di anni lavorativi, la

variazione di reddito dovuta al passaggio da un titolo di scuola media inferio-re al diploma di scuola media superiore sia uguale alla variazione ottenibiledal passaggio alla laurea dal diploma di scuola media superiore. Formal-mente, tale ipotesi può essere espressa nei termini dei parametri ¯  originalicome:

H 0 : ¯ L0 ¡ ¯ S 0 = ¯ S 

0 ¡ ¯ I 0

oppureH 0 : ¯ L0 ¡ ¯ I 

0 = 2(¯ S 0 ¡ ¯ I 

0)

e nei termini dei parametri del modello applicato a tutte le osservazioni

H 0 : ± 2 = 2± 1

Per procedere alla veri…ca di tale ipotesi si stima il modello non ristretto,ricavandone la somma del quadrato dei residui (URSS , unrestricted residual sum of squares )

yi = ± 0 + ± 1D1i + ± 2 D2i + ¯ 1 xi + "i ) URSS 

Page 208: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 208/228

 

208 capitolo 12

Imponendo la restrizione ± 2 = 2± 1, il modello ristretto viene così formulato:

yi = ± 0 + ± 1 D1i + 2 ± 1 D2i + ¯ 1 xi + "i

) yi = ± 0 + ± 1 (D1i + 2 D2i)  | { z }  D3i

+¯ 1 xi + "i

con la (nuova) variabile dummy  D3 = D1 + 2D2 de…nita nel modo seguente:

D3i =

8<

:

0 inferiore a sc. media sup.1 scuola media superiore2 laurea

Si può quindi stimare il seguente modello ristretto e ricavarne la relativasomma del quadrato dei residui (RRSS , restricted residual sum of squares ):

yi = ± 0 + ± 1 D3i + ¯ 1 xi + "i ) RRSS 

La veri…ca dell’ipotesi H 0 (che comporta una restrizione lineare sui parame-tri del modello originario) è e¤ettuata mediante la costruzione della seguentestatistica F :

F  =RRSS ¡ URSS 

URSS n¡4

distribuita (sotto H 0) come una F (1; n¡ 4).

Page 209: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 209/228

 

variabili dummy 209

12.3. Variabili dummy moltiplicative

Fino a questo punto abbiamo assunto che l’e¤etto del sesso, del titolo distudio, ecc. sia semplicemente additivo. Tuttavia, è possibile che questecaratteristiche qualitative in‡uenzino anche la relazione esistente fra numerodi anni lavorativi e stipendio. In questo caso:

yi = ¯ F 0 + ¯ F 

1 xi + "i

yi = ¯ M 0 + ¯ M 

1 xi + "i

da cui si deriva, utilizzando variabili dummy , l’equazione generale applicabilea tutti gli individui:

yi = ¯ F 0 + (¯ M 

0 ¡ ¯ F 0 ) Di + ¯ F 

1 xi + (¯ M 1 ¡ ¯ F 

1 ) Di xi + "i

I coe¢cienti (¯ M 0 ¡ ¯ F 

0 ) e (¯ M 1 ¡ ¯ F 

1 ) misurano rispettivamente l’e¤ettodel sesso sullo stipendio all’inizio della vita lavorativa (quando cioè x =0) e l’e¤etto del sesso sullo stipendio per ogni anno aggiuntivo di lavoro.Ad esempio, (¯ M 

0 ¡ ¯ F 0 ) > 0 e (¯ M 

1 ¡ ¯ F 1 ) = 0 implica che gli uomini

ottengono una remunerazione più elevata all’ingresso nel mercato del lavoro,ma che tale di¤erenziale rimane invariato nel corso della vita lavorativa degliindividui.

Forma matriciale. Possiamo esprimere il modello con variabili dummy 

moltiplicative in forma matriciale come segue:µyF 

yM 

¶= ¯ F 

0

µi

0

¶+ ¯ M 

0

µ0

i

¶+ ¯ F 

1

µxF 

0

¶+ ¯ M 

1

µ0

xM 

¶+

µ"F 

"M 

¶µ

yF 

yM 

¶= ¯ F 

0

µi

i

¶+ (¯ M 

0 ¡ ¯ F 0 )

µ0

i

¶+

+¯ F 1

µxF 

xM 

¶+ (¯ M 

1 ¡ ¯ F 1 )

µ0

xM 

¶+

µ"F 

"M 

) y = ¯ F 0 i + (¯ M 

0 ¡ ¯ F 0 ) D + µ

xF  0

xM  xM  ¶ µ¯ F 1

¯ M 

1 ¡¯ F 

1 ¶+ "

con D =µ

0

i

Page 210: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 210/228

 

210 capitolo 12

12.4. Variabili dummy e test di stabilità dei parametri.

Consideriamo il seguente modello non ristretto composto da due equazioni:

yi = ¯  pre0 + ¯  pre

1 xi + "i

yi = ¯  post0 + ¯  post

1 xi + "i

dove la prima equazione si applica alle prime n1 osservazioni (periodo “pre”)e la seconda alle successive n2 osservazioni (periodo “post”).

Utilizzando una variabile dummy  D che assume valore 0 se l’osservazionesi riferisce al periodo “pre” e valore 1 se si riferisce al periodo “post”, le dueequazioni possono essere combinate come segue:

yi = ¯  pre0 + (¯  post

0 ¡ ¯  pre0 ) Di + ¯  pre

1 xi + (¯  post1 ¡ ¯  pre

1 ) Di xi + "i

Dal modello non ristretto è possibile veri…care l’ipotesi di stabilità nel tempodei due parametri del modello (l’“intercetta” ¯ 0 e la “pendenza” ¯ 1) sottopo-nendo a test la signi…catività dei coe¢cienti (¯  post

0 ¡¯  pre0 ) e (¯  post

1 ¡¯  pre1 ). Si

possono imporre le seguenti restrizioni, a cui corrisponde un diverso modelloristretto:

(i) diverse “intercette” ma uguali “pendenze”, con modello ristretto:

yi = ¯  pre0 + (¯  post

0

¡¯  pre0 ) Di + ¯ 1 xi + "i

(ii) diverse “pendenze” ma uguali “intercette”, con modello ristretto:

yi = ¯ 0 + ¯  pre1 xi + (¯  post

1 ¡ ¯  pre1 ) Di xi + "i

(iii) uguali “pendenze” ed uguali “intercette”, con modello ristretto:

yi = ¯ 0 + ¯ 1 xi + "i

Page 211: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 211/228

 

variabili dummy 211

12.5. Esercizi

1. Le osservazioni yi si riferiscono al reddito di un campione di individuicomposto da nM  maschi e nF  femmine. Il modello che viene stimatoè semplicemente

yi = ¯ 0 + ¯ 1 di + "i

dove di è una variabile dummy  costruita come segue:

di =

½0 per le femmine1 per i maschi

Il numero di individui nel campione è n = nF  + nM .

(a) Ricavate gli stimatori OLS dei parametri ¯ 0 e ¯ 1 e interpretateneil signi…cato:

(b) impostate il test appropriato per l’ipotesi nulla di uguaglianza frail reddito medio dei maschi e quello delle femmine.

2. Supponiamo di essere interessati alla stima della relazione fra due va-riabili xt e yt nell’arco del periodo t = 1;:::;T . Ipotizziamo anche che,all’interno del periodo in esame, si possano individuare tre sottope-riodi di¤erenti, caratterizzati da speci…ci parametri ® e ¯ . I modellirelativi a ciascun sottoperiodo hanno la forma seguente (con l’errore "

white noise  in tutti i sottoperiodi):

yt = ®1 + ¯ 1 xt + "1t per t = 1;:::;t1

yt = ®2 + ¯ 2 xt + "2t per t = t1 + 1;:::;t2

yt = ®3 + ¯ 3 xt + "3t per t = t2 + 1;:::;T 

(a) Scrivete un modello unico (valido per t = 1;:::;T ) che incorporile tre relazioni sopra ipotizzate, de…nendo le eventuali variabilidummy  costruite e interpretando correttamente tutti i parametridel modello.

(b) Spiegate come si può procedere al test  congiunto delle seguentiipotesi: (i ) l’e¤etto di xt su yt è uguale nel primo e nel terzosottoperiodo; (ii ) il valore dell’intercetta nel secondo sottoperiodoè pari alla somma dei valori delle intercette nei rimanenti dueperiodi.

Page 212: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 212/228

 

212

Page 213: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 213/228

 

Capitolo 13

Modelli dinamici

13.1. Introduzione

Un modello di regressione si dice dinamico quando sul lato destro dell’e-quazione sono inclusi valori ritardati delle variabili indipendenti e/o dellavariabile dipendente. Possiamo distinguere due tipologie di modelli dinami-ci:

(i) modello a ritardi distribuiti (con K  …nito):

yt = ® + ¯ 0xt + ¯ 1xt¡1 + ::: + ¯ K xt¡K  + "t per t = 1; 2;:::;T 

(ii) modello autoregressivo:

yt = ® + ¯ 0xt + °yt¡1 + "t per t = 1; 2;:::;T 

Page 214: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 214/228

 

214 capitolo 13

13.2. Modelli a ritardi distribuiti

Dato il seguente modello dinamico a ritardi distribuiti

yt = ® + ¯ 0xt + ¯ 1xt¡1 + ::: + ¯ K xt¡K  + "t per t = 1; 2;:::;T 

¯ 0 è de…nito moltiplicatore di breve periodo (o moltiplicatore di impatto) emisura l’e¤etto sul valore atteso di yt di una variazione unitaria di x nellostesso periodo. Supponendo che dal periodo t + 1 in poi x rimanga costanteal livello raggiunto nel periodo t, allora

¯  = ¯ 0 + ¯ 1 + ::: + ¯ K 

misura l’e¤etto sul valore atteso di yt+K  di una variazione di x nel periodot. ¯  è de…nito moltiplicatore di lungo periodo (o moltiplicatore totale).

Stima: procedura di Koyck . Per procedere alla stima del modello di-namico, si può decidere “a priori” il numero dei ritardi oppure selezionarlomediante una ricerca sequenziale. Il problema che si può incontrare è lamulticollinearità delle variabili, con conseguenti problemi di e¢cienza dellestime. Una procedura che evita il problema (procedura di Koyck ) si basa suuna ipotesi sui parametri del vettore da stimare ¯. In particolare, con rife-rimento al modello dinamico a ritardi distribuiti visto sopra, per un numeroin…nito di ritardi (k !1), assumiamo che i parametri ¯ k siano tutti dellostesso segno e declinino geometricamente secondo la relazione

¯ k = ¯ 0 ¸k

con 0 < ¸ < 1. La “velocità di aggiustamento” di y a variazioni nel valoredi x è data da 1¡¸. Il modello a ritardi distribuiti può quindi essere scrittocome:

yt = ® + ¯ 0xt + ¯ 0 ¸ xt¡1 + ¯ 0 ¸2 xt¡2 + ::: + "t

Ritardando questa espressione di un periodo:

yt¡1 = ® + ¯ 0xt¡1 + ¯ 0 ¸ xt¡2 + ¯ 0 ¸2 xt¡3 + ::: + "t¡1

e moltiplicandola per ¸ otteniamo

¸ yt¡1 = ¸ ® + ¸ ¯ 0xt¡1 + ¯ 0 ¸2 xt¡2 + ¯ 0 ¸3 xt¡3 + ::: + ¸ "t¡1

Sottraendo otteniamo

yt ¡ ¸ yt¡1 = ® (1¡ ¸) + ¯ 0xt + "t ¡ ¸ "t¡1

Page 215: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 215/228

 

modelli dinamici 215

e in…ne

yt = ® (1¡ ¸) + ¯ 0xt + ¸ yt¡1 + vt

con vt = "t ¡ ¸ "t¡1

Il moltiplicatore di lungo periodo è uguale a

¯  =1X

k=0

¯ k =¯ 0

1¡ ¸

Si può osservare ora che:

(a) data la struttura dei ritardi è stato possibile riscrivere il modello aritardi distribuiti come un modello autoregressivo, riducendo quindi iproblemi di multicollinearità;

(b) la variabile yt¡1 è stocastica (è infatti funzione di "t¡1). Ciò viola l’as-sunzione che la matrice X sia una matrice di costanti. Se assumiamoche

Cov (yt¡1; vt) = 0

è ancora possibile stimare il modello con OLS. Tuttavia:

(c) assumendo che "t segua un processo stocastico white noise , il termine

di errore vt nel modello autoregressivo segue un processo stocastico amedia mobile del primo ordine M A(1). Ne segue che

Cov (yt¡1; vt) = Cov (yt¡1; "t ¡ ¸"t¡1) = ¡¸¾2 6= 0

Si può dimostrare che in questo caso lo stimatore OLS è distorto einconsistente.

Page 216: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 216/228

 

216 capitolo 13

13.3. Fondamenti economici dei modelli dinamici (I): modello con aspet-

tative adattive

Consideriamo il seguente modello economico, che descrive la relazione frauna variabile (dipendente) y e le aspettative  su una variabile (indipendente)x:

yt = ® + ¯ 0 x¤t+1 + "t

dove x¤t+1 rappresenta l’aspettativa (degli agenti economici) formata al tem-po t sul valore che la variabile x assumerà al tempo t+1. Notiamo che questasemplice relazione non ha alcun elemento dinamico (non sono presenti valoriritardati di y o di x¤).

Assumiamo che le aspettative si formino in modo adattivo, secondo la

seguente relazione:x¤t+1 ¡ x¤t = ° (xt ¡ x¤t )

Le aspettative formate al tempo t (e quindi relative al periodo futuro t +1) sono riviste in funzione dello scostamento (detto “errore di previsione”)tra il valore e¤ettivamente realizzatosi della variabile al tempo t, xt, e leaspettative che si erano formate al tempo t¡1, x¤t . Il parametro ° > 0 misuradi quanto gli agenti modi…cano le proprie aspettative sulla base degli erroridi previsione compiuti. Possiamo riscrivere il meccanismo di formazionedelle aspettative come segue:

x¤t+1 = ° xt + (1

¡° ) x¤t

Sostituendo quest’ultima equazione nel modello originario per y abbiamo:

yt = ® + ¯ 0 [° xt + (1¡ ° ) x¤t ] + "t

Ritardando di un periodo il modello originario otteniamo:

yt¡1 = ® + ¯ 0 x¤t + "t¡1

e moltiplicando entrambi i membri dell’ultima equazione per (1¡ ° ):

(1¡ ° ) yt¡1 = (1 ¡ ° ) ® + (1¡ ° ) ¯ 0 x¤t + (1¡ ° ) "t¡1

In…ne, sottraendo, otteniamo:

yt = ° ® + ° ¯ 0 xt + (1¡ ° ) yt¡1 + "t ¡ (1¡ ° ) "t¡1

che può essere riscritto come

yt = ° ® + ° ¯ 0 xt + (1¡ ° ) yt¡1 + vt

con vt = "t ¡ (1¡ ° ) "t¡1

Page 217: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 217/228

 

modelli dinamici 217

Si noti che da un modello economico (statico) con aspettative adattive si

ottiene una relazione dinamica fra y e x di forma analoga a quella ottenutapartendo da un modello a ritardi distribuiti e utilizzando la procedura diKoyck.

13.4. Fondamenti economici dei modelli dinamici (II): modello con “ag-giustamento parziale”

Consideriamo ora un modello economico che descrive la relazione fra unvalore desiderato (o obiettivo) per la variabile y e il valore assunto da un’altravariabile x:

y¤t = ® + ¯ 0 xt + "t

dove y¤t denota il livello desiderato di y per il tempo t (ad esempio, lo stock di capitale desiderato da un’impresa). Nuovamente notiamo che il modellonon contiene originariamente alcun elemento dinamico. Come nel caso pre-cedente erano le aspettative a non essere direttamente osservabili (e quindi arichiedere un’ipotesi sul loro meccanismo di formazione) così in questo caso èil valore desiderato y¤ a non essere osservabile. Adottiamo la seguente ipote-si (detta di “aggiustamento parziale” o stock adjustment ) per legare il valoree¤ettivo (ed osservabile) di y con il suo valore desiderato (non osservabile):

yt ¡ yt¡1

 | {z } aggiustamentoe¤ettivo

= ±  (y¤t ¡ yt¡1)

  | { z } aggiustamentodesiderato

Tale relazione ipotizza che in ogni periodo t il valore e¤ettivo di y van-ga variato (“aggiustamento e¤ettivo”, membro di sinistra dell’equazione) inmodo da colmare (almeno) parte della di¤erenza fra valore desiderato per ilperiodo y¤t e valore e¤ettivo di partenza yt¡1 (“aggiustamento desiderato”,membro di destra dell’equazione). Il parametro 0 < ± · 1 misura la frazio-ne dell’aggiustamento desiderato che viene e¤ettivamente compiuta in ogniperiodo t.

Questo meccanismo di aggiustamento può essere equivalentemente ri-

scritto nel modo seguente:yt = ± y¤t + (1¡ ± ) yt¡1

Sostituendo dal modello originario l’espressione per y¤t in quella per yt siottiene:

yt = ± ® + ± ¯ 0 xt + (1¡ ± ) yt¡1 + ± "t

Page 218: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 218/228

 

218 capitolo 13

Questa equazione ora esprime una relazione dinamica fra x e il valore e¤etti-

vo (ed osservabile) di y. Si osservi come l’equazione abbia la stessa strutturaottenuta dal modello dinamico a ritardi distribuiti dopo l’applicazione dellaprocedura di Koyck, con l’unica di¤erenza che in questo caso il termine dierrore non è autocorrelato.

13.5. Modelli dinamici: cenno ai problemi di stima

Nelle sezioni precedenti sono state introdotte alcune semplici tipologie dimodelli dinamici, che qui riportiamo chiamandole per brevità “Koyck”,“aspettative adattive” e “aggiustamento parziale”:

yt = ® (1¡ ¸) + ¯ 0 xt + ¸ yt¡1 + ("t ¡ ¸ "t¡1) (Koyck)

yt = °® + °¯ 0xt + (1¡ ° )yt¡1 + ("t ¡ (1¡ ° )"t¡1) (Adatt.)

yt = ± ® + ± ¯ 0 xt + (1¡ ± ) yt¡1 + ± "t (Agg. parz.)

Tutti i modelli visti hanno una comune forma dinamica autoregressiva deltipo generale:

yt = ·0 + ·1 xt + ·2 yt¡1 + vt

Nei primi due casi, inoltre, il termine di errore (non autocorrelato nel mo-dello originario) presenta autocorrelazione di tipo MA(1). Si pone quindi ilseguente problema per la stima  del modello:

² inclusione di yt¡1 (elemento stocastico) fra i regressori

in presenza di

² autocorrelazione  nel termine di errore

Dal momento che yt¡1 è funzione di vt¡1 l’assunzione che la matrice deiregressori X sia non stocastica è violata. Anche in presenza di matrice X

(anche solo parzialmente) stocastica, lo stimatore OLS continua ad esse-re consistente purchè sia possibile assumere Cov(yt¡1; vt) = 0. Tuttavia,tale assunzione non può valere per i modelli in cui il termine di errore èautocorrelato: in questo caso lo stimatore OLS è distorto e inconsistente.

In questo caso si può utilizzare per la stima il metodo delle “variabilistrumentali” (instrumental variables , IV), che produce stimatori consistenti

Page 219: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 219/228

 

modelli dinamici 219

dei parametri. L’idea è di utilizzare altre variabili (dette appunto “stru-

mentali”) per trasformare il modello originario in modo da rimuovere lacorrelazione fra regressori e termine di errore e poter procedere alla stimamediante OLS.

A titolo di esempio, consideriamo il seguente modello di regressione

y = XT £3

¯ + v

con i termini di errore nel vettore v autocorrelati (del primo ordine). Inparticolare consideriamo

X =¡

i x y¡1¢

e vt = "t ¡ ¸ "t¡1

Per ipotesi, il regressore xt non è correlato con il termine di errore vt men-

tre il regressore yt¡1 presenta tale correlazione e necessita di una variabile“strumentale”. Tale variabile deve possedere due proprietà: (i ) non deveessere correlata con il termine di errore vt, e (ii ) deve essere correlata conla variabile yt¡1. Supponiamo di aver individuato nel valore ritardato di x,cioè xt¡1, tale variabile “strumentale” per cui valgono: Cov(xt¡1; vt) = 0e Cov(xt¡1; yt¡1) 6= 0 Costruiamo la seguente matrice (detta “matrice divaribili strumentali”, Z) che raccoglie i regressori del modello originario noncorrelati con il termine di errore vt (cioè la costante e xt) e, al posto di yt¡1,la variabile strumentale xt¡1. Tale matrice (di cui si assume rango pieno,pari nel nostro esempio a 3) risulta quindi costruita come

ZT £3= (i x x¡1)

Possiamo ora procedere alla trasformazione del modello di partenza pre-moltiplicando entrambi i lati dell’equazione per la matrice Z0:

Z0 y = Z0 X¯ + Z0 v

) yz = Xz ¯ + vz

Sul modello trasformato si procede poi alla stima mediante OLS, ricavandoil vettore degli stimatori IV, che godono della proprietà della consistenza:

bIV   = ¡X0z Xz¢¡1 X0

z yz

X0 Z Z0 X¢¡1

X0 Z Z0 y

Z0 X¢¡1 ¡

X0 Z¢¡1

X0 Z Z0 y

Z0 X¢¡1

Z0 y

Page 220: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 220/228

 

220

13.6. Test di autocorrelazione in modelli autoregressivi (del primo or-

dine)

Il test Durbin-Watson non può essere applicato per veri…care la presenzadi autocorrelazione del primo ordine quando la matrice dei regressori X èstocastica. In particolare, se la variabile dipendente ritardata è inclusa fra iregressori, la statistica DW  risulta distorta verso il valore 2 e quindi tendead accettare troppo spesso l’ipotesi nulla di assenza di autocorrelazione.Nel caso di presenza di yt¡1 fra i regressori, Durbin ha proposto la seguentestatistica:

D = r

s T 

1

¡T V ar (g)

dove T  è il numero delle osservazioni nel campione, r è il coe¢ciente dicorrelazione campionario dei residui ricavati dalla stima mediante OLS del-l’equazione, e g è lo stimatore OLS del parametro associato alla variabiledipendente ritardata (° , nella formulazione del modello autoregressivo pro-posta nell’introduzione). Se l’ipotesi nulla di assenza di autocorrelazionedel primo ordine è vera, la statistica D tende a distribuirsi asintoticamentecome una normale standardizzata.

Per e¤ettuare il test di Durbin è quindi necessario:

(a) stimare il modello originale con OLS;

(b) calcolare r, V ar(g) e la statistica D;

(c) pre…ssato un livello di signi…catività, ad esempio 0,05, confrontare ilvalore di D con i corrispondenti valori critici della distribuzione nor-male standardizzata, che nell’esempio risultano essere 1; 96 e ¡1; 96.Se l’ipotesi nulla è vera

Prob (¡1; 96 · D · 1; 96) = 0; 95

e se D cade in questo intervallo l’ipotesi di assenza di autocorrelazio-ne non può venire ri…utata dal test. Invece, se D > 1; 96 l’ipotesinulla è ri…utata e c’è evidenza di autocorrelazione positiva, mentre seD < ¡1; 96 l’ipotesi nulla è ri…utata e c’è evidenza di autocorrelazionenegativa.

Page 221: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 221/228

 

Capitolo 14

Tavole

Le pagine seguenti contengono tavole con i valori critici di alcune distri-buzioni ampiamente utilizzate in econometria per la costruzione di intervallidi con…denza e per il test delle ipotesi (si veda il capitolo 2 per le distribuzioninormale, Â2, t ed F ; il capitolo 10 per la distribuzione Durbin-Watson).

Page 222: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 222/228

 

222 capitolo 14

14.1. Distribuzione normale standardizzata

Esempio

P r (0 · Z · 1; 96) = 0; 475P r (Z > 1; 96) = 0; 5¡ 0; 475 = 0; 025

Page 223: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 223/228

 

tavole 223

14.2. Distribuzione Â2

Esempio ( per 20 gradi di libertµa) :

P r¡

Â2 > 10; 85¢

= 0; 95P r

¡Â2 > 23; 83

¢= 0; 25

P r ¡Â2 > 31; 41¢ = 0; 05

Page 224: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 224/228

 

224 capitolo 14

14.3. Distribuzione t

Esempio ( per 20 gradi di libertµa) :

P r (t > 2; 086) = 0; 025P r (t > 1; 725) = 0; 05

P r (jtj > 1; 725) = 0; 10

Page 225: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 225/228

 

tavole 225

14.4. Distribuzione F 

Esempio (N 1 = 10 e N 2 = 9)

P r (F > 2; 42) = 0; 10P r (F > 3; 14) = 0; 05P r (F > 5; 26) = 0; 01

Page 226: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 226/228

 

226 capitolo 14

Page 227: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 227/228

 

tavole 227

14.5. Distribuzione Durbin-Watson

Valori critici inferiori e superiori per ® = 5%

Page 228: Appunti econometria_2006

5/10/2018 Appunti econometria_2006 - slidepdf.com

http://slidepdf.com/reader/full/appunti-econometria2006 228/228

 

228

Valori critici inferiori e superiori per ® = 1%