Capitolo 5 5-1 5-2 G L S 5-3 AR(1); Lo stimatore di Prais-Winsten...
Transcript of Capitolo 5 5-1 5-2 G L S 5-3 AR(1); Lo stimatore di Prais-Winsten...
5- Econometria, a.a. 2012-13
Capitolo 5
5-1 Il metodo GLS (per campioni finiti)
5-2 Il metodo (asintotico) FGLS (Feasible Generalized Least Square)
5-3 Stima dei modelli lineari con errori AR(1); Lo stimatore di Prais-Winsten
5-4 Il metodo di Cochrane-Orcutt
5-5 Appendice: Il test di White e il test di Breusch-Pagan (sulla presenza di eteroschedasticita`)
5-6 Appendice: I modelli AR, MA e ARMA per processi stazionari autocorrelati
5-7 Previsione nei processi ARMA
Nei metodi di stima OLS e NLS, presentati nei precedenti capitoli, l’eventuale presenza di
eteroschedasticità (e eventualmente della autocorrelazione) negli errori influenza soltanto la
varianza asintotica degli stimatori; detti stimatori sono asintoticamente efficienti in una opportuna
classe di stimatori (la classe degli stimatori costruiti con il metodo dei momenti) se gli errori sono
omoschedastici( )1 . In questo capitolo si descrivono procedure che consentono, in particolari
contesti e in presenza di eteroschedasticità (e/o correlazione), di costruire stimatori asintoticamente
più efficienti.
Per semplicità si farà riferimento ai soli modelli lineari (ma i risultati asintotici sono validi
anche per i modelli nonlineari) e inizialmente, come d’altronde è stato fatto quando è stato
presentato il metodo OLS, si farà una veloce carrellata su quanto gia` noto nel caso di campioni
finiti.
5-1 Il metodo GLS-Generalized Least Square (per campioni finiti)
E’ assegnato il modello lineare
t ty ut′= +x β per (o in forma matriciale 1, ,t = … n = +y Xβ u ).
con le seguenti ipotesi sugli errori:
i) Stretta esogeneità delle variabili (cioè E(tx | ) 0tu =X per ogni 1, ,t n= … );
ii) Errori eteroschedastici ed eventualmente correlati (cioè e 2E( | ) ( )σ′ = =uu X Σ Δ n≠Δ I ; se
gli errori sono non correlati allora la matrice è diagonale). Δ
iii) La matrice è completamente nota (dunque l’unico parametro non noto nella varianza degli
errori è
Δ2σ ).
Costruzione dello stimatore GLS: Si considera una matrice (quadrata di ordine ) tale che Ψ n
( )1 Naturalmente se le variabili dipendenti sono esogene o predeterminate e sussistono le usuali ipotesi sui processi che assicurino l’identificabilita` del modello e l’asintotica normalita` delle stime.
1
5- Econometria, a.a. 2012-13
1− ′=Δ ΨΨ (2) e il modello lineare
(*) = +Ψy ΨXβ v , =v Ψu ,
che, data l`invertibilità di , è equivalente al modello originario. In esso, le variabili sono
strettamente esogene e gli errori sono omoschedastici; infatti si ha
Ψ
( )E( | ) E( | ) E( | )= =v ΨX Ψu ΨX Ψ u ΨX 0=
=
,
2 2E( | ) E( | ) E( | ) nσ σ′ ′ ′ ′ ′ ′= = =vv ΨX Ψuu Ψ ΨX Ψ u u ΨX Ψ ΨΔΨ I .
Definizione 1: Posto (essendo lo stimatore OLS di per il modello (*)),
dicesi stimatore GLS (dei minimi quadrati generalizzati) di per il modello originario.
*ˆ ˆGLS OLS=β β *ˆ
OLSβ β ˆGLSβ
β
Proprietà dello stimatore GLS (seguono facilmente dalle proprietà di . L’elenco è comunque
parziale):
*ˆOLSβ
• ha la seguente rappresentazione ˆGLSβ ( ) ( )( )1 11 1 1 1ˆ
GLS
− −− − − −′ ′ ′ ′= Δ Δ = + Δ Δβ X X X y β X X X u .
• è stimatore corretto di β ; ˆGLSβ
• è efficiente (nel senso che ha la minima varianza tra gli stimatori corretti e lineari in ˆGLSβ y );
• ; ( ) (1 12 2ˆvar( | )GLS σ σ− −′ ′ ′= =β X XΨΨX X ΔX)
))
• Se allora si ha ( )2 2| ( , ) e sono indipendenti e ( , )N Nσ σ⇔u X 0 Δ u X u 0 Δ∼ ∼
( )ˆ ˆ| ( , var( |GLS GLSNβ X β β X∼
• 2 1 1 1 1 11 1( ( ) ) ( )s In k n k
− − − − − − −′ ′ ′ ′ ′ ′ ′ ′1 1⎡ ⎤= − = −⎣ ⎦− −y Ψ ΨX X Δ X XΨ Ψy y Δ Δ X X Δ X X Δ y è uno
stimatore corretto di 2σ ; inoltre se gli errori hanno distribuzione normale allora e sono
indipendenti e
ˆGLSβ 2s
22
2( ) n ksn k χσ −− ∼ .
Osservazione:
a) La matrice ( )1 1 1
( 1) ( 1)
k k
n n× ×
⎡ ⎤ k⎡ ⎤⎡ ⎤= = =⎣ ⎦ ⎣ ⎦⎢ ⎥⎣ ⎦ΨX Ψ Ψ Ψ… … …X X X X X X è la matrice (di
ordine ) delle osservazioni delle variabili indipendenti del modello (*). Se tali nuove variabili
sono denotate con il simbolo
n k×
1, , kx x… , la t esima− osservazione di jx è combinazione lineare
( )2 Una tale matrice esiste (e non è unica), in quanto la matrice Δ e` a meno di una costante la matrice di covarianza del vettore degli errori u e pertanto e` simmetrica e definita positiva.
2
5- Econometria, a.a. 2012-13
delle osservazioni della corrispondente variabile (originaria) n jx , i cui coefficienti sono gli
elementi della t e riga di . Da ciò segue sima− Ψ
1) (le variabili sono strettamente esogene)tx ⇔ (le variabili sono strettamente
esogene);
tx
2) le variabili e non possono essere contemporaneamente (soltanto) esogene a
meno che la matrice non sia diagonale.
tx tx
Δ
b) minimizza la funzione obiettivo ˆGLSβ 11( ) ( ) (Q
n−′= − −β )y Xβ Δ y Xβ ; (la verifica è
immediata). Dunque minimizza la distanza di ˆGLSβ y da Xβ , distanza definita dalla matrice
simmetrica e definita positiva (che è a meno di un fattore moltiplicativo l’inversa della varianza
degli errori).
1−Δ
c) e` lo stimatore del parametro (del modello originario) costruito con il metodo dei
momenti, utilizzando il vettore (di dimensione ) di variabili strettamente esogene , la cui
matrice delle osservazioni e` (per la definizione di tali stimatori vedi 3-8).
ˆGLSβ β
k tw
1
( )n k
−
×=W Δ X
Infatti si ha
( ) ( )1
11 1 1
1 1
1 1ˆ ˆn n
t t t t GLSt t
yn n
−−− − −
= =
⎛ ⎞′ ′ ′ ′ ′= = =⎜ ⎟⎝ ⎠∑ ∑wβ w x w W X W =y X Δ X X Δ y β .
d) Per lo stimatore OLS di β (che e` lo stimatore con il metodo dei momenti ottenuto
utilizzando come variabili strettamente esogene ), si ha tx
1 1ˆvar( | ) ( ) ( )OLS− −′ ′ ′=β X X X XΣX X X e . ˆ ˆvar( | ) var( | )OLS GLS≥β X β X
e) Se è una matrice diagonale (e dunque gli errori sono non correlati), denotato con Δ 2tδ
l’elemento diagonale di indice t , la sima GLS di β del modello t ty tu′= +x β è la stima OLS del
modello t tt
t t
y vδ δ
′= +
x β . Si noti che quest`ultimo modello non ha l`intercetta e quindi 2cR non è
utilizzabile per misurare la bontà dell’adattamento del modello ai dati.
top
5-2 Il metodo (asintotico) FGLS (Feasible Generalized Least Square)
Nel precedente paragrafo si e` fatta l’ipotesi che la matrice Δ , nella rappresentazione della
varianza del vettore degli errori, fosse nota; ipotesi del tutto irragionevole in presenza di dati non
sperimentali, come in econometria. E` opportuno ricordare che quando Δ non e` nota (e il
campione e` sufficientemente grande) la procedura di stima, frequentemente adoperata e descritta
3
5- Econometria, a.a. 2012-13
nei precedeenti capitoli, e` quella di utilizzare il metodo OLS (risp. NLS) e stimare la varianza
asintotica dello stimatore del (vettore) parametro con lo stimatore di White (HC) in presenza della
sola eteroschedasticita` o con quello di Newey-West (HAC) se e` presente anche
l`autocorrelazione.
Il metodo FGLS utilizza eventuali informazioni disponibili (o soltanto ipotizzate) sulla matrice
(e quindi sul processo degli errori) e il metodo GLS, per costruire stimatori di β asintoticamente
piu` efficienti di quelli OLS. E` importante osservare che l’efficienza delle stime e` soltanto
asintotica e pertanto non e` detto che si conservi anche per campioni finiti che peraltro e` l’ambito
in cui si lavora.
Δ
Si considera il modello lineare (ma non ci sono modifiche da apportare se il modello fosse
nonlineare)
t ty u′ t= +x β con E( | ) 0 e t t tu tΩ = ∈x Ω , per 1,2,t = … .
Osservazione:
• Si sta assumendo che le variabili indipendenti del modello sono esogene; se il processo degli
errori e` autocorrelato allora le variabili indipendenti devono ragionevolmente essere strettamente
esogene (in particolare tra le variabili indipendenti non ci possono essere ritardi della variabile
dipendente).
• Per non appesantire l’esposizione non saranno indicate esplicitamente, ma si riterranno
sempre valide, le ipotesi che consentono di utilizzare, quando se ne presenti la necessità, qualche
versione della legge dei grandi numeri e del teorema del limite centrale.
• Pur non essendo strettamente necessario, nella descrizione del metodo di stima si e` preferito
distinguere il caso in cui il processo degli errori non e` autocorrelato, che e` quello che si incontra
piu` spesso, da quello in cui il processo degli errori e` autocorrelato.
Il metodo FGLS quando il processo tu e` non autocorrelato (in particolare quando i dati sono
del tipo cross-section) – In questo caso, per ogni , la matrice di covarianza del
vettore degli errori è diagonale; siano
n ( )2
( )n nσ
×=Σ Δ
2tδ (per 1, ,t n= … ) gli elementi diagonali di e dunque si ha Δ
2E( | )t tu 2 2tσ δΩ = . In assenza di ulteriori informazioni sul processo degli errori, un modello
sufficientemente ampio per la varianza condizionata (coerente con la positivita` della varianza e
comunque relativamente semplice) e` il seguente:
4
5- Econometria, a.a. 2012-13
2E( | ) exp( )t t tu ′Ω = z γ con t t∈Ωz per ogni , (e t l∈γ R non noto)( )3 .
La costruzione dello stimatore FGLS (descritta nei passi da i) a iii)):
i) Si stima il modello originario con il metodo OLS ( e` una stima consistente di β ) e si
considera il processo dei residui
ˆOLSβ
ˆtu ; ( )4
ii) Si stima il parametro γ , con il metodo OLS, utilizzando il modello di regressione lineare
ausiliario 2ˆlog( )t tu r′= +z γ esid
n
)
e siano , per , i valori previsti; ˆt′z γ 1, ,t = …
iii) Posto , si stima il modello ausiliario ( 1/ 2ˆ ˆexp( )t tδ ′= z γ 1ˆ ˆt
tt t
y residδ δ
′= +x β con il metodo OLS.
Definizione: La stimatore OLS di β ottenuto dal modello in iii) (che si prova essere consistente),
dicesi stimatore dei minimi quadrati generalizzati realizzabile (FGLS) di (del modello
originario) e si denota con il simbolo .
β
ˆFGLSβ
Osservazione:
• e` dunque lo stimatore GLS del modello originario nel quale gli elementi diagonali della
matrice sono stati sostituiti con
ˆFGLSβ
Δ 2tδ .
• Distribuzione asintotica di : Si prova facilmente ˆFGLSβ ˆ ˆ( ) ( , Avar(
d
FGLS FGLSn N− →β β 0 β ))
con 1
22
1
1ˆAvar( ) limn
t tFGLS
t t
pn
σδ
−
=
⎡ ⎤′= ⋅ ⎢
⎣ ⎦∑ x xβ ⎥
; uno stimatore consistente della varianza asintotica e`
evidentemente
( )3 Per dati cross-section, e` costituito dal complesso delle informazioni disponibili nella unita` statistica e quindi in ci potrebbero essere variabili presenti oppure no in ; talvolta lo scatter-plot della coppia , essendo
tΩ t
tz tx ˆ( , )t tu z
ˆtu i residui della stima OLS del modello e tz t∈Ω , puo` essere utile .per selezionare le variabili tz da
inserire in . Invece per dati del tipo time-series, tz tΩ e` piu` ampio perche` in esso ci sono certamente non solo le variabili indipendenti presenti nel modello con i loro ritardi, ma anche i ritardi della variabile dipendente. Va comunque segnalato che in presenza di dati del tipo time-series sono stati introdotti altri (e piu` interesanti) modelli per la varianza condizionata degli errori che pero` richiedono differenti procedure di stima.
( )4 Si noti che dalla consistenza di segue ˆ ˆ( OLS=β β ) ( ),ˆ ˆˆ ( ) max
p
jtt jx− = − ≤ − →u u X β β β β 0 (per ) e ciò
giustifica i passi successivi, in cui si sostituiscono gli errori per i quali non sono disponibili le osservazioni con i residui,
operazione già effettuata precedentemente, ma giustificata in modo differente. Questa proprietà` si esprime dicendo che
il processo dei residui e` consistente per il processo degli errori.
n →∞
5
5- Econometria, a.a. 2012-13
1
22
1
1ˆAvar( ) ˆn
t tFGLS
t t
sn δ
−
=
⎡ ⎤′= ⎢ ⎥
⎣ ⎦∑ x xβ con calcolato con il modello in iii). 2s
• Lo stimatore e` certamente asintoticamente piu` efficiente di (quest`ultimo con lo
stimatore di White per la varianza), pero`, come gia` precedentemente segnalato, quando sono
utilizzati con campioni finiti non e` detto che la predetta efficienza continui a sussistere.
ˆFGLSβ ˆ
OLSβ
• Una naturale conseguenza di quanto ora detto e` che la procedura di stima usuale, in presenza di
modelli lineari (o non lineari) per dati cross-section (comunque del tipo fin qui considerati), e` il
metodo di stima OLS o NLS, con l’unico dubbio (ma generalmente e` ritenuta una certezza) se e`
opportuno utilizzare lo stimatore di White per la varianza asintotica; nasce cosi` l’esigenza di
costruire strumenti (in statistica si chiamano test) che possa indirizzare la scelta. Due tra i principali
test sulla presenza di eteroschedasticita sono riportati nell’appendice 5.5.
Il metodo FGLS per modelli (lineari o nonlineari) con autocorrelazione negli errori. Si segnala
immediatamente, ma cio` apparira` chiaro nella successiva discussione che il metodo, che non
presenta alcuna difficoltà` di tipo teorico, e` realizzabile soltanto in casi molto particolari.
Costruzione dello stimatore FGLS: Se per ogni , la matrice di covarianza del vettore degli
errori e` del tipo
n
( 2σ=Σ )Δ con e ( )=Δ Δ γ γ vettore non noto di indipendente da (lR n 5)
ed inoltre e` disponibile uno stimatore consistente di γ γ , allora lo stimatore FGLS di β si ottiene
stimando il modello (che deve avere le variabili indipendenti strettamente esogene se la matrice
non e` diagonale) con il metodo GLS considerando pero` come matrice di covarianza degli errori la
matrice
Δ
2ˆ ˆ( )σ=Σ Δ γ .
Osservazione:
• Si tralascia di riportare le proprieta` asintotiche degli stimatori (che peraltro sono prevedibili) e
la loro prova (che invece necessita di qualche accorgimento).
• Generalmente la costruzione di non presenta particolari difficoltà, invece problemi di tipo
numerico si possono presentare nella costruzione della matrice che verifichi la condizione
(quando la matrice non e` diagonale) essendo di grosse dimensioni.
γ
Ψ1−′ =ΨΨ Δ Δ Δ
top
5-3 Stima dei modelli lineari con errori AR(1); lo stimatore di Prais-Winsten
In questo paragrafo si presenta la stima con il metodo FGLS di un modello lineare con errori
( )5 Come si potra` notare quello che ora si dira` e` valido anche se la matrice Δ e` diagonale
6
5- Econometria, a.a. 2012-13
del tipo AR(1). In tale modello la matrice non e` diagonale, ma l’analisi della sua struttura
consente di individuare facilmente la matrice . E` importante segnalare che con tecniche di
simulazione e` stato mostrato che generalmente il metodo FGLS per tali modelli (quando e`
utilizzabile; infatti e` richiesta la stretta esogeneita` delle variabili indipendenti), e` piu` efficiente di
altri metodi anche per campioni finiti (un altro metodo di stima e` stato presentato nel paragrafo
4.6).
Δ
Ψ
Si considera il modello econometrico
2
1
, . . .(0, )t t tt
t t t
y ui i d
u u εε σρ ε−
′= +⎧⎨ = +⎩
x β∼ , | | 1ρ < , 1,t = … ,
e si suppone che
a) tra le variabili indipendenti non ci sono ritardi della variabile dipendente (e dunque le variabili
sono strettamente esogene); tx
b) il processo tu e` AR(1) (l’unica soluzione stazionaria dell’equazione alle differenze
1t tu u tρ ε−= + ).
c) il valore del parametro ρ non e` noto.
Osservazione: In 4-6 e` stata descritta una procedura di stima per un modello che appare molto
simile a quello qui considerato, ma che e` in realtà molto piu` generale. Qui il processo degli errori
e` strettamente stazionario e le variabili indipendenti sono strettamente esogene, in 4-6 invece il
processo tu e` (soltanto) una soluzione di 1t tu u tρ ε−= + con | | 1ρ < (pertanto e` debolmente
stazionario) e inoltre tra le variabili indipendenti ci possono essere anche ritardi della variabile
dipendente . ty
Costruzione dello stimatore . La procedura descritta nei successivi passi da i) a iv) fu
proposta da Prais e Winsten nel 1954; per questa ragione in letteratura lo stimatore e` indicato con
il loro nome. Sia un fissato intero naturale:
ˆFGLSβ
n
i) Rappresentazione della matrice di covarianza degli errori 2( , )ερ σΣ per un processo
AR(1).
Si ha (per la prova vedi 5.6)
( ) ( )
2 1
22 2
2
1 2 3
111( , ) E( ) ( )
11
n
n
n n n
ε ε
ρ ρ ρρ ρ ρ 2
ερ σ σ σρ
ρ ρ ρ
−
−
− − −
⎛ ⎞⎡ ⎤⎜ ⎟⎢ ⎥⎜ ⎟⎢ ⎥′= = =⎜ ⎟⎢ ⎥−⎜ ⎟⎢ ⎥⎜ ⎟⎢ ⎥⎣ ⎦⎝ ⎠
Σ uu Δ ρ .
7
5- Econometria, a.a. 2012-13
ii) Scelta di una matrice tale che Ψ ( ) 1( )ρ −′ =ΨΨ Δ .
La scelta piu` immediata sembra essere ( ) 1/ 2( )ρ −=Ψ Δ , ma evidentemente il calcolo per
individuare la sua rappresentazione e` numericamente complesso; qui di seguito si presenta una
procedura indiretta per individuare una(altra) . Ψ
Si osserva che alla matrice si richiede semplicemente di trasformare il vettore degli errori
autocorrelati in un vettore (della stessa dimensione) di variabili non correlate e con varianza
costante, ma una tale Ψ e` descritta implicitamente nelle ipotesi. Infatti, essendo il processo
Ψ u
tu
soluzione dell’equazione alle differenze 1t t tu uρ ε− + , 2. . .(0, )t i i dε= εσ∼ , esso e` necesssariamente
soluzione di un problema di valore iniziale 1
1 1
per 2, ,
t t tu u tu uρ ε−= + =⎧
⎨ =⎩
… n e dalla sua stazionarieta`
segue (facilmente) che deve essere 21 1 / 1u ε ρ= − . Quindi 1, ,t t
u= … n
e` soluzione del problema
1
21 1
per 2,
t = ,
1t t tu u n
u
ρ ε
ρ ε−= +⎧⎪
⎨− =⎪⎩
…, la cui versione matriciale e`
21 1
2 2
1 1
1 0 0 01 0 0
0 0 1 00 0 1
n n
n n
uu
uu
ερερ
εερ
− −
⎛ ⎞⎛ ⎞ ⎛ ⎞−⎜ ⎟⎜ ⎟ ⎜ ⎟
−⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟=⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟− ⎝ ⎠ ⎝ ⎠⎝ ⎠
.
In definitiva una matrice che soddisfa la condizione richiesta e`
( )
21 0 01 0
( )
0 0 1 00 0 1
ρρ
ρ
ρ
⎛ ⎞−⎜ ⎟
−⎜ ⎟⎜ ⎟= =⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟−⎝ ⎠
Ψ Ψ
00
.
iii) Costruzione di uno stimatore consistente del parametro ρ .
Si considera il processo dei residui ˆtu ottenuti dalla stima OLS del modello originario (si noti
che la stima OLS di β e` consistente) e si costruisce ρ utilizzando indifferentemente una delle
seguenti due procedure
• Il metodo OLS nel modello ausiliario 1ˆ ˆt tu u residρ −= + ;
• La correlazione empirica del prim’ordine del processo dei residui e dunque 12
1ˆ ˆ ˆn
t tt
u un
ρ −=
= ∑ .
8
5- Econometria, a.a. 2012-13
iv) Stima FGLS di e sua distribuzione asintotica. β
ˆFGLSβ e la sua distribuzione asintotica si ottengono stimando con il metodo OLS il modello
ˆ ˆ( ) ( )ρ ρ= +Ψ y Ψ Xβ ε con 2. . .(0, )t i i d εε σ∼ , che in forma vettoriale ha la seguente rappresentazione
( )
2 221 1 1
1 1
ˆ ˆ1 1 , . . .(0, )ˆ ˆ per 2, , t
t t t t t
y i i dy y t n ε
ρ ρ ε ε σρ ρ ε− −
⎧ ′− = − +⎪⎨
′ ′− = − + =⎪⎩
x βx x β
∼…
.
Un confronto tra gli stimatori di Prais-Winsten e NLS (costruito in 4.6) – Qui si segnalano (di
nuovo) le differenze nei modelli e quando entrambe le procedure sono utilizzabili i vantaggi e gli
svantaggi nell’utilizzo dell’uno o dell’altro stimatore.
i) Il metodo FGLS (in particolare lo stimatore di Prais-Winsten) richiede che le variabili
indipendenti siano strettamente esogene e quindi non potrà essere utilizzato se il modello è
dinamico (cioe` tra le variabili indipendenti c’è qualche ritardo della variabile indipendente). Questa
restrizione non e` necessaria se si utilizza il metodo NLS.
ii) Il metodo FGLS utilizza tutte le n osservazioni, mentre il metodo NLS sacrifica (almeno) la
prima osservazione (infatti nel modello nonlineare c`è sicuramente 1ty − ).
iii) Con il metodo NLS si ottiene la stima congiunta con le utili informazioni sulla sua
distribuzione asintotica, mentre nella procedura FGLS la stima di β è condizionata a quella di
ˆ ˆ( ,NLS NLSρβ )
ρ ,
pertanto può risentire dell’eventuale inefficienza di ˆFGLSβ ρ .
iv) (La differenza nei modelli) Nel modello in 4-6 il processo tu e` soltanto (una) soluzione
dell’equazione alle differenze 1t tu u tρ ε−= + , mentre in questo paragrafo tu e` la (unica)
soluzione stazionaria della precedente equazione. Puo` essere utile ricordare che la generica
soluzione dell’equazione e` somma della soluzione stazionaria e di una componente deterministica
del tipo naρ .
v) Quando sono utilizzabili entrambe le procedure lo stimatore FGLS di β e` asintoticamente piu`
efficiente di quello NLS (con tecniche di simulazione e` stato mostrato che l`efficienza sussiste
anche per campioni finiti).
top
5-4 Il metodo di Cochrane-Orcutt
Il metodo utilizzabile per il modello in 5-3, fu presentato da Cochrane e Orcutt in un articolo
del 1949; la procedura di stima e` iterativa e richiede che le variabili indipendenti siano
strettamente esogene. Si prova che con questo metodo si ottiene la stima FGLS, inoltre come si
9
5- Econometria, a.a. 2012-13
potra` notare in seguito, il metodo ha il vantaggio di non richiedere la stazionarieta` del processo
degli errori (ma soltanto di essere soluzione dell’equazione alle differenze) e di poter essere
facilmente adattato al caso in cui il processo degli errori è ( )pAR con (o piu` precisamente
soluzione di un’equazione alle differenze stabile di ordine
2p ≥
p con termine noto 2. . .(0, )i i d σ ).
Costruzione della stima di Cochrane-Orcutt: Innanzitutto si osserva che il modello
2
1
, . . .(0, )t t tt
t t t
y ui i d
u u εε σρ ε−
′= +⎧⎨ = +⎩
x β∼ , | | 1ρ < , 1,t = … ,
ha le seguenti due rappresentazioni equivalenti:
M.a) 1 1( ) ( )t t t ty y tρ ε− −′ ′− = − +x β x β
M.b) 1 1( ) ( )t t t ty y tρ ρ ε− −′ ′− = − +β x x .
Procedura iterativa di stima: Si considera il valore iniziale stima OLS di β del
modello (certamente consistente per l’ipotesi di stretta esogeneità di ) e per ogni
0ˆ
OLS=β β
t ty ′= +x β tu tx
0i ≥
i) si pone in M.a e si denota con i=β β iρ la stima OLS di ρ ;
ii) si pone iρ ρ= in M.b, si denota con 1i+β la stima OLS di β ;
iii) si ritorna al punto i) ponendo 1i+=β β .
Si interrompe la procedura iterativa (come e` consuetudine) quando due valori consecutivi di
sono sufficientemente vicini e la stima della varianza asintotica della stima di β e` ottenuta
dall’ultima stima del modello M.b.
iβ
top
5-5 Appendice: Il test di White e il test di Breusch-Pagan (sulla presenza di eteroschedasticita`
negli errori)
Si segnala che qui ci si limita a descrivere come i test sono costruiti e l’idea da cui hanno tratto
origine, omettendo i risultati teorici che costituiscono il loro fondamentale sostegno.
Si supponga assegnato il modello lineare
t ty u′ t= +x β con E( | ) 0 e t t tu tΩ = ∈x Ω , per 1,2,t = … .
per dati cross-section (o piu` in generale con errori non vorrelati) e si supponga (come al solito) che
sussistano le ipotesi che garantiscono l’utilizzo della legge dei grandi numeri e del teorema del
limite centrale quando se ne presenta la necessita`.
Il test di White (1980) – Si denota con z la variabile (vettoriale) le cui coordinate sono le iz
10
5- Econometria, a.a. 2012-13
variabili (distinte) nell’insieme 1 , 1,i j ,x x i j k∨ = … (dunque tra le coordinate di z c’e`
certamente 1 anche se nel modello originario manca la costante).
Costruzione del test di White:
i) Si stima con il metodo OLS il modello assegnato e sia ˆtu il processo dei residui;
ii) Si considera il modello ausiliario e sia 2ˆt tu re′= +z γ sid 2R il coefficiente di determinazione
centrato.
iii) La statistica ha distribuzione asintotica 2nR 21lχ − ( l e` la dimensione di z ) se gli errori nel
modello assegnato sono omoschedastici; il test a livello di significatività α e` allora il seguente:
“Si rifiuta l’ipotesi di errori omoschedastici se 2 21,1lnR αχ − −> ”.
Alcune semplici considerazioni (che in qualche modo giustificano la procedura): Nel caso in cui
gli errori dovessero essere omoschedastici deve aversi
2 2 2
1 1
1 1ˆlim lim limn n
t t t t t t t tn n nt tp u p u S p
n n→∞ →∞ →∞= =
⎛ ⎞′ ′= =⎜ ⎟⎝ ⎠
∑ ∑x x x x x x1
1 n
tn =
′∑
e quindi
2 2
1
1 ˆlim ( )n
t t tn t
p u Sn→∞
=
′− =∑ x x 0 .
Le coordinate di , di cui si e` parlato precedentemente, sono elementi della matrice tz t t′x x e
dunque deve essere
2 2
1
1 ˆlim ( )n
t tn t
p u Sn→∞
=
− =∑ z 0 ,
d’altra parte la rappresentazione di (2 2
1
1 ˆ( )n
t tt
u Sn =
− =∑ z c )n fa pensare alla possibilita` che nnc
possa convergere in distribuzione verso una normale (se dovesse essere valido il teorema del limite
centrale per la sequenza ( )2 2ˆ( )t t tu S− z ).
White nel suo articolo del 1980, prova che e` utilizzabile il teorema del limite centrale e inoltre
trova
a) la varianza asintotica di ( ; )n nc
b) un (opportuno) stimatore della varianza asintotica tale che la statistica coincida con
di iii).
B ˆnn ′c Bcn
2nR
Il test di Breusch-Pagan – Si fa riferimento allo stesso modello e qui si suppone che ci siano
informazioni sul fenomeno che inducono a sospettare che la eteroschedasticita` possa essere del tipo
11
5- Econometria, a.a. 2012-13
( )2E( ) ( )t t tu h δ ′Ω = + z γ , con una funzione regolare non nota, e , con non
necessariamente coincidente con .
h t ∈Ωz t tz
tx
Costruzione del test di Breusch-Pagan:
i) si stima il modello con il metodo OLS e sia ˆtu il processo dei residui;
ii) si considera il modello ausiliario e sia 2ˆt tu b residδ ′= + +γz b 2R il coefficiente di
determinazione centrato;
iii) la statistica ha distribuzione asintotica 2nR 21lχ − ( e` la dimensione di z ) se gli errori nel
modello assegnato sono omoschedastici; il test a livello di significatività
l
α e` allora il seguente:
“Si rifiuta l’ipotesi di errori omoschedastici se 2 21,1lnR αχ − −> ”.
Alcune semplici considerazioni (che in qualche modo giustificano la procedura): L’ipotesi di
omoschedasticita` degli errori e` equivalente a =γ 0 in 2E( ) ( )t t tu h δ ′Ω = + z γ . Breusch e Pagan,
nel loro articolo del 1979, inizialmente assumono che sono disponibili le osservazioni per il
processo 2tu , considerano il modello non lineare u h2 ( )t t tvδ ′= + +z γ tv (su si puo` soltanto dire
che ha media nulla) e costruiscono il test LM per l’ipotesi 0 :H =γ 0 (cfr. 2 in 4-5) che ora si passa
a descrivere brevemente.
a) Il modello ausiliario di Gauss-Newton (se si denota con ( )h′ ⋅ la derivata prima di ) e` ( )h ⋅
2 ( ) ( ) ( )t t t t tu h h b h residδδ δ δ′ ′ ′ ′ ′ ′− + = + + + +γz γ z γ z γ z b ;
b) Se fosse disponibile δ , una stima -consistenten di δ quando e` vera si considererebbe 0H
il modello lineare 2 ˆ ˆ ˆ( ) ( ) ( )t tu h h b h residδδ δ δ′ ′ ′− = + +γz b
e si verificherebbe l’ipotesi equivalente 0 :H =γb 0 ;
c) Nella situazione attuale, non serve la disponibilita` di δ ma soltanto la sua esistenza (che qui
non e` provata) in quanto ˆ( )h δ e ˆ( )h δ′ comunque sono due costanti e allora il precedente modello
diventa (con 2t tu rα ′= + +z δ esid bˆ ˆ( ) ( )h h δα δ δ′= + e ) e l’ipotesi diventa
, se e` (come e` ragionevole che sia);
ˆ( )h δ′= γδ b 0 :H =γb 0
0 :H =δ 0 ˆ( ) 0h δ′ ≠
d) Breusch e Pagan infine mostrano che nel precedente punto c) il processo 2tu puo` essere
sostituito dal processo 2ˆtu .
top
12
5- Econometria, a.a. 2012-13
5-6 Appendice: I modelli AR, MA e ARMA per processi stazionari autocorrelati
Si descrivono ora alcuni modelli per processi (strettamente) stazionari autocorrelati che sono
utilizzati in econometria. La classe di questi modelli e` molto ampia e per lungo tempo (quando
l`unico settore applicativo delle time-series era la teoria dei segnali in ingegneria) si e` pensato
erroneamente (supportati anche dal famoso Teorema di Wold del 1938 sulla rappresentazione dei
processi debolmente stazionari) che per le applicazioni, tale classe si potesse sostanzialmente far
coincidere con quella di tutti i processi (strettamente) stazionari. Recentemente sono stati introdotti
altri modelli per processi stazionari, di grande interesse in econometria, che consentono la presenza
di eteroschedasticita` condizionale evidentemente non presente nei modelli che saranno descritti in
questo paragrafo.
In quanto segue
i) tε e` (sempre) un processo 2. . (0, )i i d εσ ed è denominato rumore bianco stretto (o forte);( )6
ii) Se tx e` un processo stocastico si pone 1( ,t tx − )Ω =F … (sigma algebra generata dalle
variabili ); esso non e` altro che il complesso delle informazioni sul processo all’istante t se
e` noto tutto il suo passato.
1,tx − …
Definizione (dei processi (1)AR ): La (unica) soluzione strettamente stazionaria dell’equazione alle
differenze 1t tu u tρ ε−= + con | | 1ρ < dicesi processo autoregressivo del prim’ordine (in breve
AR(1)).
Osservazione:
i) L`equazione alle differenze 1t tu u tρ ε−= + con | | 1ρ < ha infinite soluzioni che differiscono da
quella strettamente stazionaria per un termine infinitesimo per ( ) del tipo n →∞ ncρ ; per questa
ragione tutte le altre soluzioni si dicono asintoticamente stazionarie.
ii) Denotato con l’operatore ritardo, definito sui processi dalla relazione L 1( )t tL x x −= (o
più brevemente 1( )t tL x x −= ) sussiste la seguente rappresentazione per il processo (1)AR :
1 21 2
0 0( ) ( ) ( ) (n n n
t t t t t t t t n t t tn n
I L u u I L u L uρ ε ρ ε ρ ε ρ ε ε ρε ρ ε∞ ∞
−− − −
= =
⎛ ⎞− = ⇔ = − ⇔ = ⇔ = = + + +⎜ ⎟⎝ ⎠
∑ ∑ ..)
.
Proprietà dei Processi AR(1):
( )6 Si noti che in queste lezioni sara` sempre 2. . (0, )t i i d εε σ∼ . Si segnala che molto (ma non tutto) di quello che si dira`
sussiste anche se il processo tε verifica soltanto le seguenti condizioni 2 2E( ) 0, E( ) , E( ) 0 per t t t s t sεε ε σ ε ε= = = ≠ ;
in tal caso il processo tε dicesi rumore bianco debole. Una ipotesi intermedia tra rumore bianco forte e debole e` “il
processo tε e` una differenza martingala debolmente stazionaria”.
13
5- Econometria, a.a. 2012-13
• La rappresentazione in ii) del processo tu come somma di una serie e` stata ottenuta
euristicamente, ma si prova che la serie converge quasi ovunque e in media quadratica, che il
processo somma e` strettamente stazionario ed ergodico, ed infine e` soluzione dell’equazione alle
differenze. (Nella prova ha un ruolo fondamentale la rapida convergenza a 0 dei coefficienti della
serie);
• E( ) 0;tu = ( )1 1E( | ) E( | )t t t t tu u u uρ− −Ω = = ;
• ( )2
22var( )
1u tu εσσρ
= =−
per ogni t (segue dalla ovvia uguaglianza 2 21var( ) var( )t tu u ερ σ−= + , );
• 21 1var( ) var( )t t t t tu u u ερ ε σ− −Ω ⎡= + ⎤ =⎣ ⎦ ;
• Per ogni si ha 0s ≥ ( )corr( , ) ( ) ( ) ss t t su u ACF s ACF sρ ρ−= = = − = ;
infatti dalla uguaglianza ( )1 1cov( , ) E( ) E( ) E( )s t t s t t s t t s t t s su u u u u u uγ ρ ε ργ− − − − −= = = + = − per ,
dividendo per
1s ≥
0γ , si ha 1s sρ ρρ −= ed essendo 0 1ρ = segue ovviamente l’asserto);
• La matrice di covarianza del vettore 1( , , )nu u ′=u … è
( ) ( )
2 1
222
2
1 2 3
11
( ) E( ) ( )1
1
n
n
u
n n n
ε
ρ ρ ρρ ρ ρσρ σ ρ
ρρ ρ ρ
−
−
− − −
⎡ ⎤⎢ ⎥⎢ ⎥′= = =⎢ ⎥−⎢ ⎥⎢ ⎥⎣ ⎦
Ω uu Δ ;
• Se l’equazione alle differenze che definisce il processo e` interpretata come un modello di
regressione lineare allora la stima OLS di ρ e` consistente, asintoticamente normale e
asintoticamente efficiente (motivare le precedenti affermazioni, scrivere la rappresentazione e la
stima della varianza asintotica della stima).
Definizione (dei processi ( )AR p ): Sia ( )1 1 2 2 ( )t t t p t p t tu u u u L u tβ β β ε β− − −= + + + + ⇔ = ε una
equazione alle differenze, tale che il polinomio ( )1( ) 1 ppz zβ β β= − − − z ha radici in modulo
maggiore di 1. La (unica) soluzione strettamente stazionaria dell’equazione (alle differenze) dicesi
processo autoregressivo di ordine p (in simboli ( )AR p ).
Proprietà dei processi ( )AR p :
• Il processo tu (che ha una rappresentazione del tipo (0
( )t n t nn
u )tLα ε α ε∞
−=
= =∑ con la serie di
potenze avente raggio di convergenza maggiore di 1) è strettamente stazionario ed
ergodico;
0
nn
nzα
∞
=∑
14
5- Econometria, a.a. 2012-13
• I coefficienti nα nella precedente rappresentazione possono essere individuati per ricorrenza
dalla identita` ( ) ( ) 1z zβ α = ;
• Le altre soluzioni dell’equazione che definisce il processo ( )AR p , poiché sono somma dello
stesso processo e di un processo deterministico infinitesimo di ordine esponenziale, sono
asintoticamente stazionarie;
• ; E( ) 0tu = 1 1 1 2 2E( | ) E( | , , )t t t t t p t t p t puu u u u u uβ β β− − − −Ω = = + + +… 2var( | )t tu− ; εσΩ = ;
• La sequenza delle autocovarianze (e` soluzione di un problema di valore iniziale per
l`equazione alle differenze che ha (1/ )zβ come polinomio caratteristico) – infatti moltiplicando
ripetutamente nell’equazione per , ,t tu u p−… e calcolando l’aspettazione si ottengono le seguenti
1p + equazioni (in 1p + incognite)
20 1 1
1 1 0 2 1 1
2 1 1 2 0 2
1 1 2 2 0
p p
p p
p p
p p p p
εγ β γ β γ σγ β γ β γ β γγ β γ β γ β γ
γ β γ β γ β γ
−
−
− −
⎧ = + + +⎪ = + + +⎪⎪ = + + +⎨⎪⎪
= + + +⎪⎩
la cui unica soluzione fornisce i valori di 0 , , pγ γ… . D’altra parte se (nel modello originario) si
moltiplica per (con ) e si calcola l’aspettazione, si ottiene l’equazione alle differenze t su − s p>
1 1 2 2s s s p s pγ β γ β γ β γ− − −= + + + ,
che insieme ai valori (iniziali) già individuati consente l’individuazione della sequenza delle
autocovarianze del processo.
• La sequenza delle autocorelazioni – Si ottiene risolvendo il problema di valore iniziale
(denominato sistema di Yule-Walker) relativo all’equazione alle differenze
1 1 2 2s s s p s pρ β ρ β ρ β ρ− − −= + + +
con le condizioni iniziali che risolvono il sistema (con p equazioni e p incognite)
1 1 2 1 1
2 1 1 2 2
1 1 2 2
p p
p p
p p p
ρ β β ρ β ρρ β ρ β β ρ
pρ β ρ β ρ β
−
−
− −
= + + +⎧⎪ = + + +⎪⎨⎪⎪ = + + +⎩
.
Segue dal punto precedente, non appena si divide per 0γ sia l’equazione alle differenze che le
ultime equazioni, delle p 1p + , che fissano le condizioni iniziali.
Evidentemente la sequenza delle autocorrelazioni converge a 0 per in modo
esponenziale.
n →∞
15
5- Econometria, a.a. 2012-13
• Se l’equazione alle differenze che definisce il processo e` interpretata come un modello di
regressione lineare allora le stima OLS di 1( , , )pβ β… e` consistente, asintoticamente normale e
asintoticamente efficiente (motivare le precedenti affermazioni).
Definizione (dei processo ( )MA q invertibili): Un processo tu si dice ( )MA q (Moving Average)
oppure a media mobile di ordine q invertibile, se ha la seguente rappresentazione
1 1 ( ( )t t t q t qu L tε α ε α ε α ε− −= + + + = ) con 0
( ) 0q
ii
i
z zα α=
⎛ ⎞= ≠⎜ ⎟⎝ ⎠∑ per 1z ≤ e 0 1α = .( ) 7
Proprietà dei processi ( )MA q :
• Il processo tu è strettamente stazionario ed ergodico (segue immediatamente dalla sua
rappresentazione) inoltre se si pone
00
1( ) per (0, ) (0,1) e 1( )
nn
n
z z z B r Bz
β βα
∞
=
⎛ ⎞′ β= = ∈ ⊃⎜ ⎟⎝ ⎠∑ = .
si ha
0
( ) t t n t n tn
L u uβ ε β∞
−=
⎛ ⎞= ⇔ =⎜ ⎟⎝ ⎠
∑ ε
2 2i
;( ) 8
• , E( ) 0tu = ( )2 20
0
var( ) E( )q
u t ti
u u εσ γ σ=
= = = = α∑ ;
• 0sγ = per (e` ovvio), in particolare le variabili del processo che hanno una distanza
temporale maggiore di sono indipendenti, mentre per
s q>
q ( )1 s q≤ ≤ si ha
2 2
0
q q s
s i i s i si s i
ε εγ σ α α σ α α−
− += =
⎛ ⎞⎛ ⎞ ⎛ ⎞= =⎜ ⎟⎜ ⎟ ⎜ ⎟
⎝ ⎠ ⎝ ⎠⎝ ⎠∑ ∑ i ,
infatti si ha 21
0E( ) E( )
q q s q
s t t s i t i s i t i i si i s i s
u u εγ α ε α ε σ α α+
− − − −= = =
= = =∑ ∑ ∑ − ;
• I processi : Quanto detto finora continua a rimanere valido per ; si deve soltanto
richiedere che
( )MA ∞ q = +∞
0i
i
α∞
=
< +∞∑ (e la somma nella definizione del processo va intesa in media
quadratica). E` evidente che anche i processi ( )AR p sono processi ( )MA ∞ .
( )7 La restrizione sulla funzione ( )zα sara` motivata piu` avanti, comunque va detto che non è necessaria per provare la stazionarieta` del processo. In econometria tale restrizione è abbastanza naturale; infatti se gli shock del passato persistono allora il loro effetto sul processo tende a ridursi. D’ora innanzi il termine “invertibile” è sottinteso quando sono presenti processi MA. ( )8 Si noti l’analogia con la rappresentazione dei processi AR(p), e ciò giustifica l’affermazione che i processi MA hanno una rappresentazione come processo ( )AR ∞
16
5- Econometria, a.a. 2012-13
• Nei processi (1)MA si ha: ( ) 21 1E( )t tu u 1 εγ α σ−= = e quindi 1
1 211
αρα
=+
(donde è immediato
riconoscere che 1ρ è compreso tra e 1/ ); 1/ 2− 2
• La matrice di covarianza del vettore aleatorio 1( , , )nu u ′=u … e`
( )
21 1
22 21 1 1
1 1
21 1
1 0 01 0
( ) E( ) ( )
0 0 1
ε ε
α αα α α
α σ σ
α α
⎡ ⎤+⎢ ⎥+⎢ ⎥′= = =⎢ ⎥⎢ ⎥
+⎢ ⎥⎣ ⎦
Ω uu Δ α .
(In questo caso non e` altrettanto immediato come nel caso dei processi (1)AR individuare una
matrice tale che Ψ [ ] 11( )α −′ =ΨΨ Δ ).
• L’espressione che definisce un processo ( )MA q e` evidentemente interpretabile come un
modello, ma non e` un modello di regressione lineare. Qualche cenno su come trovare buone stime
dei parametri, naturalmente quando sono disponibili le osservazioni del processo, sara` dato in
seguito.
Definizione (dei processi ( , )ARMA p q ): Un processo tu dicesi ( , )ARMA p q se e` la (unica)
soluzione stazionaria dell’equazione alle differenze
1 1 2 2 1 1t t t p t p t t qu u u u t qβ β β ε α ε α− − − − ε −= + + + + + + +
con
• 0
( )q
ii
i
z zα α=
=∑ , 0 1α = e ( ) 0zα ≠ in (0,1)B′ ;
• e 1( ) 1 ppz z zβ β β= − − − ( ) 0z ≠ in (0,1)B′ ; β
• ( )zα e ( )zβ non hanno radici in comune.
Proprietà dei processi ARMA:
• I processi ARMA hanno una rappresentazione come processi ( )MA ∞ e . Infatti si ha ( )AR ∞
1( ) ( )t tu L Lβ α ε−= e 1( ) ( ) t tL L uα β ε− = ;
• La fuzione di autocovarianza sγ è soluzione dell’equazione alle differenze
1 1s s p s pβ γ β γ− −= + + max( , 1)s p q≥ + per γ
(è sufficiente motiplicare per nell’equazione che definisce il processo e prendere la media),
pertanto
t su −
sγ , e quindi sρ , è infinitesima di ordine esponenziale per . s →+∞
17
5- Econometria, a.a. 2012-13
Per , 0 max( , 1)s p q≤ < + sγ si ottiene come soluzione di un sistema che qui non e` riportato,
ma la sua individuazione non presenta particolari problemi.
• I processi ARMA di ordine ( , )p q non molto elevati (in econometria generalmente è , 3p q ≤ )
ben approssimano i processi MA e AR di ordine elevato.
Tralasciando una rigorosa giustificazione, il risultato è abbastanza prevedibile ed è di grande
utilità quando si devono stimare i parametri di un modello MA o . AR
Nota conclusiva: I modelli fin qui considerati sono tutti riferiti a processi (stazionari) con media
nulla, ma questa restrizione può essere rimossa immediatamente osservando che se tx è un
processo stazionario con media μ allora tx μ− è un processo stazionario a media nulla.
La funzione Autocorrelazione Parziale (empirica): Un (ulteriore e non ultimo) utile strumento per
selezionare un modello ( , )ARMA p q che meglio interpreta le osservazioni su un processo (che si
ritiene stazionario) è la versione empirica della funzione (Partial Autocorrelation
Correlation Function).
( )PACF k
Qui ci si limita a segnalare una interesante proprietà di (in un certo senso duale della
funzione ACF ) e a fornire una procedura per la costruzione della sua versione empirica.
( )PACF k
• Se tu è un processo ( )AR p allora ( ) 0PACF k = per ; k p>
• Se tu è un processo ( )MA q allora è infinitesima di ordine esponeziale; ( )PACF k
• Se tu un processo stazionario ed ergodico di media nulla e 1, ,t tu
= … n
)
il processo delle
osservazioni, l’autocorrelazione parziale (empirica) di ordine è la stima OLS
del parametro
k
(( )ˆ ( )kk PACF kα = ( )k
kα nel modello lineare ausiliario
( ) ( )1 1
k kt t k t ku u u resα α− −= + + + id .
Osservazione: Dalla precedente procedura per la costruzione di ( )PACF k e dal teorema FWL, si
intuisce che (potrebbe essere definita come il limite in probabilità di ( )PACF k ( )ˆ kkα ) non è altro
che la correlazione tra e quando da entrambe è stata rimossa la parte spiegata dalle
variabili .
tu t ku −
1 1, ,t tu u− −… k+
top
5-7 Previsione nei processi ARMA
Il problema della previsione (costruzione di un modello, individuazione della struttura e sua
utilizzazione) in Econometria, come in ogni altro settore applicativo, ha ricevuto grande attenzione,
18
5- Econometria, a.a. 2012-13
pero` bisogna dire che l’impegno profuso, che comunque ha prodotto risultati teorici importanti e
pertanto non e` stato inutile, non ha dato i frutti sperati; spesso, alla prova dei fatti, le previsioni si
rivelavano insoddisfacenti. La causa di questo (parziale) insuccesso e` dovuto alla difficolta` di
individuare buoni modelli (migliori di quelli utilizzati nell’analisi strutturale) per la complessita`
dei fenomeni economici.
In questo paragrafo, si introduce il problema della previsione per alcuni particolari modelli (i
processi ARMA) che, come gia` segnalato, sono utilizzati con successo in altri settori disciplinari.
Inizialmente si fa riferimento ad una fissata struttura del modello (e dunque si assume che i
parametri siano noti), nelle note conclusive si segnalano le estensioni ai modelli dei risultati
ottenuti.
In quanto segue tu e` un processo ( )MA ∞ invertibile e dunque
• ( )0
( )t i t ii
u tLθ ε θ ε∞
−=
= =∑ con 0 1θ = ;
• 2. . .(0, )t ti i d εε σ
∈Z∼ ;
• la funzione 0
( ) ii
iz zθ θ
∞
=
=∑ e` definita nella sfera aperta (0, )B r con ed e` priva di zeri in
;
1r >
(0,1)B′
• tu e` strettamente stazionario ed ergodico e si ha E( ) 0tu = e ( )2 2
0
var( )u ti
u ε2iσ σ θ
∞
=
= = ∑ ).
Rappresentazione del processo tu come processo ( )AR ∞ : Posto [ ] 1( ) ( )z zϕ θ −= allora si ha
• 0
( ) ii
i
z zϕ ϕ∞
=
=∑ in una sfera aperta contenente (0,1)B′ e priva di zeri in ; (0,1)B′
• 0 1ϕ = ;
• I coefficienti iϕ possono essere individuati per ricorrenza dalla sequenza di uguaglianze
ottenute dalla identita` ( ) ( ) 1z zϕ θ = , utilizzando il principio di identita` delle funzioni analitiche;
• Il processo tu e` soluzione dell’equazione ( )0
( ) ( ) ( )i t i t t ti
u L u L Lϕ ϕ ϕ θ ε∞
−=
ε= = =∑ .
Definizione: Sia e sia (per ogni ) 0h > t ( )( ) (t s su s t s tε= ≤ = ≤F F F ) la σ -algebra
generata dalle variabili aleatorie su s t≤ . Allora
• la variabile
ˆ E( )t h tt h tu u ++ = F dicesi previsione (fatta all’istante ) del processo t tu passi
in avanti;
h
19
5- Econometria, a.a. 2012-13
•
ˆt ht h t t h te u u++ = − + dicesi errore della previsione (e per esso si ha
E( ) 0t h te + = );
• ( )
2ˆ( ) E( ) E ( )t ht h t t h t t h tMSE u e u u++ + +⎡= = −⎣
2ˆ ⎤⎦ , (la varianza della previsione) dicesi errore
quadratico medio (della previsione).
Costruzione della previsione, dell’errore e dell’errore quadratico medio della previsione
passi in avanti: Sia t fissato e . Dalle due rappresentazioni del processo -h 1h ≥ tu si ha:
1 1 1 1 1 11 11 1
1 0
(risp. ) (per 1)
(risp. ) (per 1)
t i t i t t t i t ii ih h
t h i t h i i t h i t h t h i t h i i t h ii i h i i h
u u u h
u u u u h
ϕ ε ε θ ε
ϕ ϕ ε θ ε θ ε
∞ ∞
+ + − + + + + −= =
− ∞ − ∞
+ + − + − + + + − + −= = = =
⎧ = − + = + =⎪⎪⎨
= − − + = + >
∑ ∑
∑ ∑ ∑ ∑⎪⎪⎩
donde, considerando l’aspettazione condizionata rispetto ad , ed essendo tF E( ) 0t s tε + =F per
, si ha 1s ≥
( )
11
11
11
ˆ E( )i t i
it tt t
i t ii
uu u
ϕ
θ ε
∞
+ −=
++ ∞
+ −=
⎧−⎪⎪= = ⎨⎪⎪⎩
∑
∑F ,
1 11 1ˆt tt t t te u u ε+ ++ += − = , ( )
2 21 1ˆ( ) E( )t t t tMSE u e εσ+ += = ;
e (per ) 1h >
( )
1
1
ˆˆ E( )
h
i i t h it h i ti i h
t h tt h t
i t h ii h
u uu u
ϕ ϕ
θ ε
− ∞
+ −+ −= =
++ ∞
+ −=
⎧− −⎪⎪= Ω = ⎨⎪⎪⎩
∑ ∑
∑,
1
0
ˆh
t h i t h it h t t h ti
e u u θ ε−
+ + −+ +=
= − =∑ ,
( )
12 2
0
ˆ( ) E( )h
it h t t h ti
MSE u e ε2σ θ
−
+ +=
= = ∑ .
Osservazione:
• Se per il processo tu e` disponibile il processo delle osservazioni 1, ,t tu
= … n, essendo
1( , , ) ( )n su u u s n≠ ≤ =F F… nF , si ha che 1E( ( , , ))n h nu u u+ F … (la previsione passi in
avanti fatte all’istante con le informazioni disponibili) non coincide (in generale) con
-h
n
ˆn h nu + e il
suo calcolo e` piu laborioso. Per grande, come approssimazione di n 1E( ( , , ))n h nu u u+ F … (che
per la legge della media iterata coincide con 1ˆE( ( , , ))nn h nu u u+ F … ), e` d’uso utilizzare n hu +
definito per ricorrenza dalla seguente
20
5- Econometria, a.a. 2012-13
1 11
1 1
1
per 1
per 1
n
n i n iih n h
n h i n h i i n h ii i h
u u
u u u
ϕ
ϕ ϕ
+ + −=
− + −
+ + − + −= =
⎧ = − =⎪⎪⎨⎪ = − − >⎪⎩
∑
∑ ∑
h
h,
il cui errore quadratico medio si approssima nel modo seguente
2 2
0
ˆ( ) ( ) E( )h
n h in h n n h ni
MSE u MSE u e ε2σ θ+ + +
=
⎛ ⎞≈ = =⎜ ⎟⎝ ⎠
∑ .
Osservazione: e` stato ottenuto troncando opportunamente la rappresentazione di n hu + ˆn h nu + ; piu`
precisamente in
1
1
ˆ ˆh
in h n n h i ni i h
u uϕ ϕ− ∞
i n h iu + −+ + −= =
= − −∑ ∑ si e` posto ( )0 E( )s su u= = per . 0s ≤
Previsioni nei processi ( )AR p : Sia 1 1t t p t p tu u uα α ε− − 2. . .(0, )t i i dε+ + + , = εσ∼ un processo
( )AR p stazionario, osservato che
0i t i t
i
uϕ ε∞
−=
=∑ con 0 1ϕ = , i iϕ α= − per 1 i p≤ ≤ , 0iϕ = per , i p>
allora per , si ha n p>
• ( ) 1ˆ E( ) E( ( , , ))n h n n h nn h nu u u u+ ++ = =F F … u ;
• ( ) ( )1 1 111 1
ˆ E( )p
n n i n i i n i nn ni i
u u u u uϕ α∞
+ + − + −+= =
= = − = =∑ ∑F 1+ ;
• ( )
1 1
1 1
ˆ ˆE( )p ph h
n h n i i n h i i n h i i n h i n hn h n n h i ni i h i i h
u u u u u uα α α α− −
+ + − + − u++ + −= = = =
= = + = + =∑ ∑ ∑ ∑F h p>− + , (per
manca il secondo addendo);
• ( )
12
0
ˆ( ) ( )h
n h in h ni
MSE u MSE u ε2σ θ
−
+ +=
= = ∑ (che converge a 2uσ per ). h →∞
Osservazione:
• Nei processi per n , quando i parametri del processo sono noti, le previsioni AR p≥ n hu + sono
esatte.
• Per le previsioni nei processi MA oppure si deve fare necessariamente al risultato
generale al risultato generale, in ogni caso per un processo
ARMA
( )MA q si ha (per ) h q>
ˆ 0i t h in h ni h
u θ ε∞
+ −+=
=∑ = , donde 1 1ˆE( ( , , )) E( ( , , )) 0n h n nn h nu u u u u u+ += =F F… … e allora si pone
. 0n hu + =
• I risultati finora ottenuti sono validi con la sola ipotesi che il processo tε e` un rumore bianco
21
5- Econometria, a.a. 2012-13
debole con qualche adattamento sulla interpretazione di
ˆ E( )t h tt h tu u ++ = F ; nel caso in esame
essendo 2. . .(0, )t i i d εε σ∼ si puo` provare che 1
2 2
0
(0, )h
n h n h ii
u u N εσ θ−
+ +=
− ≈ ∑ (per n ). →∞
• Finora si e` assunto che i parametri ( )i iθ o ( )i i
ϕ che definiscono il processo tu sono noti.
Nelle applicazioni econometriche, in presenza di un modello (i cui indici ARMA p e in genere
non superano 3), si utilizzano i dati a disposizione per stimare i parametri del modello e
successivamente si utilizza il modello stimato per fare le previsioni. Si tralascia di verificare la
validità` asintotica di questa procedura, in particolare che
q
12 2
0
ˆˆ(0, )h
n h n h ii
u u N εσ θ−
+ +=
− ≈ ∑ (per n ). →∞
• L’aver considerato processi a media nulla non e` per niente restrittivo; se i processi sono a
media non nulla e` sufficiente considerare i processi centrati nella media (empirica o teorica a
seconda che i parametri siano noti oppure siano stati stimati).
top
22