Capitolo 5 5-1 5-2 G L S 5-3 AR(1); Lo stimatore di Prais-Winsten...

5- Econometria, a.a. 2012-13

Capitolo 5

5-1 Il metodo GLS (per campioni finiti)

5-2 Il metodo (asintotico) FGLS (Feasible Generalized Least Square)

5-3 Stima dei modelli lineari con errori AR(1); Lo stimatore di Prais-Winsten

5-4 Il metodo di Cochrane-Orcutt

5-5 Appendice: Il test di White e il test di Breusch-Pagan (sulla presenza di eteroschedasticita`)

5-6 Appendice: I modelli AR, MA e ARMA per processi stazionari autocorrelati

5-7 Previsione nei processi ARMA

Nei metodi di stima OLS e NLS, presentati nei precedenti capitoli, l’eventuale presenza di

eteroschedasticità (e eventualmente della autocorrelazione) negli errori influenza soltanto la

varianza asintotica degli stimatori; detti stimatori sono asintoticamente efficienti in una opportuna

classe di stimatori (la classe degli stimatori costruiti con il metodo dei momenti) se gli errori sono

omoschedastici( )1 . In questo capitolo si descrivono procedure che consentono, in particolari

contesti e in presenza di eteroschedasticità (e/o correlazione), di costruire stimatori asintoticamente

più efficienti.

Per semplicità si farà riferimento ai soli modelli lineari (ma i risultati asintotici sono validi

anche per i modelli nonlineari) e inizialmente, come d’altronde è stato fatto quando è stato

presentato il metodo OLS, si farà una veloce carrellata su quanto gia` noto nel caso di campioni

finiti.

5-1 Il metodo GLS-Generalized Least Square (per campioni finiti)

E’ assegnato il modello lineare

t ty ut′= +x β per (o in forma matriciale 1, ,t = … n = +y Xβ u ).

con le seguenti ipotesi sugli errori:

i) Stretta esogeneità delle variabili (cioè E(tx | ) 0tu =X per ogni 1, ,t n= … );

ii) Errori eteroschedastici ed eventualmente correlati (cioè e 2E( | ) ( )σ′ = =uu X Σ Δ n≠Δ I ; se

gli errori sono non correlati allora la matrice è diagonale). Δ

iii) La matrice è completamente nota (dunque l’unico parametro non noto nella varianza degli

errori è

Δ2σ ).

Costruzione dello stimatore GLS: Si considera una matrice (quadrata di ordine ) tale che Ψ n

( )1 Naturalmente se le variabili dipendenti sono esogene o predeterminate e sussistono le usuali ipotesi sui processi che assicurino l’identificabilita` del modello e l’asintotica normalita` delle stime.

1


1− ′=Δ ΨΨ (2) e il modello lineare

(*) = +Ψy ΨXβ v , =v Ψu ,

che, data l`invertibilità di , è equivalente al modello originario. In esso, le variabili sono

strettamente esogene e gli errori sono omoschedastici; infatti si ha

Ψ

( )E( | ) E( | ) E( | )= =v ΨX Ψu ΨX Ψ u ΨX 0=

=

,

2 2E( | ) E( | ) E( | ) nσ σ′ ′ ′ ′ ′ ′= = =vv ΨX Ψuu Ψ ΨX Ψ u u ΨX Ψ ΨΔΨ I .

Definizione 1: Posto (essendo lo stimatore OLS di per il modello (*)),

dicesi stimatore GLS (dei minimi quadrati generalizzati) di per il modello originario.

*ˆ ˆGLS OLS=β β *ˆ

OLSβ β ˆGLSβ

β

Proprietà dello stimatore GLS (seguono facilmente dalle proprietà di . L’elenco è comunque

parziale):

*ˆOLSβ

• ha la seguente rappresentazione ˆGLSβ ( ) ( )( )1 11 1 1 1ˆ

GLS

− −− − − −′ ′ ′ ′= Δ Δ = + Δ Δβ X X X y β X X X u .

• è stimatore corretto di β ; ˆGLSβ

• è efficiente (nel senso che ha la minima varianza tra gli stimatori corretti e lineari in ˆGLSβ y );

• ; ( ) (1 12 2ˆvar( | )GLS σ σ− −′ ′ ′= =β X XΨΨX X ΔX)

))

• Se allora si ha ( )2 2| ( , ) e sono indipendenti e ( , )N Nσ σ⇔u X 0 Δ u X u 0 Δ∼ ∼

( )ˆ ˆ| ( , var( |GLS GLSNβ X β β X∼

• 2 1 1 1 1 11 1( ( ) ) ( )s In k n k

− − − − − − −′ ′ ′ ′ ′ ′ ′ ′1 1⎡ ⎤= − = −⎣ ⎦− −y Ψ ΨX X Δ X XΨ Ψy y Δ Δ X X Δ X X Δ y è uno

stimatore corretto di 2σ ; inoltre se gli errori hanno distribuzione normale allora e sono

indipendenti e

ˆGLSβ 2s

22

2( ) n ksn k χσ −− ∼ .

Osservazione:

a) La matrice ( )1 1 1

( 1) ( 1)

k k

n n× ×

⎡ ⎤ k⎡ ⎤⎡ ⎤= = =⎣ ⎦ ⎣ ⎦⎢ ⎥⎣ ⎦ΨX Ψ Ψ Ψ… … …X X X X X X è la matrice (di

ordine ) delle osservazioni delle variabili indipendenti del modello (*). Se tali nuove variabili

sono denotate con il simbolo

n k×

1, , kx x… , la t esima− osservazione di jx è combinazione lineare

( )2 Una tale matrice esiste (e non è unica), in quanto la matrice Δ e` a meno di una costante la matrice di covarianza del vettore degli errori u e pertanto e` simmetrica e definita positiva.

2


delle osservazioni della corrispondente variabile (originaria) n jx , i cui coefficienti sono gli

elementi della t e riga di . Da ciò segue sima− Ψ

1) (le variabili sono strettamente esogene)tx ⇔ (le variabili sono strettamente

esogene);

tx

2) le variabili e non possono essere contemporaneamente (soltanto) esogene a

meno che la matrice non sia diagonale.

tx tx

Δ

b) minimizza la funzione obiettivo ˆGLSβ 11( ) ( ) (Q

n−′= − −β )y Xβ Δ y Xβ ; (la verifica è

immediata). Dunque minimizza la distanza di ˆGLSβ y da Xβ , distanza definita dalla matrice

simmetrica e definita positiva (che è a meno di un fattore moltiplicativo l’inversa della varianza

degli errori).

1−Δ

c) e` lo stimatore del parametro (del modello originario) costruito con il metodo dei

momenti, utilizzando il vettore (di dimensione ) di variabili strettamente esogene , la cui

matrice delle osservazioni e` (per la definizione di tali stimatori vedi 3-8).

ˆGLSβ β

k tw

1

( )n k

−

×=W Δ X

Infatti si ha

( ) ( )1

11 1 1

1 1

1 1ˆ ˆn n

t t t t GLSt t

yn n

−−− − −

= =

⎛ ⎞′ ′ ′ ′ ′= = =⎜ ⎟⎝ ⎠∑ ∑wβ w x w W X W =y X Δ X X Δ y β .

d) Per lo stimatore OLS di β (che e` lo stimatore con il metodo dei momenti ottenuto

utilizzando come variabili strettamente esogene ), si ha tx

1 1ˆvar( | ) ( ) ( )OLS− −′ ′ ′=β X X X XΣX X X e . ˆ ˆvar( | ) var( | )OLS GLS≥β X β X

e) Se è una matrice diagonale (e dunque gli errori sono non correlati), denotato con Δ 2tδ

l’elemento diagonale di indice t , la sima GLS di β del modello t ty tu′= +x β è la stima OLS del

modello t tt

t t

y vδ δ

′= +

x β . Si noti che quest`ultimo modello non ha l`intercetta e quindi 2cR non è

utilizzabile per misurare la bontà dell’adattamento del modello ai dati.

top

5-2 Il metodo (asintotico) FGLS (Feasible Generalized Least Square)

Nel precedente paragrafo si e` fatta l’ipotesi che la matrice Δ , nella rappresentazione della

varianza del vettore degli errori, fosse nota; ipotesi del tutto irragionevole in presenza di dati non

sperimentali, come in econometria. E` opportuno ricordare che quando Δ non e` nota (e il

campione e` sufficientemente grande) la procedura di stima, frequentemente adoperata e descritta

3


nei precedeenti capitoli, e` quella di utilizzare il metodo OLS (risp. NLS) e stimare la varianza

asintotica dello stimatore del (vettore) parametro con lo stimatore di White (HC) in presenza della

sola eteroschedasticita` o con quello di Newey-West (HAC) se e` presente anche

l`autocorrelazione.

Il metodo FGLS utilizza eventuali informazioni disponibili (o soltanto ipotizzate) sulla matrice

(e quindi sul processo degli errori) e il metodo GLS, per costruire stimatori di β asintoticamente

piu` efficienti di quelli OLS. E` importante osservare che l’efficienza delle stime e` soltanto

asintotica e pertanto non e` detto che si conservi anche per campioni finiti che peraltro e` l’ambito

in cui si lavora.

Δ

Si considera il modello lineare (ma non ci sono modifiche da apportare se il modello fosse

nonlineare)

t ty u′ t= +x β con E( | ) 0 e t t tu tΩ = ∈x Ω , per 1,2,t = … .

Osservazione:

• Si sta assumendo che le variabili indipendenti del modello sono esogene; se il processo degli

errori e` autocorrelato allora le variabili indipendenti devono ragionevolmente essere strettamente

esogene (in particolare tra le variabili indipendenti non ci possono essere ritardi della variabile

dipendente).

• Per non appesantire l’esposizione non saranno indicate esplicitamente, ma si riterranno

sempre valide, le ipotesi che consentono di utilizzare, quando se ne presenti la necessità, qualche

versione della legge dei grandi numeri e del teorema del limite centrale.

• Pur non essendo strettamente necessario, nella descrizione del metodo di stima si e` preferito

distinguere il caso in cui il processo degli errori non e` autocorrelato, che e` quello che si incontra

piu` spesso, da quello in cui il processo degli errori e` autocorrelato.

Il metodo FGLS quando il processo tu e` non autocorrelato (in particolare quando i dati sono

del tipo cross-section) – In questo caso, per ogni , la matrice di covarianza del

vettore degli errori è diagonale; siano

n ( )2

( )n nσ

×=Σ Δ

2tδ (per 1, ,t n= … ) gli elementi diagonali di e dunque si ha Δ

2E( | )t tu 2 2tσ δΩ = . In assenza di ulteriori informazioni sul processo degli errori, un modello

sufficientemente ampio per la varianza condizionata (coerente con la positivita` della varianza e

comunque relativamente semplice) e` il seguente:

4


2E( | ) exp( )t t tu ′Ω = z γ con t t∈Ωz per ogni , (e t l∈γ R non noto)( )3 .

La costruzione dello stimatore FGLS (descritta nei passi da i) a iii)):

i) Si stima il modello originario con il metodo OLS ( e` una stima consistente di β ) e si

considera il processo dei residui

ÔLSβ

ˆtu ; ( )4

ii) Si stima il parametro γ , con il metodo OLS, utilizzando il modello di regressione lineare

ausiliario 2ˆlog( )t tu r′= +z γ esid

n

)

e siano , per , i valori previsti; ˆt′z γ 1, ,t = …

iii) Posto , si stima il modello ausiliario ( 1/ 2ˆ êxp( )t tδ ′= z γ 1ˆ ˆt

tt t

y residδ δ

′= +x β con il metodo OLS.

Definizione: La stimatore OLS di β ottenuto dal modello in iii) (che si prova essere consistente),

dicesi stimatore dei minimi quadrati generalizzati realizzabile (FGLS) di (del modello

originario) e si denota con il simbolo .

β

ˆFGLSβ

Osservazione:

• e` dunque lo stimatore GLS del modello originario nel quale gli elementi diagonali della

matrice sono stati sostituiti con

ˆFGLSβ

Δ 2tδ .

• Distribuzione asintotica di : Si prova facilmente ˆFGLSβ ˆ ˆ( ) ( , Avar(

d

FGLS FGLSn N− →β β 0 β ))

con 1

22

1

1Âvar( ) limn

t tFGLS

t t

pn

σδ

−

=

⎡ ⎤′= ⋅ ⎢

⎣ ⎦∑ x xβ ⎥

; uno stimatore consistente della varianza asintotica e`

evidentemente

( )3 Per dati cross-section, e` costituito dal complesso delle informazioni disponibili nella unita` statistica e quindi in ci potrebbero essere variabili presenti oppure no in ; talvolta lo scatter-plot della coppia , essendo

tΩ t

tz tx ˆ( , )t tu z

ˆtu i residui della stima OLS del modello e tz t∈Ω , puo` essere utile .per selezionare le variabili tz da

inserire in . Invece per dati del tipo time-series, tz tΩ e` piu` ampio perche` in esso ci sono certamente non solo le variabili indipendenti presenti nel modello con i loro ritardi, ma anche i ritardi della variabile dipendente. Va comunque segnalato che in presenza di dati del tipo time-series sono stati introdotti altri (e piu` interesanti) modelli per la varianza condizionata degli errori che pero` richiedono differenti procedure di stima.

( )4 Si noti che dalla consistenza di segue ˆ ˆ( OLS=β β ) ( ),ˆ ˆˆ ( ) max

p

jtt jx− = − ≤ − →u u X β β β β 0 (per ) e ciò

giustifica i passi successivi, in cui si sostituiscono gli errori per i quali non sono disponibili le osservazioni con i residui,

operazione già effettuata precedentemente, ma giustificata in modo differente. Questa proprietà` si esprime dicendo che

il processo dei residui e` consistente per il processo degli errori.

n →∞

5


1

22

1

1ˆAvar( ) ˆn

t tFGLS

t t

sn δ

−

=

⎡ ⎤′= ⎢ ⎥

⎣ ⎦∑ x xβ con calcolato con il modello in iii). 2s

• Lo stimatore e` certamente asintoticamente piu` efficiente di (quest`ultimo con lo

stimatore di White per la varianza), pero`, come gia` precedentemente segnalato, quando sono

utilizzati con campioni finiti non e` detto che la predetta efficienza continui a sussistere.

ˆFGLSβ ˆ

OLSβ

• Una naturale conseguenza di quanto ora detto e` che la procedura di stima usuale, in presenza di

modelli lineari (o non lineari) per dati cross-section (comunque del tipo fin qui considerati), e` il

metodo di stima OLS o NLS, con l’unico dubbio (ma generalmente e` ritenuta una certezza) se e`

opportuno utilizzare lo stimatore di White per la varianza asintotica; nasce cosi` l’esigenza di

costruire strumenti (in statistica si chiamano test) che possa indirizzare la scelta. Due tra i principali

test sulla presenza di eteroschedasticita sono riportati nell’appendice 5.5.

Il metodo FGLS per modelli (lineari o nonlineari) con autocorrelazione negli errori. Si segnala

immediatamente, ma cio` apparira` chiaro nella successiva discussione che il metodo, che non

presenta alcuna difficoltà` di tipo teorico, e` realizzabile soltanto in casi molto particolari.

Costruzione dello stimatore FGLS: Se per ogni , la matrice di covarianza del vettore degli

errori e` del tipo

n

( 2σ=Σ )Δ con e ( )=Δ Δ γ γ vettore non noto di indipendente da (lR n 5)

ed inoltre e` disponibile uno stimatore consistente di γ γ , allora lo stimatore FGLS di β si ottiene

stimando il modello (che deve avere le variabili indipendenti strettamente esogene se la matrice

non e` diagonale) con il metodo GLS considerando pero` come matrice di covarianza degli errori la

matrice

Δ

2ˆ ˆ( )σ=Σ Δ γ .

Osservazione:

• Si tralascia di riportare le proprieta` asintotiche degli stimatori (che peraltro sono prevedibili) e

la loro prova (che invece necessita di qualche accorgimento).

• Generalmente la costruzione di non presenta particolari difficoltà, invece problemi di tipo

numerico si possono presentare nella costruzione della matrice che verifichi la condizione

(quando la matrice non e` diagonale) essendo di grosse dimensioni.

γ

Ψ1−′ =ΨΨ Δ Δ Δ

top

5-3 Stima dei modelli lineari con errori AR(1); lo stimatore di Prais-Winsten

In questo paragrafo si presenta la stima con il metodo FGLS di un modello lineare con errori

( )5 Come si potra` notare quello che ora si dira` e` valido anche se la matrice Δ e` diagonale

6


del tipo AR(1). In tale modello la matrice non e` diagonale, ma l’analisi della sua struttura

consente di individuare facilmente la matrice . E` importante segnalare che con tecniche di

simulazione e` stato mostrato che generalmente il metodo FGLS per tali modelli (quando e`

utilizzabile; infatti e` richiesta la stretta esogeneita` delle variabili indipendenti), e` piu` efficiente di

altri metodi anche per campioni finiti (un altro metodo di stima e` stato presentato nel paragrafo

4.6).

Δ

Ψ

Si considera il modello econometrico

2

1

, . . .(0, )t t tt

t t t

y ui i d

u u εε σρ ε−

′= +⎧⎨ = +⎩

x β∼ , | | 1ρ < , 1,t = … ,

e si suppone che

a) tra le variabili indipendenti non ci sono ritardi della variabile dipendente (e dunque le variabili

sono strettamente esogene); tx

b) il processo tu e` AR(1) (l’unica soluzione stazionaria dell’equazione alle differenze

1t tu u tρ ε−= + ).

c) il valore del parametro ρ non e` noto.

Osservazione: In 4-6 e` stata descritta una procedura di stima per un modello che appare molto

simile a quello qui considerato, ma che e` in realtà molto piu` generale. Qui il processo degli errori

e` strettamente stazionario e le variabili indipendenti sono strettamente esogene, in 4-6 invece il

processo tu e` (soltanto) una soluzione di 1t tu u tρ ε−= + con | | 1ρ < (pertanto e` debolmente

stazionario) e inoltre tra le variabili indipendenti ci possono essere anche ritardi della variabile

dipendente . ty

Costruzione dello stimatore . La procedura descritta nei successivi passi da i) a iv) fu

proposta da Prais e Winsten nel 1954; per questa ragione in letteratura lo stimatore e` indicato con

il loro nome. Sia un fissato intero naturale:

ˆFGLSβ

n

i) Rappresentazione della matrice di covarianza degli errori 2( , )ερ σΣ per un processo

AR(1).

Si ha (per la prova vedi 5.6)

( ) ( )

2 1

22 2

2

1 2 3

111( , ) E( ) ( )

11

n

n

n n n

ε ε

ρ ρ ρρ ρ ρ 2

ερ σ σ σρ

ρ ρ ρ

−

−

− − −

⎛ ⎞⎡ ⎤⎜ ⎟⎢ ⎥⎜ ⎟⎢ ⎥′= = =⎜ ⎟⎢ ⎥−⎜ ⎟⎢ ⎥⎜ ⎟⎢ ⎥⎣ ⎦⎝ ⎠

Σ uu Δ ρ .

7


ii) Scelta di una matrice tale che Ψ ( ) 1( )ρ −′ =ΨΨ Δ .

La scelta piu` immediata sembra essere ( ) 1/ 2( )ρ −=Ψ Δ , ma evidentemente il calcolo per

individuare la sua rappresentazione e` numericamente complesso; qui di seguito si presenta una

procedura indiretta per individuare una(altra) . Ψ

Si osserva che alla matrice si richiede semplicemente di trasformare il vettore degli errori

autocorrelati in un vettore (della stessa dimensione) di variabili non correlate e con varianza

costante, ma una tale Ψ e` descritta implicitamente nelle ipotesi. Infatti, essendo il processo

Ψ u

tu

soluzione dell’equazione alle differenze 1t t tu uρ ε− + , 2. . .(0, )t i i dε= εσ∼ , esso e` necesssariamente

soluzione di un problema di valore iniziale 1

1 1

per 2, ,

t t tu u tu uρ ε−= + =⎧

⎨ =⎩

… n e dalla sua stazionarieta`

segue (facilmente) che deve essere 21 1 / 1u ε ρ= − . Quindi 1, ,t t

u= … n

e` soluzione del problema

1

21 1

per 2,

t = ,

1t t tu u n

u

ρ ε

ρ ε−= +⎧⎪

⎨− =⎪⎩

…, la cui versione matriciale e`

21 1

2 2

1 1

1 0 0 01 0 0

0 0 1 00 0 1

n n

n n

uu

uu

ερερ

εερ

− −

⎛ ⎞⎛ ⎞ ⎛ ⎞−⎜ ⎟⎜ ⎟ ⎜ ⎟

−⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟=⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟− ⎝ ⎠ ⎝ ⎠⎝ ⎠

.

In definitiva una matrice che soddisfa la condizione richiesta e`

( )

21 0 01 0

( )

0 0 1 00 0 1

ρρ

ρ

ρ

⎛ ⎞−⎜ ⎟

−⎜ ⎟⎜ ⎟= =⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟−⎝ ⎠

Ψ Ψ

00

.

iii) Costruzione di uno stimatore consistente del parametro ρ .

Si considera il processo dei residui ˆtu ottenuti dalla stima OLS del modello originario (si noti

che la stima OLS di β e` consistente) e si costruisce ρ utilizzando indifferentemente una delle

seguenti due procedure

• Il metodo OLS nel modello ausiliario 1ˆ ˆt tu u residρ −= + ;

• La correlazione empirica del prim’ordine del processo dei residui e dunque 12

1ˆ ˆ ˆn

t tt

u un

ρ −=

= ∑ .

8


iv) Stima FGLS di e sua distribuzione asintotica. β

ˆFGLSβ e la sua distribuzione asintotica si ottengono stimando con il metodo OLS il modello

ˆ ˆ( ) ( )ρ ρ= +Ψ y Ψ Xβ ε con 2. . .(0, )t i i d εε σ∼ , che in forma vettoriale ha la seguente rappresentazione

( )

2 221 1 1

1 1

ˆ ˆ1 1 , . . .(0, )ˆ ˆ per 2, , t

t t t t t

y i i dy y t n ε

ρ ρ ε ε σρ ρ ε− −

⎧ ′− = − +⎪⎨

′ ′− = − + =⎪⎩

x βx x β

∼…

.

Un confronto tra gli stimatori di Prais-Winsten e NLS (costruito in 4.6) – Qui si segnalano (di

nuovo) le differenze nei modelli e quando entrambe le procedure sono utilizzabili i vantaggi e gli

svantaggi nell’utilizzo dell’uno o dell’altro stimatore.

i) Il metodo FGLS (in particolare lo stimatore di Prais-Winsten) richiede che le variabili

indipendenti siano strettamente esogene e quindi non potrà essere utilizzato se il modello è

dinamico (cioe` tra le variabili indipendenti c’è qualche ritardo della variabile indipendente). Questa

restrizione non e` necessaria se si utilizza il metodo NLS.

ii) Il metodo FGLS utilizza tutte le n osservazioni, mentre il metodo NLS sacrifica (almeno) la

prima osservazione (infatti nel modello nonlineare c`è sicuramente 1ty − ).

iii) Con il metodo NLS si ottiene la stima congiunta con le utili informazioni sulla sua

distribuzione asintotica, mentre nella procedura FGLS la stima di β è condizionata a quella di

ˆ ˆ( ,NLS NLSρβ )

ρ ,

pertanto può risentire dell’eventuale inefficienza di ˆFGLSβ ρ .

iv) (La differenza nei modelli) Nel modello in 4-6 il processo tu e` soltanto (una) soluzione

dell’equazione alle differenze 1t tu u tρ ε−= + , mentre in questo paragrafo tu e` la (unica)

soluzione stazionaria della precedente equazione. Puo` essere utile ricordare che la generica

soluzione dell’equazione e` somma della soluzione stazionaria e di una componente deterministica

del tipo naρ .

v) Quando sono utilizzabili entrambe le procedure lo stimatore FGLS di β e` asintoticamente piu`

efficiente di quello NLS (con tecniche di simulazione e` stato mostrato che l`efficienza sussiste

anche per campioni finiti).

top

5-4 Il metodo di Cochrane-Orcutt

Il metodo utilizzabile per il modello in 5-3, fu presentato da Cochrane e Orcutt in un articolo

del 1949; la procedura di stima e` iterativa e richiede che le variabili indipendenti siano

strettamente esogene. Si prova che con questo metodo si ottiene la stima FGLS, inoltre come si

9


potra` notare in seguito, il metodo ha il vantaggio di non richiedere la stazionarieta` del processo

degli errori (ma soltanto di essere soluzione dell’equazione alle differenze) e di poter essere

facilmente adattato al caso in cui il processo degli errori è ( )pAR con (o piu` precisamente

soluzione di un’equazione alle differenze stabile di ordine

2p ≥

p con termine noto 2. . .(0, )i i d σ ).

Costruzione della stima di Cochrane-Orcutt: Innanzitutto si osserva che il modello

2

1

, . . .(0, )t t tt

t t t

y ui i d

u u εε σρ ε−

′= +⎧⎨ = +⎩

x β∼ , | | 1ρ < , 1,t = … ,

ha le seguenti due rappresentazioni equivalenti:

M.a) 1 1( ) ( )t t t ty y tρ ε− −′ ′− = − +x β x β

M.b) 1 1( ) ( )t t t ty y tρ ρ ε− −′ ′− = − +β x x .

Procedura iterativa di stima: Si considera il valore iniziale stima OLS di β del

modello (certamente consistente per l’ipotesi di stretta esogeneità di ) e per ogni

0ˆ

OLS=β β

t ty ′= +x β tu tx

0i ≥

i) si pone in M.a e si denota con i=β β iρ la stima OLS di ρ ;

ii) si pone iρ ρ= in M.b, si denota con 1i+β la stima OLS di β ;

iii) si ritorna al punto i) ponendo 1i+=β β .

Si interrompe la procedura iterativa (come e` consuetudine) quando due valori consecutivi di

sono sufficientemente vicini e la stima della varianza asintotica della stima di β e` ottenuta

dall’ultima stima del modello M.b.

iβ

top

5-5 Appendice: Il test di White e il test di Breusch-Pagan (sulla presenza di eteroschedasticita`

negli errori)

Si segnala che qui ci si limita a descrivere come i test sono costruiti e l’idea da cui hanno tratto

origine, omettendo i risultati teorici che costituiscono il loro fondamentale sostegno.

Si supponga assegnato il modello lineare

t ty u′ t= +x β con E( | ) 0 e t t tu tΩ = ∈x Ω , per 1,2,t = … .

per dati cross-section (o piu` in generale con errori non vorrelati) e si supponga (come al solito) che

sussistano le ipotesi che garantiscono l’utilizzo della legge dei grandi numeri e del teorema del

limite centrale quando se ne presenta la necessita`.

Il test di White (1980) – Si denota con z la variabile (vettoriale) le cui coordinate sono le iz

10


variabili (distinte) nell’insieme 1 , 1,i j ,x x i j k∨ = … (dunque tra le coordinate di z c’e`

certamente 1 anche se nel modello originario manca la costante).

Costruzione del test di White:

i) Si stima con il metodo OLS il modello assegnato e sia ˆtu il processo dei residui;

ii) Si considera il modello ausiliario e sia 2ˆt tu re′= +z γ sid 2R il coefficiente di determinazione

centrato.

iii) La statistica ha distribuzione asintotica 2nR 21lχ − ( l e` la dimensione di z ) se gli errori nel

modello assegnato sono omoschedastici; il test a livello di significatività α e` allora il seguente:

“Si rifiuta l’ipotesi di errori omoschedastici se 2 21,1lnR αχ − −> ”.

Alcune semplici considerazioni (che in qualche modo giustificano la procedura): Nel caso in cui

gli errori dovessero essere omoschedastici deve aversi

2 2 2

1 1

1 1ˆlim lim limn n

t t t t t t t tn n nt tp u p u S p

n n→∞ →∞ →∞= =

⎛ ⎞′ ′= =⎜ ⎟⎝ ⎠

∑ ∑x x x x x x1

1 n

tn =

′∑

e quindi

2 2

1

1 ˆlim ( )n

t t tn t

p u Sn→∞

=

′− =∑ x x 0 .

Le coordinate di , di cui si e` parlato precedentemente, sono elementi della matrice tz t t′x x e

dunque deve essere

2 2

1

1 ˆlim ( )n

t tn t

p u Sn→∞

=

− =∑ z 0 ,

d’altra parte la rappresentazione di (2 2

1

1 ˆ( )n

t tt

u Sn =

− =∑ z c )n fa pensare alla possibilita` che nnc

possa convergere in distribuzione verso una normale (se dovesse essere valido il teorema del limite

centrale per la sequenza ( )2 2ˆ( )t t tu S− z ).

White nel suo articolo del 1980, prova che e` utilizzabile il teorema del limite centrale e inoltre

trova

a) la varianza asintotica di ( ; )n nc

b) un (opportuno) stimatore della varianza asintotica tale che la statistica coincida con

di iii).

B ˆnn ′c Bcn

2nR

Il test di Breusch-Pagan – Si fa riferimento allo stesso modello e qui si suppone che ci siano

informazioni sul fenomeno che inducono a sospettare che la eteroschedasticita` possa essere del tipo

11


( )2E( ) ( )t t tu h δ ′Ω = + z γ , con una funzione regolare non nota, e , con non

necessariamente coincidente con .

h t ∈Ωz t tz

tx

Costruzione del test di Breusch-Pagan:

i) si stima il modello con il metodo OLS e sia ˆtu il processo dei residui;

ii) si considera il modello ausiliario e sia 2ˆt tu b residδ ′= + +γz b 2R il coefficiente di

determinazione centrato;

iii) la statistica ha distribuzione asintotica 2nR 21lχ − ( e` la dimensione di z ) se gli errori nel

modello assegnato sono omoschedastici; il test a livello di significatività

l

α e` allora il seguente:

“Si rifiuta l’ipotesi di errori omoschedastici se 2 21,1lnR αχ − −> ”.

Alcune semplici considerazioni (che in qualche modo giustificano la procedura): L’ipotesi di

omoschedasticita` degli errori e` equivalente a =γ 0 in 2E( ) ( )t t tu h δ ′Ω = + z γ . Breusch e Pagan,

nel loro articolo del 1979, inizialmente assumono che sono disponibili le osservazioni per il

processo 2tu , considerano il modello non lineare u h2 ( )t t tvδ ′= + +z γ tv (su si puo` soltanto dire

che ha media nulla) e costruiscono il test LM per l’ipotesi 0 :H =γ 0 (cfr. 2 in 4-5) che ora si passa

a descrivere brevemente.

a) Il modello ausiliario di Gauss-Newton (se si denota con ( )h′ ⋅ la derivata prima di ) e` ( )h ⋅

2 ( ) ( ) ( )t t t t tu h h b h residδδ δ δ′ ′ ′ ′ ′ ′− + = + + + +γz γ z γ z γ z b ;

b) Se fosse disponibile δ , una stima -consistenten di δ quando e` vera si considererebbe 0H

il modello lineare 2 ˆ ˆ ˆ( ) ( ) ( )t tu h h b h residδδ δ δ′ ′ ′− = + +γz b

e si verificherebbe l’ipotesi equivalente 0 :H =γb 0 ;

c) Nella situazione attuale, non serve la disponibilita` di δ ma soltanto la sua esistenza (che qui

non e` provata) in quanto ˆ( )h δ e ˆ( )h δ′ comunque sono due costanti e allora il precedente modello

diventa (con 2t tu rα ′= + +z δ esid bˆ ˆ( ) ( )h h δα δ δ′= + e ) e l’ipotesi diventa

, se e` (come e` ragionevole che sia);

ˆ( )h δ′= γδ b 0 :H =γb 0

0 :H =δ 0 ˆ( ) 0h δ′ ≠

d) Breusch e Pagan infine mostrano che nel precedente punto c) il processo 2tu puo` essere

sostituito dal processo 2ˆtu .

top

12


5-6 Appendice: I modelli AR, MA e ARMA per processi stazionari autocorrelati

Si descrivono ora alcuni modelli per processi (strettamente) stazionari autocorrelati che sono

utilizzati in econometria. La classe di questi modelli e` molto ampia e per lungo tempo (quando

l`unico settore applicativo delle time-series era la teoria dei segnali in ingegneria) si e` pensato

erroneamente (supportati anche dal famoso Teorema di Wold del 1938 sulla rappresentazione dei

processi debolmente stazionari) che per le applicazioni, tale classe si potesse sostanzialmente far

coincidere con quella di tutti i processi (strettamente) stazionari. Recentemente sono stati introdotti

altri modelli per processi stazionari, di grande interesse in econometria, che consentono la presenza

di eteroschedasticita` condizionale evidentemente non presente nei modelli che saranno descritti in

questo paragrafo.

In quanto segue

i) tε e` (sempre) un processo 2. . (0, )i i d εσ ed è denominato rumore bianco stretto (o forte);( )6

ii) Se tx e` un processo stocastico si pone 1( ,t tx − )Ω =F … (sigma algebra generata dalle

variabili ); esso non e` altro che il complesso delle informazioni sul processo all’istante t se

e` noto tutto il suo passato.

1,tx − …

Definizione (dei processi (1)AR ): La (unica) soluzione strettamente stazionaria dell’equazione alle

differenze 1t tu u tρ ε−= + con | | 1ρ < dicesi processo autoregressivo del prim’ordine (in breve

AR(1)).

Osservazione:

i) L`equazione alle differenze 1t tu u tρ ε−= + con | | 1ρ < ha infinite soluzioni che differiscono da

quella strettamente stazionaria per un termine infinitesimo per ( ) del tipo n →∞ ncρ ; per questa

ragione tutte le altre soluzioni si dicono asintoticamente stazionarie.

ii) Denotato con l’operatore ritardo, definito sui processi dalla relazione L 1( )t tL x x −= (o

più brevemente 1( )t tL x x −= ) sussiste la seguente rappresentazione per il processo (1)AR :

1 21 2

0 0( ) ( ) ( ) (n n n

t t t t t t t t n t t tn n

I L u u I L u L uρ ε ρ ε ρ ε ρ ε ε ρε ρ ε∞ ∞

−− − −

= =

⎛ ⎞− = ⇔ = − ⇔ = ⇔ = = + + +⎜ ⎟⎝ ⎠

∑ ∑ ..)

.

Proprietà dei Processi AR(1):

( )6 Si noti che in queste lezioni sara` sempre 2. . (0, )t i i d εε σ∼ . Si segnala che molto (ma non tutto) di quello che si dira`

sussiste anche se il processo tε verifica soltanto le seguenti condizioni 2 2E( ) 0, E( ) , E( ) 0 per t t t s t sεε ε σ ε ε= = = ≠ ;

in tal caso il processo tε dicesi rumore bianco debole. Una ipotesi intermedia tra rumore bianco forte e debole e` “il

processo tε e` una differenza martingala debolmente stazionaria”.

13


• La rappresentazione in ii) del processo tu come somma di una serie e` stata ottenuta

euristicamente, ma si prova che la serie converge quasi ovunque e in media quadratica, che il

processo somma e` strettamente stazionario ed ergodico, ed infine e` soluzione dell’equazione alle

differenze. (Nella prova ha un ruolo fondamentale la rapida convergenza a 0 dei coefficienti della

serie);

• E( ) 0;tu = ( )1 1E( | ) E( | )t t t t tu u u uρ− −Ω = = ;

• ( )2

22var( )

1u tu εσσρ

= =−

per ogni t (segue dalla ovvia uguaglianza 2 21var( ) var( )t tu u ερ σ−= + , );

• 21 1var( ) var( )t t t t tu u u ερ ε σ− −Ω ⎡= + ⎤ =⎣ ⎦ ;

• Per ogni si ha 0s ≥ ( )corr( , ) ( ) ( ) ss t t su u ACF s ACF sρ ρ−= = = − = ;

infatti dalla uguaglianza ( )1 1cov( , ) E( ) E( ) E( )s t t s t t s t t s t t s su u u u u u uγ ρ ε ργ− − − − −= = = + = − per ,

dividendo per

1s ≥

0γ , si ha 1s sρ ρρ −= ed essendo 0 1ρ = segue ovviamente l’asserto);

• La matrice di covarianza del vettore 1( , , )nu u ′=u … è

( ) ( )

2 1

222

2

1 2 3

11

( ) E( ) ( )1

1

n

n

u

n n n

ε

ρ ρ ρρ ρ ρσρ σ ρ

ρρ ρ ρ

−

−

− − −

⎡ ⎤⎢ ⎥⎢ ⎥′= = =⎢ ⎥−⎢ ⎥⎢ ⎥⎣ ⎦

Ω uu Δ ;

• Se l’equazione alle differenze che definisce il processo e` interpretata come un modello di

regressione lineare allora la stima OLS di ρ e` consistente, asintoticamente normale e

asintoticamente efficiente (motivare le precedenti affermazioni, scrivere la rappresentazione e la

stima della varianza asintotica della stima).

Definizione (dei processi ( )AR p ): Sia ( )1 1 2 2 ( )t t t p t p t tu u u u L u tβ β β ε β− − −= + + + + ⇔ = ε una

equazione alle differenze, tale che il polinomio ( )1( ) 1 ppz zβ β β= − − − z ha radici in modulo

maggiore di 1. La (unica) soluzione strettamente stazionaria dell’equazione (alle differenze) dicesi

processo autoregressivo di ordine p (in simboli ( )AR p ).

Proprietà dei processi ( )AR p :

• Il processo tu (che ha una rappresentazione del tipo (0

( )t n t nn

u )tLα ε α ε∞

−=

= =∑ con la serie di

potenze avente raggio di convergenza maggiore di 1) è strettamente stazionario ed

ergodico;

0

nn

nzα

∞

=∑

14


• I coefficienti nα nella precedente rappresentazione possono essere individuati per ricorrenza

dalla identita` ( ) ( ) 1z zβ α = ;

• Le altre soluzioni dell’equazione che definisce il processo ( )AR p , poiché sono somma dello

stesso processo e di un processo deterministico infinitesimo di ordine esponenziale, sono

asintoticamente stazionarie;

• ; E( ) 0tu = 1 1 1 2 2E( | ) E( | , , )t t t t t p t t p t puu u u u u uβ β β− − − −Ω = = + + +… 2var( | )t tu− ; εσΩ = ;

• La sequenza delle autocovarianze (e` soluzione di un problema di valore iniziale per

l`equazione alle differenze che ha (1/ )zβ come polinomio caratteristico) – infatti moltiplicando

ripetutamente nell’equazione per , ,t tu u p−… e calcolando l’aspettazione si ottengono le seguenti

1p + equazioni (in 1p + incognite)

20 1 1

1 1 0 2 1 1

2 1 1 2 0 2

1 1 2 2 0

p p

p p

p p

p p p p

εγ β γ β γ σγ β γ β γ β γγ β γ β γ β γ

γ β γ β γ β γ

−

−

− −

⎧ = + + +⎪ = + + +⎪⎪ = + + +⎨⎪⎪

= + + +⎪⎩

la cui unica soluzione fornisce i valori di 0 , , pγ γ… . D’altra parte se (nel modello originario) si

moltiplica per (con ) e si calcola l’aspettazione, si ottiene l’equazione alle differenze t su − s p>

1 1 2 2s s s p s pγ β γ β γ β γ− − −= + + + ,

che insieme ai valori (iniziali) già individuati consente l’individuazione della sequenza delle

autocovarianze del processo.

• La sequenza delle autocorelazioni – Si ottiene risolvendo il problema di valore iniziale

(denominato sistema di Yule-Walker) relativo all’equazione alle differenze

1 1 2 2s s s p s pρ β ρ β ρ β ρ− − −= + + +

con le condizioni iniziali che risolvono il sistema (con p equazioni e p incognite)

1 1 2 1 1

2 1 1 2 2

1 1 2 2

p p

p p

p p p

ρ β β ρ β ρρ β ρ β β ρ

pρ β ρ β ρ β

−

−

− −

= + + +⎧⎪ = + + +⎪⎨⎪⎪ = + + +⎩

.

Segue dal punto precedente, non appena si divide per 0γ sia l’equazione alle differenze che le

ultime equazioni, delle p 1p + , che fissano le condizioni iniziali.

Evidentemente la sequenza delle autocorrelazioni converge a 0 per in modo

esponenziale.

n →∞

15


• Se l’equazione alle differenze che definisce il processo e` interpretata come un modello di

regressione lineare allora le stima OLS di 1( , , )pβ β… e` consistente, asintoticamente normale e

asintoticamente efficiente (motivare le precedenti affermazioni).

Definizione (dei processo ( )MA q invertibili): Un processo tu si dice ( )MA q (Moving Average)

oppure a media mobile di ordine q invertibile, se ha la seguente rappresentazione

1 1 ( ( )t t t q t qu L tε α ε α ε α ε− −= + + + = ) con 0

( ) 0q

ii

i

z zα α=

⎛ ⎞= ≠⎜ ⎟⎝ ⎠∑ per 1z ≤ e 0 1α = .( ) 7

Proprietà dei processi ( )MA q :

• Il processo tu è strettamente stazionario ed ergodico (segue immediatamente dalla sua

rappresentazione) inoltre se si pone

00

1( ) per (0, ) (0,1) e 1( )

nn

n

z z z B r Bz

β βα

∞

=

⎛ ⎞′ β= = ∈ ⊃⎜ ⎟⎝ ⎠∑ = .

si ha

0

( ) t t n t n tn

L u uβ ε β∞

−=

⎛ ⎞= ⇔ =⎜ ⎟⎝ ⎠

∑ ε

2 2i

;( ) 8

• , E( ) 0tu = ( )2 20

0

var( ) E( )q

u t ti

u u εσ γ σ=

= = = = α∑ ;

• 0sγ = per (e` ovvio), in particolare le variabili del processo che hanno una distanza

temporale maggiore di sono indipendenti, mentre per

s q>

q ( )1 s q≤ ≤ si ha

2 2

0

q q s

s i i s i si s i

ε εγ σ α α σ α α−

− += =

⎛ ⎞⎛ ⎞ ⎛ ⎞= =⎜ ⎟⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠⎝ ⎠∑ ∑ i ,

infatti si ha 21

0E( ) E( )

q q s q

s t t s i t i s i t i i si i s i s

u u εγ α ε α ε σ α α+

− − − −= = =

= = =∑ ∑ ∑ − ;

• I processi : Quanto detto finora continua a rimanere valido per ; si deve soltanto

richiedere che

( )MA ∞ q = +∞

0i

i

α∞

=

< +∞∑ (e la somma nella definizione del processo va intesa in media

quadratica). E` evidente che anche i processi ( )AR p sono processi ( )MA ∞ .

( )7 La restrizione sulla funzione ( )zα sara` motivata piu` avanti, comunque va detto che non è necessaria per provare la stazionarieta` del processo. In econometria tale restrizione è abbastanza naturale; infatti se gli shock del passato persistono allora il loro effetto sul processo tende a ridursi. D’ora innanzi il termine “invertibile” è sottinteso quando sono presenti processi MA. ( )8 Si noti l’analogia con la rappresentazione dei processi AR(p), e ciò giustifica l’affermazione che i processi MA hanno una rappresentazione come processo ( )AR ∞

16


• Nei processi (1)MA si ha: ( ) 21 1E( )t tu u 1 εγ α σ−= = e quindi 1

1 211

αρα

=+

(donde è immediato

riconoscere che 1ρ è compreso tra e 1/ ); 1/ 2− 2

• La matrice di covarianza del vettore aleatorio 1( , , )nu u ′=u … e`

( )

21 1

22 21 1 1

1 1

21 1

1 0 01 0

( ) E( ) ( )

0 0 1

ε ε

α αα α α

α σ σ

α α

⎡ ⎤+⎢ ⎥+⎢ ⎥′= = =⎢ ⎥⎢ ⎥

+⎢ ⎥⎣ ⎦

Ω uu Δ α .

(In questo caso non e` altrettanto immediato come nel caso dei processi (1)AR individuare una

matrice tale che Ψ [ ] 11( )α −′ =ΨΨ Δ ).

• L’espressione che definisce un processo ( )MA q e` evidentemente interpretabile come un

modello, ma non e` un modello di regressione lineare. Qualche cenno su come trovare buone stime

dei parametri, naturalmente quando sono disponibili le osservazioni del processo, sara` dato in

seguito.

Definizione (dei processi ( , )ARMA p q ): Un processo tu dicesi ( , )ARMA p q se e` la (unica)

soluzione stazionaria dell’equazione alle differenze

1 1 2 2 1 1t t t p t p t t qu u u u t qβ β β ε α ε α− − − − ε −= + + + + + + +

con

• 0

( )q

ii

i

z zα α=

=∑ , 0 1α = e ( ) 0zα ≠ in (0,1)B′ ;

• e 1( ) 1 ppz z zβ β β= − − − ( ) 0z ≠ in (0,1)B′ ; β

• ( )zα e ( )zβ non hanno radici in comune.

Proprietà dei processi ARMA:

• I processi ARMA hanno una rappresentazione come processi ( )MA ∞ e . Infatti si ha ( )AR ∞

1( ) ( )t tu L Lβ α ε−= e 1( ) ( ) t tL L uα β ε− = ;

• La fuzione di autocovarianza sγ è soluzione dell’equazione alle differenze

1 1s s p s pβ γ β γ− −= + + max( , 1)s p q≥ + per γ

(è sufficiente motiplicare per nell’equazione che definisce il processo e prendere la media),

pertanto

t su −

sγ , e quindi sρ , è infinitesima di ordine esponenziale per . s →+∞

17


Per , 0 max( , 1)s p q≤ < + sγ si ottiene come soluzione di un sistema che qui non e` riportato,

ma la sua individuazione non presenta particolari problemi.

• I processi ARMA di ordine ( , )p q non molto elevati (in econometria generalmente è , 3p q ≤ )

ben approssimano i processi MA e AR di ordine elevato.

Tralasciando una rigorosa giustificazione, il risultato è abbastanza prevedibile ed è di grande

utilità quando si devono stimare i parametri di un modello MA o . AR

Nota conclusiva: I modelli fin qui considerati sono tutti riferiti a processi (stazionari) con media

nulla, ma questa restrizione può essere rimossa immediatamente osservando che se tx è un

processo stazionario con media μ allora tx μ− è un processo stazionario a media nulla.

La funzione Autocorrelazione Parziale (empirica): Un (ulteriore e non ultimo) utile strumento per

selezionare un modello ( , )ARMA p q che meglio interpreta le osservazioni su un processo (che si

ritiene stazionario) è la versione empirica della funzione (Partial Autocorrelation

Correlation Function).

( )PACF k

Qui ci si limita a segnalare una interesante proprietà di (in un certo senso duale della

funzione ACF ) e a fornire una procedura per la costruzione della sua versione empirica.

( )PACF k

• Se tu è un processo ( )AR p allora ( ) 0PACF k = per ; k p>

• Se tu è un processo ( )MA q allora è infinitesima di ordine esponeziale; ( )PACF k

• Se tu un processo stazionario ed ergodico di media nulla e 1, ,t tu

= … n

)

il processo delle

osservazioni, l’autocorrelazione parziale (empirica) di ordine è la stima OLS

del parametro

k

(( )ˆ ( )kk PACF kα = ( )k

kα nel modello lineare ausiliario

( ) ( )1 1

k kt t k t ku u u resα α− −= + + + id .

Osservazione: Dalla precedente procedura per la costruzione di ( )PACF k e dal teorema FWL, si

intuisce che (potrebbe essere definita come il limite in probabilità di ( )PACF k ( )ˆ kkα ) non è altro

che la correlazione tra e quando da entrambe è stata rimossa la parte spiegata dalle

variabili .

tu t ku −

1 1, ,t tu u− −… k+

top

5-7 Previsione nei processi ARMA

Il problema della previsione (costruzione di un modello, individuazione della struttura e sua

utilizzazione) in Econometria, come in ogni altro settore applicativo, ha ricevuto grande attenzione,

18


pero` bisogna dire che l’impegno profuso, che comunque ha prodotto risultati teorici importanti e

pertanto non e` stato inutile, non ha dato i frutti sperati; spesso, alla prova dei fatti, le previsioni si

rivelavano insoddisfacenti. La causa di questo (parziale) insuccesso e` dovuto alla difficolta` di

individuare buoni modelli (migliori di quelli utilizzati nell’analisi strutturale) per la complessita`

dei fenomeni economici.

In questo paragrafo, si introduce il problema della previsione per alcuni particolari modelli (i

processi ARMA) che, come gia` segnalato, sono utilizzati con successo in altri settori disciplinari.

Inizialmente si fa riferimento ad una fissata struttura del modello (e dunque si assume che i

parametri siano noti), nelle note conclusive si segnalano le estensioni ai modelli dei risultati

ottenuti.

In quanto segue tu e` un processo ( )MA ∞ invertibile e dunque

• ( )0

( )t i t ii

u tLθ ε θ ε∞

−=

= =∑ con 0 1θ = ;

• 2. . .(0, )t ti i d εε σ

∈Z∼ ;

• la funzione 0

( ) ii

iz zθ θ

∞

=

=∑ e` definita nella sfera aperta (0, )B r con ed e` priva di zeri in

;

1r >

(0,1)B′

• tu e` strettamente stazionario ed ergodico e si ha E( ) 0tu = e ( )2 2

0

var( )u ti

u ε2iσ σ θ

∞

=

= = ∑ ).

Rappresentazione del processo tu come processo ( )AR ∞ : Posto [ ] 1( ) ( )z zϕ θ −= allora si ha

• 0

( ) ii

i

z zϕ ϕ∞

=

=∑ in una sfera aperta contenente (0,1)B′ e priva di zeri in ; (0,1)B′

• 0 1ϕ = ;

• I coefficienti iϕ possono essere individuati per ricorrenza dalla sequenza di uguaglianze

ottenute dalla identita` ( ) ( ) 1z zϕ θ = , utilizzando il principio di identita` delle funzioni analitiche;

• Il processo tu e` soluzione dell’equazione ( )0

( ) ( ) ( )i t i t t ti

u L u L Lϕ ϕ ϕ θ ε∞

−=

ε= = =∑ .

Definizione: Sia e sia (per ogni ) 0h > t ( )( ) (t s su s t s tε= ≤ = ≤F F F ) la σ -algebra

generata dalle variabili aleatorie su s t≤ . Allora

• la variabile

ˆ E( )t h tt h tu u ++ = F dicesi previsione (fatta all’istante ) del processo t tu passi

in avanti;

h

19


•

ˆt ht h t t h te u u++ = − + dicesi errore della previsione (e per esso si ha

E( ) 0t h te + = );

• ( )

2ˆ( ) E( ) E ( )t ht h t t h t t h tMSE u e u u++ + +⎡= = −⎣

2ˆ ⎤⎦ , (la varianza della previsione) dicesi errore

quadratico medio (della previsione).

Costruzione della previsione, dell’errore e dell’errore quadratico medio della previsione

passi in avanti: Sia t fissato e . Dalle due rappresentazioni del processo -h 1h ≥ tu si ha:

1 1 1 1 1 11 11 1

1 0

(risp. ) (per 1)

(risp. ) (per 1)

t i t i t t t i t ii ih h

t h i t h i i t h i t h t h i t h i i t h ii i h i i h

u u u h

u u u u h

ϕ ε ε θ ε

ϕ ϕ ε θ ε θ ε

∞ ∞

+ + − + + + + −= =

− ∞ − ∞

+ + − + − + + + − + −= = = =

⎧ = − + = + =⎪⎪⎨

= − − + = + >

∑ ∑

∑ ∑ ∑ ∑⎪⎪⎩

donde, considerando l’aspettazione condizionata rispetto ad , ed essendo tF E( ) 0t s tε + =F per

, si ha 1s ≥

( )

11

11

11

ˆ E( )i t i

it tt t

i t ii

uu u

ϕ

θ ε

∞

+ −=

++ ∞

+ −=

⎧−⎪⎪= = ⎨⎪⎪⎩

∑

∑F ,

1 11 1ˆt tt t t te u u ε+ ++ += − = , ( )

2 21 1ˆ( ) E( )t t t tMSE u e εσ+ += = ;

e (per ) 1h >

( )

1

1

ˆˆ E( )

h

i i t h it h i ti i h

t h tt h t

i t h ii h

u uu u

ϕ ϕ

θ ε

− ∞

+ −+ −= =

++ ∞

+ −=

⎧− −⎪⎪= Ω = ⎨⎪⎪⎩

∑ ∑

∑,

1

0

ˆh

t h i t h it h t t h ti

e u u θ ε−

+ + −+ +=

= − =∑ ,

( )

12 2

0

ˆ( ) E( )h

it h t t h ti

MSE u e ε2σ θ

−

+ +=

= = ∑ .

Osservazione:

• Se per il processo tu e` disponibile il processo delle osservazioni 1, ,t tu

= … n, essendo

1( , , ) ( )n su u u s n≠ ≤ =F F… nF , si ha che 1E( ( , , ))n h nu u u+ F … (la previsione passi in

avanti fatte all’istante con le informazioni disponibili) non coincide (in generale) con

-h

n

ˆn h nu + e il

suo calcolo e` piu laborioso. Per grande, come approssimazione di n 1E( ( , , ))n h nu u u+ F … (che

per la legge della media iterata coincide con 1ˆE( ( , , ))nn h nu u u+ F … ), e` d’uso utilizzare n hu +

definito per ricorrenza dalla seguente

20


1 11

1 1

1

per 1

per 1

n

n i n iih n h

n h i n h i i n h ii i h

u u

u u u

ϕ

ϕ ϕ

+ + −=

− + −

+ + − + −= =

⎧ = − =⎪⎪⎨⎪ = − − >⎪⎩

∑

∑ ∑

h

h,

il cui errore quadratico medio si approssima nel modo seguente

2 2

0

ˆ( ) ( ) E( )h

n h in h n n h ni

MSE u MSE u e ε2σ θ+ + +

=

⎛ ⎞≈ = =⎜ ⎟⎝ ⎠

∑ .

Osservazione: e` stato ottenuto troncando opportunamente la rappresentazione di n hu + ˆn h nu + ; piu`

precisamente in

1

1

ˆ ˆh

in h n n h i ni i h

u uϕ ϕ− ∞

i n h iu + −+ + −= =

= − −∑ ∑ si e` posto ( )0 E( )s su u= = per . 0s ≤

Previsioni nei processi ( )AR p : Sia 1 1t t p t p tu u uα α ε− − 2. . .(0, )t i i dε+ + + , = εσ∼ un processo

( )AR p stazionario, osservato che

0i t i t

i

uϕ ε∞

−=

=∑ con 0 1ϕ = , i iϕ α= − per 1 i p≤ ≤ , 0iϕ = per , i p>

allora per , si ha n p>

• ( ) 1ˆ E( ) E( ( , , ))n h n n h nn h nu u u u+ ++ = =F F … u ;

• ( ) ( )1 1 111 1

ˆ E( )p

n n i n i i n i nn ni i

u u u u uϕ α∞

+ + − + −+= =

= = − = =∑ ∑F 1+ ;

• ( )

1 1

1 1

ˆ ˆE( )p ph h

n h n i i n h i i n h i i n h i n hn h n n h i ni i h i i h

u u u u u uα α α α− −

+ + − + − u++ + −= = = =

= = + = + =∑ ∑ ∑ ∑F h p>− + , (per

manca il secondo addendo);

• ( )

12

0

ˆ( ) ( )h

n h in h ni

MSE u MSE u ε2σ θ

−

+ +=

= = ∑ (che converge a 2uσ per ). h →∞

Osservazione:

• Nei processi per n , quando i parametri del processo sono noti, le previsioni AR p≥ n hu + sono

esatte.

• Per le previsioni nei processi MA oppure si deve fare necessariamente al risultato

generale al risultato generale, in ogni caso per un processo

ARMA

( )MA q si ha (per ) h q>

ˆ 0i t h in h ni h

u θ ε∞

+ −+=

=∑ = , donde 1 1ˆE( ( , , )) E( ( , , )) 0n h n nn h nu u u u u u+ += =F F… … e allora si pone

. 0n hu + =

• I risultati finora ottenuti sono validi con la sola ipotesi che il processo tε e` un rumore bianco

21


debole con qualche adattamento sulla interpretazione di

ˆ E( )t h tt h tu u ++ = F ; nel caso in esame

essendo 2. . .(0, )t i i d εε σ∼ si puo` provare che 1

2 2

0

(0, )h

n h n h ii

u u N εσ θ−

+ +=

− ≈ ∑ (per n ). →∞

• Finora si e` assunto che i parametri ( )i iθ o ( )i i

ϕ che definiscono il processo tu sono noti.

Nelle applicazioni econometriche, in presenza di un modello (i cui indici ARMA p e in genere

non superano 3), si utilizzano i dati a disposizione per stimare i parametri del modello e

successivamente si utilizza il modello stimato per fare le previsioni. Si tralascia di verificare la

validità` asintotica di questa procedura, in particolare che

q

12 2

0

ˆˆ(0, )h

n h n h ii

u u N εσ θ−

+ +=

− ≈ ∑ (per n ). →∞

• L’aver considerato processi a media nulla non e` per niente restrittivo; se i processi sono a

media non nulla e` sufficiente considerare i processi centrati nella media (empirica o teorica a

seconda che i parametri siano noti oppure siano stati stimati).

top

22

Capitolo 5 5-1 5-2 G L S 5-3 AR(1); Lo stimatore di Prais-Winsten...

Documents

Transcript of Capitolo 5 5-1 5-2 G L S 5-3 AR(1); Lo stimatore di Prais-Winsten...