Panel Data

download Panel Data

of 22

Transcript of Panel Data

Panel DataGiulioPalombaAgosto2008Idati informatopanel combinanoleinformazioni relativeallecaratteristichedi Nindividui nellostessoistante temporale con quelle rilevate per gli stessi individui inTdiversi periodi di tempo. Nei modelli di tipopanel i dati disponibili hanno perci`o entrambe le caratteristiche di Dati CrossSection: per un dato istante sono osservate le caratteristiche di pi` u individui, Dati TimeSeries: per un dato collettivo di individui sono rilevate le diverse caratteristiche in diversiistanti1.La seguente matrice mostra la disposizione dei dati in formato panel relativi ad una variabile Y ; ogni colonnasi riferisce ad un diverso individuo per cui la variabile `e stata rilevata, mentre per riga sono disposte le diverseosservazioni nel tempo. Ovviamente la variabileY`e composta diNTosservazioni.Y(NT)=__y11y21. . . yi1. . . yN1y12y22. . . yi2. . . yN2............y1ty2t. . . yit. . . yNt...............y1Ty2T. . . yiT. . . yNT__(1)Poichei dati crosssectionequelli timeserieshannociascunolepropriepeculiarit`a, essi portanoconsetutte le complicazioni soprattutto per quanto riguarda il venir meno di alcune ipotesi classiche del modello diregressione lineareY= X +. (2)Attraversola(2)`epossibileintrodurrelanotazione. Il vettore Y di dimensione(NT 1)`eottenutoapplicando loperatore vec alla matrice (1) e rappresenta la variabile dipendente, la matrice dei regressori Xhadimensione (NT k), mentre il vettorek-dimensionalecontiene i parametri incogniti da stimare. Il terminedi disturbo ha le stesse dimensioni della variabile dipendente.Inmolti testi spesso`eutilizzataunanotazionemenocompattarispettoallequazione(2): moltospessoimodelli per i dati panel vengono presentati nella formulazione che tiene conto della singola osservazione, quindilequazione del modello lineare di regressione diventayit = x

it +it, (3)dove tutte le variabili si riferiscono allosservazione relativa alli-esimo individuo nellistante t-esimo di tempo; inquesto contesto yit e it sono scalari, mentre la matrice dei regressori `e data da un vettore riga con k componenti.Avoltepu`ocapitaredi imbattersi inunanotazionecheaccorpatutteleosservazioni relativealli-esimoindividuo per il quale vengono rilevateTosservazioni. Lequazione che ne scaturisce `e perci`o la seguente:yi(T1)= xi(Tk)(k1)+ i(T1),1Talvoltaiterminicrosssectionetimeseriessonotradottirispettivamenteconcross-sezionalieseriestoriche.1Nelle pagine che seguiranno, salvo alcune eccezioni, sar`a utilizzata la notazione compatta introdotta nelle-quazione (2).La matrice delle varianze e delle covarianze del termine di errore del modello panel `e quadrata, simmetricaed ha dimensione (NT NT). Essa `e denita come = V ar() = E(

)Laconvenienzadellutilizzodei modelli di tipopanel risiedesoprattuttonel guadagnodi ecienzadellastima perche il maggior numero di osservazioni che si ha rispetto alla sola dimensione cross section o time seriesgenera uno stimatore con variannza pi` u piccola.1 ModelliperseriestorichepooledQuestasezioneconsisteinunarassegnadeiprincipalimodellidiregressionelineareperseriestorichepooledman mano che le ipotesi classiche si fanno sempre meno stringenti.Le serie storiche pooled consistono in una combinazione di pochi individui osservati attraverso un campione diTosservazioni ritenuto sucientemente ampio da consentire regressioni di tipo time series per ciascun individuo.Questotipodi modelli permettelottenimentodi stimepi` uecienti rispettoal casodellesingoleregressioniperche utilizza un set informativo maggiore dovuto alla presenza di pi` u individui.1.1 ModellolineareclassicoData lequazione (2), devono essere rispettate le ipotesi classiche1. E( | X) = 0,2. La matriceXha rango pieno pari ak,3. E(X

) = 0,4. = V ar() = E(

) = 2INT: questultima ipotesi (di omoschedasticit`a) implicitamente assume che(a) la varianza di ciascuna osservazione2it `e costante per i e t,(b) E(itis) per ognit = s, cio`e non c`e correlazione tra le osservazioni relative allo stesso individuo inistanti diversi,(c) E(itjt) per ognii = j, cio`e non c`e correlazione istantanea tra le osservazioni relative ad individuidiversi.Sotto queste condizioni lo stimatore OLS risulta essere non distorto, consistente, BLUE.1.2 Modelloconeteroschedasticit`apuraRispettoal modellolineareclassicodi cui sopravienerimossalipotesi perlaqualelavarianza`ecostantelungoladiagonaleprincipaledellamatrice. Inparticolare, si assumecheciascunindividuoallinternodelcampioneconservalipotesi di omoschedasticit`anel periododi tempoconsiderato, mapu`opresentareunavarianza dierente rispetto agli altri individui.Leteroschedasticit`apurasiconguraperci`ocomeunasituazioneincuilamatricerestadiagonale, macon varianze che variano ogniTosservazioni. Analiticamente si ha =__21IT0 . . . 0 . . . 00 22IT. . . 0 . . . 0............0 0 2iIT0............0 0 . . . 0 . . . 2NIT__. (4)2La presenza di eteroschedasticit`a pura `e condizione necessaria anche si utilizzi lo stimatore GLSGLS = (X

1X)1X

1Y (5)Ovviamente, data la forma diagonale di , lo stimatore GLS in pratica `e uno stimatore dei minimi quadratiponderati (stimatore WLS) in quanto pu`o essere ottenuto attraverso la regressione OLS di 1/2Ysu 1/2X,con 1/2matrice diagonale i cui elementi (pesi) sono dati da Nsequenze di lunghezza Tcon valori pari a 1/i.Poiche gli Nparametri 2inon sono noti, occorre una loro stima consistente. La soluzione a questo problemarisiede in due strade alternative e non equivalenti:si stima un modello OLS su tutte leNTosservazioni, si salvano i residui (vettore di dimensioneNT),si stimanoNregressioni del tipoyi(T1)= xi(Tk)i(k1)+ i(T1).In entrambi i casi, per ciascuno degliNindividui, si calcola la statistica i =

i iT k.Naturalmente, unavoltaottenutalastima, lostimatore(5) divienefeasible(FGLS) conleusualipropriet`a di non distorsione e consistenza. Inoltre, perT , esso risulta asintoticamente eciente.1.3 Modelloconeteroschedasticit`apuraecorrelazionetraindividuiRispetto allapproccio precedente viene rimossa lassunzione di incorrelazione contemporanea tra gli individui.In pratica si haE(itjt) = 2ijper ognii ej, quindi la matrice delle varianze e delle covarianze del termine di disturbo diventa = IT(6)dove(NN)=__2112. . . 1N1222. . . 2N............1N2N. . . NN__.La struttura della matrice di fatto consiste nellaccostamento diN2matrici diagonali quadrate di dimen-sioneT T, struttura coerente con il modello Seemingly Related Regression (SUR) dato da__y1y2...yN__=__X10 . . . 00 X2. . . 0............0 0 . . . XN____12...N__+__12...N__Y = ( Xi(Tk)IN) (Nk1)+,sottolipotesiche1=2=. . . =N(quindiintuttokparametridastimare). Datochelamatricenonrispetta lipotesi di omoschedasticit`a, anche in questo caso lo stimatore FGLS risulta essere il pi` u appropriatoe le covarianze stimate ijpossono essere ottenut attraverso i due metodi introdotto nel precedente paragrafo.Una volta ottenuta, quindi = IT, lo stimatore FGLS diventaFGLS = (X

1X)1X

1Y (7)conX= (Xi IN). Lo stimatore FGLS `e non distorto, consistente ed asintoticamente eciente perT ,datoN.31.4 Modelloconeteroschedasticit`aecorrelazionipureInquestocasosonolecorrelazioniadesserepureenonleteroschedasticit`a: ci`osignicachelamatricedellevarianze e delle covarianze per ciascun individuo tiene conto del fatto che c`e autocorrelazione tra le osservazioni,mentre tra diversi individui tale autocorrelazione `e inesistente.eteroschedasticit`a pura: E(itjt) = 2ij(nello stesso istante c`e correlazione tra diversi individui),correlazioni pure: E(itis) = i,ts(per lo stesso individuo c`e correlazioni per le osservazioni in diversiistanti).Considerando il vettore (T 1)i, si ha perci`o cheE(i

i) = 2i i(8)coni(TT)=__1 i2i. . . T1ii1 i. . . T2i2ii1 . . . T3i...............T1iT2iT3i. . . 1__.Gli elementi extradiagonali dellamatrice isonoottenuti ricorsivamente mediante unmodelloAR(1)calcolato sugli errori relativi alli-esimo individuo (i), cio`ei,t = ii,t1 +ui,tconi =1, 2, . . . , Ne t =2, 3, . . . , T. Per il calcolodi tuttelealtreautocorrelazioni si procedemediantesostituzioni ricorsive2. Dal puntodi vistaanaliticolamatricediagonaledi cui alla(4)diventadiagonaleablocchi in quanto le matrici identit`aIT(diagonali) vengono rimpiazzate con le matrici i(piene), quindi si ha =__2110 . . . 0 . . . 00 222. . . 0 . . . 0............0 0 2i i0............0 0 . . . 0 . . . 2NN__. (9)Il modello pertanto va stimato in due stadi: nel primo si eettua una regressione OLS di Ysu X per ottenerei residui . A questo punto, per ciascun individuo, si eettua un ulteriore OLS i,t = i i,t1 +ui,t per ottenerela stima consistente del parametro i.Il secondostepconsisteinunastimaWLSanalogaalla(5)nellaqualelamatricedei pesi `enotacomeTrasformazionedi PraiseWinsten denita come seguezi,t = izi,t12Inparticolare,perlautocorrelazionediordine2risultai,t= ii,t1 +ui,t= i(ii,t2 +ui,t1) +ui,t= 2ii,t2 +iui,t1 +ui,t.Generalizzando,perlautocorrelazionediordinessihai,t= sii,ts +s1Xr=0riui,tr.Ovviamenteilcoecientesi`equellochevaimmessoallinternodellamatricei.4dovezi,t=yi,t, xi,t. Inoltre,perevitarelaperditadellaprimaosservazione,simoltiplicazi,1perlaquantit`a1 i.Anche in questo caso lo stimatore ottenuto ha le usuali propriet`a della non distorsione, della consistenza edellecienza asintotica perT .1.5 Modello con eteroschedasticit`a e correlazioni pura e con correlazione traindividuiQuesto modello `e il pi` u generale di tutti quelli proposti nora in quantoc`e eteroschedasticit`a dei termini di errore tra gli individui,c`e correlazione istantanea tra i diversi individui,c`e autocorrelazione tra le osservazioni relative ad ogni individuo.La logica conseguenza di queste assunzioni `e che la matrice sia piena, quindi assuma la forma =__21111212. . . 1i1i. . . 1N1N21212222. . . 2i2i. . . 2N2N............i1i1i2i22i iiiNiN............N1N1N2N2. . . NiNi. . . 2i ii__. (10)in questo caso il metodo di stima adottato sostanzialmente ricalca quello presentato nel precedente paragrafo.2 ModelliperdatilongitudinaliQuandosi parladi dati longitudinali si intendeunastrutturacomequellaillustratadallamatrice(1)nellaquale generalmente la numerosit`a degli individui `e elevata, mentre quella relativa alla dimensione temporale `epiuttosto contenuta.Si tengapresenteche, qualoraleipotesi circalamatricedellevarianzeedellecovarianzeelacostante(qualora ci fosse) rispettino quelle proprie dei modelli di serie storiche pooled, questi divengono automaticamenteutilizzabili in questo contesto semplicemente scambiando gli indici relativi agli individui e al tempo.2.1 ModelloadeettissiConsiderando li-esimo individuo, il modello ad eetti ssi si congura come segueyi = i +xi +i, (11)doveyieihannodimensione(T 1), xihadimensione(T k)e`eilvettorecontenentekparametridastimare. La peculiarit`a della (11) riguarda la costante che si congura come un vettore diTelementi costantipari adi: questa caratteristica indica innanzi tutto che per ciascun individuo occorre stimare un solo valoredella costante e che, sei = jper ognii = j, tale costante misura leffettoindividuale, cio`e quellinsiemedi caratteristiche speciche proprie di ciascun individuo che per`o restano immutate nel tempo. In pratica, nelmodelloci sonointuttok + Nparametri dastimare, kcontenuti nel vettoreedNcostanti peri diversiindividui. Questecostanti rappresentanoleterogeneit`apresentetragli individui nel sistema, caratteristicapeculiare dei panel data.5Generalizzando la (11) riscrivendola in forma matriciale si ottiene:__y1y2...yN1yN__=__T0 . . . 0 X10 T. . . 0 X2...............0 0 . . . 0 XN10 0 . . . TXN____12...N__+__12...N1N__, (12)doveT`e un vettore contenenteTelementi pari a 1. In forma compatta si ha perci`oY= [ (IN T) X]__+ (13)oppureY(NT1)= (IN T)(NTN)(N1)+ X(NTk)(k1)+ (NT1)(14)Poiche i valori del vettore non sono osservabili essi entrerebbero a pieno titolo allinterno dellerrore delmodello ma, se cos` fosse, essi potrebbero essere correlati con le variabili esplicativeXie la stima risulterebbedistorta.Le formulazione (14) permette di stimare il modello attraverso lOLS in quanto tutte le ipotesi classiche sonorispettate. Il modello prende il nome dimodelloavariabili dummy poiche occorre costruireN(nuerosit`adegli eetti individuali) variabili dummy da inserire allinterno della matrice dei regressori. Lo stimatore che siottiene `e non distorto, consistente e BLUE. La sua forma analitica `e ottenibile come_ _ =_(IN T)

(IN T) (IN T)

XX

(IN T) X

X_1_(IN T)

YX

Y_Dato che per le propriet`a del prodotto di Kronecker vale (IN T)

(IN T) = IN

TT= TIN, risulta_ _ =_TIN(IN T)

XX

(IN T) X

X_1_(IN T)

YX

Y_.Per invertire la matrice contenuta allinterno dellespressione dello stimatore OLS si ricorre ad un noto risultatosulle matrici partizionate e, dopo alcuni calcoli3si arriva a_ _ =__1T (IN T)

(Y X)(X

MX)1X

MY__, (15)doveM= INT P`e la matrice di proiezione che, applicata ad una variabile, per ogni individuo restituisce loscostamento dalla media aritmetica temporale. Tale matrice, per denizione, risulta essere quadrata (NT NT),diagonale a blocchi, simmetrica ed idempotente4.3InparticolarecisiriferisceallaseguenteinversioneA11A12A21A221=A111+A111A12S2A21A111A111A12S2S2A21A111S2,doveS2=(A22 A21A111A12)1. LAppendiceA-2contienetuttaladerivazioneanaliticadellostimatoredel modelloadeettissi.4Denizioneepropriet`adellematriciPeMsonodiscussenellAppendiceA-1.62.2 StimatorewithinPrendendo in considerazione lo stimatoredeterminato nellequazione (15) e tenendo presente la propriet`a diidempotenza della matriceMsi ha = (X

MX)1X

MY= (XX)1X Y . (16)Tale stimatore `e perci`o ottenibile anche attraverso la regressione OLS diY=MYsuX=MX; in pratica sitratta di applicare il modello lineare classico dove sia la variabile dipendente, sia la matrice dei regressori sonoespressa in deviazione dalle corrispondenti medie individuali calcolate rispetto al tempo5.Lo stimatoreprende perci`o il nome diStimatoreWithin in quanto tiene conto degli eetti individualigrazie alla trasformazione eettuata attraverso la matrice M, ma li elimina6dal modello utilizzando per ciascunindividuo linformazione derivante dalle variazioni temporali (variazioni nei gruppi).Lo stimatore within e lo stimatore a variabili dummy producono sempre gli stessi valori numerici.Una volta ottenuto lo stimatore within, gli eetti individuali esclusi dal suo computo possono essere sfruttatiattraverso lequazione (14), infatti(IN T) = Y X1T (IN T)

(IN T) =1T (IN T)

(Y X)1T (IN

T)(IN T) =1T (IN T)

(Y X)1T (IN T) =1T (IN T)

(Y X) =1T (IN T)

(Y X). (17)Lequazione (17) mostra che, per ogni singolo individuo, la costante `e pari alla dierenza tra la media individualedella variabile dipendente e le medie individuali dei regressori ponderate per lo stimatore within. Dal punto divista dellindividuo, analiticamente si ha i = yi xi (18)Le costanti i con i = 1, 2, . . . , Ncatturano leetto di quelle variabili che variano tra individuo e individuo,ma restano immutate nel tempo; lo stimatore within perci`o tiene conto solo delleterogeneit`a tra gli individui.Il limite pi` u evidente di questo approccio consiste nellimpossibilit`a di includere nel modello regressori cheassumanounvalorecostanteallinternodelleosservazioni relativeal singoloindividuo: dal puntodi vistastatistico, questa impossibilit`a deriva dal fatto che una variabile esplicativa con questa caratteristica risulterebbecollineare con (INT) nellequazione (14), mentre dal punto di vista algebrico calcolare lo scostamento di questevariabili dal loro valore medio individuale (attraverso la matriceM) produrrebbe colonne di zeri nella matricedei regressori che quindi non avrebbe rango pieno. In questo caso il metodo OLS non sarebbe perci`o applicabile.Perlavericadi ipotesi relativaallassenzadi eterogeneit`atragli individui il testtdi azzeramentodellecostanti inon`edi alcunautilit`apratica.`EinvecepossibilecostruireuntestFnel qualelipotesi nulla`eH0 : 1 = 2 = . . . = N(N 1 vincoli in tutto); la statistica test `e

NT N K 1N 1 FN1,NTNK1, (19)dove e sono i residui rispettivamente del modello vincolato e di quello libero, mentre lo stimatore corretto econsistente per la varianza `e 2=

NT N K 1.5Sitengapresenteche,perlipotesiclassicaE() = 0,quindirisultaM = 6 `EovviocheilprodottoM(INT) = 0quindilecostantidelmodellosonorimosseattraversoilcalcolodellostimatorewithin.7Allalucedi questorisultatosi hainoltreV ar()= 2(X

MX)1. Si noti inneche, sottoH0, di fattolostimatore within coincide con lo stimatore pooled.Lo stimatore within `eBLUE,consistente perNT ,asintoticamente normale poicheNT( )dN_0, 2Q1_,doveQ = limNT_1NT X

MX_1.2.3 ModelloadeetticasualiIlmodelloadeetticasualitrattaglieettiindividualicomepartedelterminedierrore, quindiliconsideracomecomponenti stocastichesicuramenteincorrelateconi regressori: inquestomodo`epossibileincludereallinternodellamatriceXvariabilichecambianotrasoggettoesoggetto, purrimenendocostantiallinternodelle Tosservazioni relative al singolo individuo. Con il modello ad eetti ssi questa opportunit`a era preclusa.Considerando li-esimo individuo, la forma analitica del modello ad eetti casuali `eyi= i +xi +iyi= +x

i +i +i(20)dove il vettore (T 1) relativo alla costantei = + i `e dato dalla somma di una componente indipendentedai e dat e da unaltra che varia da individuo ad individuo. Ovviamente, datoi,i `e un vettore di costanti.Anche si ottengano stime consistenti con questapproccio, la condizione necessaria `e lincorrelazione traiela matrice dei regressorixiper ognii.Rispettoalmodelloadeettissiilterminedierroreihaesattamentetuttelestessepropriet`a, mentreoccorre introdurre alcune ipotesi aggiuntive riguardo alla componentei.1. E(i) = 0,2. V ar(i) = 2per ognii = 1, 2, . . . , N,3. E(i, j) = 0 per ognii = j(incorrelazione tra gli eetti individuali),4. E(i, j,t) = 0 per ognii, j, t (incorrelazione tra eetti individuali e disturbi).Riscrivendo il modello in forma compatta si haY(NT1)= (NT1)+ X(NTk)(k1)+ ( T)(NT1)+ (NT1)(21)dove di dimensione N `e il vettore contenente gli eetti individuali. Denendo inoltre il vettore U= (T)+si nota immediatamente che lerrore del modello ad eetti casuali `e composto di una componente che varia tragli individui, ma resta costante nel tempo, ed unaltra che varia stocasticamente tra gli individui e nel tempo.Dateleipotesi aggiuntivedi cui sopra, lamatricedellevarianzeedellecovarianzedi Uricopreunruolodeterminante. Essa `e denita come = V ar(U)= E(UU

)= E{[( T) +][( T) +]

}= E[( T)( T)

+

]= E(

T

T +

)= E(

T

T) +E(

).8Dato cheE(

) = 2IN, la matriceE(

T

T) assume una struttura diagonale a blocchi quindi, tenendopresente anche cheE(

) = 2INT, si ottiene = 2(IN T

T) +2INT= IN (2T

T +2IT). (22)La matrice `e anchessa diaginale a blocchi e ciascun blocco `e dato dai(TT)=__2 +22. . . 222 +2. . . 2............22. . . 2 +2__.La matrice i mostra che lerrore composto (U) ha autocorrelazione non nulla e costante nel tempo e soprattuttoche la struttura di autocorrelazione non varia da individuo ad individuo (la matrice `e priva degli indicii et).Poiche tale matrice delle varianze e delle covarianze `e diagonale a blocchi, il modello ad eetti casuali deveessere stimato attraverso il metodo GLS, quindi si hab = (X

1X)1X

1Y (23)dove b = [ ]

ha dimensione (k + 1).La matrice inversa 1`e data da1= (IN i)1= IN 1i= IN (2T

T +2IT)1.Aggiungendo e togliendoP2si ottiene1= IN [(T2 +2)P +2(IT P)]1= IN [(T2 +2)P +2M]1= [(T2 +2)P +2M]1.Ponendo2= (T2 +2), per le propriet`a delle matriciPeMsi ha71=12P +12M (24)e quindi1/2=1P +1M. (25)DaquestadenizioneemergechelostimatoreGLSperilmodelloadeetticasualicoincideconlostimatoreOLS della regressione diY= 1/2YsuX = 1/2X. Le propriet`a di questo stimatore sono1. se2e2sono noti, lo stimatore GLS `e consistente perN eT ,2. perTdato, lo stimatore GLS `e pi` u eciente dello stimatore within;perN tale ecienza tende asvanire,3. se 1 M lo stimatore GLS coincide con lo stimatore within, quindi il modello ad eetti casuali coincidecon quello ad eetti ssi: ci`o pu`o accadere se lunica fonte di variabilit`a deriva dagli eetti individualii.Analiticamente deve perci`o risultare che 2= 0 (vettore costante per ognii et),7SivedalAppendiceA-1.9 T (per denizione 2= 0): in questo caso gli eetti individuali diventano osservabili8,,4. se 1 INTil modello ad eetti casuali diventa un modello OLS standard e coincide con un modello diserie storiche pooled; in questo caso naturalmente2 = 0 quindi non ci sono eetti individuali e tutta lavariabilit`a dipende dal termine di disturbo.2.4 StimatorebetweenConsiderando il modello ad eetti casuali di cui alla (21), la trasformazione Between consiste nellesprimere levariabili attraverso le medie temporali di ciascun individuo; in pratica algebricamente si tratta di premoltiplicarelintera equazione per la matriceP,PY = P +PX +P[( T) +]= PXb +Pu.Lo stimatore che si allpica `e perci`o un GLS che si congura come un modello OLS della regressione diY= PYsuX = PX, infattib = (X

P1X)1X

P1Y= (X

X)1X

Y (26)dove b = [ ]

ha dimensione (k +1). Lo stimatore di cui alla (26) risulta essere non distorto e consistenteperN .Analogamente allo stimatore within, lo stimatore between determina una perdita di informazione poiche sibasasulcalcolodellemedietemporalidiciascunindividuo. Perdenizione,taletrasformazioneproduceunaperdita di ecienza.Mentre lo stimatore within sfrutta la variazione che avviene allinterno delle osservazioni relative a ciascunindividuo (deviazioni dalle medie o variazioni nei gruppi), lo stimatore between sfrutta quelle derivanti dallavariabilit`a delle osservazioni tra diversi individui (variazioni tra i gruppi), in quanto opera una regressione diNmedie su un set di regressori nel quale sono state calcolate leNmedie corrispondenti.2.5 StimatoreGLS,withinebetweenI tre stimatori visti nora possono essere messi in relazione in quanto lo stimatore GLS `e una media ponderatadegli stimatori withinebetween; considerandoi parametri a1 [0, 1] ea2=1 a1eleduetrasformazioniwithin e between si ha(a1P +a2M)Y= (a1P +a2M)X +a1Pbet +a2Mwit.Lo stimatore GLS che ne risulta `eGLS= [X

(a1P +a2M)

(a1P +a2M)X]1X

(a1P +a2M)

(a1P +a2M)Y= [X

(a21P +a22M)X]1X

(a21P +a22M)Y. (27)`E perci`o possibile esprimere lo stimatore GLS semplicemente imponendo 1= (a1P+ a2M). Poiche dalle-quazione (25) risultaa1 = 1/ ea2 = 1/, dove = (T2 +2)1/2, si hanno i seguenti scenari:se2= 0 a2 (peso innito assegnato allo stimatore within),seT a1=0(lostimatoreGLScoincideconlostimatorewithin, gli eetti individuali sonoosservabili),se2 = 0 = ,a1 = a2(lo stimatore GLS in realt`a `e uno stimatore OLS, omoschedasticit`a).8Considerandoil modelloperlasingolaosservazioneyit x

it=i+ it, seT signicacheil valoreattesodellacomponenteit`edavveronulloquindilespressioneasinistradelsegnodiuguaglianzarappresentalasingolaosservazioneperi.InquestocasolostimatoreGLS`econsistente.102.6 StimatoreFGLSQuando2e2sono osservabili in pratica lo stimatore GLS pu`o essere applicato senza alcun problema; nellapratica questa situazione capita raramente.Per ovviare a questo inconveniente si ricorre allo stimatore Feasible GLS (FGLS). Innanzi tutto si ricorreai residui dello stimatore within witper ottenere lo stimatore 2=

witM witNT N k, (28)dove la correzione per i gradi di libert`a `e data dal numero dei parametri da stimare che ammonta aN +k.9Successivamentesiricorrealmodelloadeetticasualiesiconsiderailmodellorelativoalli-esimamediaindividuale rispetto al tempoyi xi = i +i; la varianza rispetto allo scalareui = i +i `e data daV ar(ui) = V ar(i +i)= V ar(i) +V ar_1TT

t=1it_= 2 +2T= 2R.Considerando perci`o li-esimo individuo, uno stimatore corretto e consistente per2R `e 2R = u

i uiN k, (29)dove ui sono i residui del modello e k indica il numero dei regressori escludendo la costante. Data la denizioneanalitica di2R `e immediato stimare indirettamente la varianza degli eetti individuali attraverso lequazione 2 = 2R 2T(30)Attraversoquestarelazione`equindi possibilestimareil modellocol metodoGLS(chedivienefeasible).Lunico inconveniente di questo metodo `e determinato dal fatto che, in campioni niti, pu`o accadere che la (30)restituisca un valore negativo.2.7 TeststatisticiPer decidere se `e preferibile la stima di un modello ad eetti ssi o uno ad eetti casuali `e possibile utilizzarealcune procedure di test. I pi` u famosi sono il test di Breusch e Pagan (1980) e quello di Hausman (1978).2.7.1 TestdiBreuschePaganIl test di Breusche Pagan(test BP) `e unodei test diagnostici pi` upopolari per valutare lapresenzadieteroschedasticit`aallinternodel modellolinearedi regressioneY =X + con N(0, 2). Lipotesinulla del test `e lassenza di eteroschedasticit`a quindi, poiche vale lassunzioneV ar() = 2f(Z) = 2f(0 +1Z1 +. . . +qZq),essa si struttura comeH0 : 1 = 2 = . . . = q = 0 (q vincoli), (31)9SesiconsiderasseloscenariorelativoaciascunindividuosiavrebberoN(T k 1)g.d.l. intutto,quindiunastimaineccessodelloronumero.11dove Z `e una matrice dove ciascuna delle (q +1) colonne costituisce una variabile esplicativa per la varianza deltermine di errore. La statistica test, nella sua forma generale, si congura come un test LM e risulta essereLMBP=12 02( 2 0)

Z(Z

Z)1Z

( 2 0), (32)dove 0=

n`e lo stimatore OLS non corretto della varianza,mentren `e il numero totale delle osservazioni.In pratica, la statistica test (32) `e esprimibile come10LMBP= nR2dovelindiceR2`equellorelativoallaregressionedi( 2/ 0 1)suZ. Ladistribuzionelimitedellastatisticatest BP `eLMBP 2q. Per il calcolo di questa statistica occorre procedere come segue:stima OLS del modelloY= X +,calcolo dello stimatore 0,stima della regressione ausiliaria,calcolo dellindiceR2.Nellambitodei modelli panel data`epossibilericorrereal testBPpersottoporreavericadi ipotesi lasignicativit`a degli eetti individuali. Lipotesi nulla impone il solo vincoloH0 : 2 = 0, (33)che garantisce omoschedasticit`a, quindi la matrice diagonale. Il test BP necessita solo dei residui del modellovincolato che in questo contesto `e dato dal modello ad eetti ssi, quindi la statistica test assume la formaLMBP=NT2(T 1)_

wit(IN T)(IN T)

wit

wit wit

wit wit_2(34)=NT2(T 1)_

wit(IN T

T) wit

wit wit1_2, (35)dove wit`e il residuo del modello stimato attraverso lo stimatore within. Poiche in questo caso lipotesi nullaimpone solo un vincolo, la distribuzione limite della statistica test `e data da una21.2.7.2 TestdiHausmanUnaltraproceduraditestperlasceltadelmodellopaneldaadottare `edatadaltestdiHausman(1978); lostimatore withi `e costoso in termini di variabili da inserire nel modello e ci`o genera una perdita di g.d.l., mentrelostimatoreadeetticasualideveaverelaprerogativacheglieettiindividualidevonoessereincorrelaticoiregressori altrimenti lo stimatore stesso `e inconsistente.Ponendou = T +, il test di Hausman si occupa perci`o di testare lipotesi nulla_H0 : E(X

u) = 0H1 : E(X

u) = 0.Considerando gli stimatori within (OLS) e GLS si hanno i seguenti scenari:H0H1consistente consistenteOLSinecienteconsistente inconsistenteGLSeciente10SivedalAppendiceA-3perladimostrazione.12Naturalmente il test `e basato sulla dierenza q =OLSGLS:se questa risulta essere statisticamente irrilevante`e preferibile lutilizzo degli eetti casuali, mentre se q `e diversa da zero lo stimatore within `e preferibile11.La statistica test `e data daH = q

[V ar( q)]1 q (36)doveV ar( q) = V ar(OLS) +V ar(GLS) + 2Cov(OLS, GLS).SottoH0si pu`o dimostrare che la covarianza tra i due stimatori OLS e GLS `e nulla, infatti basta considerarelo stimatoredenito dalla seguente combinazioe lineare =GLS +OLS,dove `e uno scalare diverso da zero; calcolando la sua varianza si ottieneV ar() = V ar(GLS) +2V ar(GLS) + 2Cov(OLS, GLS)V ar() V ar(GLS) = 2V ar(GLS) + 2Cov(OLS, GLS).PoicheV ar() V ar(GLS) 0perdenizione, occorrenecessariamentecheanchelequazionedi secondogrado spuria al secondo membro sia maggiore o uguale a zero, cio`e[V ar(GLS) + 2Cov(OLS, GLS)] 0.Lesoluzioni perquestadisequazionesono 0e 2Cov(OLS, GLS)V ar(OLS). Ovviamente, lacondizionedipositivit`aV ar() V ar(GLS) `e garantita per ogni se e solo se i due stimatori OLS e GLS sono incorrelati.Alla luce di questo risultato si ha semplicemente che q = V ar(OLS) +V ar(GLS). La distribuzione del testdi Hausman `eH 2kdovek `e il numero delle colonne diX(numero di regressori).3 PaneldinamiciUnosvilupponaturaleerecentedellaletteraturasuimodelliditipopanel `equellarelativaaipaneldinamicicaratterizzati dallapresenzadellavariabiledipendenteritardataallinternodellamatricedei regressori. Inquesto modo `e possibile modellare, quindi distinguere tra due diversi tipi di correlazione:1. vera: autocorrelazione della variabile dipendente,2. spuria: correlazione dovuta ad eterogeneit`a non osservata.Prendendo come riferimanto la singola osservazione e limitando per semplicit`a la trattazione ai modelli conun solo ritardo, lequazione generale per un panel dinamico `eyit = X

it +yit1 +uit, (37)doveuit = i +ite `e il parametro relativo alla componente autoregressiva del modello.Il problema principale di questo tipo di modelli `e dato dal fatto che il termine di errore uit non `e incorrelatoconyit1e ci`o genera stime OLS e GLS inconsistenti. In particolareE(uityit1) = E[uit(X

it1 +yit2 +uit1)]= E[(i +it)(X

it1 +yit2 +i +it1)]= E(2i)= 2 = 0,11 `EpertantopossibiledimostrarechelostimatoreGLSconeetti casuali correlati coi regressori si identicanellostimatorewithin.13quindi i valori nel tempo della variabile dipendente dipendono da i e non possono essere incorrlati col terminedi errore. Gli stimatori applicabili nellapproccio statico sono perci`o inconsistenti12.Applicandolatrasformazionewithinallequazione(37)implicalipotesidiunatrattazionedeglieettiin-dividuali comessi, matalestrategiaconduceugualmenteadunostimatoreinconsistente; anchesesi halaseguente equazione che rimuove gli eetti ssiyit yi = (Xit xi)

+(yit1 yi) + (it i),tuttavia risultaE[(yit1 yi)(it i)] = E[yit1ityit1 i yiit + yi i]= E[ yiit]= E__1TT

t=1yit_it_= E_1T (yi1 +yi2 +. . . +yit. . . +yiT)it_= E_1T yitit_= 1T E[2it]= 1T 2 = 0.Lo stimatore within `e perci`o anchesso inconsistente perTnito, mentre diviene consistente perT .3.1 StimatorediAnderson-HsiaoRiscrivendo lequazione (37) in termini di dierenze prime si ottieneyit = X

it +yit1 + it, (38)quindi gli eetti individuali vengono eliminati in quanto uit = itit1; in particolare si ha it MA(1),dove il coeciente associato alla componente ritardata `e ovviamente pari a 1.Anche in questo caso per`o il problema della correlazione tra variabile dipendente ed errore ha il suo peso,infattiE(yit1it) = E[(yit1yit2)(itit1)]= E[yit1ityit2ityit1it1 +yit2it1]= E[yit1it1] = 0,inquantoyit1dipendedait1. Taleproblemapu`oesseresuperatoricorrendoallostimatoreavariabilistrumentali (IV o 2SLS) utilizzandoyit2come strumento per il quale valeE(yit2it) = 0.Naturalmente la scelta dei ritardi della variabile dipendente da utilizzare come strumenti nella stima dipendestrettamentedallapresenzadiautocorrelazioneneglierrori. Tecnicamente,`eperci`opossibilespingersimoltoindietro nel tempo per trovare uno strumento incorrelato coi regressori,ma ci`o presenta il costo della perditadi osservazioni.12Sostituendoricorsivamentenella(37)siottieneyit= tyi0 +0@t1Xj=0jX

itj1A+t1Xj=0juitj.La variabile dipendente `e funzione dallerrore presente e passato, quindi `e correlata con esso. Per la denizione di uitemerge inoltrecheessadipendedaglieettiindividualii. Sesiconsideranoiritardiditalevariabileildiscorsononcambia.143.2 StimatorediArellano-BondLostimatoredi Arellano-Bond(1991)`eunostimatoreavariabili strumentali cherappresentalostrumentoprincipe nella stima dei modelli di tipo panel dinamico.3.2.1 ModelloautoregressivopuroPer semplicit`a, per la spiegazione del modello di Arellano-Bond si ricorre inizialmente al modello autoregressivopuro nel quale i regressori esogeni sono omessi ( = 0); si ha perci`o lequazioneyit = yit1 +i +it. (39)Le ipotesi alla base di questo metodo di stima sono: T`e sso, N , it i.i.d.(0, 2).Si considera pertanto il modello in dierenze primeyit= yit1 + it= (yit1yit2) +itit1(40)dove ovviamente it MA(1), i = 1, 2, . . . , Net = 3, 4, . . . , T. Lequazione (40) equivale ad un sistema diequazioni simultanee con (T 2) equazioni conNosservazioni ciascuna del tipo___yi3 = yi2 + i3strumenti: yi1yi4 = yi3 + i4strumenti: yi1, yi2...yiT= yiT1 + iTstrumenti: yi1, yi2, . . . , yiT2,(41)dove gli strumenti sono selezionati in base alla loro propriet`a di essere incorrelati coi termini di errore. In questomodo `e possibile ottenere una stima consistente del modello dinamico.A queso punto `e importante costruire la matrice delle varianze e delle covarianze di itche risulta esserecomposta da V ar(it) = V ar(itit1) = 22, Cov(itit1) = E(itit12it1itit2 +it1it2) = 2 Cov(ititk) = E(ititkit1itkititk1 +it1itk1) = 0 perk > 1.Utlizzandolaformamatriciale, per lindividuoi-esimosi haperci`ounamatricequadrataesimmetricadidimensione (T 2) (T 2) cos` compostaVi = E(i

i) = 2__2 1 0 0 . . . 0 0 0 01 2 1 0 . . . 0 0 0 00 1 2 1 . . . 0 0 0 00 0 1 2 . . . 0 0 0 0...........................0 0 0 0 . . . 2 1 0 00 0 0 0 . . . 1 2 1 00 0 0 0 . . . 0 1 2 10 0 0 0 . . . 0 0 1 2__. (42)15Naturalmente, considerando il modello nella forma generale la matrice delle varianze e delle covarianze13`e datadaV= IN Vi. (43)Allo stesso modo si denisce la matrice (T 2) Cdegli strumenti, doveC =T2

j=1jZi =__yi10 0 0 0 0 . . . 0 0 . . . 00 yi1yi20 0 0 . . . 0 0 . . . 00 0 0 yi1yi2yi3. . . 0 0 . . . 0.................................0 0 0 0 0 0 . . . yi1yi2. . . yiT2__, (44)dove ogni riga contiene gli strumenti validi per ciascun istante nel tempot = 3, 4, . . . , T. Considerando tutte leosservazioni del modello, tale matrice `e denita comeZ = N Zi(45)edhadimensioneN(T 2) C. Naturalmente, segli strumenti sonovalidi, deverisultareE(Z

) =0.Riscrivendo la (40) nella forma compatta si haYtN(T2)1= Yt1N(T2)1+ tN(T2)1, (46)dove `e un parametro scalare. Il modello (46) `e caratterizzato dalla presenza di correlazione tra lerrore ed iregressori, nonche dalla presenza di eteroschedasticit`a; Arellano e Bond (1991) risolvono il primo inconvenientestrumentando lequazione come segueZ

YtC1= Z

Yt1C1+Z

tC1. (47)Perquantoriguardaleteroschedasticit`a,lamatricedellevarianzeedellecovarianzedipendestrettamentedalla presenza diNindividui e risulta essere = V ar(Z

)= E(Z

Z)= 2Z

V Z= 2Z

(IN Vi)Z. (48)Lo stimatore di Arellano-Bond `e perci`o uno stimatore GLS del tipo = (Y

t1Z1Z

Yt1)1Y

t1Z1Z

Yt= {Y

t1Z[Z

(IN Vi)Z]1Z

Yt1}1Y

t1Z[Z

(IN Vi)Z]1Z

Yt. (49)Tale stimatore`e notocol nome Stimatore di Arellano-BondOne step consistent. LostimatoreTwostep consistentinvece`e ottenibile sostituendolamatrice dei momenti secondi dellapopolazioneVi=E(

)conquelladei corrispondenti momenti secondi campionari datadaWi=E(

), dovevarepsilon `e ottenuto come residuo del modello (40) stimato attraverso lo stimatore (49). I due stimatori sonoasintoticamente equivalenti perN .13TalematricehadimensioneN(T 2) N(T 2).163.2.2 RegressoriesogeniInserendo nella trattazione anche i regressori esogeni lequazione (39) si modica nella seguente espressioneyit = yit1 +X

it +i +it, (50)doveX

ithaK 1colonne; inquestomodoilnumerototaledeiparametridastimaresiapariaK(tuttelecomponenti dipi` u lo scalare).Anche in questo contesto si esprime il modello utilizzando le dierenze prime in modo da determinare qualisiano gli strumenti validi. Analiticamente si ottiene perci`oyit = yit1 + X

it + it, (51)dove gli eetti ssi sono rimossi. A questo punto occorre distinguere due casi:1. Regressoripredeterminati E(X

itis) = 0soloquandot>s. Lamatricedeglistrumenti `eanalogaalla(44) con laggiunta di altri strumenti ottenibili dalla matrice dei regressori esogeni, infattiZi =__yi1Xi1Xi20 0 0 0 0 . . . 0 0 . . . 0 0 0 . . . 00 0 0 yi1yi2Xi1Xi2Xi3. . . 0 0 . . . 0 0 0 . . . 0...................................................0 0 0 0 0 0 0 0 . . . yi1yi2. . . yiT2Xi1Xi2. . . XT1__. (52)2. Regressori esogeni in senso stretto E(X

itis) = 0 per ogni t, s = 1, 2, . . . , T 2. In questo caso le variabiliXi1, Xi2, . . . , XiT1sono sempre tutti strumenti validi e vanno inseriti nelle righe della matriceZi.Una volta determinate le matrici degli strumenti validi la procedura illustrata nella sezione 3.2.1 resta validaanche in questambito.AppendiceA-1 Propriet`adellematriciPeMMatricePLa matrice di proiezioneP`e denita comeP= (IN P) conP = T(

TT)1

T. Essa risulta esserequadrata: dato cheP = T(

TT)1

T`e quadrata di dimensione (T T)P =1T__1 1 . . . 11 1 . . . 1............1 1 . . . 1__,il prodottoP= (IN P) `e esso stesso una matrice quadrata di dimensione (NT NT).diagonaleablocchi: in tutto ci sonoNblocchi composti dalla matricePP=__P0 . . . 00 P. . . 0............0 0 . . . P__.simmetrica: poiche tutti i blocchi sono simmetrici, naturalmente risulta ancheP= P

.17idempotente: dato chePP = T(

TT)1

TT(

TT)1

T= T(

TT)1

T= PrisultaPP =__P0 . . . 00 P. . . 0............0 0 . . . P____P0 . . . 00 P. . . 0............0 0 . . . P__=__PP0 . . . 00 PP. . . 0............0 0 . . . PP__=__P0 . . . 00 P. . . 0............0 0 . . . P__ = PQuando moltiplica una matrice in formato panelXdi dimensione (NT k),Pritorna la matriceXavente lestesse dimensioni della matrice data e contenente le sue medieindividuali calcolate sulle colonne.PX = (IN P)(NTNT)X(NTk)=__T(

TT)1

T0 . . . 00 T(

TT)1

T. . . 0............0 0 . . . T(

TT)1

T____x1x2...xN__=__T(

TT)1

Tx1T(

TT)1

Tx2...T(

TT)1

TxN__Dato che (

TT)1

Txi =1TT

j=1x

ij = x

i (vettore riga k-dimensionale contenente le medie aritmetiche temporalirelative alli-esimo individuo), si ottienePX =__T x

1T x

2...T x

N__ =X.Dal punto di vista geometricoPsi congura come la matrice delle proiezioni ortogonali sullo spazio generatodaTdi tutte le variabili individuali yi(N1)e xi(Nk).MatriceMLa matriceM`e denita comeM= (IN M) conM = IT P = IT T(

TT)1

T. Anche la matriceM`e18quadrata: dato cheM = IT P `e quadrata di dimensione (T T)M =__1 0 . . . 00 1 . . . 0............0 0 . . . 1__1T__1 1 . . . 11 1 . . . 1............1 1 . . . 1__,il prodottoP= (IN M) `e esso stesso una matrice quadrata di dimensione (NT NT).diagonaleablocchi: analogamente a quanto accadeva per la matrice P, anche in questo caso ci sono in tuttoNblocchi composti dalla matriceMP=__M0 . . . 00 M. . . 0............0 0 . . . M__.simmetrica: poiche siaItsiaP, sono simmetriche, tutti i blocchi diMsono simmetrici, quindiM= M

.idempotente: dato cheMM= [IT P][IT P]= IT PPPP= IT P= M,risultaMM =__M0 . . . 00 M. . . 0............0 0 . . . M____M0 . . . 00 M. . . 0............0 0 . . . M__=__MM0 . . . 00 MM. . . 0............0 0 . . . MM__=__M0 . . . 00 M. . . 0............0 0 . . . M__ = MQuando moltiplica una matrice in formato panel X di dimensione (NT k), Mritorna la matrice XX aventelestessedimensioni dellamatricedatae, perciascunindividuo, contenentegli scarti dellecolonnedalleloromedieindividuali. Questo risultato `e facilmente dimostrabile come segue considerando la matriceXdi19dimensioneNT k:MX = (IN M)(NTNT)X(NTk)=__IT T(

TT)1

T0 . . . 00 IT T(

TT)1

T. . . 0............0 0 . . . IT T(

TT)1

T____x1x2...xN__=__x1T(

TT)1

Tx1x2T(

TT)1

Tx2...xN T(

TT)1

TxN__=__x1T x1x2T x2...xT T xN__ = X X.Dal punto di vista della singola osservazione si ha perci`o xit xi che rappresenta lo scarto dalla media aritmeticaindividuale calcolata attraverso le diverse osservazioni nel tempo.Dal puntodi vistageometricoMsi conguracomelamatricedelladistanzatrai vettori colonnadellevariabili individuali yi(N1)e xi(Nk)e le loro proiezioni ortogonali sullo spazio generato daT.RelazionitraPeMDate le propriet` a delle matriciPedMrisulta:P +M= INTMinfatti equivale aINT P,PM= 0 PM= P(INT P) = P PP= P P= 0.Naturalmente, per i singoli blocchi, valeP +M = ITePM = 0.Inoltre, valgono le seguenti relazioni

TM = MT= 0,

TP = PT= T.Dati due numeri scalaric1ec2risulta(c1P +c2M)s= cs1P +cs2M,quindi risulta facile ad esempio determinarela matrice inversa(c1P +c2M)1=1c1P +1c2M.La dimostrazione si basa sulle propriet`a di idempotenza, somma e prodotto delle matriciPedM, infatti(c1P +c2M)_ 1c1P +1c2M_=c1c1PP +c2c1MP +c1c2PM +c2c2MM= P +M= INT20la forma quadratica(c1P +c2M)

(c1P +c2M) = c21P +c22M.Anche in questo caso, sfruttando le propriet`a di idempotenza, somma e prodotto delle matrici Ped M, siottiene(c1P +c2M)

(c1P +c2M) = (c1P +c2M)2= c21PP +c2c1MP +c1c2PM +c22MM= c21P +c22MA-2 DeterminazionedellostimatoreadeettissiDatalespressionedellinversadiunamatricepartizionata(divedalanota3),ilbloccodiSud-Estsiottieneattraverso i seguenti passaggiS2= [X

X X

(IN T) 1T IN(IN T)

X]1= {X

[INT 1T (IN T)(IN T)

]X}1= {X

[(IN IT) 1T (IN T

T)]X}1= {X

[IN (IT 1T T

T)]X}1= {X

[IN (IT T(

TT)1

T)]X}1= [X

(IN M)X]1= (X

MX)1.Una volta ottenuta questa quantit`a, lequazione dello stimatore diventa_ _ =__S11T (IN T)

XS21T S2X

(IN T) S2____(IN T)

YX

Y__doveS1 =1T IN +1T IN(IN T)

XS2X

(IN T) 1T IN. Svolgendo i prodotti_ _=__1T (IN T)

Y+1T (IN T)

XS2X

(IN T) 1T (IN T)

Y 1T (IN T)

XS2X

YS2X

Y 1T S2X

(IN T)(IN T)

Y__=__1T (IN T)

_INT XS2X

_INT 1T (IN T

T)__YS2X

_INT 1T (IN T

T)_Y__PoicheINT 1T (IN T

T) = (IN IT) [IN T(

TT)1T]= IN [IT T(

TT)1T]= IN (IT P)= IN M= M,21lo stimatore diventa quello di cui allequazione (15)_ _=_1T (IN T)

{INT XS2X

M} YS2X

MY_=_1T (IN T)

[Y X(X

MX)1X

MY ](X

MX)1X

MY_=_1T (IN T)

(Y X)(X

MX)1X

MY_.A-3 TestBPConsiderando la regressione ausiliaria 2= Z +, lindice di determinazione corrispondente `eR2= 2

Z(Z

Z)1Z

2 2

2.Sostituendo 2con( 2/ 0 1)inpraticasi sottraeesuccessivamentesi divideperlaquantit`acostante 0,quindi lindiceR2non cambia e si haR2=( 2/ 01)

Z(Z

Z)1Z

( 2/ 01)( 2/ 01)

( 2/ 01)=_ 2 0 0_

Z(Z

Z)1Z

_ 2 0 0__ 2 0 0_

_ 2 0 0_.Poiche N(0, ), sottolipotesi nullarisulta / 0 N(0, In)peril TCLdi Lindeberg-Levy, quindi ildenominatore della statistica test converge al valore 2 una volta diviso per lampiezza campionarian, infatti1n_ 2 0 0_

_ 2 0 0_=1n( 2 0)

( 2 0) 20=1n 2

2n 20 20= 2

2n_

n_2 1Questa espressione si congura come il rapporto tra il momento 4ed il quadrato della varianza di ; nel casodi distribuzione normale del residuo tale rapporto converge al valore 3 quindi1n_ 2 0 0_

_ 2 0 0_p3 1 = 2Alla luce di questo risultato si ottienenR2=12 02( 2 0)

Z(Z

Z)1Z

( 2 0).22