Altafrequenza

8
 17 Scienza & Business, Anno III, n.9-10, 2001 Massimiliano Cecconi, Marco J. Lombardi Università degli Studi di Firenze - Dipartimento di Statistica "G. Parenti" Trattamento e applicazioni U na delle tendenze più moderne della finanza consiste nello studio dei cosiddetti dati ad alta frequenza , ovvero osservazioni registrate in tempo reale sui mercati. A differenza degli studi tradizionali, nei qua- li si tende a considerar e dati misurati ad intervalli equispaziati, nel ca- so dell’alta frequenza si registra ogni singola transazione (e anche ri- chiesta di transazione) che avviene sul mercato . La possibilità di sfrut- tare questa enorme mole di informazione costituisce un indubbio van- taggio; le applicazioni di stime econometriche ricavate da dati ad altissima frequen za (ultra-high frequency , Engle [4]) si riflettono su gran parte della moderna teoria fi- nanziaria: dal prezzaggio di opzioni alla previsione della volatilità intragiornaliera, dal calcolo del Value at Risk alla gestione della li quidità. T uttavia, l’impiego di tali dati po- ne delle difficoltà sia per quanto concerne la loro raccolta che il loro trattamento. Di- fatti, oltre al problema di gestire ed organizzare enormi quantità di osservazioni (si può anche arrivare ad alcune migliaia di registrazioni nell’arco di una sola giornata borsistica), si pone quello del trattamento di osservazioni a frequenza irrego lare. Una delle possibilità che sta riscuotendo maggior successo in letteratura consiste nel mo- dellare i tempi che intercorrono tra una transazione e l’altra (le cosiddette durations ) tramite un nuovo processo, introdot to da Engle e Russell [5] e noto con l’acronimo di modello ACD (Autoregressive Conditional Duration) . Tra le motivazioni che hanno ispirato i due autori vi è la constatazione che la presenza sul mercato di operatori maggiormente informati di altri si riflette in un tempo medio di attesa tra una trans- azione e l’altra relativame nte breve. Viceve rsa, tempi di attesa più lunghi sono indice di una maggiore calma dei mercati, poiché si ritiene che il prezzo corrente sia pros- simo al suo valore di equilibrio. Scopo di questo articolo è quello di presentare sin- teticamente i dati ad alta frequenz a, le problema tiche connesse al loro stoccaggio ed al loro trattamento, e di fornire alcuni spunti sulle possibilità di utilizzo dei dati in svariati ambiti della moderna teoria finanziaria. Dati finanziari ad alta frequenza  

Transcript of Altafrequenza

Page 1: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 1/8

17Scienza & Business, Anno III, n.9-10, 2001

Massimiliano Cecconi, Marco J. LombardiUniversità degli Studi di Firenze - Dipartimento di Statistica "G. Parenti" 

Trattamento e applicazioni

U

na delle tendenze più moderne della finanza consiste nello studio deicosiddetti dati ad alta frequenza , ovvero osservazioni registrate intempo reale sui mercati. A differenza degli studi tradizionali, nei qua-li si tende a considerare dati misurati ad intervalli equispaziati, nel ca-so dell’alta frequenza si registra ogni singola transazione (e anche ri-chiesta di transazione) che avviene sul mercato. La possibilità di sfrut-

tare questa enorme mole di informazione costituisce un indubbio van-taggio; le applicazioni di stime econometriche ricavate da dati ad altissima frequenza(ultra-high frequency , Engle [4]) si riflettono su gran parte della moderna teoria fi-nanziaria: dal prezzaggio di opzioni alla previsione della volatilità intragiornaliera, dalcalcolo del Value at Risk alla gestione della liquidità. Tuttavia, l’impiego di tali dati po-ne delle difficoltà sia per quanto concerne la loro raccolta che il loro trattamento. Di-fatti, oltre al problema di gestire ed organizzare enormi quantità di osservazioni (sipuò anche arrivare ad alcune migliaia di registrazioni nell’arco di una sola giornataborsistica), si pone quello del trattamento di osservazioni a frequenza irregolare. Unadelle possibilità che sta riscuotendo maggior successo in letteratura consiste nel mo-dellare i tempi che intercorrono tra una transazione e l’altra (le cosiddette durations )

tramite un nuovo processo, introdotto da Engle e Russell [5] e noto con l’acronimo dimodello ACD (Autoregressive Conditional Duration) . Tra le motivazioni che hannoispirato i due autori vi è la constatazione che la presenza sul mercato di operatorimaggiormente informati di altri si riflette in un tempo medio di attesa tra una trans-azione e l’altra relativamente breve. Viceversa, tempi di attesa più lunghi sono indicedi una maggiore calma dei mercati, poiché si ritiene che il prezzo corrente sia pros-simo al suo valore di equilibrio. Scopo di questo articolo è quello di presentare sin-teticamente i dati ad alta frequenza, le problematiche connesse al loro stoccaggio edal loro trattamento, e di fornire alcuni spunti sulle possibilità di utilizzo dei dati insvariati ambiti della moderna teoria finanziaria.

Dati finanziari ad alta frequenza 

Page 2: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 2/8

18 Scienza & Business, Anno III, n.9-10, 2001

 Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

L

a modernizzazione degli strumenti infor-matici è spesso venuta a coincidere conimportanti innovazioni nel campo della fi-nanza. Ad esempio, a partire dall’inizio de-gli anni ‘90, la crescente velocità di elabo-razione dei processori ha reso possibilesviluppare tecniche di analisi che risulta-

vano in precedenza impensabili: tra le altre cose, adesempio, si sono potute sviluppare tecniche di prezzag-gio per titoli derivati di tipo non standard basate sulla si-mulazione del prezzo del titolo sottostante.

Una delle ultime conseguenze della rapida espansio-ne della tecnologia hardware è rappresentata dalla pos-sibilità di archiviare e gestire database di dimensioni im-ponenti grazie alla costante crescita di capienza deisupporti magnetici e all’introduzione su larga scala (e acosti contenuti) degli strumenti ottici di lettura/scrittura.In ambito finanziario, ciò rende possibile studiare l’anda-

mento dei mercati in una prospettiva intragiornaliera, ov-vero registrare tutte le transazioni (eseguite o solo r i-chieste) che si rilevano sui terminali degli operatori. Inletteratura, spesso si indicano tali rilevazioni come datitick-by-tick o trade-by-trade (Gwilym e Sutcliffe [6]).

Se fino a poco tempo fa le applicazioni si limitavano aconsiderare al massimo osservazioni giornaliere, si stadiffondendo oggi la pratica di sfruttare la massima infor-mazione possibile utilizzando i dati tick-by-tick. Difatti,utilizzando dati giornalieri, si suole considerare il prezzodi chiusura come indicativo dell’intera giornata di con-trattazioni, ma ciò non è necessariamente vero; trala-

sciando i movimenti intragiornalieri del prezzo si rischiapertanto di trascurare informazioni rilevanti ai fini dellastima e della previsione.

Tuttavia, utilizzare questo tipo di dati pone alcuni pro-blemi e rende necessario ricorrere a strumenti parzial-mente diversi da quelli tradizionalmente impiegati. Il pro-blema principale consiste nel fatto che le osservazionicosì rilevate non sono necessariamente equispaziate:tra un’osservazione e l’altra può intercorrere un lasso ditempo che oscilla da pochissimi secondi a qualche mi-

nuto. Al contrario, è immediatamente evidente che, uti-lizzando dati giornalieri, tale problema non si pone.

Modalità di raccolta e gestione dei dati

Idati ad altissima frequenza sono raccolti e forniti daorganismi di vario tipo, spesso identificabili con l’isti-tuzione che gestisce e regola il singolo mercato na-

zionale; nel caso italiano, essi sono gestiti direttamentedalla Borsa Italiana S.p.A. Tali dati si presentano sottoforma di database in formato ASCII che riporta in ordi-ne:! data della transazione, nel formato aaaammgg (ad

esempio 20000703 indica il 3 luglio 2000);! orario della transazione, nel formato hhmmsscc (ad

esempio 11073200 indica le ore 11,7 minuti, 32 secondi);! prezzo in euro al quale avviene lo scambio;!

volume scambiato;! controvalore in euro.

Una tipica giornata di contrattazioni, sul mercato italia-no, supera abbondantemente le 1500 osservazioni. Sicapisce subito come ciò risulti costoso sia dal punto divista dello stoccaggio che da quello del trattamento deidati: un database di un anno consterebbe di circa600.000 rilevazioni. Dai grafici che presentiamo possia-mo vedere un confronto tra l’andamento giornaliero equello tick-by-tick del prezzo del titolo FIAT tra il 10 e il31 luglio del 2000. Nella Figura 1 riportiamo i prezzi gior-

nalieri di chiusura, mentre nella Figura 2 il grafico dellequotazioni tick-by-tick. Si osserva che, ovviamente, ledue serie risultano più o meno sovrapponibili, ma chead ogni modo la serie ad alta frequenza veicola unaquantità di informazione infinitamente maggiore rispettoa quella giornaliera.

La non omogeneità dei dati tick-by-tick non risulta mol-to evidente dalla Figura 2 a causa della enorme quanti-tà di dati a disposizione (29087 osservazioni). Tuttavia,

Figura 1

Prezzo del titolo FIAT nel periodo 10/31 luglio 2000 sullabase di rilevazioni giornaliere

Figura 2Prezzo del titolo FIAT nel periodo 10/31 luglio 2000 sullabase di rilevazioni tick-by-tick

Page 3: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 3/8

19Scienza & Business, Anno III, n.9-10, 2001

 Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

se concentriamo l’attenzione su una frazione della gior-nata borsistica (ad esempio un’ora), è immediatamentevisibile l’andamento a “salti” della serie dovuto alla diver-sa frequenza con cui si registrano le transazioni. La Fi-gura 3 illustra quanto descritto per il titolo FIAT nel gior-no 10 luglio 2000 tra le 9. 30 e le 10. 30 del mattino; cia-scun punto indica una diversa transazione avvenuta nelperiodo considerato.

Se il problema del trattamento dei dati si avverte giàsul mercato italiano, su quello statunitense è infinita-mente più grande: non solo le transazioni sono moltopiù numerose, ma l’insieme delle informazioni rilevate ri-sulta molto più ampio. Il principale fornitore di dati per ilmercato statunitense è il New York Stock Exchange(NYSE) stesso, che cura il database TAQ (Trades andQuotes, [12]). Tale database riporta, oltre alle transazio-ni che effettivamente hanno luogo (trades), anche le

quotazioni bid e ask, ovvero le proposte di vendita e diacquisto che non vanno a buon fine (quotes). Nel data-base TAQ, oltre ai dati relativi al NYSE, sono rilevati an-che dati di altri mercati, tra cui il National Association ofSecurities Dealers Automated Quotations (NASDAQ),l’American Stock Exchange (AMEX) e il Chicago BoardOptions Exchange (CBOE).

Per dare un’idea della mole che può raggiungere il da-tabase TAQ, ne riportiamo, in Figura 4, le dimensioni inMegaBytes per alcuni mesi di riferimento e solo per po-chi titoli azionari del NYSE. Dal grafico si evince che lafrequenza degli scambi sul mercato statunitense è in for-

te crescita: la dimensione del database presenta difattiun marcato trend crescente sia per quanto riguarda leproposte immesse nel circuito telematico che per quan-to riguarda le transazioni effettivamente realizzate.

La modellistica tradizionale che si è soliti utilizzare perl’analisi delle serie storiche finanziarie è stata sviluppataquando ancora le osservazioni giornaliere rappresenta-vano il massimo grado di informazione che si potesse ri-uscire a gestire. Tale modellistica (ci riferiamo in partico-

lare ai modelli di tipo ARMA-GARCH; si veda, per unatrattazione introduttiva, Hamilton [7]) è quindi applicabilesolo nel caso in cui i dati siano equispaziati e, come ab-biamo visto, questo non è il caso delle osservazioni ad

alta frequenza. I primi studi in tale ambito si sono con-centrati sul cercare di “recuperare” la modellistica tradi-zionale trasformando le osservazioni ad alta frequenzain osservazioni equispaziate. L’idea più naturale in que-sto senso è quella di registrare i dati a intervalli di tempopredefiniti: ad esempio ogni minuto, oppure ogni secon-do. Questo approccio comporta però alcuni problemi: seinfatti, per quanto riguarda le osservazioni giornaliere, altermine della giornata di contrattazioni si osserva comun-que un singolo prezzo di chiusura, non è detto (specieper quanto concerne i titoli a minore flottante) che si pos-sa osservare una transazione esattamente ogni minuto (o

addirittura ogni secondo). I dati devono essere quindi trat-tati in modo da renderli veramente equispaziati.Vi sono varie modalità di intervento possibili, che illu-

streremo con un semplice esempio grafico. Supponiamoche il prezzo di apertura del titolo che vogliamo analiz-zare sia 100. Desideriamo ricavare, a partire dalle os-servazioni tick-by-tick, una serie di osservazioni equi-spaziate a un minuto. Dopo esattamente un minuto dal-l’apertura del mercato, si registra la prima transazione aun prezzo di 101. La seconda transazione, a un prezzodi 102, avviene 1 minuto e 48 secondi (1,8 minuti) dopol’apertura del mercato, e la terza, a un prezzo di 104,

dopo 2 minuti e 36 secondi (2,6 minuti).La situazione che ci si trova ad affrontare è schema-tizzata nella Figura 5: a partire dalla prima linea tempo-rale, non equispaziata, dobbiamo costruire la seconda,“riempiendo” le rilevazioni x0, x1, x2, e così via.

Per quanto riguarda x0, essa ovviamente coincide colprezzo di apertura; ugualmente, poiché la prima trans-azione si è verificata esattamente un minuto dopo l’a-pertura del mercato, x1 coincide col prezzo di tale trans-azione, ovvero 101. Per quanto riguarda x2, invece, nondisponiamo di un’osservazione corrispondente al termi-ne temporale dei 2 minuti, e dobbiamo quindi procedere

in maniera diversa. Una prima idea può essere quella diFigura 3Prezzo del titolo FIAT tra le 9.30 e le 10.30 del 10 luglio2000

Figura 4Dimensione in MegaBytes del database TAQ

Page 4: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 4/8

20 Scienza & Business, Anno III, n.9-10, 2001

 Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

utilizzare la transazione più vicina ai 2 minuti, in questocaso 102. Altrimenti, si può considerare la media aritme-tica delle osservazioni immediatamente precedente eseguente ai 2 minuti, ovvero:

x2 = (102 + 104) / 2 = 103.Un’ulteriore possibilità, più raffinata, è quella di consi-

derare una media ponderata con gli intervalli di tempoche intercorrono tra le transazioni e il termine dei 2 mi-nuti:

x2 = [102 * (2 - 1,8) + 104 * (2,6 - 2)] / [(2 - 1,8) + (2,6 - 2)] = 103,5.

Menzioniamo, infine, la strada dell’interpolazione li-neare, consistente nel tracciare una retta per le duetransazioni più prossime a quella “mancante” e prenderecome valore quello appartenente a tale retta in corri-spondenza dell’istante considerato. In pratica, ciò si tra-duce nel risolvere la proporzione

(x2 - 102): (2 - 1,8) = (104 - 102): (2,6 - 1,8),

la cui soluzione rende un valore interpolato per x2 di102,5.Ovviamente, nessuna di queste metodologie è intrin-

secamente la migliore. La media ponderata è quella checonsidera il numero più ampio di fattori, ma non è ne-cessariamente superiore alle altre in termini di risultato.Quello che vale la pena qui osservare è che procederead accorpare i dati per renderli equispaziati comportacomunque, per quanto alta possa essere la frequenza dicampionamento, una perdita di informazione. Abbiamogià rilevato che, disponendo di dati equispaziati, possia-mo sfruttare tutta la modellistica preesistente. Tuttavia,

se si aggiunge a questo indubbio vantaggio l’inconve-niente relativo alla perdita di informazione, questa stra-tegia può rivelarsi non ottimale a fini di analisi.

L’approccio sperimentale alle serie ad alta

frequenza

I n ciò che precede abbiamo messo in evidenza comeoggigiorno, chiunque si avvicini ai mercati finanziaripossa disporre di enormi quantità di dati dai quali

estrapolare utili suggerimenti per le proprie decisioni di

investimento e disinvestimento. Tra i problemi maggioriche si incontrano vi è senz’altro la necessità di operareun’adeguata sintesi dell’informazione raccolta in mododa poterla utilizzare al meglio. L’approccio comunemen-te utilizzato in questo ambito è quello proprio dellescienze sperimentali (fisica, chimica o biologia), dove ifenomeni naturali vengono studiati mediante l’ausilio distrumenti matematici e statistici rigorosi.

L’applicazione del cosiddetto metodo sperimentale aidati finanziari ad alta frequenza si esplica in tre fasi fon-damentali (Dacorogna et al. [3]). La prima di esse, e for-se la più delicata, consiste nell’analizzare da un punto di

vista esplorativo e descrittivo i dati a disposizione del ri-

cercatore allo scopo di individuarne le proprietà statisti-che fondamentali, sulla base di un minimo insieme diassunzioni sottostanti. Si va dunque alla ricerca di quel-le regolarità empiriche che nella letteratura econometri-co-finanziaria prevalente vengono definite fatti stilizzati.Andamento delle funzioni di autocorrelazione, forma del-la distribuzione campionaria, individuazione di patternsgiornalieri e/o settimanali caratteristici, sono solo alcunidegli esempi di regolarità empiriche ispezionate in que-sta fase.

Il secondo passo consiste nell’utilizzare i fatti stilizzatiprecedentemente individuati per formulare adeguati mo-delli matematico-statistici. Occorre notare che per mo-delli adeguati si intendono formulazioni rigorose in gra-do di riprodurre le regolarità empiriche osservate, ope-rando in un contesto di tipo essenzialmente “ateorico”,tipico delle scienze sperimentali, che si pone in contrap-posizione all’approccio economico tradizionale dove l’a-

spetto determinante è costituito dalla verifica empirica diquelle relazioni teoriche ritenute esplicative del compor-tamento dei mercati (la cosiddetta microstruttura).

Nell’ultima fase occorre verificare l’adeguatezza delmodello nel riprodurre i fatti stilizzati precedentementeindividuati sui dati. L’obiettivo finale non si limita alla ri-cerca di un modello puramente descrittivo dell’anda-mento dei fenomeni analizzati, ma consiste piuttostonell’utilizzo di tali formulazioni per ricavare ragionevoliprevisioni sui loro movimenti futuri, integrando nelle ap-plicazioni pratiche questi strumenti con quelli oramai piùconsolidati del risk management e del prezzaggio di op-

zioni.Come già evidenziato, il metodo sperimentale si con-trappone a quello proprio della teoria finanziaria tradi-zionale utilizzato per comprendere la microstruttura delmercato e volto ad analizzare la reazione dei mercati fi-nanziari all’insorgere di nuova informazione. La presen-za di operatori diversamente informati gioca un ruolo

Figura 5

Costruzione di una serie di osservazioni equispaziate a parti-re da osservazioni tick-by-tick

Page 5: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 5/8

21Scienza & Business, Anno III, n.9-10, 2001

 Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

chiave nel meccanismo di formazio-ne dei prezzi. In tal senso, uno deiprincipali vantaggi dell’applicazionedel metodo sperimentale ai dati adalta frequenza consiste nella possi-bilità di riconciliare i due approcci,sintetizzando la maggiore informa-zione disponibile in particolari varia-bili esplicative da aggiungere ai mo-delli derivati in stretta aderenza alleregolarità empiriche osservate.

In ciò che segue daremo un sem-plice esempio illustrativo di modelloeconometrico derivato secondo le li-nee guida dell’approccio sperimen-tale ai mercati finanziari e ne mette-remo brevemente in evidenza le po-tenzialità nel riprodurre le regolarità

empiriche osservate su dati reali.

Una rappresentazione formale:

il modello ACD

C ome già accennato in prece-denza, la moderna teoria fi-nanziaria si basa sulla con-

statazione che l’unica variabile ingrado di fornire utili suggerimenticirca la presenza di informazione

superiore nel mercato è rappresen-tata dalla sequenza delle transazio-ni. Partendo da una tale assunzio-ne, numerosi sono stati i tentativi diformalizzare il comportamento deglioperatori di mercato (si veda, adesempio, O’Hara [11] per una ras-segna di tali modelli). Basti qui ricor-dare che se da un lato le peculiaritàdei vari modelli consistono nel diver-

so punto di vista in base al qualevengono studiate le sequenze ditransazioni, dall’altro il loro elemen-to comune è l’individuazione dellapresenza di operatori maggiormen-te informati di altri. Ciò si traduce nelfatto che la quotazione corrente de-gli attivi finanziari risulta più o menovicina al suo valore di equilibrio aseconda della frequenza con cui av-vengono le transazioni.

La formulazione matematico-stati-stica più innovativa volta a tale sco-po è senz’altro il modello ACD (Au-toregressive Conditional Durations)introdotto da Engle e Russell [5]. Sitratta di una rappresentazione stati-stica per dati non equispaziati la cui

finalità è quella di comprenderequale sarà il tempo medio di attesafino alla prossima transazione, inquanto è proprio dalla previsione diquesto dato che gli operatori aggior-neranno la loro opinione (o probabi-lità soggettiva) circa la possibilitàche vi sia informazione superiorenel mercato e che di conseguenzale quotazioni degli attivi finanziarisiano relativamente lontane dal lorovalore di equilibrio. Riportiamo in Fi-

gura 6, a titolo esemplificativo, il gra-fico delle durations rilevate per il ti-tolo FIAT nel mese di gennaio 2000.Dal campione sono state escluse ledurations nulle (relative al fatto chepiù transazioni si sono verificate nel-lo stesso istante), quelle della fasedi pre-apertura, e le durate tra la pri-ma transazione della giornata e l’ul-tima della giornata precedente, ridu-

cendo il cam-pione a 35777

osservazioni,contro le 58123originarie. Co-me si vede, leconsiderazioniche portano aritenere cheuna maggioreattività di tra-ding si verifichinelle prime oresuccessive al-

l’apertura ed in

quelle prossime alla chiusura dellagiornata borsistica è confermatadall’andamento sinusoidale delledurations. I fondamenti di un similecomportamento si ritrovano nellaconstatazione che all’apertura siada scontare tutta l’informazione e leopinioni della notte, mentre in pros-simità della chiusura gli operatoritenderanno a liquidare eventuali po-sizioni rimaste aperte o a scontareimmediatamente un’aspettativa sul-la quotazione alla riapertura.

Senza entrare nei dettagli dei pro-cessi ad intensità condizionale, per iquali si rimanda, fra gli altri, a Lan-caster [9], la rappresentazione for-

male del modello ACD può essereespressa come segue. Sia xi = ti -ti-1l’intervallo di tempo espresso in se-condi tra due transazioni consecuti-ve (le cosiddette durations) e sia ψ iil valore atteso dell’i-esima durationcondizionato a tutta la storia passa-ta di xi (xi-1 , xi-2 , ... , x1 ). In tal modo ilmodello può essere espresso come:

xi = ψ i ε idove ε i rappresenta una sequenzadi variabili casuali indipendenti e

identicamente distribuite con funzio-ne di densità di probabilità che deveessere specificata e media uguale a1. Da queste semplici assunzioni sinota come diverse formulazioni delmodello ACD possono essere rica-vate semplicemente indicando para-metrizzazioni alternative per ψ i edipotizzando distribuzioni diverse perε i . Nel modello originario di Engle eRussell [5] si assume che le dura-tions condizionali attese dipendano

da q dei loro valori passati e da m ri-tardi delle durations più un terminecostante:

Il valore numerico dei parametri ω> 0, α1, …,αm ≥ 0, β 1, …,β q ≥ 0, il cuivincolo di non-negatività si rendenecessario al fine di ottenere stimenon negative per ψ i , è determinatomediante l’applicazione di metodo-

logie statistiche di stima, ed in parti-Figura 6Durations per il titolo FIAT - gennaio 2000

Page 6: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 6/8

22 Scienza & Business, Anno III, n.9-10, 2001

 Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

colare del metodo della massima verosimiglianza, unavolta che si è specificata la forma della distribuzione di ε i. Nei casi più frequenti nella pratica, si ipotizza una dis-tribuzione esponenziale o di Weibull per ε i , dalle qualiderivano rispettivamente i modelli EACD (m, q) e WACD(m, q). A titolo esemplificativo, si riporta nella Tabella 1la stima di vari modelli ACD di tipo esponenziale per il ti-tolo FIAT all’interno del campione considerato. Oltre allestime dei parametri, riportiamo gli standard error robusti

(tra parentesi quadre sotto la stima), la stati-stica test LB di Ljung e Box [10] per la verifi-ca dell’assenza di correlazione, nonché lamedia e la deviazione standard calcolate suiresidui del modello stimato

Sebbene i residui sembrino, almeno in pri-ma approssimazione, in linea con le ipotesiteoriche formulate sul modello, la parametriz-zazione che meglio si adatta ai dati è quellaEACD (1, 2). Negli altri casi, o ci troviamo difronte a parametri statisticamente non signifi-cativi, oppure la presenza di un valore nega-tivo per α2 nel modello EACD (2, 1) o la noncompleta assenza di correlazione nei residuiper il caso EACD (1, 1), li rendono di fattomeno accettabili del modello EACD (1, 2).

Inoltre, come si evince dalle figure 7 e 8, l’i-potesi di distribuzione esponenziale per i ter-

mini di disturbo sembra poter essere adeguata. L’isto-gramma dei residui osservati (Figura 7), a parte una di-versità di scala facilmente eliminabile, riproduce abba-stanza fedelmente l’andamento della distribuzione espo-nenziale (la media e la varianza sono infatti prossime al-l’unità). Ciò è confermato dallo scatterplot tra i quantiliteorici della distribuzione esponenziale e quelli ricavatida dalla distribuzione empirica dei residui (Figura 8), do-ve la disposizione dei punti lungo la bisettrice che passa

per l’origine degli assi ne giustifica l’adozione come ipo-tesi per la stima dei parametri. Le maggiori diversità ri-spetto ad una retta si hanno in corrispondenza di pochivalori elevati per i quali varrebbe la pena dare una spie-gazione teorica piuttosto che considerare distribuzionialternative (quali la Weibull) che avrebbero l’effetto dicomplicare eccessivamente la procedura iterativa di sti-ma. In tal caso, la presenza di pochi valori eccezional-mente grandi può essere dovuta al fatto che la quotazio-ne del momento abbia superato le soglie dell’eccesso dirialzo o di ribasso, in modo da provocare la sospensionedel titolo FIAT dalle contrattazioni per qualche minuto.

L’inclusione tra i regressori di variabili dummy in grado dicogliere questi momenti o la ricerca di variabili esplicati-ve aggiuntive potrebbero in parte rimediare a questeinefficienze del modello.

Infine presentiamo in Figura 9 un confronto grafico trale durations reali e quelle stimate col modello EACD (1,2). Come si vede, il modello è in grado di cogliere quel-l’andamento sinusoidale di cui si è parlato in preceden-za evidenziando un’adeguata discriminazione tra periodicaratterizzati da durate brevi e periodi nei quali i tempi diattesa tra una transazione e l’altra sono significativa-mente più lunghi.

Figura 7

Istogramma sui residui del modello EACD (1, 2) per il titolo FIAT -gennaio 2000

Tabella 1Stime di vari modelli EACD per il titolo FIAT - gennaio 2000

Page 7: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 7/8

Note conclusive

Abbiamo presentato somma-riamente i principali problemiche si incontrano volendo la-

vorare con dati finanziari ad alta fre-quenza al posto dei “tradizionali” da-ti giornalieri. Si è visto come tali datipresentino alcune interessanti pecu-liarità, in particolare il fatto che nonrisultano equispaziati. A tale propo-sito, si è introdotto il modello ACD, dicui abbiamo mostrato i tratti salienti

ed un’esemplificazione su dati reali.

Pur essendo un model-lo relativamente recente,si trovano già, in lettera-tura, numerose applica-zioni, anche relative almercato italiano. Si è os-servato, in particolare,che tale modello è in gra-do di riprodurre in manie-ra adeguata l’andamentodelle transazioni intra-giornaliere.

Sono state inoltre pro-poste numerose esten-sioni al modello ACD,con l’obiettivo di miglio-rarne la performance e direnderlo adeguato a trat-

tare determinate caratte-ristiche empiriche rileva-te sui dati reali. In parti-colare, sono stati intro-dotti modelli in grado dicatturare le asimmetrie(Asymmetric ACD, Bau-wens e Giot [2]), la me-moria lunga (FractionallyIntegrated ACD, Jasiak[8]) e la non-linearità(Log ACD, Bauwens e

Giot [1] e ThresholdACD, Zhang et al. [13]).Tra gli elementi che più

frenano una maggiorediffusione della modelli-stica ACD e, più in gene-rale, dei dati ad alta fre-quenza stessi, vi è l’as-senza di software pro-gettato specificamenteper il loro trattamento e

la loro analisi. Notiamo infatti che, al

di là dell’assenza di pacchetti di sti-ma dei modelli ACD, anche la stessaraccolta e analisi grafica dei dati èproblematica, facendo affidamentosui software di uso comune pressogli operatori del settore, ovviamentea causa della loro mole.

Riteniamo che, analogamente aquanto si è verificato in passato peraltri modelli, la spinta decisiva allaloro diffusione possa venire propriodall’introduzione di pacchetti softwa-

re specifici.

Bibliografia

[1] Bauwens, L., Giot, P. (1997). The Logarithmic

ACD Model: An Application to Market Micro-

structure and NASDAQ.CORE Discussion Pa-

per 9789 :Universitè Catholique de Louvain.

[2] Bauwens, L., Giot, P. (1998). Asymmetric

ACD Models: Introducing Price Information in

ACD Models with A Two State Transition Mo-

del. CORE Discussion Paper 9844: Universi-

tè Catholique de Louvain.

[3] Dacorogna, M. M., Gençay, R., Müller, U., Ol-

sen, R.B., Pictet, O.V.(2001). An Introduction

to High-Frequency Finance, San Diego:Aca-

demic Press.

[4] Engle, R. F. (2000). The Econometrics of Ul-

tra-High Frequency Data, Econometrica, 66,

pp. 1-22.

[5] Engle, R. F., Russell, J.R. (1998).Autoregres-

sive Conditional Duration:A New Model for Ir-

regularly Spaced Transaction Data, Econo-

metrica, 66, pp.1127-1162.

[6] Gwilym, O., Sutcliffe, C. (1999). High-Fre-

quency Financial Market Data, London: Risk

Books.

[7] Hamilton, J. D. (1994).Time Series Analysis,

Princeton: Princeton University Press.

[8] Jasiak, J.(1999). Persistence in Intertrade Du-

rations. Manuscript:York University.

[9] Lancaster, T. (1990). The Econometrics

Analysis of Transition Data, Econometric So-ciety Monographs. Cambridge: Cambridge

University Press.

[10] Ljung, G., Box, G. (1979). On a Measure of

Lack of Fit in Time Series Models, Biometri-

ka, 66, pp.265-270.

[11] O’Hara, M. (1995). Market Microstructure

Theory, Oxford: Basil Blackwell Inc.

[12] TAQ Database, http: //www. nyse. com/mar-

ketinfo/marketinfo. html.

[13] Zhang, M. Y., Russell, J. R., Tsay, R. S.

(2001). A Nonlinear Autoregressive Conditio-

nal Duration Model with Applications to Fi-nancial Transaction Data, Journal of Econo-

metrics, 104, pp. 179-207.

23Scienza & Business, Anno III, n.9-10, 2001

 Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

Figura 8Scatterplot tra quantili stimati e quantili teorici delladistribuzione esponenziale per il titolo FIAT - gennaio2000

Figura 9Confronto tra durations reali (linea rossa) e stimate(linea bianca) per il titolo FIAT - gennaio 2000

Ringraziamenti

R ingraziamo la Borsa Italiana S.p.A.per averci cortesemente messo adisposizione i dati ad alta frequen-

za utilizzati in questo articolo. Un ringrazia-mento particolare va inoltre al Prof. Giam-piero M. Gallo per averci supportato e in-

coraggiato nel nostro lavoro.

Page 8: Altafrequenza

5/11/2018 Altafrequenza - slidepdf.com

http://slidepdf.com/reader/full/altafrequenza 8/8

24 Scienza & Business, Anno III, n.9-10, 2001

 Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

 APPROFONDIMENTO: LA DI ST RIBUZIONE DI WEIBULL 

L a distribuzione di Weibull è in genere utilizzata per modellare dati di dura-ta ed ha la peculiarità che la sua hazard function (funzione tasso di gua-sto) dipende dal parametro di forma k e può risultare crescente, costante o

decrescente, rendendo così la distribuzione assai versatile. L’equazione dellafunzione di densità di probabilità è:

per t > 0. Il parametro k può assumere valori strettamente positivi e determina, come dice il nome stesso, laforma della distribuzione. Nel caso in cui k = 1 la distribuzione è detta anche esponenziale, ed ha tasso di gua-sto costante. In Figura 10 riportiamo il grafico della densità di Weibull per tre diversi valori di k. Il parametro θ,invece, è detto parametro di scala, e determina l’ampiezza della distribuzione. Ai fini delle stime ACD, il para-metro di scala viene spesso fissato a priori pari a uno.

Figura 10 - Densità di Weibullper diversi valori del parametrok , ponendo θ  = 1

Notizie sugli Autori

MASSIMILIANO CECCONI

Massimiliano Cecconi si è lau-reato a pieni voti con lode

presso la Facoltà di Economia del-l’Università degli Studi di Firenze

nell’aprile 2001. Ha discusso una tesi in Econometria dal titolo:“Modelli econometrici per fenomeni soggetti a smooth transition:

lo studio della volatilità sui mercati finanziari”, supervisionata dalprof. Giampiero M. Gallo, per la quale la commissione di laureaha espresso l'auspicio di pubblicazione. Attualmente è Assegni-sta di Ricerca presso il Dipartimento di Statistica “G.Parenti”del-l’Università di Firenze, dove svolge una ricerca dal titolo “Micro-strutture di Mercati Finanziari”. Fa infine parte del gruppo di ri-cerca FEDRA. I suoi interessi di ricerca riguardano l’econometriadei mercati finanziari, con particolare attenzione alla microstrut-tura dei mercati ed allo studio delle serie storiche finanziarie adaltissima frequenza (tick-by-tick).Si interessa inoltre di modellisti-ca GARCH per lo studio della volatilità, modelli non-lineari per imercati finanziari, modelli a transizione liscia, metodi di simula-

zione, implementazione di routine econometrico-finanziarie.È contattabile all’indirizzo e-mail: [email protected] o all'URL:http://www.cecconim.it.

MARCO J. LOMBARDI

Marco Jacopo Lombardi è natoa Firenze il 16 giugno 1976.

Dopo il Diploma di Maturità Classi-ca, si è iscritto alla Facoltà di Eco-

nomia dell’Università degli studi di Firenze e si è laureato colmassimo dei voti e lode il 12 febbraio 2001. La sua tesi in Eco-

nometria, supervisionata dal Prof. Giampiero M. Gallo e intitolata“La previsione della volatilità di attivi finanziari: Processi a memo-ria lunga e Fractionally Integrated GARCH”, ha ricevuto dallacommissione l’auspicio di pubblicazione.Attualmente segue il corso di Dottorato di Ricerca in StatisticaApplicata presso il Dipartimento di Statistica “G.Parenti” dell’Uni-versità degli studi di Firenze.Oltre che ai modelli per dati ad alta frequenza e ai modelli a me-moria lunga, è interessato alla programmazione in linguaggioC/C++, all’analisi spettrale, alle reti neurali e ai metodi numericidi ottimizzazione.Lavora presso il Dipartimento di Statistica “G. Parenti” dell’Uni-

versità degli studi di Firenze (Viale G.B.Morgagni 59 - 50134 Fi-renze) e può essere contattato all’indirizzo e-mail: [email protected] all’URL http://www.ds.unifi.it/~mjl/.

FEDRA

Il gruppo di ricerca FEDRA (Financial Econometrics and Derivatives Research Associates) si è costituito nel giugno2001 presso il Dipartimento di Statistica “G. Parenti” dell’Università degli studi di Firenze con l’obiettivo di coordinare epromuovere l’attività di ricerca del dipartimento nel settore dell’analisi quantitativa dei mercati finanziari.

Il gruppo è diretto da Giampiero M. Gallo ed è attualmente composto da Christian T. Brownlees, Massimiliano Cecconi,Orazio Di Miscia, Andrea Gigli, Marco J. Lombardi e Barbara Pacini.

Ulteriori informazioni sulle attuali attività del gruppo sono disponibili all’URL: http://www.ds.unifi.it/~fedra/.