Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; -...

69
IRPET Istituto Regionale Programmazione Economica Toscana Un modello per la stima e la previsione dei flussi regionali delle presenze turistiche registrate Nicola Falocci Renato Paniccià Elena Stanghellini Working paper Firenze, 2006

Transcript of Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; -...

Page 1: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

IRPET Istituto Regionale Programmazione Economica Toscana

Un modello per la stima e la previsione dei flussi regionali delle presenze turistiche registrate Nicola Falocci Renato Paniccià Elena Stanghellini

Working paper Firenze, 2006

Page 2: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

2

RICONOSCIMENTI L’allestimento del testo è stato curato da Chiara Coccheri del servizio editoriale dell’IRPET.

Page 3: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

3

INDICE INTRODUZIONE 5 1. I MODELLI ECONOMETRICI PER LA STIMA DEI FLUSSI TURISTICI 7 1.1 I modelli A.I.D.S. 7 1.2 I modelli gravitazionali 8 1.3 Il modello gravitazionale con gli effetti di regione 12 1.4 Il problema del bilanciamento della matrice dei flussi turistici 13 1.5 Il modello di bilanciamento 14 1.6 Inclusione di una forma lineare 16 1.6.1 Il vincolo lineare 16 1.6.2 Il vincolo non lineare 18 2. I MODELLI PER LA STIMA DELLE PRESENZE 21 2.1 Il modello interregionale con variabili contemporanee 21 2.1.1 Il Prodotto Interno Lordo a prezzi costanti 23 2.1.2 La variabile di distanza 23 2.1.3 Il ruolo degli investimenti turistici 25

2.1.4 Variabili Dummy di confine 26 2.1.5 Il livello dei prezzi 26 2.1.6 Le variabili di offerta turistica 29 2.1.7 La popolazione residente 31 2.1.8 Variabili in forma pro capite 32 2.1.9 L’inserimento degli effetti di regione 33 2.1.10 La scelta delle variabili gravitazionali 34 2.1.11 Variabili contemporanee e causalità inversa 36 2.2 Modello con variabili ritardate 38 2.3 Il modello per i flussi intra-regionali 43 2.4 Il modello completo sulle presenze 47 2.5 Il modello con i vincoli 49 CONCLUSIONI 55 APPENDICE Funzioni MATLAB 57 BIBLIOGRAFIA 67

Page 4: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

4

Page 5: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

5

INTRODUZIONE La modellizzazione dei flussi turistici consente di ottenere una importante analisi ai fini della conoscenza del funzionamento dei sistemi economici regionali, specialmente in Italia, dove, in alcune regioni l’incidenza della spesa turistica rappresenta circa il 10% del consumo interno delle famiglie (ad esempio in Toscana, Veneto ed Emilia Romagna), raggiungendo quasi il 25% in Trentino Alto Adige e Valle d’Aosta.

Nelle stesse regioni la spesa turistica può attivare una percentuale significative del PIL regionale: in Trentino Alto Adige e Valle d’Aosta circa il 12% mentre in Toscana 8% e 6% in Veneto ed Emilia Romagna.

Le componenti geografiche dei flussi turistici di una regione sono interregionali ed estere, tuttavia la maggior parte delle analisi si è concentrata sulla modellizzazione dei flussi esteri, nonostante la componente interregionale rappresenti quasi il 50% della spesa turistica complessiva.

Il motivo di tale distorsione risiede nella mancanza di dati su alcune variabile esplicative a livello regionale e nella complessità delle stime che implicano matrici di origine e destinazione.

L’analisi che verrà proposta in questo paper mira a colmare in parte questo gap attraverso la stima di un modello dei flussi turistici interregionali (approssimati dalle presenze turistiche) che utilizza alcune variabile chiave a livello regionale tra cui il reddito disponibile (stimato solo recentemente da ISTAT) e soprattutto una nuova procedura per il bilanciamento di un set di dati soggetto a vincoli non lineari.

Page 6: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

6

Page 7: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

7

1. I MODELLI ECONOMETRICI PER LA STIMA DEI FLUSSI TURISTICI Gli studi nella letteratura econometrica sulla stima dei flussi turistici possono essere suddivisi in due grandi gruppi. Il primo concerne approcci basati essenzialmente sull’analisi delle serie storiche, che cercano di prevedere i valori futuri della domanda turistica sulla base delle \\sull’analisi delle serie storiche necessitano notoriamente di un numero piuttosto consistente di osservazioni; per tale ragione, le applicazioni in ambito turistico hanno in genere riguardato la componente internazionale del turismo di un certo paese, per la quale sono disponibili dati a cadenza trimestrale o mensile.

Il secondo gruppo riguarda invece modelli econometrici basati sulla specificazione di relazioni funzionali tra la domanda turistica ed una serie di variabili utilizzate come esplicative. Questo tipo di modelli risulta in genere più vantaggioso rispetto a quelli basati su serie storiche univariate, poiché è possibile specificare relazioni che tengano conto in maniera opportuna delle teorie economiche che stanno alla base del fenomeno e di interpretare i parametri del modello di conseguenza. In questo lavoro faremo riferimento a modelli basati sulla specificazione di relazioni funzionali con il fine di stimare in maniera simultanea i flussi turistici in entrata e in uscita dalle regioni. 1.1 I modelli A.I.D.S. A partire dagli anni ‘90, una classe di modelli per la stima della spesa turistica si fa strada nella letteratura applicata: il modello Almost Ideal Demand System (Deaton, Muellbauer, 1980), il cui infelice acronimo è A.I.D.S..

In questa classe di modelli viene descritta la quota di spesa turistica wj in una data regione j, con j = 1, 2,.., n, ottenuta come rapporto fra la spesa turistica nella regione e il totale della spesa turistica allocata in tutte le altre destinazioni concorrenti. L’equazione di riferimento del modello è:

w j = α j + γ iji

∑ ln pi + β j lnxP

⎛ ⎝ ⎜

⎞ ⎠ ⎟ (1.1)

in cui pi è l’indice dei prezzi turistici nella i-esima regione, x è la spesa turistica totale in tutte le regioni divisa per il totale della popolazione

Page 8: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

8

(ovvero la spesa totale pro capite) e P è un indice generale dei prezzi. La spesa turistica nel paese j viene messa in competizione con la spesa verso le altre destinazioni. Il modello è particolarmente flessibile, in quanto permette di tradurre gli assiomi della teoria della scelta in una serie di restrizioni lineari sui parametri e quindi, di stimare le elasticità di interesse in maniera piuttosto semplice.

In letteratura esistono due diverse formulazioni del modello A.I.D.S., che si traducono in due diversi metodi di stima. La prima considera tutte le variabili esplicative della variabile risposta come esogene e si traduce in una stima dei parametri attraverso le usuali tecniche dei minimi quadrati. Applicazioni di questa formulazione per la stima della domanda turistica si trovano in Brau (1994), Durbarry (2000a) oppure De Mello et al. (2002). La seconda considera endogena la variabile relativa all’indice dei prezzi P, presente nell’equazione di stima, e pertanto si traduce in un sistema di equazioni la cui stima richiede le procedure della seemingly unrelated regression (Zellner, 1962). Un’applicazione di questa seconda formulazione nell’ambito della spesa turistica si trova in Papatheodoru (1999).

I modelli A.I.D.S. prevedono come variabile di risposta la quota di spesa nella regione di destinazione. Questa informazione non è disponibile a livello regionale, ma soltanto nei dati del turismo internazionale rilasciati, nel caso italiano, dall’Ufficio Italiano dei Cambi. Pertanto, questo tipo di approccio risulta complicato qualora si vogliano esplorare le dinamiche turistiche a livello interregionale. 1.2 I modelli gravitazionali L’ISTAT rilascia, a partire dal 1998, le matrici di origine/destinazione delle presenze turistiche tra le venti regioni italiane; l’approccio seguito nel presente lavoro è dunque quello di formulare un modello per le presenze turistiche interregionali, utilizzando come variabile dipendente le presenze turistiche e come variabili esplicative principalmente i dati derivanti dai Conti Economici Regionali.

Mentre per i modelli di tipo A.I.D.S. si può identificare una struttura teorica sottostante prevalentemente di carattere micro-economico, i modelli di tipo gravitazionale pongono la loro attenzione sui meccanismi macro che sottendono alla formazione degli scambi economici, adattando il concetto di gravitazione formulato da Newton nel 1686 alle problematiche economiche. Il primo tentativo in questo senso fu avanzato

Page 9: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

9

da Tinbergen (1962) che suggeriva l’applicazione di una logica gravitazionale ai problemi del commercio internazionale. Nella sua formulazione di base, l’ammontare del commercio tra due stati veniva posto come direttamente proporzionale alla loro dimensione, ovvero alla forza di attrazione di ciascuna area, misurata attraverso il Prodotto Interno Lordo, ed inversamente proporzionale a alla distanza tra i centri economici principali dei due stati come elemento di frizione tra ciascuna coppia di aree.

Formalmente, indicando con X l’ammontare dello scambio commerciale tra due paesi e con i pedici i e j rispettivamente il paese di origine e quello di destinazione dello scambio, il modello gravitazionale può essere così espresso:

Xij =Yi ×Y j

Dijβ (1.2)

dove - Yi è il Prodotto Interno Lordo del paese di origine i; - Yj è il Prodotto Interno Lordo del paese di destinazione j; - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima.

Il modello gravitazionale è stato ampiamente utilizzato in letteratura nella stima dei flussi di commercio internazionale e per valutare l’impatto di certe scelte di politica economica sul commercio, sia nella sua versione di base, sia esteso in modo da comprendere variabili di natura diversa. Inoltre, a partire dal contributo seminale di Anderson (1979), diversi lavori hanno cercato di giustificare il modello gravitazionale a partire dai diversi approcci della teoria economica; Bergstrand (1985) mostra invece la sua corrispondenza alla forma ridotta di un modello strutturale.

L’applicazione al contesto turistico dell’approccio gravitazionale non è particolarmente diffuso in letteratura a causa della scarsa disponibilità di dati di tipo bilaterale sui flussi turistici, e si ritrovano quasi esclusivamente nel caso del turismo internazionale. Un’utile anche se non aggiornata rassegna a tale riguardo si trova in Grasselli (1989), mentre tra i più recenti contributi ricordiamo quelli di Durbarry (2000b), Garìn-Muñoz e Amaral (2000) e Song et al. (2003).

In questo lavoro faremo riferimento ad un approccio di tipo gravitazionale al fine di modellare la matrice dei flussi turistici tra le diverse regioni italiane; come meglio vedremo nel prossimo capitolo, uno dei problemi principali è quello della scelta delle variabili di gravitazione più opportune da inserire nel modello econometrico. Per il momento, ci limitiamo a dire che i problemi di scelta del modello dovrebbero riguardare

Page 10: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

10

i tre seguenti aspetti: • la specificazione delle variabili di attrazione per la regione di

destinazione; • la specificazione delle variabili di espulsione per la regione di origine; • la specificazione di una misura di distanza fra le due regioni.

Riguardo alle variabili di attrazione, è opportuno sottolineare come, per i fenomeni di carattere turistico, queste dovrebbero rispecchiare in qualche misura la propensione al turismo delle regioni ed il grado di “turisticità” delle stesse. Le statistiche ufficiali riguardanti l’offerta turistica ci permettono di tenere conto del numero di posti letto presenti nelle strutture ricettive alberghiere e complementari, che dovrebbero, in una certa misura, rispecchiare le aspettative degli operatori in termini di presenze turistiche. Accanto a ciò, sarebbe comunque opportuno considerare sia l’aspetto delle infrastrutture turistiche presenti in una certa regione, sia le caratteristiche proprie della regione che possono assumere una qualche valenza turistica: le caratteristiche morfologiche che la fanno preferire per un certo tipo di villeggiatura, la ricchezza della regione in termini di città d’arte, siti archeologici e via dicendo. Tuttavia, queste variabili, pur racchiudendo molte informazioni sui flussi turistici generati fra regioni, non colgono totalmente le motivazioni che rendono una regione attraente dal punto di vista turistico. Infatti, da un lato, una discreta parte di spostamenti avvengono per motivazioni diverse dalla semplice vacanza essendo collegati alle visite presso parenti e amici o a semplici spostamenti per motivi di lavoro, dall’altro le cause sottostanti ad uno spostamento per motivi turistici possono essere legate a fattori culturali, politici o di abitudine, che non possono essere catturati unicamente attraverso le variabili economiche tradizionali.

Per la componente di espulsione è opportuno tenere conto di variabili connesse in qualche misura alla popolazione della regione di origine dei flussi turistici, dato che i flussi turistici sono espressi in termini di numero di visitatori o di presenze turistiche, nonché alla capacità di spesa della popolazione, che rappresenta il fattore economico che spinge alla scelta di un certo soggiorno.

Per quanto riguarda una misura della distanza, dobbiamo distinguere fra una distanza di carattere "fisico" e una distanza di carattere "socio-economico". Nella prima, entrano in gioco fattori che misurano sia la distanza geografica che la difficoltà di trasferimento da una regione all’altra dovuta all’assenza di adeguate connessioni. Per quanto riguarda la distanza di natura socio-economica, nel raffronto fra due regioni occorre tenere in considerazione sia di diversità economiche, quali la differenza nei livelli dei prezzi, sia di diversità morfologiche che rendono due regioni

Page 11: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

11

speculari e pertanto capaci di generare flussi turistici. La struttura dei dati a disposizione, ovvero la serie storica delle matrici

di origine/destinazione delle presenze turistiche nelle regioni italiane fanno si che i modelli che utilizziamo siano di tipo panel.

In generale si parla di dati panel quando per uno stesso insieme di osservazioni di tipo cross-section, si ha a disposizione una serie di misure ripetute ad intervalli di tempo equispaziati. La combinazione tra dati trasversali e dati temporali permette non soltanto di impostare un modello a fini previsivi, ma anche di inserire tra le variabili esplicative quelle di carattere socio-demografico, per le quali manca una sufficiente variabilità rispetto al tempo. In letteratura non sono molti i lavori che propongono l’utilizzo di dati panel in ambito turistico, nonostante questo tipo di studio permetta un’analisi che non risente della ridotta dimensione temporale delle serie storiche disponibili; tra gli studi disponibili ricordiamo quelli di Carey (1991), Tremblay (1989) e Yavas e Bilgin (1996).

Nel modello panel che qui proponiamo, la dimensione multiregionale della matrice dei flussi turistici rappresenta la componente sezionale del campione, a cui si associa un’ulteriore dimensione temporale derivante dalle serie storiche delle diverse variabili di interesse. In particolare, chiamando X la variabile dipendente del modello legata alle presenze turistiche, la generica osservazione del modello sarà indicata da xijt dove il pedice i rappresenta la regione di origine del flusso turistico, il pedice j la regione di destinazione, mentre t indica il periodo di tempo di riferimento. La funzione della domanda turistica attorno a cui ruota il modello di stima avrà dunque la seguente struttura: xijt = f z'it , z' jt , z'ijt , uijt( ) (1.3)

dove, ad ogni istante t, - z'it è un vettore di variabili esplicative riferite alla regione di origine;

- z'jt è un vettore di variabili esplicative riferite alla regione di destinazione;

- z'ijt è un vettore di variabili esplicative riferite alla particolare coppia di regioni i e j;

- uijt è un termine di disturbo che cattura tutte gli effetti non osservabili e le determinanti non direttamente incluse nel modello. Per il momento ipotizziamo che tutti i predittori mostrino anche una

certa variabilità rispetto al tempo. Ovviamente il modello di stima può essere specificato in diversi modi.

Page 12: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

12

1.3 Il modello gravitazionale con gli effetti di regione I modelli gravitazionali hanno trovato un certo successo nelle applicazioni in ambito economico, sia per le proprietà econometriche che permettono di interpretare i parametri di un modello di questo tipo in elasticità della domanda, sia per la loro forza in termini previsivi, accresciuta dalle buone performance delle statistiche diagnostiche. Tuttavia, nel caso di relazioni bilaterali, il modello gravitazionale tende in genere a sovrastimare i flussi tra regioni poco legate e a sottostimare invece quelli più importanti. Come sottolineato da più parti (Cheng, Wall, 2002), questo tipo di problema può essere dovuto alla presenza di eterogeneità nelle diverse coppie bilaterali, che solitamente non viene presa in considerazione negli approcci di tipo cross-section. In questa ottica, un approccio di tipo panel è invece da preferire poiché i problemi di eterogeneità tra le regioni possono essere modellati attraverso i cosiddetti error component models in cui si prevede l’inclusione di un effetto individuale specifico per le regioni coinvolte nel flusso turistico. In questa sede faremo riferimento ad una particolare specificazione di questo tipo di modelli in cui si ipotizza la seguente struttura per l’errore

uijt = α i + γ j +ε ijt (1.4)

dove αi denota l’effetto attribuibile alla generica regione di origine, γj quello specifico per le regioni di destinazione, mentre εijt è un termine di errore residuo che varia sia rispetto alle coppie bilaterali che rispetto al tempo e che possiede le usuali caratteristiche di un modello di regressione lineare. Dal punto di vista econometrico gli effetti specifici possono essere trattati come fissi (fixed effects) oppure casuali (random effects). Nel primo caso, gli effetti ⟨i e ©j sono supposti parametri fissi oggetto di stima, mentre i termini εijt rappresentano variabili casuali indipendenti e identicamente distribuite IID(0,σε

2); al contrario, in un approccio con effetti casuali, le componenti di errore sono supposte variabili aleatorie tra loro indipendenti.

Un modello a effetti fissi è appropriato quando l’oggetto dell’analisi è un insieme ben determinato di unità cross-section, mentre un modello a effetti casuali è più appropriato quando le unità cross-section osservate sono state selezionate in maniera aleatoria da una popolazione più grande. Nel nostro caso, il modello fa riferimento a tutte le possibili coppie bilaterali delle regioni italiane, pertanto un approccio a effetti fissi è più consono. L’inferenza sui parametri del modello sarà dunque condizionata alle venti regioni italiane che danno luogo ai flussi turistici interregionali.

Page 13: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

13

A questo punto possiamo inserire gli effetti di regione nel modello che, in forma matriciale diventa X = D iα +D jγ +Zβ +ε (1.5)

dove Di e Dj sono matrici di variabili dummy, ciascuna formata da un numero di colonne pari al numero delle regioni e contengono le rispettivamente le variabili indicatrici delle regioni di origine e di destinazione dei flussi, mentre la matrice Z conterrà le variabili gravitazionali. Le due matrici degli effetti specifici possono essere definite attraverso opportuni prodotti di Kronecker; inoltre, per evitare problemi di perfetta dipendenza lineare con l’intercetta del modello, ciascuna di esse prevede restrizioni sui parametri individuali. 1.4 Il problema del bilanciamento della matrice dei flussi turistici Il problema delle variabili misurate con errore è molto frequente nella letteratura statistica di carattere economico e molte proposte sono state avanzate rispetto a questa situazione da diversi anni. Il problema degli errori di misura assume una rilevanza particolare nel caso della costruzione dei sistemi di conti economici che sono, come noto, soggetti ad una serie di vincoli di quadratura. In pratica accade che un sistema di equazioni in cui dovrebbero valere una serie di uguaglianze contabili risulta invece sbilanciato a causa della presenza di errori, dovuti sia a semplici errori di misurazione, sia alla natura campionaria di alcune informazioni.

Errori di misura si verificano anche nel caso delle matrici di origine/destinazione delle presenze turistiche utilizzate nel presente lavoro. Nella costruzione delle matrici delle presenze turistiche può accadere che, a causa dell’incompletezza dei dati di base, non sia possibile allocare opportunamente i turisti in base all’effettiva regione di origine. Pertanto, i totali di colonna di una matrice osservata delle presenze non coincidono con l’ammontare complessivo di presenze registrate dalle diverse strutture ricettive delle regioni di destinazione. Come conseguenza si avranno a disposizione, per le presenze secondo la regione di destinazione, due diverse distribuzioni: una che deriva direttamente dalla matrice di origine/destinazione che contiene tutti i clienti delle strutture ricettive correttamente classificati, ed una seconda distribuzione che contiene invece i dati sull’ammontare delle presenze nelle strutture a prescindere dalla regione di residenza che può essere considerata come un vincolo contabile, riflettendo una maggiore completezza dei dati.

Page 14: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

14

1.5 Il modello di bilanciamento I metodi statistici utilizzati per bilanciare le poste di una matrice origine/destinazione in modo da fare coincidere i totali di riga e di colonna con una serie di vincoli contabili, fanno riferimento allo stimatore proposto da Stone, Champernowne e Meade (1942) e rivisitato successivamente da Byron (1978). Il problema del bilanciamento delle stime può essere trattato come un particolare problema di stima pesata e vincolata, in cui il sistema dei pesi è collegato alla variabilità e al diverso grado di attendibilità degli aggregati di partenza, mentre i vincoli lineari che devono essere soddisfatti derivano proprio dal bilanciamento dell’intero sistema di equazioni.

In questo tipo di approccio si suppone generalmente che la variabilità del processo che governa le stime dei diversi aggregati sia nota a priori; in questo caso si dimostra come è possibile costruire una nuova serie di stime di massima verosimiglianza, ricorrette sulla base della loro varianza relativa, che soddisfano i vincoli contabili. In certi casi (Weale, 1992) è possibile pervenire al bilanciamento anche se non si conosce la varianza delle stime originarie, utilizzando come stimatore la varianza campionaria derivante da una serie storica di osservazioni.

In questo paragrafo descriviamo brevemente la struttura dello stimatore SCM così come presentato da Byron (1978).

Il problema può essere posto nel modo seguente: per ogni tempo t, si consideri un vettore X0t di dimensione p, di stime iniziali o di osservazioni che potrebbero essere affette da errori di misurazione, tali da determinare un mancato bilanciamento delle poste rispetto alle due distribuzioni marginali. Nel nostro caso dove p=20x20, la dimensione della matrice di origine/destinazione di ciascun anno della serie. Sia inoltre Xt

* il corrispondente vettore dei valori veri che risultano però non osservabili. Sia inoltre ht il vettore dei vincoli che devono essere soddisfatti, che il vettore dei valori veri deve soddisfare. Poiché le derivazioni che faremo sono uguali ad ogni istante t, in questa sezione si omette il pedice t. Assumiamo, per il momento che i due vettori siano legati da un modello del tipo

X0 = X* +ε (1.6) dove, per la componente casuale si assume che ε ~ N p (0,Ω) (1.7) con Ω nota a priori. Il vettore ∑ raccoglie allora tutte le perturbazioni

non osservabili presenti nelle osservazioni. In base all’equazione precedente si assume quindi che le stime iniziali possano essere ritenute non distorte. Inoltre, supponiamo che l’errore non dipenda dal vettore dei

Page 15: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

15

valori veri, ovvero E( X* ,ε' ) = 0 (1.8) che rientra tra le ipotesi standard del modello di regressione lineare con

errori sferici. Come abbiamo detto, alcuni aggregati che compongono il vettore X*

debbano soddisfare una serie di vincoli di bilancio, esprimibili in modo equivalente in una delle due forme seguenti

AX* = 0 (1.9) GX* − h = 0 (1.10) in cui A è una matrice di contrasti linearmente indipendenti che

esprimono i coefficienti delle combinazioni lineari, G è invece una matrice di aggregazione degli elementi del vettore mentre h è un vettore di costanti.

Il vettore dei valori osservati X0, ovviamente, non soddisfa l’insieme di vincoli, a causa della presenza della componente di disturbo; il problema è allora quello di riaggiustare il vettore delle osservazioni, ovvero di determinare un nuovo vettore di stime ˜ X che soddisfi i vincoli contabili, in modo tale che la distanza tra il nuovo vettore di stime e quelle iniziali sia minima. Si tratta dunque di risolvere rispetto ad X un problema di minimizzazione vincolata per la seguente funzione obiettivo

F =12

( X − X0 )' Ω −1( X − X0 ) + λ' (GX − h ) (1.11)

che corrisponde ad un ordinario problema dei minimi quadrati vincolati in cui la matrice di varianze e covarianze è utilizzata come sistema di ponderazione in modo tale da tenere conto, nel processo di riaggiustamento, del diverso grado di precisione delle stime iniziali. L’ottimizzazione ha come soluzione

˜ λ = GΩG'( )−1 GX0 − h( )˜ X = X0 − ΩG' ˜ λ

⎧ ⎨ ⎪

⎩ ⎪ (1.12)

da cui, sostituendo l’espressione di ˜ λ si ottiene:

˜ X = X0 −ΩG' GΩG'( )−1 GX0 − h( ) (1.13) ovvero, sviluppando il prodotto e mettendo in evidenza X0 si ha:

˜ X = I− ΩG' GΩG'( )−1G[ ]X0 + ΩG' GΩG'( )−1 h. (1.14)

Nel caso in cui i vincoli siano posti come contrasti lineari nulli (ovvero utilizzando la 1.9, piuttosto che la 1.10), lo stimatore avrà invece una forma leggermente più semplice:

˜ X = I− ΩA' AΩA'( )−1 A[ ]X0 . (1.15)

Page 16: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

16

La cosa da sottolineare, in entrambe le versioni dello stimatore, è che sono proprio le varianze relative a rappresentare il fattore attraverso cui le stime iniziali vengono riscalate. Si può facilmente verificare dalle precedenti espressioni come E[ ˜ X ]=X*, ovvero che il bilanciamento delle stime iniziali non introduce distorsioni, mentre la varianza delle nuove stime sarà data da

Var ˜ X [ ]= E ˜ X − X*( ) ˜ X − X*( )'⎡

⎣ ⎢ ⎢

⎦ ⎥ ⎥

= Ω − ΩG' GΩG'( )−1GΩ. (1.16)

Essendo Ω una matrice di varianze e covarianze, la matrice

ΩG' GΩG'( )−1GΩ risulta essere semi-definita positiva e, avendo segno negativo,

rappresenta la riduzione di varianza che si ottiene con il bilanciamento dei dati. Pertanto la varianza dello stimatore SCM non è mai superiore a quella del vettore delle stime iniziali Ω.

Alcune osservazioni aggiuntive devono essere avanzate proprio rispetto alla matrice di varianze e covarianze iniziale, che abbiamo supposto essere nota. Nel caso in cui i diversi aggregati che compongono il vettore delle stime iniziali siano stati ottenuti in modo indipendente, allora la sua struttura sarà quella di una matrice diagonale. Questa ipotesi non è realistica quando si possa sospettare la presenza di un qualche fattore di distorsione sistematica nelle stime iniziali. Se, oltre che diagonale, tale matrice è posta pari a σ2I, con I la matrice identità, allora si verifica agevolmente che il fattore σ2 nella equazione (1.14) si elide. 1.6 Inclusione di una forma lineare 1.6.1 Il vincolo lineare La metodologia esaminata nel paragrafo precedente è riferita ad una struttura del modello in un contesto di tipo uniperiodale. Possiamo ora estendere quanto detto considerando che l’insieme delle stime iniziali consista, per ciascun aggregato considerato, in una serie storica di T osservazioni, in cui per ciascun periodo devono essere soddisfatti un certo insieme di vincoli contabili. Inoltre, introduciamo nel modello una componente sistematica di tipo lineare; in questo modo, assumiamo per il vettore dei valori iniziali una forma del tipo (1.5) che qui riscriviamo sinteticamente:

Page 17: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

17

X = Zβ + U con U ~ NTp 0,Ω( ) (1.17) dove, ricordiamo, p=20x20 ed in cui X è un vettore di dimensioni Tpx1,

Z è una matrice di variabili esplicative di dimensioni Tpxq, β è un vettore di q parametri incogniti, U è un vettore di dimensioni Tpx1, di disturbi casuali normali con Ω matrice di varianza e covarianza che in questo caso avrà dimensioni TpxTp ed una struttura a blocchi, ciascuno dei quali riferito ai diversi vettori di ogni periodo. Si tratta dunque di stimare un insieme di parametri incogniti e individuare, sulla base del modello lineare e delle stime iniziali, un nuovo vettore di stime teoriche che, come nel caso precedente, soddisfino i vincoli richiesti. Consideriamo, in questo caso, la funzione di log-verosimiglianza che avrà una forma molto simile a quella della (1.11)

F = −

12

log Ω −12

X − Zβ( )' Ω −1 X − Zβ( )+ λ' GZβ -h( ). (1.18)

L’insieme dei vincoli contabili è sempre determinato tramite la matrice di aggregazione G, questa volta di dimensioni TkxTp. Nel caso in cui si dovesse stimare un modello senza alcun vincolo sui parametri, il problema rientra nuovamente nel caso della stima di un modello lineare generalizzato con matrice di varianza nota, la cui soluzione, per il vettore dei parametri incogniti, è data da ˆ β * = Z' Ω −1Z( )−1

Z' Ω −1X. (1.19) In questo caso, il vettore dei valori teorici ˆ X * = Z ˆ β * rappresenta un

punto di minimo, però non essendo uno stimatore vincolato, nulla ci assicura che i nuovi valori soddisfino i vincoli richiesti.

Il punto di ottimo si ottiene risolvendo il sistema delle derivate parziali della funzione obiettivo rispetto ai parametri β e λ e imponendo che le derivate parziali si annullino; il controllo sulle derivate seconde assicura che il punto scelto sia un massimo. Il sistema è:

∂F∂β

= −Z' Ω −1X + Z' Ω −1Z( )−1β − Z'G' λ = 0

∂F∂λ

= GZΩ − h = 0

⎨ ⎪ ⎪

⎩ ⎪ ⎪

(1.20)

che conduce al seguente stimatore vincolato di massima verosimiglianza per ˆ β :

ˆ β = ˆ β * + (Z' Ω −1Z )−1Z'G' W −1(h − GZ ˆ β * )ˆ λ = W −1 h − GZ ˆ β *( )

⎧ ⎨ ⎪

⎩ ⎪ (1.21)

dove ˆ β * è lo stimatore dei minimi quadrati generalizzati non vincolati

Page 18: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

18

della (1.19) e W = GZ(Z' Ω −1Z)−1G'Z' . In generale, Ω è una matrice incognita. In tal caso al sistema precedente

si devono aggiungere le equazioni relative alle derivate della funzione obbiettivo rispetto agli elementi di Ω. Data la similarità con il problema delle equazioni seemingly unrelated (Zellner, 1962) non trattiamo diffusamente questo caso: si veda Johnston e DiNardo (1997). Nel caso semplice in cui Ω è una matrice diagonale, Ω = σ 2I, con I la matrice identità di dimensioni TpxTp e σ2 un valore incognito, si verifica agevolmente che lo stimatore di massima verosimiglianza di σ2, una volta dato il valore di ˆ β , è:

ˆ σ 2 =1

TpX − Z ˆ β ( )' X − Z ˆ β ( )= SSE

Tp

dove SSE è la somma dei quadrati dei residui. La metodologia presentata ha un interesse in questa sede in cui abbiamo

l’esigenza di riquadrare i flussi turistici stimati attraverso il modello, con i vincoli derivanti dalle rilevazioni ufficiali. Sia ht il vincolo al tempo t. Se ht coincide con il vettore dei totali di riga delle celle della matrice input-output al tempo t, allora il vincolo lineare è automaticamente soddisfatto nel momento in cui il modello contenga un parametro di intercetta per ogni regione j e per ogni tempo t. Si verifica infatti che in tal caso le equazioni di stima mediante il metodo dei minimi quadrati impongono che ∑∑ =

iijt

iijt xx

ovvero in ogni anno t e per ogni regione j, il totale di flussi in ingresso stimati attraverso il modello coincide con il totale dei flussi osservati in ingresso. Se ne deduce che il vettore ˆ β sarà tanto più lontano da ˆ β * tanto maggiore è la distanza fra questi due vettori. 1.6.2 Il vincolo non lineare Il modello gravitazionale che consideriamo impone che la variabile dipendente sia una trasformazione logaritmica delle variabili di studio. Questo porta a considerare il problema della stima del modello sotto vincoli non lineari sui parametri. La trattazione che segue si riferisce ad una generica funzione non lineare, in modo da prestarsi anche a situazioni in cui la variabile oggetto di studio presenti problemi di eteroschedasticità, che inducono a trasformazioni non lineari di altro tipo. Sia f(β) la funzione non lineare dei parametri β tale per cui Gf β( )= h . La funzione obiettivo è pertanto:

Page 19: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

19

F = −12

log Ω −12

X − Zβ( )' Ω −1 X − Zβ( )+ λ' G[ f β( )− h] (1.22)

Supponiamo per il momento che Ω sia nuovamente nota. Le derivazioni precedenti si ripetono in maniera del tutto analoga nel caso trattato, ma la soluzione del sistema di equazioni non porta ad una espressione esplicita per lo stimatore dei parametri β. Il problema della determinazione del punto di ottimo può essere risolto linearizzando il vincolo attraverso l’espansione in serie di Taylor intorno a un valore β0. Si ha, infatti:

f β( ) ≈ f β 0( )+∂f∂β

β − β 0( )

Indicando con A0 la matrice A0 = G ∂f∂β

⎝ ⎜

⎠ ⎟

β 0

e con H0 il vettore

H0 = h −Gf ( β0 ) + Aβ0 , il vincolo può essere approssimato con A0β − H0 = 0 Il sistema può essere risolto iterativamente, calcolando ad ogni

iterazione r, i valori di λr e βr come nel caso lineare e ricalcolando le matrici Ar e Hr Come valore iniziale β0 può essere preso ˆ β *, ovvero la stima di β non vincolata. Nel caso in cui Ω sia una matrice incognita, come nel caso precedente, alle equazioni precedenti si aggiungono quelle relative alle derivate parziali della funzione obiettivo rispetto ad Ω. Il caso semplice in cui Ω = σ2I viene risolto attraverso il calcolo, ad ogni iterazione, di σ r

2 = SSErTp.

Page 20: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

20

Page 21: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

21

2. I MODELLI PER LA STIMA DELLE PRESENZE In questo capitolo sono riportati i risultati principali delle stime dei modelli delineati in precedenza. La variabile dipendente del modello delle presenze, intra-regionali e interregionali, è rappresentata dalle presenze turistiche registrate nelle strutture ricettive alberghiere e complementari così come si desumono dalle matrici di origine e destinazione pubblicate dall’ISTAT a partire dal 1998. Ciascuna matrice dei flussi turistici è composta da 400 osservazioni regionali, di cui 380 attinenti all’insieme dei flussi turistici bilaterali e 20 relative alla componente intra-regionale. In questo modo il panel a disposizione per la stima dei modelli è composto da 1900 osservazioni di flussi tra regioni e di 100 osservazioni per i flussi turistici interni. Di queste, tutte le osservazioni riguardanti la regione Piemonte per gli anni 1998 e 1999 risultano mancanti per problemi sorti al momento della raccolta dei dati da parte dell’ISTAT. 2.1 Il modello interregionale con variabili contemporanee La specificazione del modello gravitazionale per i flussi delle presenze tra regioni, ha riguardato le seguenti fasi: a) la scelta delle variabili di tipo gravitazionale, b) la costruzione delle singole variabili e la definizione della forma funzionale e c) la corretta specificazione del modello in termini di dinamica dei flussi. I prossimi paragrafi saranno dedicati alla descrizione dettagliata di queste diverse fasi, enfatizzando sia gli aspetti riguardanti la specificazione delle variabili che i problemi riguardanti la stima dei parametri del modello di regressione. In questa parte, i modelli che consideriamo, pongono in relazione le presenze turistiche che coinvolgono una coppia di regioni, osservate ad un certo tempo t, con un insieme di variabili esplicative, anch’esse misurate rispetto al tempo t, e non permettono dunque di tenere conto della possibile componente dinamica che determina la formazione delle scelte di carattere turistico. A questo scopo utilizzeremo il cosiddetto pooled estimator (Johnston, DiNardo, 1997) che trasferisce le ipotesi di un modello lineare classico con componente d’errore omoschedastica ed incorrelata al contesto dei dati panel.

Page 22: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

22

Come punto di partenza per la specificazione del nostro modello gravitazionale consideriamo un nucleo, che chiameremo per brevità "Modello 1", in cui compaiono il numero di posti letto nelle strutture ricettive come variabile di attrazione, il reddito disponibile a prezzi costanti come variabile di espulsione e la distanza chilometrica tra i capoluoghi delle regioni del flusso bilaterale, come variabile di distanza. Indicando con i la regione di origine e j la regione di destinazione e con t il tempo, l’equazione del Modello 1 è la seguente:

lnxijt = β0 + β1lnRDit + β2lnPL jt + β3lnDij + uijt (2.1) dove con RDit indichiamo il reddito disponibile, con PLjt i posti letto e

con Dij la distanza. Per un modello di questo tipo ci aspettiamo che ®1, ®2>0 e che ®3<0, ovvero che il reddito disponibile e i posti letto, rappresentando il primo la forza espulsiva della regione di origine, il secondo la capacità attrattiva della regione di destinazione, presentino una relazione positiva con il numero delle presenze, mentre per la distanza, che può rappresentare una componente di freno nei flussi turistici, ci aspettiamo una discordanza con le presenze turistiche ed un parametro di segno negativo. La tabella che segue mostra le stime dei minimi quadrati di questo primo modello.

Tabella 2.1

STIME DEI PARAMETRI DEL MODELLO 1

Variabili Stima Errore Std. t test Pr(>|t|) Intercetta -5,5478 0,2943 -18,85 <0,001 RDit 0,9682 0,0137 70,40 <0,001 PLjt 1,0058 0,0156 64,53 <0,001 Dij -0,6967 0,0253 -27,56 <0,001

8446,02 =R ; F = 3365; p-value = 0

L’inclusione di queste tre sole variabili ci permette di spiegare quasi

l’85% della variabilità complessiva delle presenze turistiche. Rispetto a questi risultati preliminari è possibile estendere il modello gravitazionale in modo da inserire nel modello variabili con una particolare valenza economica e cercando anche di migliorarne le caratteristiche complessive. Pertanto nei paragrafi seguenti discuteremo nel dettaglio le caratteristiche delle altre variabili che possono essere ritenute importanti nella formazione dei flussi di presenza turistica.

Page 23: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

23

2.1.1 Il Prodotto Interno Lordo a prezzi costanti I dati sul reddito disponibile delle famiglie sono stati rilasciati dall’ISTAT, per il dettaglio regionale, nel mese di settembre 2004. In questo modo è stato possibile tenere conto di queste informazioni nel modello gravitazionale. In assenza del reddito disponibile delle famiglie, l’alternativa consiste nel Prodotto Interno Lordo a prezzi costanti. Questa grandezza, inserita in un modello gravitazionale per i flussi turistici, si presta all’interessante interpretazione di tipo economico secondo cui una quota consistente dei pernottamenti nelle strutture ricettive è da addebitarsi a spostamenti per motivi diversi da quelli della semplice vacanza, come ad esempio i viaggi di lavoro. Questa componente delle presenze male si accompagna alla capacità di spesa delle famiglie residenti, mentre trova una più naturale associazione con una misura del reddito che include le potenzialità economiche della regione da cui il flusso turistico ha origine (Song et al., 2003).

La forte correlazione lineare fra il PIL e il reddito disponibile (r = 0,99) rende l’applicazione dell’una o dell’altra variabile praticamente equivalente in termini delle caratteristiche del modello. La stima di un modello gravitazionale che contiene il PIL anziché il reddito disponibile, dà risultati molto simili sia dal punto di vista del valore dei coefficienti che delle altre statistiche di riferimento ( R 2 = 0,8438). Tuttavia, la distribuzione dei residui presenta per questo caso un’asimmetria negativa più accentuata. Per tali ragioni, e per l’effettiva valenza economica del reddito disponibile delle famiglie, il precedente Modello 1 sembra essere la scelta migliore. 2.1.2 La variabile di distanza Un altro elemento chiave di un modello gravitazionale riguarda la variabile che misura la distanza tra le due regioni. Come prima si accennava, distanze maggiori potrebbero associarsi a tragitti comodi che ne facilitano la percorrenza; al contrario, località che sono geograficamente vicine a quelle di origine, potrebbero non essere facilmente raggiungibili a causa della mancanza di adeguate strutture stradali o per la particolare conformazione morfologica del territorio. La mera distanza geografica potrebbe essere quindi sostituita con una variabile che descrive piuttosto l’accessibilità della località di destinazione rispetto a quella di origine. Un primo indicatore di accessibilità può essere ricavato mettendo a rapporto proprio la distanza chilometrica tra due località e la corrispondente distanza in linea d’aria; tanto più questo rapporto risulta superiore all’unità quanto più tortuoso è il tragitto stradale di collegamento. Una misura alternativa dell’accessibilità di una data regione può essere espressa in termini di tempo di percorrenza del tragitto necessario a raggiungerla:

Page 24: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

24

ovviamente maggiore è il tempo di percorrenza minore dovrebbe risultare l’appetibilità di una certa destinazione di viaggio. In certi casi però la sola analisi della distanza o del tempo di percorrenza risulta insufficiente, infatti una certa località potrebbe essere preferita ad un’altra geograficamente meno distante o separata da una percorrenza equivalente, soltanto per motivi di abitudini o per il tipo di offerta turistica che propone. Per sintetizzare in maniera opportuna un’unica variabile di accessibilità si può ricorrere all’analisi in componenti principali che è in grado di sintetizzare le diverse proprietà di più variabili legate ad uno stesso fenomeno.

Le variabili di cui si è tenuto conto nell’analisi in componenti principali, mettono in relazione i due capoluoghi di regione della coppia considerata e riguardano: • il rapporto tra distanza chilometrica e distanza in linea d’aria; • il tempo di percorrenza considerando il tragitto più conveniente.

La determinazione di queste tre variabili di base è stata ottenuta attraverso i dati disponibili del Touring Club Italiano (Atlante Stradale d’Italia, 2003; Autoatlante d’Italia, 2002).

L’analisi in componenti principali ha mostrato come la prima componente spiega quasi il 95% della variabilità complessiva delle tre variabili originarie e risulta correlata negativamente con le presenze; rispetto al Modello 1 che contiene la semplice distanza chilometrica, l’utilizzo delle componenti principali dà luogo ad un indice 2R leggermente inferiore (0,834), tuttavia i residui mostrano un andamento più regolare. La leggera curvatura che traspare nel normal probability plot dei residui di questo modello suggerisce la presenza o di un effetto quadratico o di una qualche interazione con le altre due variabili gravitazionali. L’introduzione di un effetto quadratico risulta altamente significativo (p<0,001). Invece, nel caso delle interazioni, si può osservare come soltanto quella tra componente principale della distanza e i posti letto è significativa (p<0,001), mentre al contrario l’interazione tra componente principale della distanza e il reddito disponibile non introduce nel modello nessuna informazione aggiuntiva. Tuttavia, i due effetti, quadratico e di interazione, sembrano essere complementari e non sono significativi congiuntamente. Preferiamo introdurre l’interazione tra la prima componente principale della distanza e i posti letto, a cui possiamo associare un’interessante interpretazione: l’effetto negativo della distanza è mitigato dalla presenza di infrastrutture.

Alcune osservazioni ulteriori possono essere avanzate rispetto al concetto di distanza qui elaborato. Prima di tutto occorre ricordare che le distanze tra le diverse coppie di regioni sono state calcolate con

Page 25: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

25

riferimento ai capoluoghi di regione. Una soluzione migliore da questo punto di vista consisterebbe invece nel calcolare le distanze con riferimento ai centroidi delle regioni, calcolati ponderando opportunamente le distanze di tutti i capoluoghi di provincia; questo permetterebbe di tenere conto dell’effettiva distribuzione della popolazione sul territorio.

Una seconda osservazione riguarda invece le variabili che sono state considerate fino ad ora. Sia le distanze chilometriche che i tempi di percorrenza fanno riferimento a tragitti stradali, che non permettono pertanto di tenere conto di tutti quegli spostamenti fatti con mezzi di trasporto diversi. Un raffinamento necessario della variabile da questo punto di vista riguarda almeno l’introduzione delle distanze ferroviarie e dei tempi di percorrenza ferroviari esistenti tra due regioni, proprio per l’importanza che questa modalità di viaggio assume nella vita quotidiana. 2.1.3 Il ruolo degli investimenti turistici Recentemente, Bougheas et al. (1999) hanno mostrato che, nell’ambito di un modello per il commercio internazionale, i costi di trasporto sono funzione non soltanto della distanza, ma anche delle infrastrutture pubbliche. Gli autori inseriscono pertanto variabili addizionali sulle infrastrutture per le quali si evidenzia una significativa relazione positiva con il volume degli scambi internazionali. Se trasliamo queste considerazioni al contesto dei flussi turistici, possiamo dedurre che una parte del concetto di distanza tra regioni si riflette nella presenza o meno di infrastrutture.

Gli aggregati ricavabili dai Conti Economici Regionali permettono, almeno in parte, di individuare tipologie di investimento per branche proprietarie con una certa valenza turistica. Si tratta degli investimenti delle branche Commercio, Riparazioni, Alberghi e ristoranti, Trasporti e comunicazioni. Se andiamo a misurare l’associazione tra il numero indice in base 1995 di questa voce degli investimenti ed il numero di posti letto, osserviamo un valore dell’indice di correlazione lineare pari a r = 0,48, che denota una leggera concordanza tra le due variabili che lascia spazio ad un possibile miglioramento della capacità predittiva del modello gravitazionale.

Il coefficiente di regressione del modello semplice con i livelli dell’indice degli investimenti non risulta significativamente diverso da zero (p = 0,833). Si costruisce pertanto un indice relativo, dato dal rapporto tra il livello degli investimenti nella regione di origine e quello della regione di destinazione. Per tenere conto in maniera contemporanea sia delle regioni che partono da livelli di partenza inferiori e quelle che invece

Page 26: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

26

sono interessate da dinamiche turistiche rilevanti, consideriamo sia il termine lineare che il quadrato di tale rapporto. In pratica, la forma della variabile può essere così rappresentata

INV j|i,t = lnINV jt

INVit

⎣ ⎢

⎦ ⎥

2

(2.2)

che risulta essere significativa (p<0,01) con un segno del coefficiente di regressione che rispecchia, essendo positivo (0,021), quello atteso. 2.1.4 Variabili Dummy di confine Consideriamo ora l’introduzione nel modello di una serie di variabili dummy che sono in qualche modo legate al diverso grado di accessibilità nelle diverse coppie bilaterali.

In primo luogo, è necessario tenere conto delle regioni che sono tra loro confinanti; si definisce dunque una variabile che assume valore 1 se le regioni coinvolte nel flusso turistico confinano e 0 altrimenti. La variabile così fatta risulta significativa ed il parametro di riferimento è positivo (0,3189); allo stesso modo possiamo pensare di inserire una variabile dummy per i flussi turistici che coinvolgono le due isole, che però non risulta essere significativa (p = 0,975). Se invece di considerare tutti i flussi che coinvolgono le isole consideriamo quelli verso la sola Sardegna; in tale modo la variabile risulta significativa (p = 0,04) ed il valore del parametro corrispondente assume un valore negativo (-0,1312). 2.1.5 Il livello dei prezzi Una variabile di indubbia rilevanza è costituita da un indice dei prezzi turistici della regione di destinazione. Questo indice dovrebbe descrivere l’andamento del prezzo di beni e servizi con rilevanza turistica. Tuttavia, questa variabile è quella per cui si verificano le maggiori carenze informative, per i motivi che abbiamo già delineato. Come abbiamo avuto modo di intuire parlando della distanza, inoltre, una componente rilevante della spesa turistica è rappresentata dai costi di trasporto che dovrebbero pertanto rientrare nel computo di indicatore dei prezzi turistici. Anche in questo senso si dovrebbe tenere conto sia dei costi effettivi dello spostamento sostenuto per il viaggio, che del tempo di percorrenza dello stesso. Essendo il valore del tempo una misura soggettiva, la scelta dei pesi da attribuire ai costi dei diversi mezzi di trasporto non è tuttavia scontata e la scelta migliore potrebbe coinvolgere in qualche misura l’importanza relativa del mezzo di spostamento. La costruzione di questo indicatore non risulta per il momento possibile, sia per la mancanza di informazioni sui collegamenti tra le regioni, sia per la complessità della struttura degli

Page 27: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

27

spostamenti. Da questa discussione possiamo tuttavia trarre un’ulteriore giustificazione all’inclusione dei tempi di percorrenza nella costruzione della variabile di accessibilità, che risolve, anche se parzialmente, questa carenza informativa.

Un secondo ordine di considerazioni è legato al fatto che solo pochi indici sono pubblicati con dettaglio regionale. Questi sono: 1. l’indice dei prezzi al consumo; 2. i deflattori impliciti derivabili dai Conti Economici territoriali. 1. L’indice dei prezzi al consumo viene pubblicato dall’ISTAT a livello dei singoli capoluoghi di regione. Questo può essere utilizzato agevolmente per costruire un indice dei prezzi relativi tra coppie bilaterali di regioni. In particolare, una prima variabile che introduciamo nel modello gravitazionale risulta così definita:

IPC j|i,t = lnIPC jt

IPCit

⎣ ⎢

⎦ ⎥ (2.3)

dove IPCjt è l’indice dei prezzi al consumo nella regione di destinazione j al tempo t, mentre IPCit è lo stesso indice nella regione di origine i, sempre al tempo t. Questa variabile fornisce dunque un indice dei prezzi relativi tra le due regioni coinvolte nel flusso turistico e caratterizza anche un confronto tra il costo della vita nelle due regioni.

Una forte limitazione della variabile così costruita è legata alla base rispetto cui la serie dei numeri indici è costruita. I Conti Economici regionali più recenti pubblicano i dati sugli indici dei prezzi al consumo con base 1995. Una base così ravvicinata rispetto al tempo corrente non permette tuttavia di considerare l’indice dei prezzi come una misura del reale divario esistente tra le diverse regioni in termini di costo della vita, bensì riflette soltanto le diverse dinamiche dei prezzi di breve periodo. Queste risultano di difficile percezione da parte dei consumatori, se riferite ad una regione diversa da quella della propria residenza.

Per tenere conto in modo corretto dei divari territoriali nei prezzi sono state concatenate le serie storiche pubblicate dall’ISTAT nei vari anni, in modo da risalire ad un’unica serie storica dei prezzi al consumo per i capoluoghi di regione, con base 1970. A partire dai nuovi numeri indice dei prezzi al consumo sono stati calcolati di conseguenza i vari indici dei prezzi relativi, che possono questa volta essere interpretati come misura del divario del costo della vita tra coppie di regioni.

Inserendo la variabile dei prezzi nel modello gravitazionale troviamo che il coefficiente di regressione segnala una correlazione negativa tra presenze e indice dei prezzi relativi, infatti ad un rapporto tra prezzi di

Page 28: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

28

destinazione e prezzi di origine elevato si associa un minor numero di presenze turistiche.

Figura 2.2

SERIE STORICA DAL 1970 AL 2002 DELL’INDICE DEI PREZZI AL CONSUMO NEI CAPOLUOGHI DI REGIONE. BASE 1970 = 100

0

200

400

600

800

1.000

1.200

1.400

1.600

1.800

1970

1971

1972

1973

1974

1975

1976

1977

1978

1979

1980

1981

1982

1983

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

Piemonte Valle d'AostaLombardia Trentino Alto AdigeVeneto Friuli Venezia GiuliaLiguria Emilia RomagnaToscana UmbriaMarche LazioAbruzzo MoliseCampania PugliaBasilicata CalabriaSicilia Sardegna

Tabella 2.3

MODELLO 3 CON I PREZZI RELATIVI

Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -0,466 0,5811 -0,80 0,422 RDit 0,967 0,0143 67,57 <0,001 PLjt 1,038 0,0168 61,74 <0,001 Dij -0,694 0,0254 -27,33 <0,001 IPCj|i,t -0,673 0,1218 -5,53 <0,001

2. Ai nostri fini consideriamo il deflattore implicito della spesa delle famiglie, che certamente riflette una parte della dinamica dei prezzi dei servizi turistici, anche se altrettanto certamente non ne coglie la globalità. Il deflattore può essere ricavato agevolmente dai dati della contabilità territoriale, rapportando l’aggregato della spesa a prezzi correnti con quello a prezzi costanti. Anche in questo caso si possono avanzare le considerazioni relative al tempo base fatte per l’indice dei prezzi al

Page 29: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

29

consumo: tuttavia la serie storica della spesa in alberghi e ristoranti parte dal 1995 e pertanto non è possibile slittare la base dell’indice anteriormente a tale data. L’apporto informativo che questo indicatore può dare riguarda pertanto una dinamica dei prezzi di breve periodo. Per questo tipo di indicatore consideriamo anzitutto il modello seguente: lnxijt = β0 + β1lnRDit + β2lnPL jt + β3lnDij + β4 lnIPTij + uijt (2.4)

dove con IPTjt indichiamo il livello dei prezzi impliciti della spesa per alberghi e ristoranti nella regione di destinazione j al tempo t. L’introduzione nel Modello 1 del valore dell’indice dei prezzi turistici nella regione di destinazione dà luogo ad un certo miglioramento del modello: la variabile risulta significativa (p-value<0,01) ed anche nei residui si rileva un andamento più regolare; il valore del parametro associato ai prezzi turistici assume un valore positivo e questo poiché, restando slegato alle dinamiche dei prezzi nella regione di origine, trascina dietro di sé una serie di effetti spuri.

Tabella 2.4

MODELLO 4 CON INDICE DEI PREZZI TURISTICI NELLE REGIONI DI DESTINAZIONE

Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -8,0689 1,2169 -6,63 <0,001 RDit 0,9679 0,0137 70,45 <0,001 PLjt 0,9905 0,0171 57,82 <0,001 Distij -0,6925 0,0253 -27,35 <0,001 IPTjt 0,5641 0,2642 2,13 0,033

Oltre alla precedente specificazione, possiamo anche considerare, come

abbiamo visto per i prezzi al consumo, l’indice dei prezzi relativi tra regione di origine e destinazione, definito in modo analogo come:

IPTj|i,t = lnIPTjt

IPTit

⎣ ⎢

⎦ ⎥ (2.5)

che, però non risulta apportare nessun miglioramento significativo al modello gravitazionale (p-value = 0,14). 2.1.6 Le variabili di offerta turistica La capacità di attrazione di una regione dipende, oltre che dalla capacità ricettiva di cui dispone e dal grado di sviluppo, da fattori di tipo morfologico o culturale che ne determinano la vocazione al turismo. Come nel caso della distanza, è difficile avere a disposizione informazioni di sintesi su questi aspetti. Alcune pubblicazioni ISTAT ad esempio

Page 30: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

30

presentano un indice di turisticità di regione, calcolato come rapporto tra presenze giornaliere della regione in un dato periodo di tempo e popolazione residente nella stessa. Ovviamente, trattandosi di un indicatore basato sulle presenze non è possibile inserirlo tra le variabili esplicative del nostro modello. Una soluzione alternativa consiste nel considerare un insieme di indicatori esistenti a livello regionale in qualche modo correlati con l’attrattività turistica e farne, anche in questo caso, un’opportuna sintesi attraverso l’analisi in componenti principali. A tale proposito, le variabili di cui si è tenuto conto sono in totale 8 e rappresentano: • coste balneabili e superficie montana; • siti archeologici, musei e monumenti pubblici; • teatri e spettacoli dal vivo.

L’analisi in componenti principali mostra che le prime tre componenti principali descrivono circa l’83% della variabilità complessiva di questo tipo di offerta turistica.

Tabella 2.5

PRIME QUATTRO COMPONENTI PRINCIPALI PER LE VARIABILI DI OFFERTA TURISTICA Variabili Comp. 1 Comp. 2 Comp. 3 Comp. 4 Superficie -0,23378 0,16252 -0,69504 0,07200 Montagna -0,04208 -0,52794 -0,53690 0,41697 Coste -0,04116 0,63938 -0,39488 -0,34362 Antichità -0,55555 0,04792 0,14153 0,11194 Musei -0,53514 0,08934 0,13455 -0,01649 Monumenti -0,52567 0,04277 0,15120 0,25878 Spettacoli -0,26559 -0,52341 -0,10835 -0,78937

La prima componente principale sembrerebbe in qualche modo legata

alla capacità offerta globale della regione, in quanto i coefficienti associati a tutte le variabili assumono lo stesso segno, seppure negativo. La seconda e la terza componente fanno invece riferimento ad una certa specializzazione turistica delle regioni in quanto risulta positivamente associata a particolari aspetti di offerta turistica: in particolare, la seconda componente risulta positivamente correlata con la presenza di coste balneabili, di siti archeologici, monumenti e musei, che di fatto rappresentano le forme di attrattività turistica tipicamente più importanti. La prima componente principale, se aggiunta al modello gravitazionale, non apporta un miglioramento significativo (p = 0,53). Per quanto riguarda la seconda componente di offerta, che mette in evidenza aspetti turistici specifici, la sua introduzione nel modello gravitazionale risulta

Page 31: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

31

significativa (p<0,001), che sta a significare un contributo specifico della variabile non messo in luce dalle altre variabili macro-economiche.

Trattandosi di variabili di offerta turistica si potrebbe pensare di sostituirle alla variabile che nel modello gravitazionale rappresenta l’attrazione turistica, ovverosia il numero dei posti letto. Se si sostituisce nel Modello 1 la variabile dei posti letto con le due componenti principali dell’offerta si ottiene un modello peggiore, infatti l’indice di determinazione assume un valore pari a R

2 = 0,6048 che è molto inferiore a quello osservato per il Modello 1. I parametri associati alle due variabili presentano ora entrambi un segno negativo, segno di una correlazione negativa con il numero di presenze, che non ci permette di attribuire loro un significato di capacità di attrazione della regione. Inoltre, anche dal punto di vista diagnostico, i residui presentano una forte asimmetria negativa, che non rispetta le ipotesi di base del modello. 2.1.7 La popolazione residente L’inclusione della popolazione residente di entrambe le regioni è anch’essa di interesse, in quanto la consistenza del flusso turistico in uscita dipende dal numero dei potenziali turisti residenti nella regione di origine, e la numerosità della popolazione della regione in entrata è ovviamente correlata con la sua importanza economica. Le variabili relative alla popolazione possono dunque essere viste in una prospettiva gravitazionale in modo da cogliere sia l’aspetto della dimensione del fenomeno che l’aspetto espulsivo e attrattivo delle regioni coinvolte (Cheng, Wall, 2002). Il modello gravitazionale può assumere quindi la seguente struttura: lnxijt = β 0 + β1lnRDit + β 2lnPLit + β 3lnPOPit + β 4 lnPOP jt + β 5Dij + uijt (2.6)

in cui POPit e POPjt sono in ordine la numerosità della popolazione della regione di origine e destinazione al tempo t. L’inserimento delle due variabili di popolazione porta ad un valore dell’indice di determinazione solo leggermente superiore a quello visto in precedenza (

2R = 0,8451) ed

in cui soltanto il parametro relativo alla popolazione di destinazione risulta essere significativamente diverso da zero, come mostra la tabella seguente.

Page 32: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

32

Tabella 2.6

STIME DEI PARAMETRI NEL MODELLO CON LA POPOLAZIONE RESIDENTE Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -5,5612 0,3529 -15,76 <0,001 RDit 0,9982 0,0719 13,87 <0,001 PLjt 0,9671 0,0217 43,64 <0,001 POPit -0,0291 0,0717 -0,41 0,685 POPjt 0,0489 0,0190 2,57 0,01 Dij -0,6931 0,0255 -27,19 <0,001

Il segno del parametro della popolazione della regione di destinazione

è, come ci si poteva attendere, positivo e quindi positivamente correlato con le presenze. Questo fatto può essere dovuto alla correlazione fra questa variabile e altre variabili che esprimono la dimensione economica, e quindi, il grado di attrazione della regione. Come vedremo, infatti, essa perde importanza con l’inserimento di altre informazioni. Dal punto di vista predittivo, questo modello presenta caratteristiche simili a quello visto in precedenza, catturando un numero equivalente di punti di svolta nelle serie storiche delle presenze. 2.1.8 Variabili in forma pro capite Dal punto di vista della valenza economica del modello gravitazionale sarebbe importante considerare le due variabili relative al reddito e ai posti letto in forma pro capite. Una modifica di questo tipo permette di depurare i parametri dagli effetti spuri legati ad un mero fattore dimensionale. Infatti, regioni piccole ma con un elevato reddito pro capite vanno ad assomigliare a regioni grandi ma con reddito pro capite basso. L’inserimento del reddito pro capite, inoltre, permette di misurare l’influenza della capacità di spesa individuale. Dal punto di vista della potenzialità di attrazione, invece, una regione potrebbe avere un numero di posti letto elevato soltanto perché si tratta di una regione di grandi dimensioni, senza tuttavia rispecchiarne la reale vocazione turistica.

È quindi possibile pensare ad un modello in cui figurano le due variabili in forma pro capite, ovvero ad un’equazione del tipo lnxijt = β0 + β1lnRDPC it + β2lnPLPC jt + β3lnDij + uijt (2.7)

dove con RDPCit indichiamo il reddito disponibile pro capite della regione di origine e con PLPCjt il numero di posti letto pro capite nella regione di destinazione.

Page 33: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

33

Tabella 2.7

STIME DEI PARAMETRI DEL MODELLO CON VARIABILI PRO CAPITE Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta 16,453 0,4179 39,36 <0,001 RDPCit -0,244 0,1972 -1,24 0,216 PLPCjt 0,275 0,0345 6,32 <0,001 Dij -0,943 0,0603 -15,64 <0,001

Come si vede dalla tabella precedente il modello gravitazionale con le

variabili pro capite possiede una capacità predittiva piuttosto limitata: soltanto il 13% della variabilità complessiva dei flussi di presenza viene colta in questo modo; inoltre anche in questo caso i residui presentano una forte asimmetria negativa indice di sottostima dei flussi di minore consistenza. Nonostante ciò, è possibile recuperare informazione affiancando alle variabili pro capite la popolazione delle due regioni coinvolte nel flusso turistico, come visto poc’anzi. In questo modo dissociamo l’informazione sulla forza attrattiva e repulsiva delle variabili pro capite dal fattore di spinta dovuto alla dimensione della popolazione. L’equazione di riferimento è dunque la seguente: lnxijt = β 0 + β1lnRDPCit + β 2lnPLPC jt + β 3lnPOPit + β 4 lnPOPjt + β 5lnDij + uijt (2.8)

che dà luogo ai seguenti risultati in termini di stime dei parametri:

Tabella 2.8

STIME DEI PARAMETRI DEL MODELLO CON VARIABILI PRO CAPITE E POPOLAZIONI Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -3,238 0,2854 -11,35 <0,001 RDPCit 1,041 0,0863 12,06 <0,001 PLPCjt 0,964 0,0219 44,00 <0,001 POPit 0,984 0,0142 69,37 <0,001 POPjt 1,015 0,0162 62,51 <0,001 Dij -0,687 0,0259 -26,46 <0,001

2.1.9 L’inserimento degli effetti di regione In questa parte si considera il modello con l’introduzione di effetti di regione. Come specificato nel paragrafo 2.4, si tratta di aggiungere un’intercetta αi per regione di origine e un’intercetta γj per regione di destinazione. Tuttavia, è necessario fare alcune considerazioni aggiuntive. L’inserimento degli effetti di regione, che in letteratura è sempre auspicato, assume nel nostro caso un ruolo scomodo. Se si considera un

Page 34: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

34

modello in cui sono presenti sia la seconda componente principale che descrive l’offerta turistica che le variabili dummy delle regioni di destinazione, si creano delle relazioni lineari tra variabili, con la conseguenza che la matrice del disegno non è più di rango pieno e che i parametri non possono più essere stimati. Considerare le variabili dummy regionali delle regioni di destinazione significa di fatto considerare tutti quegli effetti non osservabili che competono ai fattori di offerta turistica. In sostanza si tratta quindi di scegliere tra un modello gravitazionale che contiene una specifica variabile di offerta turistica ed un modello che invece contiene tutti gli effetti non osservabili relativi alle capacità di attrazione delle regioni. Entrambe le soluzioni presentano vantaggi e svantaggi, sia dal punto di vista economico che dal punto di vista statistico. I problemi segnalati nella discussione della componente principale di offerta, insieme alla analisi comparata dei residui dei modelli, portano a preferire il modello con le dummy delle regioni di destinazione, che corrisponde ad un’equazione del tipo

lnxijt = γ j + z'ijt β +ε ijt dove z'ijt è il vettore delle variabili gravitazionali per la generica

osservazione, mentre il vettore dei parametri ® conterrà anche l’intercetta generale del modello.

Tale scelta porta ad amplificare la dimensione del vettore dei coefficienti e può costituire un limite. Tuttavia, come vedremo, per arrivare ad un buon modello che soddisfi i vincoli di bilanciamento è opportuno che la dimensione del vettore dei parametri non risulti troppo ristretta. 2.1.10 La scelta delle variabili gravitazionali Tenendo presenti tutte le considerazioni svolte finora per le diverse variabili, e considerando le significatività delle loro differenti combinazioni, è possibile considerare un modello che meglio descrive complessivamente le dinamiche interregionali dei flussi delle presenze. L’equazione proposta è la seguente:

lnx ijt = β0 + β1lnPOPit + β2lnRDPCit + β3lnPLPC jt + β4 lnPCDistij +

+β5Confij +γ j d ij +ε ijt (2.9)

L’inclusione del reddito disponibile pro capite e del numero dei posti letto pro capite ci permette di considerare i fattori di espulsione e di attrazione in termini economici, al netto degli effetti spuri, legati alla dimensione della regione, che potrebbero essere introdotti considerando le due variabili in termini assoluti. L’effetto dimensionale viene recuperato attraverso la variabile della popolazione della regione in uscita che

Page 35: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

35

rappresenta come si è detto un fattore di spinta del flusso turistico. L’effetto di frizione è rappresentato invece dalla prima componente principale della distanza, così come l’abbiamo descritta in precedenza, che permette di tenere conto del grado di accessibilità della regione di destinazione rispetto a quella di origine. Infine consideriamo la variabile dummy relativa alle regioni confinanti, per riprodurre più opportunamente i flussi turistici che coinvolgono regioni adiacenti.

Le diverse interazioni tra variabili che abbiamo considerato nei modelli precedenti non sono state incluse in questo modello in quanto, una volta che le variabili del reddito disponibile e dei posti letto sono poste in forma pro capite, perdono la loro significatività.

Una considerazione a parte deve essere fatta per il modello che coinvolge le variabili dei prezzi relativi e degli investimenti; per entrambe queste variabili, quando aggiunte nel modello gravitazionale con variabili pro capite, si osserva una inversione del segno del relativo coefficiente di regressione. Sulla base delle considerazioni svolte nel paragrafo 3.1, potremmo ritenere il modello che contiene la variabile dei prezzi relativi, così come quella della variabile degli investimenti, fra le esplicative mal specificato, e che queste due variabili sono in realtà endogenamente determinate. A supporto di questo, il modello con le stesse variabili, ritardate di un tempo, non presenta le caratteristiche sopra dette.

Il modello gravitazionale 2.9 non presenta un valore elevato degli indici di adattamento (

2R = 0,48). L’inserimento degli effetti di regione, che

catturarano gli effetti non osservati legati essenzialmente alla capacità di attrazione delle regioni di destinazione, migliora molto il modello (

2R = 0,86), i cui parametri stimati sono riassunti nel prospetto seguente.

Page 36: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

36

Tabella 2.9

MODELLO INTERREGIONALE FINALE PER VARIABILI CONTEMPORANEE Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -3,305 0,581 -5,68 <0,01 POPit 0,998 0,013 75,11 <0,01 RDPCit 0,888 0,087 10,18 <0,01 PLPCjt 1,909 0,162 11,78 <0,01 PCDistij -0,198 0,017 -11,49 <0,01 Confini 0,534 0,041 13,12 <0,01 Valle d'Aosta -4,989 0,426 -11,71 <0,01 Lombardia 1,829 0,104 17,63 <0,01 Trentino -3,113 0,409 -7,61 <0,01 Veneto -0,710 0,229 -3,09 <0,01 Friuli -1,849 0,205 -9,03 <0,01 Liguria -1,127 0,192 -5,86 <0,01 Emilia Romagna 0,179 0,197 0,91 0,36 Toscana -0,604 0,218 -2,76 <0,01 Umbria -1,300 0,155 -8,39 <0,01 Marche -1,600 0,247 -6,46 <0,01 Lazio 0,640 0,106 6,06 <0,01 Abruzzo -1,066 0,165 -6,44 <0,01 Molise -1,830 0,099 -18,31 <0,01 Campania 1,719 0,103 16,63 <0,01 Basilicata 0,549 0,107 5,09 <0,01 Puglia -2,019 0,106 -19,02 <0,01 Calabria -1,346 0,191 -7,03 <0,01 Sicilia 1,635 0,11 14,79 <0,01 Sardegna -0,827 0,185 -4,47 <0,01

2.1.11 Variabili contemporanee e causalità inversa Il vasto numero di modelli considerati in questo contesto ci ha talvolta portato ad osservare coefficienti di regressione stimati con segno opposto rispetto a quello dettato dalla teoria economica. Questo fatto è stato tanto più rilevante in modelli in cui le variabili esplicative sono misurate nello stesso periodo temporale della variabile dipendente. In questa sezione presentiamo la più semplice possibile delle situazioni in cui una inversione di segno si verifica, nel tentativo di gettare luce su questo fenomeno.

Page 37: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

37

Figura 2.10

DUE MODELLI TEORICI ALTERNATIVI

Si considerino i due modelli teorici alternativi di figura 2.10: il modello

(a) in cui la variabile X è risposta della variabile Y e W, e il modello (b), in cui la variabile Y è risposta della variabile X e W. Si suppongano i modelli lineari e ricorsivi con errori non correlati. Pertanto, dopo un opportuno ordinamento delle variabili, questi possono essere scritti nella forma:

BZ = ε in cui B è una matrice triangolare superiore con 1 lungo la diagonale

principale il cui generico elemento -bij è l’opposto del coefficiente di regressione di j nella regressione di i contro tutte le variabili, ε è un vettore di errori a media zero e non correlati, tali che cov (ε) = ∆ è una matrice diagonale. Si verifica attraverso alcuni semplici passaggi che la matrice Σ di varianze e covarianze di Z e la sua inversa Σ−1 sono:

Σ = B-1∆ (B-1)', Σ-1 = B'∆-1 B (2.10) Le matrici Σ e Σ −1 contengono gli elementi che compaiono nei

coefficienti di regressione dei due modelli. In particolare, indicando con σij l’ij-esimo elemento di Σ-1, si dimostra, attraverso i teoremi di inversione di matrici (si veda ad esempio Cox, Wermuth, 1996), che

bij = -(σii)−1 σij In relazione ai due esempi in figura 2.10, il vettore Z è, nel primo

modello, Z = (X,Y,W) e, nel secondo modello, Z = (Y,X,W). Inoltre, nel modello (a): b12 = c, b13 = d e b23 = a, e nel modello (b): b12 = c', b13 = a' e b23 = d'. Le relazioni precedenti implicano che:

a' = m(au-dvc). in cui a, d e c sono i coefficienti di regressione parziale del modello

vero, e m, u e v sono elementi della diagonale principale di Σ e Σ −1, e pertanto sono positivi (si veda la 2.10). Se ne deduce che, se il modello vero è il modello (a), in cui X è la variabile endogena, ma il modello postulato è il modello (b), in cui X è invece esplicativa, a seconda della

Page 38: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

38

entità delle grandezze coinvolte, si può assistere ad una inversione di segno dei coefficienti di regressione parziale fra Y e W.

La realtà dei fenomeni macro-economici è estremamente complessa, e modelli ricorsivi come quelli precedenti possono essere estremamente riduttivi. Spesso, infatti, si verificano a relazioni simultanee fra le variabili osservate e/o effetti spuri indotti da variabili non osservate. Tuttavia, questo semplice esercizio può essere di ausilio per dare una prima spiegazione a situazioni in cui si osservano coefficienti di regressione di segno opposto a quello dettato dalla teoria economica. 2.2 Modello con variabili ritardate Fino ad ora abbiamo considerato modelli in cui le variabili esplicative sono contemporanee rispetto alle presenze turistiche che devono predire. Tuttavia, da un punto di vista economico, un modello di tipo statico è limitativo in quanto non riflette il processo di formazione dei flussi turistici. Le scelte in ambito turistico prevedono nella maggioranza dei casi una componente dinamica: i turisti potenziali, infatti, prendono la decisione di effettuare in viaggio con un certo anticipo, che permetta di organizzare e prenotare il soggiorno nella località di destinazione. La programmazione del viaggio dipende in larga parte anche da una serie di variabili di tipo economico, contemporanee al processo di scelta. Un modello più realistico dovrebbe dunque essere costruito in modo dinamico in modo tale da incorporare in qualche misura l’effetto di tale ritardo. Ciò permette inoltre di utilizzare il modello di regressione anche a fini previsionali (Song et al., 2003).

Ipotizziamo pertanto che la domanda turistica sia influenzata dalle stesse variabili esplicative del modello "Modello 1", ma consideriamo, per le variabili che subiscono variazioni nel tempo, le osservazioni relative all’anno precedente. Questo modello conduce ai seguenti risultati:

Tabella 2.11 MODELLO GRAVITAZIONALE DI BASE CON VARIABILI RITARDATE

Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -5,4885 0,2932 -18,72 <0,01 RDi,t-1 0,9662 0,0137 70,47 <0,01 RL i,t-1 1,0058 0,0155 64,74 <0,01 PCDistij -0,6989 0,0252 -27,61 <0,01

Page 39: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

39

Se confrontiamo queste stime con quelle del corrispondente modello per le variabili contemporanee possiamo anzitutto notare come siano del tutto simili. Questo potrebbe dipendere, da un lato, dalla debole variazione degli aggregati da un anno all’altro, ma anche da una certa robustezza della relazione statistica nelle variabili prese in considerazione. Rispetto ai residui possiamo evidenziare una migliore distribuzione, nonostante sia ugualmente presente un certo grado di asimmetria.

Molte delle analisi effettuate utilizzando le variabili esplicative ritardate hanno mostrato una sostanziale equivalenza dei risultati. Le differenze più rilevanti riguardano l’indice dei prezzi relativi e gli investimenti. Abbiamo visto nel modello con variabili contemporanee che queste due variabili manifestano dei cambiamenti nel segno del coefficiente di regressione a seconda del particolare insieme di regressori in cui sono inserite, e particolarmente in presenza delle variabili economiche in forma pro capite. Una delle cause di questo fenomeno potrebbe essere identificata nella natura endogena delle variabili, che quindi sono legate alle presenze turistiche in maniera più complessa. Questa ipotesi viene avvalorata dal fatto che se reinseriamo in un modello con esplicative ritardate sia i prezzi relativi che gli investimenti, i due coefficienti di regressione tornano ad assumere i segni attesi. Consideriamo dunque un modello, che chiameremo "Modello 1R", avente la struttura seguente:

lnxijt = β0 + β1lnPOPit−1 + β2lnRDPCit−1 + β3lnPLPC jt−1 + β4 lnPCDistij +

+β5Confij + β6lnIPC j i ,t−1 + β7lnINV j i ,t−1 +γ j dij +ε ijt (2.11)

Tutte le variabili incluse in quest’ultima versione del modello risultano significative, tranne quella relativa ai prezzi che perde significatività con l’introduzione degli effetti regionali di destinazione; tuttavia, i segni dei parametri rispecchiano le aspettative teoriche. Per quanto riguarda l’interpretazione dei coefficienti di regressione la variabile dei posti letto pro capite è quella cui corrisponde una maggiore elasticità della domanda turistica, mentre al contrario il parametro relativo agli investimenti relativi indica una domanda turistica piuttosto rigida rispetto a tale variabile. Per quanto riguarda la diagnostica del modello, oltre all’elevato valore dell’indice di determinazione possiamo anche constatare come la distribuzione dei residui contro i valori predetti è piuttosto buona e non mette in evidenza nessun particolare andamento sistematico.

Page 40: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

40

Tabella 2.12

MODELLO 1R PER I FLUSSI TURISTICI INTERREGIONALI CON VARIABILI RITARDATE

Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -1,917 1,127 -1,70 0,08 POPi,t-1 0,982 0,013 72,74 <0,01 RDPCi,t-1 0,778 0,077 10,03 <0,01 PLPCj,t-1 1,352 0,165 8,20 <0,01 PCDistij -0,176 0,010 -16,87 <0,01 Confini 0,334 0,043 7,82 <0,01 IPCj|i,t-1 -0,285 0,187 -1,52 0,12 INVj|i,t-1 0,033 0,004 7,46 <0,01 Valle d'Aosta -3,693 0,434 -8,49 <0,01 Lombardia 1,608 0,088 16,19 <0,01 Trentino -1,754 0,421 -4,17 <0,01 Veneto 0,091 0,220 0,41 0,67 Friuli -1,07 0,197 -5,42 <0,01 Liguria -0,544 0,195 -2,78 <0,01 Emilia Romagna 0,735 0,199 3,67 <0,01 Toscana 0,025 0,219 0,11 0,90 Umbria -0,889 0,152 -5,85 <0,01 Marche -0,821 0,254 -3,23 <0,01 Lazio 0,734 0,103 7,11 <0,01 Abruzzo -0,576 0,170 -3,38 <0,01 Molise -1,966 0,103 -18,89 <0,01 Campania 1,702 0,097 17,38 <0,01 Basilicata 0,823 0,104 7,88 <0,01 Puglia -1,702 0,111 -16,05 <0,01 Calabria -0,471 0,194 -2,42 0,01 Sicilia 1,429 0,110 12,97 <0,01 Sardegna -0,272 0,186 -1,47 0,14

Un altro aspetto della distribuzione dei residui, che si evince dal

‘normal probability plot’ riportato di seguito, conferma delle buone caratteristiche, nonostante le code della distribuzioni risultano affette da una asimmetria positiva. Dal punto di previsivo si osservano invece le seguenti caratteristiche: nelle serie storiche dei valori osservati si osservano un totale di 449 punti di svolta, ovvero di presenze turistiche che diminuiscono rispetto al quelle registrate per il periodo precedente. Ciò indica che nella maggior parte dei flussi turistici bilaterali si assiste ad un incremento nelle presenze. Di questi punti di svolta, il modello ne riesce a catturare 191, cioè poco meno della metà: di questi 84 fanno riferimento al passaggio dall’anno 1998 al 1999. Per l’ultimo anno della serie, il 2002, nel quale si sono registrate 191 casi di flessione nelle presenze turistiche, il modello ne identifica solamente 31.

Page 41: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

41

Figura 2.13

PRESENZE STIMATE CONTRO RESIDUI, NEL MODELLO DEI FLUSSI INTERREGIONALI

Figura 2.14

NORMAL PROBABILITY PLOT NEL MODELLO DEI FLUSSI INTERREGIONALI

Page 42: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

42

Accanto al "Modello 1R" proponiamo un secondo modello, che chiameremo "Modello 2R" che presenta una variazione per la variabile dei posti letto che saranno espressi in termini assoluti piuttosto che in forma pro capite. Questo cambiamento non determina sostanziali modifiche nelle stime, ma nel caso dell’eliminazione degli effetti fissi di regione, impedisce che le variabili dei prezzi e degli investimenti vedano cambiato il segno del corrispondente coefficiente. Come messo in luce in precedenza, questo fatto può essere dovuto alla diversa entità dei coefficienti di regressione delle grandezze coinvolte. I risultati di questo modello sono esposti nella tabella 2.15.

Tabella 2.15

MODELLO 2R PER I FLUSSI TURISTICI INTERREGIONALI CON VARIABILI RITARDATE Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -13,738 2,126 -6,42 <0,001 POPi,t-1 0,982 0,013 72,79 <0,001 RDPCi,t-1 0,783 0,078 10,1 <0,001 PLj,t-1 1,393 0,167 8,32 <0,001 PCDistij -0,176 0,010 -16,87 <0,001 Confini 0,334 0,043 7,83 <0,001 IPCj|i,t-1 -0,281 0,187 -1,51 0,13 INVj|i,t-1 0,033 0,004 7,46 <0,001 Valle d'Aosta 1,177 0,193 6,09 <0,001 Lombardia 0,570 0,133 4,29 <0,001 Trentino 0,262 0,188 1,39 0,16 Veneto -0,337 0,231 -0,15 <0,001 Friuli 0,670 0,103 6,52 <0,001 Liguria 0,761 0,095 8,01 <0,001 Emilia Romagna 0,790 0,192 4,12 0,21 Toscana 0,241 0,194 1,24 <0,001 Umbria 1,359 0,184 7,40 <0,001 Marche 0,615 0,115 5,37 <0,001 Lazio 0,443 0,119 3,71 <0,001 Abruzzo 1,073 0,115 9,31 <0,001 Molise 1,609 0,425 3,79 <0,001 Campania 1,287 0,097 13,23 <0,001 Basilicata 0,876 0,101 8,63 <0,001 Puglia 0,923 0,319 2,89 <0,001 Calabria 0,506 0,107 4,69 <0,001 Sicilia 0,201 0,101 0,11 <0,001 Sardegna 1,010 0,096 0,09 <0,001

Rispetto al precedente, sia il valore del coefficiente di determinazione è

un poco superiore come pure il valore della statistica F di Fisher. Per quanto concerne il numero dei punti di svolta catturati dal modello osserviamo un numero praticamente equivalente.

Page 43: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

43

2.3 Il modello per i flussi intra-regionali Con riferimento alla matrice di origine/destinazione delle presenze, la stima dei flussi turistici intra-regionali rappresenta quella parte della dinamica turistica che coinvolge le famiglie residenti di una certa regione che danno luogo a spostamenti che non ne valicano però i confini e rappresenta dunque la stima nelle celle della diagonale principale della matrice, in cui origine e destinazione vanno a coincidere.

In questo caso, un modello gravitazionale, che deve includere come si è detto, una componente di attrazione, una di espulsione ed una componente di distanza, dovrebbe essere sviluppato con misure di attrazione/repulsione fra aree interne alla regione. Questo richiede un dettaglio di informazioni al momento non disponibile. Si tratta pertanto di modificare il contesto entro cui i flussi turistici domestici si realizzano, ovvero nell’identificare quali possano essere le motivazioni di base che spingono i turisti a compiere degli spostamenti all’interno alle singole regioni.

Un primo motivo è sicuramente legato alle caratteristiche fisiche e morfologiche della regione, ovvero dal tipo di offerta turistica che essa offre: ad esempio, una regione in cui coesistono spiagge balneabili e luoghi di montagna o campagna, sicuramente offre alle famiglie residenti buone opportunità di organizzarvi le proprie vacanze. D’altro canto, una maggiore propensione a soggiornare all’interno della propria regione potrebbe dipendere anche da limitate capacità di spesa delle famiglie residenti e dalle generali condizioni economiche, per cui i turisti potrebbero decidere di organizzare una vacanza all’interno della propria regione cercando di abbattere le spese di trasporto, che solitamente incidono in maniera sostanziale sui costi di viaggio. Infine, dobbiamo ricordare che una parte delle presenze turistiche è dovuta agli spostamenti per motivi di lavoro, che potrebbero rappresentare in questo caso una quota meno consistente rispetto a quella che interessa i flussi interregionali.

In questo quadro così delineato possiamo andare ora a specificare un opportuno modello per le presenze intra-regionali. Come variabili che rappresentano l’offerta turistica possiamo considerare nuovamente il numero dei posti letto pro capite della regione, mentre tra le variabili che descrivono le condizioni economiche della regione possiamo senz’altro tenere conto del reddito disponibile delle famiglie, sempre in forma pro capite e degli investimenti in infrastrutture turistiche; per questi ultimi consideriamo sia l’effetto lineare che quello quadratico, che permette di tenere conto di livelli di sviluppo diversi. Infine, per tenere conto

Page 44: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

44

dell’effetto dimensionale della regione introduciamo, come per i modelli interregionali, la popolazione residente in ciascuno degli anni di riferimento. L’equazione del modello ha dunque la seguente struttura: lnxit = β0 + β1POPit + β2lnRDPCit + β3lnPLPCit + β4 lnINVit + β5 lnINVit[ ]2 + uit (2.12)

Questo modello presenta caratteristiche piuttosto buone, infatti l’indice di determinazione è molto elevato ( 2

R = 0,9222) ed anche i residui del modello presentano una buona distribuzione, come mostra il ’normal probability plot’, nonostante il limitato numero di osservazioni. I segni dei coefficienti di regressione mostrano segni coerenti rispetto alle aspettative. Una osservazione va fatta per la variabile degli investimenti il cui effetto quadratico presenta un segno negativo, che indica una parabola con concavità rivolta verso il basso. Pertanto, in corrispondenza sia di bassi livelli degli investimenti che di investimenti elevati si rilevano bassi valori delle presenze turistiche; un maggior numero di presenze turistiche si ha in corrispondenza di livelli intermedi degli investimenti. Questo fatto potrebbe essere determinato dalle regioni svantaggiate, le quali presentano un elevato valore degli investimenti a fronte, tuttavia, di un ancora basso numero di presenze turistiche interne.

Tabella 2.16

MODELLO PER I FLUSSI INFRA-REGIONALI CON VARIABILI CONTEMPORANEE Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -7,353 1,667 -4,411 <0,001 RDPCit 1,664 0,236 7,043 <0,001 PLPCit 0,439 0,096 4,590 <0,001 INVit 0,339 0,498 0,682 0,497 INV2it -0,063 0,030 -2,150 0,034

Si noti che il coefficiente della componente lineare degli investimenti

non è significativo. Preferiamo tuttavia mantenere questa variabile, per una maggiore interpretabilità della funzione stimata. Ulteriori tentativi di arricchimento del predittore lineare del modello non hanno portato a sostanziali modifiche, né dal punto di vista dell’insieme delle variabili esplicative, né dal punto di vista diagnostico. Questi tentativi hanno riguardato l’introduzione delle variabili in forma pro capite, nel tentativo di scorporare, anche in questo caso, dai fattori di spinta e di attrazione della regione tutti quegli effetti spuri derivanti dalla grandezza. Inoltre, sono stati introdotti fra le esplicative i flussi di uscita dalla regione verso le regioni confinanti e verso l’estero, per cercare catturare un qualche effetto

Page 45: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

45

di competizione tra destinazioni alternative. Tuttavia, nessuna di queste variabili porta ad un significativo miglioramento del modello.

Figura 2.17

NORMAL PROBABILITY PLOT NEL MODELLO INTRA-REGIONALE CON VARIABILI CONTEMPORANEE

Un discorso a parte meritano in questo caso gli effetti fissi di regione,

che risultano essere significativi. Tuttavia, il loro inserimento nel modello produce una certa asimmetria nella distribuzione dei residui che non riteniamo accettabile. Questa situazione può essere dovuta al fatto che la maggiore flessibilità del modello, per la presenza di un più alto numero di parametri di intercetta, determina una maggiore influenza dei valori anomali sulle stime e pertanto una peggiore distribuzione dei residui. Per cercare di limitare in qualche misura questo effetto si è cercato di formare raggruppamenti di regioni, che consentissero l’introduzione di un limitato numero di parametri di intercetta. Una delle combinazioni possibili ha riguardato la costruzione di quattro gruppi di regioni coincidenti con le ripartizioni geografiche a cui solitamente ci si riferisce nell’ambito delle indagini ufficiali: Nord Est, Nord Ovest, Centro, Mezzogiorno. Anche in questo caso, nonostante i quattro parametri di intercetta risultano essere significativamente diversi da zero, il miglioramento del modello non è rilevante. Per motivi di parsimonia, si è preferito pertanto non procedere alla loro inclusione nel modello finale.

In conclusione, il modello di riferimento per i flussi turistici intra-regionali è quello descritto dalla seguente equazione, nella quale le diverse

Page 46: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

46

esplicative sono ritardate di un periodo, per tenere conto di una certa dinamica temporale:

lnxit = β0 + β1POPit−1 + β2lnRDPCit−1 + β3lnPLPCit−1 + β4 lnINVit−1 +

+β5 lnINVit−1[ ]2 + uit (2.13)

a cui corrispondono le stime dei parametri riportate nella tabella seguente:

Tabella 2.18

MODELLO PER I FLUSSI INTRA-REGIONALI CON VARIABILI RITARDATE Variabili Stima Errore Std. t-test Pr(>|t|) Intercetta -7,586 2,097 -3,62 <0,001 POPi,t-1 1,904 0,285 6,67 <0,001 RDPCi,t-1 2,039 0,463 4,4 <0,001 PLPCi,t-1 0,477 0,092 5,17 <0,001 INVi,t-1 -0,250 0,290 -0,86 0,39 INV2i,t-1 -0,039 0,018 -2,13 0,03

Anche in questo caso, le caratteristiche del modello con le variabili

ritardate ricalcano totalmente quelle dell’analogo sulle variabili contemporanee, sia nel segno dei coefficienti di regressione, che nella loro significatività. Il segno della componente lineare degli investimenti è in questo caso negativo, contrariamente alle aspettative. Tuttavia questa non è significativa. Le statistiche sulla bontà di adattamento ai dati, anche se il ’normal probability plot’ presenta alcune irregolarità in più che non erano presenti nel modello con le variabili contemporanee.

Page 47: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

47

Figura 2.19

NORMAL PROBABILITY PLOT NEL MODELLO DEI FLUSSI DOMESTICI CON VARIABILI RITARDATE

2.4 Il modello completo sulle presenze A questo punto possiamo pensare di mettere assieme il modello per la stima delle presenze interregionali con quello per le presenze domestiche, in un unico sistema di equazioni, in modo tale da ottenere un unico vettore dei parametri per la stima dell’intera matrice di origine/destinazione dei flussi turistici.

In maniera compatta possiamo definire dunque con xint il vettore, di dimensioni n x (n-1) x t delle presenze nei flussi turistici interregionali, xreg il vettore di dimensioni (n x t) delle presenze domestiche, Zint la matrice che contiene le variabili esplicative del modello per gli scambi tra regioni e Zreg la matrice delle variabili esplicative per i flussi domestici. In questo modo, possiamo scrivere il modello unico come segue

lnx int

lnx reg

⎝ ⎜

⎠ ⎟ =

Zint 0 reg

0 int Zreg

⎝ ⎜ ⎜

⎠ ⎟ ⎟

β int

β reg

⎝ ⎜

⎠ ⎟ +

ε int

ε reg

⎝ ⎜

⎠ ⎟ (2.14)

dove 0int e 0reg sono matrici nulle con un numero di colonne pari alla corrispondente matrice dei regressori. La matrice del disegno complessiva ha dunque una struttura diagonale a blocchi, mentre il vettore dei parametri

Page 48: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

48

sarà formato concatenando quello dei flussi interregionali con quello dei flussi domestici. Nel nostro caso il numero complessivo di osservazioni è pari a 2000 mentre le variabili esplicative utilizzate nelle due componenti del modello è pari a 31, comprese le intercette. Le stime dei parametri sono dunque quelle già presentate nelle tabelle 2.15 e 2.18. Per quanto riguarda le statistiche del modello così impostato, ne risulta che 2

R = 0,8890, con un valore del test F per la verifica della significatività dell’intero modello pari a F = 498,5 (p<0,001). Per quanto riguarda la diagnostica del modello, si conferma una asimmetria positiva della distribuzione dei residui, come anche mostrano le due rappresentazioni grafiche qui riportate.

Figura 2.20

NORMAL PROBABILITY PLOT DEI RESIDUI NEL MODELLO COMPLETO

Page 49: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

49

Figura 2.21

PRESENZE PREDETTE CONTRO RESIDUI NEL MODELLO COMPLETO

2.5 Il modello con i vincoli Prima di procedere al commento del modello che soddisfa il vincolo di aggregazione, occorre fare alcune considerazioni. Come sappiamo, per ogni anno sono disponibili i totali delle presenze in ogni regione di ingresso, sommati lungo le regioni di destinazione. Si ha pertanto, per ogni t, un vettore ht di dimensione 20. L’ipotesi di stimare il vettore β del modello che soddisfa al vincolo che le presenze teoriche ˆ x ijt disaggregate per origine e destinazione sommino, in ogni t, al vettore ht non può essere presa in considerazione in questo contesto, dal momento che, nel modello selezionato, il vettore dei parametri non ha dimensione elevata e il numero dei vincoli è superiore al numero dei parametri. Essendo il periodo temporale di studio dal 1998 al 2002, si hanno infatti 20 x 5=100 vincoli da imporre su un vettore dei parametri di dimensione molto inferiore. Si è pertanto proceduto nella seguente maniera: • per ogni anno si è ricavato il valore nazionale delle presenze turistiche,

ovvero si è calcolato un valore Nt ottenuto per somma degli elementi del vettore ht;

Page 50: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

50

• si è proceduto a stimare un modello imponendo il vincolo che le presenze teoriche ˆ x ijt sommate sia per regione di origine che di destinazione siano uguali al valore Nt. Come abbiamo visto, il modello gravitazionale è lineare nella

trasformazione logaritmica delle presenze. In tal caso il vincolo è dato da: Gexp(Zβ)=N mentre la matrice A0 è data da: A0=Gdiag[exp(Zβ0)]Z e la matrice H0 è data da H0=N - Gexp(Zβ0) + Aβ0 Il raffronto fra i coefficienti del Modello 1R, selezionato nella parte

precedente, stimati con e senza vincoli, pone in evidenza che nel caso dei flussi interregionali tutti i coefficienti, ad esclusione dell’intercetta, mantengono lo stesso segno ed anche le variazioni nel valore risultano piuttosto contenute. Nel caso della regressione dei flussi domestici, si osservano invece variazioni del segno di quasi tutti i coefficienti. Indicando con Modello 1R il modello stimato senza imporre vincoli e con Modello 1RB quello stimato sotto i vincoli di aggregazione su base nazionale sopra descritti, i parametri dei due modelli sono raffrontati nella tabella 2.22. La tabella 2.23 mostra invece un medesimo confronto relativamente ai Modelli 2R e 2RB.

Per quanto concerne il Modello 1R e 1RB, si può notare che: • le intercette dei modelli (per flussi intra e interregionali) cambiano di

un valore rilevante; • i parametri delle grandezze economiche cambiano di entità ma non di

segno, tranne che per le variabili della regressione intra-regionale; inoltre, molti dei parametri stimati con il modello vincolato sono compresi negli intervalli di confidenza costruiti attraverso il modello non vincolato;

• il coefficiente relativo ai posti letto pro capite diventa minore dell’unità e questo ne facilita l’interpretazione economica in termini di elasticità;

• i parametri degli effetti di regione cambiano di valore ma non di segno, mantenendo una magnitudine simile.

Page 51: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

51

Tabella 2.22

COEFFICIENTI MODELLO 1R E MODELLO 1RB: CONFRONTO Variabile Coefficienti non vincolati Coefficienti vincolati Intercetta -1,9167 2,2769 POPi,t-1 0,9822 0,9780 RDPC i,t-1 0,7789 0,5292 PLPC i,t-1 1,3521 0,8496 PCDistij -0,1760 -0,1846 Confini 0,3339 0,3345 IPCj|i,t-1 -0,2852 -0,6643 INV j|i,t-1 0,0330 0,0357 Valle d’Aosta -3,6930 -2,3776 Lombardia 1,6081 1,5211 Trentino -1,7546 -0,5214 Veneto 0,0913 0,7441 Friuli -1,0701 -0,5013 Liguria -0,5439 -0,0140 Emilia Romagna 0,7351 1,2916 Toscana 0,0251 0,6024 Umbria -0,8894 -0,5923 Marche -0,8216 -0,1506 Lazio 0,7344 0,7884 Abruzzo -0,5761 -0,2030 Molise -1,9661 -1,9984 Campania 1,7020 1,6266 Puglia 0,8232 0,9666 Basilicata -1,7918 -1,8340 Calabria -0,4717 0,0220 Sicilia 0,4297 1,2358 Sardegna -0,2725 0,1883 Intercetta -7,5862 15,2444 POP i,t-1 1,9042 -1,4814 RDPC i,t-1 2,0392 -4,4010 PLPC i,t-1 0,4770 0,3266 INV i,t-1 -0,2504 2,0917 INV2 i,t-1 -0,0393 0,0488

Page 52: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

52

Tabella 2.23

COEFFICIENTI MODELLO 2R E MODELLO 2RB: CONFRONTO Variabile Coefficienti non vincolati Coefficienti vincolati Intercetta -13,7380 -3,9899 POPi,t-1 0,9823 0,9804 RDPC i,t-1 0,7830 0,5817 PL i,t-1 1,3934 0,7373 PCDistij -0,1759 -0,1835 Confini 0,3341 0,3378 IPCj|i,t-1 -0,2815 -0,5999 INV j|i,t-1 0,0329 0,0345 Valle d’Aosta 1,1769 0,5476 Lombardia 0,5703 0,9531 Trentino 0,2621 0,8873 Veneto -0,3372 0,8143 Friuli 0,6701 0,5596 Liguria 0,7607 0,8197 Emilia Romagna 0,7909 1,4772 Toscana 0,2414 0,8893 Umbria 1,3598 0,7005 Marche 0,6154 0,8034 Lazio 0,4432 0,6742 Abruzzo 1,0732 0,7914 Molise 1,6089 -0,0792 Campania 1,2872 1,3892 Basilicata 0,8757 1,0328 Puglia 0,9238 -0,3584 Calabria 0,5063 0,6820 Sicilia 0,2015 1,0864 Sardegna 1,0105 1,0021 Intercetta -7,5862 15,1170 POP i,t-1 1,9042 0,2760 RDPC i,t-1 2,0392 -4,2458 PLPC i,t-1 0,4770 -1,4220 INV i,t-1 -0,2504 2,1144 INV2 i,t-1 -0,0393 0,0436

Il fatto che i coefficienti di regressione dell’equazione dei flussi intra-

regionali siano più instabili può essere dovuto alla minore numerosità campionaria su cui queste equazioni si basano.

La tabella 2.24 riporta le statistiche relative agli scostamenti percentuali fra gli elementi del vettore ht e i corrispondenti valori ottenuti per aggregazione a) dei valori reali, b) dei valori stimati con il Modello 1R e c) dei valori stimati con il Modello 1RB. (I dati relativi al Piemonte nei primi due anni sono stati eliminati in quanto non pubblicati dall’ISTAT.) I valori regionali ottenuti aggregando i valori osservati non sono distanti dagli analoghi valori pubblicati dall’ISTAT (il 75% ha un errore in valore assoluto inferiore o uguale al 6%). Errori percentuali superiori al 10% si

Page 53: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

53

riscontrano solamente in 7 regioni. Le stime ottenute attraverso il modello non vincolato presentano errori più elevati dei precedenti. Questo ci porta a ritenere che i valori osservati siano soggetti a errori contabili di natura non casuale, dato che altrimenti il piano di regressione ottenuto con il Modello 1R dovrebbe interpolare bene il fenomeno, lasciando questo fattore di errore nella componente casuale. Si noti inoltre, che il Modello 1RB, stimato sotto i vincoli di aggregazione nazionale, fornisce errori di stima a livello regionale più elevati di quelli del Modello 1R: la riproduzione esatta dei totali nazionali non comporta una maggiore aderenza ai totali regionali. Questo fatto a nostro giudizio è dovuto alla distanza, a livello regionale, fra i dati disaggregati e le loro somme contabili. Le considerazioni sui segni di alcuni dei coefficienti del Modello 1RB, portano a preferire il Modello 1R in fase di previsione. In seguito, quando i dati disaggregati a livello regionale saranno auspicabilmente più vicini ai dati aggregati, questo esercizio può condurre a risultati maggiormente coerenti.

Tabella 2.24

PRESENZE REGIONALI AGGREGATE E STIME: VALORI ASSOLUTI DEGLI ERRORI PERCENTUALI Min Primo quartile Mediana Terzo quartile Max Osservati 0,0% 0,0% 0,5% 5,8% 21,6% Modello 1R 0,1% 6,3% 18,0% 29,9% 59,3% Modello 1RB 1,3% 9,7% 23,4% 41,6% 88,5%

Page 54: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

54

Page 55: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

55

CONCLUSIONI Il primo ordine di conclusioni che possiamo trarre da questo studio riguarda la parzialità delle informazioni sui flussi economici generati dal turismo. Le matrici di origine/destinazione degli arrivi e delle presenze, rappresentano certamente il tentativo più sofisticato di fornire informazioni dettagliati sui flussi nelle diverse regioni italiane. D’altro canto, la base informativa è costituita dai movimenti dei clienti nelle strutture ricettive con obbligo di rilevazione che rimane carente sia per quanto concerne la quota di presenze non registrate dalle strutture, ma soprattutto coglie il fenomeno turistico soltanto dal punto di vista del pernottamento in questi tipi di strutture. Resta quindi del tutto non misurata quella parte dei flussi relativi a soggiorni presso seconde case di proprietà oppure in affitto da privati. La disponibilità di dati di questa portata è attualmente del tutto inadeguata ai fini del nostro studio.

Un secondo ordine di considerazioni riguarda la specificazione del modello presentato in questa sede. Il basso numero di dati storici analizzato (dal 1998 al 2002) ha implicato una specificazione parziale dei modelli di previsione che rende necessarie alcune osservazioni rilevanti in futuro, quando un maggior numero di osservazioni andranno a comporre la serie storica dei dati. Il problema più importante riguarda senza dubbio la corretta specificazione della struttura della matrice Ω, in questa sede posta diagonale e costante rispetto al tempo. Trattandosi di serie storiche, le componenti di errore del modello presenteranno una natura autoregressiva, che deve riflettersi, ovviamente, sulla struttura di Ω non costante rispetto al tempo. Inoltre, dovendo considerare anche i confini geografici delle diverse regioni, sarebbe opportuno tenere conto anche di una struttura di autocovarianza in senso spaziale, il che determina matrici Ωt non diagonali.

Infine, la scarsità delle osservazioni non ha permesso di valutare l’esistenza di fenomeni di integrazione e cointegrazione fre la variabili considerate. Questo tipo di studio si renderà necessario tuttavia, in futuro, e qualora portasse ad accettare l’ipotesi di grandezze cointegrate, occorre valutare specificazioni alternative, quali il modello a correzione dell’errore (Engle, Granger, 1987), del modello dinamico.

Page 56: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

56

Page 57: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

57

APPENDICE: Funzioni MATLAB PREPAREY - Preparazione della variabile delle presenze function [y]=preparey(OD,t) % function [y]=preparey(OD,t) % % trasforma la serie storica delle matrici %origine/destinazione delle presenze in due vettori: il % panel dei flussi interregionali (n*n-1*t), % seguito da quello di tutti i flussi domestici (n*t). % OD - è una matrice quadrata di origine destinazione di % ordine n (dove n è il numero delle regioni) % t - è il numero delle osservazioni della serie storica; % y - è un vettore di dimensioni n*n*t. [nt,n]=size(OD); Int = []; Reg = []; % controlla le dimensioni % if nt/t ~= n; error('Controllare la dimensione di OD!') end for i = 0:t-1; A = OD(n*i+1:n*i+n,:); [Aint, Areg]=nodiag(A); Aintv = vecarray(Aint); Aregv = vecarray(Areg); Int = [Int, Aintv]; Reg = [Reg, Aregv]; end; Intv = vecarray(Int); % crea i due vettori di flussi interregionali e domestici Regv = vecarray(Reg); y = [Intv; Regv];

PREPAREX - Preparazione delle variabili esplicative function [Xout]=preparex(Xi,Xj,t) % function [Xout]=preparex(Xi,Xj,t) % % trasforma le matrici dei dati delle variabili % esplicative separando % le osservazioni per il modello dei flussi % interregionale da quelle per il modello dei flussi % domestici. % I dati in input sono raggruppati in modo omogeneo tra: % Xi - contiene le variabili che hanno come riferimento % la regione di origine; % Xj - contiene le variabili che hanno come riferimento % la regione di destinazione; % Xout - ha n*n*t righe e come colonne le variabili

Page 58: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

58

% nello stesso ordine introdotte in input % preliminari % % controlla le dimensioni dei diversi dati % ai = size(Xi); aj= size(Xj); aij= size(Xij); if ai - aj ~= [0,0]; error('Le matrici Xi e Xj non hanno la stessa dimensione') end; % trasforma le variabili del blocco di origine Xi % if sum(size(Xi))>0 % se la matrice Xi è vuota salta tutto questo pezzo [nt,qi]=size(Xi); n= nt/t; Xif = []; % controlla la congruenza tra n e t % if floor(n)*t ~= nt; error('La dimensione di Xi non è corretta') end; for h = 1:qi; Inti = []; Regi = []; for k = 0:t-1; orih = Xi(n*k+1:n*k+n,h); % seleziona le osservazioni di una variabile in un % periodo orikron = kron(unin', orih); [orint, oreg]=nodiag(orikron); % separa i flussi interregionali da quelli domestici orintv = vecarray(orint); oregv = vecarray(oreg); Inti = [Inti, orintv]; Regi = [Regi, oregv]; end; Intiv = vecarray(Inti); % vettorializza rispetto ai tempi % Regiv = vecarray(Regi); xi = [Intiv; Regiv]; Xif = [Xif, xi]; % riaggrega le diverse variabili % end; Xinew = Xif; end; % trasforma le variabili del blocco di destinazione Xj % if sum(size(Xj))>0 % se la matrice Xj è vuota salta tutto questo pezzo [nt,qj]=size(Xj); n= nt/t; Xjf = []; unin = ones(n,1); unit = ones(t,1); % controlla la cronguenza tra n e t % if floor(n)*t ~= nt; error('La dimensione di Xi non è corretta') end; for h = 1:qj; Intj = []; Regj = []; for k = 0:t-1; desh = Xj(n*k+1:n*k+n,h); % seleziona le osservazioni di una variabile in un % periodo

Page 59: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

59

deskron = kron(unin, desh'); [deint, dereg]=nodiag(deskron); % separa i flussi interregionali da quelli domestici deintv = vecarray(deint); deregv = vecarray(dereg); Intj = [Intj, deintv]; Regj = [Regj, deregv]; end; Intjv = vecarray(Intj); % vettorializza rispetto ai tempi % Regjv = vecarray(Regj); xj = [Intjv; Regjv]; Xjf = [Xjf, xj]; % riaggrega le diverse variabili % end; Xjnew = Xjf; end; Xout = [Xinew, Xjnew]

DTHJ - Matrice degli effetti di destinazione function [Dj] = dthj(n,t); % [Dj] = dthj(n,t); % Crea la matrice degli effetti di destinazione per % un vettore di dati panel % n = numero di regioni della matrice origine % destinazione % t = numero delle osservazioni della serie storica % restituisce la matrice delle variabili dummy % per le regioni di destinazione In = eye(n); Ij = []; for i = 1:n; for j = 1:n; if i == j; Ij = Ij; else Ij = [Ij; In(j,:)]; end; end; end; Dj = kron(Ij, ones(t,1));

XSERIE - Organizza il vettore delle stime in serie storiche function [A]=xserie(y,n,t) % function [A]=xserie(y,n,t) % % Restituisce una matrice A di dimensioni (n^2 * t) in % cui le righe sono le serie storiche dei flussi % bilaterali % per colonna ci sono le matrici di origine/destinazione % dei flussi vettorializzate con la variabile di

Page 60: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

60

% destinazione che scorre piu' velocemente % y - è il vettore delle stime del modello completo: % con i flussi sia interregionali che domestici % i primi n*(n-1)*t elementi si riferiscono ai flussi % interregionali i successivi ai flussi domestici % n - numero delle regioni % t - numerosità della serie storica ntot = length(y); % osservazioni complessive % nint = n*(n-1)*t; % osservazioni dei flussi interregionali % nreg = n*t; if ntot ~= nint+nreg; error('Controllare la dimensione di y!') end yint = y(1:nint); yreg = y(nint+1:ntot); n2 = nint/t; % numero delle coppie bilaterali % yintm = reshape(yint, t, n2)'; yregm = reshape(yreg, t, n)'; blk = []; for i=1:t inti = yintm(:,i); regi = yregm(:,i); inti2 = reshape(inti',n-1,n)'; Bv = []; Dv = []; Ti = vecarray(insdiag(inti2,regi)); % riaccorpa i flussi domestici a quelli interregionali % blk = [blk, Ti]; end A = blk;

ORIDEST - Organizza il vettore delle stime in matrici origine/destinazione function OD = oridest(y,n,t); % function OD = oridest(y,n,t); % % a partire dal vettore completo delle stime delle % presenze % riconduce alla serie storica delle matrici % origine/destinazione % y - vettore delle stime % n - numero delle regioni % t - osservazioni della serie storica % OD - matrici O/D in ordine temporale nobs = length(y); n2 = n^2; logmat = reshape(y, T, n2)'; odzero = []; for i=1:T; odt = shaper(logmat(:,1),n,n); odzero = [odzero; odt]; end; OD = odzero;

CREAGT - Produce la matrice dei vincoli per il bilanciamento function [Gt]=creagt(n,t) % function [Gt]=creagt(n,t) % % Crea la matrice G dei vincoli per il bilanciamento % quando i dati hanno una struttura panel (l'indice t

Page 61: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

61

% scorre piu' velocemente) % n - numero delle regioni % t - numero osservazioni della serie storica % Gt - matrice binaria che aggrega gli elementi di y % rispettando la separazione tra flussi interregionali e % flussi domestici % L'ordine delle righe di Gt rispecchia la struttura % delle matrice di origine destinazione di ciascun anno In = eye(n); It=eye(t); un = ones(n,1); vinc0 = []; vinct = []; A = kron(It,kron(In,un)); %ok for i = 0: n*t-1; vinc0 = []; cint0 = []; creg0 = []; B = A(n*i+1:n*i+n,:); for j= 0:t-1; C = B(:,n*j+1:n*j+n); [cint, creg]=nodiag(C); cintv = vecarray(cint); cregv = vecarray(creg); cint0 = [cint0, cintv]; creg0 = [creg0, cregv]; end; vinc = [vecarray(cint0); vecarray(creg0)]'; vinct = [vinct; vinc]; end; Gt=vinct;

SCMNEW - Bilanciamento dei parametri del modello con vincoli lineari function [b1, lam1, time]= scmnew(b0,Z,V,G,h,lam0,err) % [b1, lam1, time]= scmnew(b0,Z,V,G,h,lam0,err) % b0 - vettore di stime iniziali % Z - matrice del disegno % V - matrice di varianze e covarianze (diagonale) % G - matrice binaria di vincoli % h - vettore di costanti % lam0 - valori iniziali per lambda (opzionale) % err - criterio di convergenza (opzionale) % time - tempo di elaborazione in secondi t0 = cputime; [k, p] = size(G); % k è il numero di vincoli presenti in G % if nargin < 7, err = 10^(-7); end if nargin < 6, lam0=ones(k,1); end % starting point % A = inv(Z'*inv(V)*Z); W = G*Z*A*Z'*G'; q = G*Z*b0-h; r0 = q - W*lam0; p0 = r0; lam1 = lam0; r1=r0; p1=p0; er = lam1; %algorithm% while sum(er) > 0; alfa = (r1'*r1)/(p1'*W*p1); lam2 = lam1 + alfa * p1; r2 = r1 - alfa * W * p1; bet = (r2'*r2)/(r1'*r1);

Page 62: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

62

p2 = r2 + bet * p1; er = (abs(lam2 - lam1))>err; r1 = r2; p1 = p2; lam1 = lam2; end

STIMABETAITER - Bilanciamento dei parametri del modello con vincoli non lineari function [betanuovo,stimenuove,monitorbeta,monitorsigma,monitorabs,monitoreffe,lambda,sigma]=stimabetaiter(beta,y,Z,h,G); % beta valori iniziali (usualmente gli OLS) % y i valori osservati della variabile risposta % Z la matrice delle esplicative % h i vincoli di regione % G la matrice di aggregazione delle presenze % interregionali in modo da ottenere % le presenze totali per regione % prova matrice di aggregazione dei totali regionali in % totali nazionali % stima iterativamente i beta che soddisfano ai vincoli % Gnuovo*exp(Z*beta)=prova*h % linearizzando il vincolo attraverso l'espansione in % serie di Taylor % richiama valutaeffe tol=1e-4; converge=0; monitorbeta=[beta]; betac=beta; niter=10; Rtot=y-Z*beta; Rtotf = Rtot(~isnan(Rtot)); SSEtot = Rtotf'*Rtotf; sigma= SSEtot/(length(Rtot)-length(beta)); a=length(h)/20; monitorsigma=[sigma]; prova=kron(eye(a),ones(1,20)); %aggrega da livello regionale a livello nazionale Gnuovo=prova*G; % aggrega i dati disaggregati al livello nazionale monitoreffe=[]; absdist=100*max(abs(prova*h-Gnuovo*exp(Z*beta))./(prova*h)); monitorabs=[absdist]; while ~converge for i=1:niter A=Z'*diag(exp(Z*betac))*Gnuovo'; A=A'; H=prova*h-Gnuovo*exp(Z*betac)+A*betac; Omegainv=eye(length(y))*sigma^-1; W=A*inv(Z'*Z)*A'; invW=inv(W); lambda=inv(sigma)*invW*(H-A*beta); %betanuovo=beta+inv(Z'*Omegainv*Z)*A'*lambda; betanuovo=beta+inv(Z'*Z)*A'*invW*(H-A*beta); Rtot=y-Z*betanuovo; Rtotf = Rtot(~isnan(Rtot)); SSEtot = Rtotf'*Rtotf; sigma= SSEtot/(length(Rtot)-length(beta)); monitorbeta=[monitorbeta,betanuovo]; monitorsigma=[monitorsigma,sigma]; absdist=100*max(abs(prova*h-Gnuovo*exp(Z*betanuovo))./(prova*h));

Page 63: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

63

monitorabs=[monitorabs;absdist]; absdist1=max(max(abs(monitorbeta(:,i+1) -monitorbeta(:,i))),monitorsigma(i+1)-monitorsigma(i)); effe=valutaeffe(y,Z,betanuovo,sigma,lambda,G,h); monitoreffe=[monitoreffe,effe]; absdist2=abs(effe-monitoreffe(i)); if absdist < tol & absdist1 < tol &absdist2 <tol converge=1; disp('convergiuto') stimenuove=exp(Z*betanuovo); return; else betac=betanuovo; disp(i) end end end

VALUTAEFFE - Valuta la funzione obiettivo con vincoli non lineari function [effe]=valutaeffe(y,Z,beta,sigma,lambda,G,h) miss=isnan(y); % osserv. mancanti % ycomp = y(~miss); Zcomp = Z(~miss,:); Gcomp=G(:,~miss); ncomp = length(ycomp); a=length(h)/20; prova=kron(eye(a),ones(1,20)); %aggrega da livello regionale a livello nazionale Gnuovo=prova*Gcomp; A=Zcomp'*diag(exp(Zcomp*beta))*Gnuovo'; A=A'; H=prova*h-Gnuovo*exp(Zcomp*beta)+A*beta; Omegainv=(1/sigma); detOmegainv=1/sigma; effe=(ncomp/2)*log(detOmegainv)-0.5*(ycomp-Zcomp*beta)'*Omegainv*(ycomp-Zcomp*beta) +lambda'*(Gnuovo*exp(Zcomp*beta)-H);

NODIAG - Separa gli elementi della diagonale di una matrice dai restanti function [Nd, D] = nodiag(A) % [Nd, D] = nodiag(A) % A è una matrice quadrata di ordine k % Restituisce due matrici: % la matrice Nd di ordine k*(k-1) identica ad A ma con % la diagonale soppressa; % il vettore D di ordine 1*k che contiene la % diagonale di A. % Segnala un errore se A non è una matrice quadrata. % Tipicamente A è la matrice di origine/destinazione dei % flussi turistici di un certo anno [I,J]= size(A); Bv = []; Dv = []; if I ~= J, error('La matrice deve essere quadrata') end for i = 1:I for j = 1:J if i == j Bv = Bv; Dv = [Dv, A(i,j)];

Page 64: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

64

else Bv = [Bv, A(i,j)]; Dv = Dv; end end end Nd = reshape(Bv, J-1,I)'; D = Dv';

INSDIAG - Riunisce gli elementi della diagonale di una matrice dai restanti function [Da] = insdiag(A,b) % [Da] = insdiag(A,b) % A è una matrice rettangolare di dimensioni (k x k-1) % b è un vettore (k x 1) % Restituisce una matrice quadrata di ordine k in cui il % vettore b è la diagonale % Segnala un errore se A e b non sono compatibili % Tipicamente A é la matrice dei flussi interregionali e % b è il vettore dei flussi domestici % Da è una matrice origine/destinazione [I,J]= size(A); Bv = []; Dv = []; for i = 1:I for j = 1:J if i == j Bv = [A(i,1:j-1), b(i), A(i,j:J)]; Dv = [Dv; Bv]; else end end end Bv = [A(I,:),b(I)]; Dv = [Dv; Bv]; Da = Dv;

VECARRAY - Vettorializza un array in ordine lessicografico function p = vecarray(A) % function p = vecarray(A) % vettorializza un array per riga % il numero delle dimensioni consentite per l'array % non puo' essere superiore di 4 % p - e' il vettore risultante [r,s,t,u] = size(A); vec = []; p = []; for i=1:r for j=1:s bloc = reshape(A(i,j,1:t,:), t,u); vec1 = vecr(bloc) ; vec = [vec;vec1]; end p = [p;vec]; vec=[]; end

SHAPER - Ridimensiona una matrice seguendo il criterio lessicografico function X = shaper(y,r,c) % function X = shaper(y,r,c)

Page 65: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

65

% Ridimensiona una matrice y di partenza in modo da avere r righe e c colonne % prendendo gli elementi per riga if length(y)~= r*c, error('Check for matrix dimensions') end X = reshape(y,c,r)';

Page 66: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

66

Page 67: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

67

BIBLIOGRAFIA ANDERSON P.S. (1979), “A theoretical foundation for the gravity equation”,

American Economic Review, n. 69, pp. 106-116 ANTONELLO P. (1995), “On balancing National Accounts”, Social statistics,

National Accounts and Economic Analysis, ISTAT - Annali di Statistica - serie X, PP. 183-202

BERGSTRAND J.H. (1985), “The gravity equation in international trade: microeconomic foundations and empirical evidence”, Review of Economics and Statistics, vol. 67, n. 3, pp. 474-481

BOUGHEAS et al. (1999), “Infrastructure, transport cost and trade”, Journal of International Economics, n. 47, pp. 169-189

BRAU R. (2000), Analisi econometrica della domanda turistica in Europa, Università di Cagliari, Discussion paper

BYRON R.P. (1978), “The estimation of large social account matrices”, Journal of the Royal Statistical Society A, vol. 141, n. 3, pp. 359-367

BYRON R.P. (1996), “Diagnostic testing and sensitivity analysis in the construction of social accounting matrices”, Journal of the Royal Statistical Society A, vol. 159, n. 3, pp. 169-194

BYRON R.P., CROSSMAN P.J., HURLEY J.E., SMITH S.C.E. (1995), “Balancing Hierarchical Regional Accounting Matrices”, Social statistics, National Accounts and Economic Analysis, ISTAT - Annali di Statistica - serie X, pp. 205-238

CAREY K. (1991), “Estimation of carebbean tourism demand: Issues on Measurement and Methodology”, Atlantic Economic Journal, n. 19, pp. 32-40

CARRARO C., MANENTE M. (1997), “La modellistica econometrica dei flussi turistici internazionali: alcune indicazioni metodologiche", Statistica, vol. 57, n. 4, pp. 499-512

CARRARO C., MANENTE M. (1998), “STREP: un modello di previsione dei flussi turistici internazionali per regione”, Statistica, vol. 58, n. 1, pp. 51-66

CHENG I., WALL H.J. (2002), Controlling heterogeneity in gravity models of trade, Working Paper 1999-010C, Federal Bank of St. Louis

COX D.R., WERMUTH N. (1996), Multivariate dependencies: models analysis and Interpretations, Chapman & Hall

DE MELLO M., PACK A., SINCLAIR M.T. (2002), “A system of equations of UK tourism demand in neighbouring countries”, Applied Economics, n. 34, pp. 509-521

DEATON A.S. (1985), “Panel data from a series of repeated cross-sections”, Journal of Econometrics, n. 30, pp. 109-126

DEATON A.S., MUELLBAUER J. (1980), “An almost ideal demand system”, American Economic Review, n. 70, pp. 312-326

Page 68: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

68

DEATON A.S., MUELLBAUER J. (1980), Economics and consumer behaviour, Cambridge University Press

DURBARRY R. (2000a), Long-run structural tourism demand modelling: an application to France, Tourism and Travel Research Institute (TTRI), Discussion paper

DURBARRY R. (2000b), Tourism Expenditure in the UK: analysis of competitiveness using a gravity-based model, Tourism and Travel Research Institute (TTRI), Discussion paper

EGGER P., PFAFFERMAYR M. (2003), “The proper panel econometric specification of the gravity equation: a three-way model with bilateral interaction effects", Empirical Economics, n. 28, pp. 571-580

ENGLE R.E., GRANGER C.W.J.(1987), “Co-integration and error correction: representation, estimation and testing”, Econometrica, n. 55, pp. 251-276

GARÍN-MUÑOZ T., AMARAL T. (2000), “An econometric model for international tourism flows to Spain”, Applied Economics Letters, n. 7, pp. 525-529

GRASSELLI P. (1988), Economia e politica del turismo, F. Angeli, Milano JOHNSTON J., DINARDO J. (1997), Econometric Methods, McGraw-Hill, New

York LIMAO N., VENABLES A.J. (1999), Infrastructure, geographical disadvantage

and transport Costs, Policy Research Working Paper n. 2257, World Bank MAK J., MONCUR J., YONAMINE D. (1977), “Determinants of visitor

expenditures and visitor length of stay: a Cross-section analysis of U.S. visitors to Hawaii”, Journal of Travel Research, n. 15, pp. 5-8

MARTIN C.A., WITT S.F. (1989), “Forecasting tourism demand: a comparison of the accuracy of several quantitative methods”, International Journal of Forecasting, n. 5, pp. 7-19

MÀTYÀS L. (1997), “Proper econometric specification of the gravity model”, The World Economy, n. 20, pp. 363-368.

PANICCIÀ R. (2000), “Un sistema di costruzione di matrici contabili regionali: metodologia e primi risultati”, in Casini Benvenuti S. (a cura di), Il nuovo sistema dei conti economici nazionali e regionali SEC 1995, F. Angeli. Milano

PAPATHEODOROU A. (1999), “The demand for international tourism in the Mediterranean Region” Applied Economics, n. 31, pp. 619-630

QUANDT R.E, YOUNG K.H. (1969), “Cross-sectional travel demand models: estimation and Tests”, Journal of Regional Science, n. 9, pp. 201-214

ROMILLY P., LIU X., SONG H. (1998), “Economic and social determinants of international tourism spending: a panel data analysis”, Tourism Analysis, n. 3, pp. 3-15

SOLOMOU S., WEALE M. (1993), “Balanced estimates of National Accounts when measurement errors are autocorrelated: the UK, 1920-38”, Journal of the Royal Statistical Society A, vol. 156, n. 1, pp. 89-105

SONG H., WONG K.K.F., CHON K.K.S.(2003), “Modelling and forecasting the demand for Hong Kong tourism”, Hospitality Management, n. 22, pp. 435-451

Page 69: Un modello per la stima e la previsione dei flussi ... · - Dij è la distanza tra i due paesi; - β è il parametro di frizione oggetto di stima. Il modello gravitazionale è stato

69

STONE R., CHAMPERNOWNE D.G., MEADE J.E. (1942), “The precision of National Income Estimates”, The Review of Economic Studies, n. 9, pp. 111-125

TINBERGEN J. (1962), “Shaping the world economy: suggestions for an international economic Policy”, The Twentieth Century Fund, New York

TREMBLAY P. (1989), “Polling international tourism in western Europe”, Annals of Tourism Research, n. 16, pp. 677-691

VAN DER PLOEG F. (1982), “Reliability and the adjustment of sequence of large economic accounting matrices”, Journal of the Royal Statistical Society A, vol. 145, n. 2, pp. 169-194

WEALE M. (1985), “Testing Linear Hypotheses on National Account data”, The Review of Economics and Statistics, vol. 67, pp.685-689.

WEALE M. (1988), “The reconciliation of values, volumes and prices in the National Accounts”, Journal of the Royal Statistical Society A, vol. 151, n. 1, pp. 211-221

WEALE M. (1992), “Estimation of data measured with error and subject to linear Restrictions”, Journal of Applied Econometrics, n. 7, pp. 167-174

WITT S.F. WITT C.A. (1995), “Forecasting tourism demand: a review of empirical research”, International Journal of Forecasting, n. 11, pp. 447-475.

WITT S.F., WITT C.A. (2000), Tourism demand modelling and forecasting: modern econometric approaches, Elsevier Science, Amsterdam

YAVAS B.F., BILGIN Z. (1996), “Estimation of tourism demand in Turkey: a pooled cross-section and time series analysis”, Tourism Analysis, n. 1, pp. 19-27

ZELLNER A. (1962), “An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias”, Journal of American Statistical Association, n. 57, pp. 348-368