Stima del VaR di un portafoglio con tecniche di Importance ... · c’ e solo una possibilit a su...

21
UNIVERSIT ` A DEGLI STUDI “ROMA TRE” FACOLT ` A DI S.M.F.N. TESI DI LAUREA IN MATEMATICA presentata da Valeria Romani Stima del VaR di un portafoglio con tecniche di Importance Sampling Relatore Prof.ssa Lucia Caramellino Firma del Candidato Firma del Relatore Anno Accademico 2001-2002 Classificazione AMS: 65C05, 91B28, 60F10. Parole chiave: VaR (Valore al Rischio); approssimazione Delta-Gamma; simu- lazioni Monte Carlo; metodi di riduzione della varianza: Importance Sampling.

Transcript of Stima del VaR di un portafoglio con tecniche di Importance ... · c’ e solo una possibilit a su...

UNIVERSITA DEGLI STUDI “ROMA TRE”

FACOLTA DI S.M.F.N.

TESI DI LAUREA IN MATEMATICA

presentata da

Valeria Romani

Stima del VaR di un portafogliocon tecniche di Importance Sampling

Relatore Prof.ssa Lucia Caramellino

Firma del Candidato Firma del Relatore

Anno Accademico 2001-2002

Classificazione AMS: 65C05, 91B28, 60F10.Parole chiave: VaR (Valore al Rischio); approssimazione Delta-Gamma; simu-lazioni Monte Carlo; metodi di riduzione della varianza: Importance Sampling.

Sintesi

In questa tesi viene studiato un metodo Monte Carlo efficiente, di Importance

Sampling, per il calcolo del Valore a Rischio, brevemente VaR, di un portafoglio.

Il VaR rappresenta un oggetto fondamentale per quantificare e trattare il ris-chio di un portafoglio. Intuitivamente, un portafoglio e l’insieme dei titoli (even-tualmente derivati) nei quali si investe denaro. Supponiamo che in un mercatosiano presenti m titoli, con prezzi S1, ..., Sm. Un portafoglio su questi titoli edato da una combinazione lineare di titoli derivati dai sottostanti processi di prez-zo S1(t), ..., Sm(t), ad esempio opzioni call o put, opzioni digitali, o asiatiche, oquant’altro. Non entreremo qui nei dettagli; al momento, e sufficiente dire che ilvalore V (t) di un portafoglio e tipicamente una funzione dell’istante t e deivalori osservati al tempo t dei processi di prezzo:

V (t) = V (t, S1(t), . . . , Sm(t)).

Sia quindi dato un portafoglio con valore V (t). Fissato un istante t ed un intervallotemporale di osservazione, di ampiezza ∆t, si definisce la perdita L come lavariazione del portafoglio tra gli istanti t e t+ ∆t, ovvero

L = V (t) − V (t+ ∆t).

Ma cos’e il VaR? Data una probabilita p, il VaR, e l’ (1 − p)-esimo quantile delladistribuzione della perdita1:

IP(L > VaR) = p.

Fissato p, il VaR rappresenta quindi la minima perdita che si puo tollerare conprobabilita p. Tipicamente, p e una quantita molto piccola (dell’ordine dell’1%),quindi presumibilmente la soglia definita dal VaR e piuttosto grande.

1In effetti, dalla definizione seguirebbe che il VaR e funzione del quantile p, quindi lanotazione corretta dovrebbe essere VaRp. Nella pratica pero si omette la dipendenza dalquantile p.

i

In pratica il VaR da agli utenti una misura sommaria del rischio di mercato.Ad esempio: una banca potrebbe dire che il VaR giornaliero di un portafoglio dimercato e di 35 milioni di euro a livello di confidenza del 99%. Cio significa chec’e solo una possibilita su 100, in condizioni ”normali” di mercato, che ci sia unaperdita del valore del portafoglio maggiore di 35 milioni di euro.Vediamo brevemente a cosa serve il VaR.

1. Il VaR viene utilizzato per avvertire i direttori di aziende del rischio che sicorre nel commercio e nelle operazioni di investimento.

2. Il VaR puo essere usato per porre posizioni limite per i commercianti e fardecidere loro dove allocare le risorse limitate del capitale.

3. Il VaR viene utilizzato per un’interpretazione migliore del rischio.

Il VaR puo essere adottato in massa dalle istituzioni finanziarie e dagli utenti finalipreoccupati dei derivati. In generale il VaR puo beneficiare ogni istituzione conesposizione al rischio finanziario: istituzioni finanziarie, regolatori, associazioni nonfinanziarie, asset managers.

In questo lavoro si vuole studiare un metodo numerico Monte Carlo per lavalutazione del VaR.

In generale un portafoglio ha un’espressione piuttosto complicata, a volte de-cisamente intrattabile. Per tale ragione, il primo passo e quello di utilizzare lacosiddetta approssimazione Delta-Gamma, che in sostanza significa approssi-mare L con lo sviluppo di Taylor al secondo ordine del portafoglio:

L = V (t) − V (t+ ∆t) ≈ −∂V∂t

∆t−m∑

i=0

∂V

∂Si

(

Si(t+ ∆t) − Si(t))

−1

2

m∑

i,j=0

∂2V

∂Si∂Sj

(

Si(t+ ∆t) − Si(t))(

Sj(t+ ∆t) − Sj(t))

.

Le quantita∂V

∂t, gradSV, HessSV

sono particolarmente importanti in Finanza, perche danno la sensibilita del portafo-glio in relazione a variazioni del tempo e del prezzo, e rappresentano tre possibiligreche: la prima prende il nome di Theta, la seconda e la Delta mentre l’ultimasi chiama Gamma. Detto allora ∆S = [S(t+ ∆t) − S(t)] il vettore che identifica

ii

le variazioni dei prezzi (fattori di rischio), nell’intervallo di tempo [t, t + ∆t],l’approssimazione Delta-Gamma garantisce che

L ≈ a0 + aT∆S + ∆STA∆S,

dove

a0 = −Theta∆t, a = −Delta, A = −1

2Gamma.

Va detto che anche il problema del calcolo delle greche e assolutamente non banalein Finanza: esse sono note solo per alcuni speciali modelli per il processo di prezzoS e per alcuni titoli derivati che compongono il portafoglio, in tutti gli altri casisono calcolabili numericamente, con metodi piu o meno efficienti. In ogni caso, quici poniamo nella situazione in cui i dati sono le greche ed un modello probabilistico(cioe una distribuzione) per la variazione dei prezzi ∆S. L’approssimazione Delta-Gamma consente quindi di facilitare molto le operazioni per il calcolo di L tramitesimulazioni Monte Carlo. Nel corso del nostro lavoro abbiamo voluto stimare ilVaR attraverso tecniche di riduzione della varianza. Facciamo un tipico esempiodi Monte Carlo standard e vediamo per quale motivo e cosı importante poterintrodurre tecniche di riduzione della varianza, per noi un metodo Monte Carlocon Importance Sampling.

Sia L la perdita. Prendendo valida per L la formula che si ottiene con l’ap-prossimazione Delta-Gamma, e note sia le greche che una distribuzione per i fattoridi rischio ∆S, la perdita L si puo ritenere simulabile. Ora, fissiamo il quantile p,ad esempio p = 0.01: il problema e il calcolo del VaR, ossia della soglia x tale cheIP(L > x) = 0.01. Tipicamente, quello che si fa e fissare qualche valore per x,stimare IP(L > x) con metodi Monte Carlo e poi muoversi intorno ad x in modoche la stima sia vicina a 0.01. La stima Monte Carlo standard per IP(L > x) edata dal tipico stimatore legato alla Legge dei Grandi Numeri:

IP(L > x) ≈ 1

N

n∑

k=1

I(L(k)>x)

dove N denota il numero di simulazioni, L(k) la k-esima simulazione della perditaL e I la funzione indicatrice. Questo algoritmo per il calcolo di IP(L > x), anchese semplice da implementare, risulta altamente inefficiente in quanto gli eventi{L(k) > x} sono poco probabili, giacche si cerca x affinche IP(L > x) = 0.01.Inoltre, la varianza dello stimatore e dello stesso ordine della quantita da stimare.Usando il Teorema del Limite Centrale, segue allora che per avere una buona stimadel VaR, saremmo costretti ad effettuare molte simulazioni e cio comporterebbeuna sostanziosa complessita computazionale, dunque una maggiore lentezza del

iii

programma. Per tale motivo introduciamo l’Importance Sampling. Questometodo, attraverso la teoria delle trasformate di Laplace, opera un opportunocambio di misura, detto cambio di misura esponenziale, in modo tale che, sottoquesta nuova misura, gli eventi di interesse non sono piu rari. Con l’ImportanceSampling quindi l’evento {L > x} non e piu raro e di conseguenza non occorronopiu troppe simulazioni per avere una buona stima di cio che si cerca.

In questa tesi, seguendo i lavori [6] e [7] di Glasserman, Heidelberger e Sha-habuddin, abbiamo studiato due possibili modelli per i fattori di rischio: il casoin cui ∆S assume una distribuzione gaussiana N(0,Σ), che e un modello acode sottili, e poi abbiamo analizzato un particolare modello con le code pesanti,ovvero con ∆S avente una distribuzione t di Student, decisamente piu realisticoin Finanza, come osservato da numerevoli autori.

Entriamo ora nei dettagli di quanto studiato in questa tesi, dividendo nei duecasi di code sottili e code pesanti.

1. Modello Gaussiano

Supponiamo qui che ∆S ∼ N(0,Σ). Come gia accennato, l’intento dell’Impor-tance Sampling e quello di operare un cambio di misura esponenziale. Effettuatal’approssimazione Delta-Gamma per L, per semplificare ulteriormente i calcoli,abbiamo espresso tale approssimazione nel seguente modo:

L ≈ a0 + aT∆S + ∆STA∆S = a0 +Q,

dove Q e una forma quadratica diagonalizzata:

Q =

m∑

i=1

(biZi + λiZ2i ) (1)

con Zi ∼ N(0, 1) indipendenti e dove i vettori b e λ si scrivono in termini dellaDelta e della Gamma. L’idea dell’Importance Sampling e la seguente.

Siano date due variabili aleatorie X e Y a valori in <d, rispettivamente condensita fX e fY . Per semplicita, supponiamo che fY > 0. Fissata una funzionemisurabile g : <d → <q, allora per ogni boreliano A di <q, possiamo scrivere

IP(g(X) ∈ A) = IE[Ig(X)∈A] = IE

[

Ig(Y )∈AfX(Y )

fY (Y )

]

(2)

Indicando con LX e LY le leggi di X e Y , la (2) garantisce che la misura LX eassolutamente continua rispetto a LY e la derivata di Radon-Nikodym vale

dLXdLY

(y) =fX(y)

fY (y).

iv

L’Importance Sampling consiste nell’operare un cambio di misura come quelloappena visto: si parte da un evento del tipo {g(X) ∈ A}, che ha bassa probabilitadi verificarsi, quindi si passa a considerare un’ulteriore v.a. Y tale che l’evento{g(Y ) ∈ A} e invece ragionevolmente probabile. Volendo stimare IP(g(X) ∈ A)con metodi Monte Carlo, la (2) consente di usare un ulteriore stimatore costruitoa partire da Y :

IP(g(X) ∈ A) = IE

[

Ig(Y )∈AdLXdLY

(Y )

]

≈ 1

N

N∑

k=1

Ig(Y (k))∈A

dLXdLY

(Y (k))

dove N denota il numero di simulazioni e Y (k), . . . , Y (k) sono N copie indipendentidi Y . L’idea e quindi di scegliere la variabile aleatoria Y in modo tale che IP(g(Y ) ∈A) non sia trascurabile, cosicche gli eventi {g(Y (k)) ∈ A} si verifichino con unacerta frequenza. In tal modo, la varianza di questo stimatore risulta piu piccola,a causa di una minore dispersione nei risultati.

Torniamo alla perdita L = a0+Q, dove Q e la forma quadratica presente in (1),dunque Q e funzione di un vettore aleatorio Z di gaussiane standard. Indicandocon Z un ulteriore vettore gaussiano, seguendo l’idea appena vista e in particolarela (2), nel nostro caso possiamo scrivere

IP(L > x) = IE[IL>x`(Z)]

dove `(Z) denota la derivata di Radon-Nikodym della legge di Z rispetto allalegge di Z. Se Z ha media µ e matrice di varianza-covarianza B (e ricordando cheZ ∼ N(0, Im×m)), si ha

dLZdLZ

(z) = `(z) =exp(−1

2 zT z)

(det(B))−12 exp(−1

2(z − µ)TB−1(z − µ)).

Occorre ora scegliere i parametri µ e B. L’operazione che andiamo ora ad eseguireviene detta twisting esponenziale. Sia θ ≥ 0 un parametro, detto parametrotwist, e siano:

{

B(θ) = (I − 2θΛ)−1

µ(θ) = θB(θ)b,

dove Λ = diag(λ1, . . . , λm), con λ1 ≥ λ2 ≥ · · · ≥ λm, e la matrice degli autovaloridi C ′AC, con C tale che CC ′ = Σ. Allora usando questa parametrizzazione allamedia e alla matrice di varianza-covarianza, si dimostra che, per ogni θ tale che1 − 2θλ1 > 0, la funzione di verosimiglianza diventa:

`(Z) = exp(

−θ(bTZ + ZTΛZ))

= exp (−θQ+ ψ(θ)) ,

v

dove qui Q va intesa come funzione del vettore Z e la funzione ψ(θ) e data da:

ψ(θ) =

m∑

i=1

(

1

2

(θbi)2

1 − 2θλi− log(1 − 2θλi)

)

.

Seguendo il procedimento brevemente riassunto in precedenza, determiniamo cosıun nuovo stimatore per IP(L > x):

IP(L > x) ≈ 1

N

N∑

k=1

Ia0+Q(k)>x `(Z(k))

dove le Z(k) sono gaussiane indipendenti, di media µ(θ) e matrice di varianza-covarianza B(θ), e Q(k) sono i valori che assume la forma quadratica Q in cor-rispondenza a Z (k). La quantita

Tθ(Z) = I(L>x) · `(Z)

con Z ∼ N(µ(θ), B(θ)), e detta stimatore di Importance Sampling. Osservi-amo che lo stimatore di Importance Sampling e non distorto. Inoltre, si verificache, detta IEθ la media effettuata sotto la nuova misura IPθ, si ha

IEθx[L] = x.

Ma allora, sotto IPθxl’evento {L > x} non e piu un evento raro: ci troviamo quindi

nella situazione descritta in precedenza.Da ora in poi, poiche lo stimatore di Importance Sampling dipende da θ, il

nostro scopo e quello di studiare le proprieta di Tθ(Z) e in particolare di trovare ilθ migliore, rendendo la varianza dello stimatore piu piccola possibile. Osserviamopero che studiare direttamente la varianza e di fatto impraticabile, per via delladifficile espressione che si ottiene. Per tale ragione, come normalmente si procedenell’Importance Sampling, si preferisce minimizzare non tanto la varianza ma unasua stima opportuna. Infatti, si verifica facilmente che

Varθ(Tθ(Z)) ≤ e2ψ(θ)−2θ(x−a0) − IP(L > x)2,

allora il θ ottimale si sceglie come quello che minimizza l’espressione a destra nellaformula sopra scritta. Si dimostra che tale valore per θ risulta essere quello cherisolve l’equazione

ψ′(θ) = x− a0.

Sia θx questo parametro twist: ψ′(θx) = x− a0.

Usando pesantemente la teoria delle trasformate di Laplace e sia la teoria chetecniche di dimostrazione provenienti dalle Grandi Deviazioni, e stato possibiledimostrare i seguenti risultati.

vi

• Comportamento asintotico in x di IP(L > x).

Se λ1 > 0 allora

limx→+∞

log IP(L > x)

x= − 1

2λ1

• Comportamento asintotico in x del momento secondo dello stima-

tore di Importance Sampling.

Siam2(x, θ) = IEθ[T

2θ (Z)] ≤ e2ψ(θ)−2θ(x−a0)

il momento secondo di Tθ(Z). Allora,

limx→+∞

logm2(x, θx)

x= − 1

λ1.

In particolare, questi risultati consentono di affermare che lo stimatore diImportance Sampling e asintoticamente ottimale, nel senso che

lim supx→+∞

1

xlog IEθx

[

T 2θx

(Z)]

= inf{θ∈(0,1/(2λ1)}

lim supx→+∞

1

xlog IEθ

[

T 2θ (Z)

]

.

Inoltre, tutto questo ci ha permesso di evidenziare che

Varθx(Tθx

(Z)) ≈ e−2cx, con c =1

2λ1, se x→ +∞.

Ora, se consideriamo invece T (Z) lo stimatore Monte Carlo standard, ovveroT (Z) = IL>x, abbiamo

Var(T (Z)) = IP(L > x) − IP2(L > x) ≈ IP(L > x),

dunque

Var(T (Z)) ≈ e−cx, con c =1

2λ1, se x→ +∞.

Ma allora la varianza dello stimatore di Importance Sampling, con la scelta θ = θx,converge a zero per x→ +∞ piu velocemente della varianza dello stimatore MonteCarlo standard.

Ricordiamo che nella pratica si e interessati a stimare IP(L > x) per una certagamma di valori di x, ad esempio si potrebbe essere interessati a trovare x inmodo tale che IP(L > x) cada in un certo intervallo [0.01,0.05]. Sappiamo che ilVaR e definito come quantile della distribuzione della perdita L, quindi a priorinon si conosce il valore di x. Procedendo con l’Importance Sampling e naturale

vii

chiedersi quale sia la sua efficienza quando usiamo il parametro twist θx per stimareIP(L > y) per y 6= x. A tal proposito abbiamo mostrato che l’Importance Samplingcon parametro θx e asintoticamente ottimale per la stima di IP(L > x) in unavasta gamma di valori per y vicini a x. Tale proprieta e nota come robustezza

del metodo; matematicamente si esprime nel seguente modo:

• Robustezza.

Se L = a0 +Q, λ1 > 0 e yx → +∞, in modo tale che

lim supx→+∞

(

x

yx

)

< +∞,

allora il parametro twist θx definito da ψ′(θx) = x − a0 e asintoticamenteottimale anche per la stima di IP(L > yx), cioe:

limx→+∞

logm2(yx, θx)

yx= − 1

λ1.

In seguito abbiamo assunto un nuovo punto di vista: abbiamo fissato x estudiato il comportamento asintotico al tendere all’infinito del numero m di fattoridi rischio. Si tratta questo di un problema interessante ad esempio per le banche,che possiedono portafogli costituiti da un alto numero di titoli. In tal caso, usandoteoremi di convergenza specifici, e stato possibile dimostrare il prossimo risultato.Nel seguito, sottolineeremo la dipendenza da m piuttosto che da x.

• Comportamento asintotico per m→ ∞.

Sia

xm =m∑

i=1

λi + xstd

m∑

i=1

(b2i + 2λ2i ) (3)

con xstd numero fissato, e θm il parametro twist in corrispondenza al valorex = xm: ψ′

m(θm) = xm. Se

limm→∞

[∑m

i=1

(

|bi|3 + |λi|3)]2

[∑m

i=1

(

b2i + λ2i

)]3 = 0,

allora

limm→∞

IP(Qm > xm) = 1 − Φ(y) e limm→∞

m2(xm, θm) = ey2(1 − Φ(2y)),

dove Φ denota la funzione di distribuzione di una normale standard.

viii

Abbiamo poi considerato una combinazione di Importance Sampling con un campi-onamento stratificato, allo scopo di ottenere un’ulteriore riduzione della varianza.Risultati numerici (Glasserman, Heidelberger e Shahabuddin [6]) mostrano che l’-efficienza dell’Importance Sampling combinato con un campionamento stratificatoaumenta al diminuire di IP(L > x). In breve, ”stratificare” significa considerareuna variabile Y a valori in uno spazio E ed {Sj}j=1,...,k una partizione (strati)di E. Ovviamente, se si sceglie k = 1 significa non procedere ad alcuna forma distratificazione, quindi i risultati che si ottengono rientrano nella casistica studiatain precedenza. Indichiamo con pj la probabilita che la variabile aleatoria ausil-iaria Y appartenga allo strato Sj. Consideriamo nj = [qj n] campionamenti di Ynello strato Sj (dunque qj e la proporzione dei campionamenti nello strato Sj) edefiniamo

Fjn(x) = 1 − 1

nj

nj∑

i=1

`ij ILij > x e Fn(x) =

k∑

j=1

Fjn(x),

dove Lij denota la perdita del campione i nello strato j e `ij la relativa verosimiglian-za osservata. E facile vedere che la distribuzione (aleatoria) Fn stima la dis-tribuzione vera F della perdita L. Ora, fissata una probabilita p, se definiamo ilquantile

α = F−1(1 − p),

ed il quantile (aleatorio)

αn = inf {x : Fn(x) ≥ 1 − p} ,

ci si chiede se e come αn stima α. E evidente l’importanza di tali questioni per ilnostro problema del calcolo del VaR: α e proprio il VaR! I risultati che si ottengonosi possono riassumere come segue. Indicheremo con σ2(α) la seguente quantita:

σ2(α) =k∑

j=1

p2j σ

2j (α)/qj ,

dove σ2j (α) e la varianza di `ij ILij>x e `ij ILij>x sono variabili aleatorie i.i.d. sotto

IPθ. Osserviamo che qui `ij viene calcolato sotto un θ generico positivo.Esponiamo alcuni risultati asintotici, notando che sono stati ottenuti sotto la

misura IPθ.

• Comportamento asintotico dei quantili.

Supponiamo che la densita f di L sia continua e positiva in un intorno diα, che IEθ[`

3ij ] <∞ e che σ(α) > 0. Allora,

ix

– Teorema Limite Centrale:

√n(αn − α) −→n→+∞ N

(

0,σ2(α)

f2(α)

)

, in legge.

– Convergenza forte:

αn −→n→∞ α q.c.

Il risultato di convergenza forte e originale, essendo stato dimostrato per laprima volta in questa tesi.

2. Modello di Student

In questo caso abbiamo eseguito uno studio parallelo a quello fatto nel caso gaus-siano, sviluppando pero un altro modello per i fattori di rischio ∆S. Tale nuovomodello e basato su una distribuzione con le ”code spesse”: abbiamo preso in con-siderazione in particolare la distribuzione t di Student. Dopo aver dato alcuni cenniproprio su tale legge, assumendo ancora una volta sempre un portafoglio di tipoquadratico, abbiamo affrontato il problema della trasformata di Laplace per vari-abili aleatorie di questo tipo. In verita, le trasformate di Laplace in questo caso nonsono propriamente un ”problema”: semplicemente, non esistono. Quindi lo stu-dio parallelo cui accennavamo e stato effettuato tramite opportune manipolazionisu questo tipo di variabili aleatorie. Ma, una volta effettuate, abbiamo potutodavvero riproporre le tecniche viste in precedenza. Abbiamo poi sviluppato unostudio volto ad analizzare le proprieta del conseguente stimatore di ImportanceSampling. Vediamo ora un po’ piu in dettaglio quanto e stato fatto.

Anche qui supponiamo L ≈ a0 + Q, con Q funzione quadratica con formadiagonalizzata

Q =

m∑

j=1

(λjX2j + bjXj),

dove pero questa volta assumiamo le Xj con distribuzione di Student. Abbiamoora a che fare con un punto di vista finanziario piu realistico, ovvero quello incui i fattori di rischio ∆S(= X) sono delle variabili aleatorie con una distribuzionedalle code spesse. La non-esistenza della trasformata di Laplace di ciascuna Xj nonconsente di operare da subito un cambio di misura esponenziale, con l’introduzionedel parametro twist, come visto nel caso gaussiano. Cio nonostante anche qui, cisiamo proposti di fare un cambio di misura. Prima pero abbiamo operato uncambio di variabile che ci ha consentito di lavorare su una quantita alternativa aQ. Vediamo come.

x

Una variabile aleatoria X su <m con distribuzione t di Student con ν gradi diliberta e matrice associata Σ, si puo rappresentare nel seguente modo:

Xd=

Z√

dove Z e Y sono variabili aleatorie indipendenti, con Z gaussiana su <m a medianulla e con matrice di varianza-covarianza Σ, e Y di tipo chi-quadro con ν gradidi liberta. La densita di probabilita di X e data dalla formula

fX(x) =Γ(

ν2 + n

2

)

(νπ)n2 Γ(ν/2)det(Σ)

12

(

1 +xtΣ−1x

ν

)− ν2−n

2

, x ∈ <m,

dunque le code della distribuzione vanno a zero a velocita polinomiale (da cui ”codespesse”). A questo punto abbiamo considerato il suddetto cambio di variabile.Innanzitutto abbiamo denotato con Q la quantita

Q =

m∑

i=1

(

λiZ2i

Y/ν+ bi

Zi√

Y/ν

)

,

osservando che Qd= Q. Definendo

Qx :=

(

Y

ν

)

(Q− x),

si ha ovviamenteIP(Q ≤ x) = IP(Qx ≤ 0) ≡ Fx(0).

Tale semplice proprieta si rivela cruciale: si mostra facilmente che la distribuzionedi Qx non ha le code grasse, che per di piu vanno a zero a velocita esponenziale,proprieta che finalmente consente di usare le trasformate di Laplace e le conseguentiproprieta.

Fatto questo, e considerata sempre l’approssimazione Delta-Gamma per ilportafoglio, e stato possibile definire un cambio di misura esponenziale, per poiprocedere a sviluppare un metodo di Importance Sampling. Riassumiamo qui ilcambio di misura e le principali proprieta.

• Cambio di misura nel modello di Student.

Siano φx e φY le trasformate di Laplace rispettivamente di Qx e di Y . Sianoinoltre ψx = log φx e ψY = log φY . Per θ < 1

2λ1sia

α(θ) = −θxν

+2

m∑

j=1

θ2b2j1 − 2λi

.

xi

– Cambio di misura esponenziale.

Per ogni θ tale che α(θ) < 1/2, allora la misura IPθ definita da

dIPθ = exp(θQx − ψx(θ))dIP

e una misura di probabilita e

IP(L > y) = IEθ

[

e−θQx+ψx(θ)IL>y

]

= IEθ

[

e−θ(Yν

)(Q−x)+ψx(θ)IL>y

]

.

Inoltre, se IPα e la misura definita da

dIPαdIP

= eαY −ψY (α)

con α < 12 e se IPθ e la misura definita sopra, allora

IPθ = IPα(θ).

– Distribuzione di X sotto la nuova misura IPθ.

Sotto IPθ, X ha la stessa distribuzione di Zq

, dove Y ha legge Γ(

ν2 ,

1−2α(θ)2

)

e condizionatamente a Y , le variabili aleatorie Z1, ..., Zm sono indipen-denti e gaussiane con medie e varianze date da

µj(θ) =θbj

1 − 2θλj, e σ2(θ) =

1

1 − 2θλj, j = 1, . . . ,m.

Questi risultati si rivelano particolarmente utili, ad esempio per le simulazioniperche danno una semplice regola di simulazione del vettore X di Student sotto lanuova misura.

Ora, presa IPθ come nuova misura di riferimento, possiamo definire anche nelmodello t di Student uno stimatore di Importance Sampling e, come fatto anchenel caso gaussiano, ne abbiamo studiato alcune proprieta di rilievo. Tenendo contodel cambio di misura, lo stimatore in questione e basato sulla quantita

Tθ(X) = IQ>x e−θQx+ψx(θ).

Anche qui si propone ovviamente il problema della scelta del θ ottimale. Proceden-do come nel caso gaussiano, si considera dapprima la seguente stima del momentosecondo m2(θ, x):

m2(θ, x) = IEθ

[

e−2θQx+2ψx(θ)I(Q>x)

]

= IE[

e−θQx+ψx(θ)I(Q>x)

]

≤ eψx(θ),

xii

e poi l’ottimizzazione su θ si ottiene minimizzando la quantita a destra dell’espres-sione precedente: il θx ottimale risolve l’equazione

ψ′x(θx) = 0.

Osserviamo che qui si tratta di un minimo vincolato, quindi non e proprio dettoche θx sia un punto stazionario per ψx. Ed in effetti, nelle simulazioni numericheche abbiamo effettuato in alcuni casi abbiamo avuto problemi nel calcolo del θottimale.

Le proprieta asintotiche, per x → ∞, relative al modello di Student mostranocome, sotto ipotesi opportune, lo stimatore di Importance Sampling verifichi lacosiddetta proprieta di limitatezza dell’errore relativo, cioe:

lim supx→+∞

m2(θ, x)

IP(Q > x)2<∞. (4)

Riassumiamo qui di seguito i principali risultati.

• Comportamento asintotico del momento secondo, I.

Se λ1 > 0, per ogni θ positivo fissato tale che ψx(θ) < 0, esiste una costantec(θ) per la quale,

m2(θ, x) ≤ c(θ)IP(Q > x)x−ν2 ,

per ogni x grande abbastanza.

• Limitatezza dell’errore relativo, I.

Se λj > 0, per ogni j = 1, ...,m, allora lo stimatore

Tθ(X) = e−θQx+ψx(θ) I(Q>x)

di IP(Q > x) ha errore relativo limitato, cioe vale la (4).

• Comportamento asintotico del momento secondo, II.

Se θx e tale che ψ′x(θx) = 0 e λ1 e positivo, allora esiste una costante K,

per la quale,m2(θx, x) ≤ KIP(Q > x)x−

ν2 ,

per ogni x grande abbastanza.

• Limitatezza dell’errore relativo, II.

Se θx e tale che ψ′x(θx) = 0 e se λj > 0, per ogni j = 1, ...,m, allora anche

Tθx(X) = e−θQx+ψx(θx) I(Q>x)

ha errore relativo limitato, cioe vale la (4).

xiii

Una volta studiati teoricamente i due modelli di riferimento, abbiamo effet-tuato uno studio numerico per verificare l’efficienza anche pratica dell’ImportanceSampling.

3. Risultati numerici

Nell’ultima parte del lavoro abbiamo riportato alcuni risultati numerici. In parti-colare, facendo riferimento ai portafogli indicati negli articoli di Glasserman Hei-delberger e Shahabuddin [6] e [7], attraverso il pacchetto statistico dell’applicativoMatlab e attraverso il linguaggio Pascal, abbiamo effettuato simulazioni MonteCarlo standard e Monte Carlo con Importance Sampling.

Abbiamo considerato portafogli formati da opzioni di acquisto (call) e di ven-dita (put). Le formule delle greche sono state prese dalle formule provenienti dalmodello di Black e Scholes, effettuando ovviamente delle opportune ulterioriapprossimazioni. Abbiamo eseguito i programmi sia nel caso gaussiano, sia inquello t di Student, operando 80000 simulazioni, e abbiamo potuto appurare l’-efficienza del metodo con Importance Sampling rispetto a Monte Carlo standard,soprattutto in termini di velocita di esecuzione del programma, che sottolineiamoe sostanzialmente dello stesso ordine per entrambe le procedure.

Come gia detto, abbiamo individuato la funzione quadratica Q, nella sua formadiagonalizzata per poi calcolare numericamente IP(Q+a0 > x) e relativa varianza,applicando nei due casi, come detto, sia Monte Carlo standard che Monte Carlocon Importance Sampling. Riguardo proprio a questo metodo abbiamo dovutocercare il valore ottimale θx, di cui abbiamo ampiamente parlato, risolvendo l’e-quazione ψ′(θ) = x− a0 oppure ψ′

x(θ) = 0. Per tale motivo, nei nostri programmiabbiamo utilizzato il metodo di Newton per la ricerca degli zeri di una funzione. Inun portafoglio in particolare (portafoglio a.7), a causa della sua complessita, perindividuare θx, abbiamo dovuto ricorrere a una funzione dell’applicativo Matlab.

Riassumiamo nelle seguenti tabelle i risultati ottenuti.

3.1 Modello gaussiano

I portafogli considerati sono:

1. Portafoglio a.1, maturita T = 0.5 anni, costituito da 10 call e 5 put at-the-money in posizione corta su ogni titolo.

2. Portafoglio a.2, maturita T = 0.5 anni, costituito da 10 call e 5 put at-the-money in posizione corta sui primi 5 titoli, 10 call at-the-money in posizionelunga e 5 put at-the-money in posizione corta, sui rimanenti 5 titoli.

xiv

3. Portafoglio a.3, maturita T = 0.10 anni, per il resto identico al portafoglioa.1.

4. Portafoglio a.4, maturita T = 0.10 anni, per il resto identico al portafoglioa.2.

5. Portafoglio a.5 (Delta-Hedged), maturita T = 0.10 anni, costituito da 10call at-the-money in posizione corta sui primi 5 titoli, 5 call at-the-money inposizione lunga sui rimanenti 5 titoli. La posizione e il numero di put suiprimi e sui secondi 5 titoli sono scelti in modo tale che Delta e uguale a zero.

6. Portafoglio a.6, equivalente al portafoglio a.5, ma nel quale abbiamo ap-plicato l’IS solo sui titoli corrispondenti agli autovalori positivi.

7. Portafoglio a.7, maturita T = 0.5 anni, costituito da 50 call at-the-moneye 50 put at-the-money in posizione corta su 10 titoli sottostanti con valoreiniziale S = [100, 50, 30, 100, 80, 20, 50, 200, 150, 10].

La quantita xstd presente nelle tabelle e presa dalla formula (3).

(a) Monte Carlo standard

Portafoglio xstd IP(L > x) Varianza

a.1 2.59 1.00% 0.099a.2 2.30 1.01% 0.010a.3 2.75 1.15% 0.011a.4 2.32 0.92% 0.009a.5 2.89 1.09% 0.011a.7 3.40 1.15% 0.012

Tabella 1: Monte Carlo standard-caso gaussiano.

Da questi primi risultati notiamo che la varianza e molto alta: dello stessoordine della probabilita. Questo implica che gli intervalli di confidenza sonomolto grandi.

(b) Monte Carlo con Importance Sampling

xv

Portafoglio xstd IP(L > x) Varianza

a.1 2.59 1.00% 0.00033a.2 2.30 1.00% 0.00029a.3 2.75 1.11% 0.00050a.4 2.32 1.00% 0.00031a.5 2.89 1.11% 0.00055a.6 2.89 1.12% 0.00073a.7 3.20 1.11% 0.00331

Tabella 2: Monte Carlo con Importance Sampling-caso gaussiano.

Osserviamo che nella Tabella 2, le varianze hanno subito una diminuizionedell’ordine di 10−2 ad esclusione dell’ultimo portafoglio, dove comunque c’estata una diminuizione pari a 10−1 (ricordiamo che per il portafoglio a.7,ci sono state delle difficolta per il calcolo del θ ottimale. Per tale ragioneabbiamo dovuto utilizzare una funzione di Matlab, in quanto si trattava dicalcolare un minimo vincolato che numericamente e difficle).

3.1 Modello di Student

I portafogli considerati sono:

1. Portafoglio b.1, maturita T = 0.5 anni, costituito da 10 call e 5 put at-the-money in posizione corta su ogni titolo.

2. Portafoglio b.2, maturita T = 0.5 anni, costituito da 10 call e 5 put at-the-money in posizione lunga su ogni titolo.

3. Portafoglio b.3, maturita T = 0.10 anni, equivalente al portafoglio b.1.

4. Portafoglio b.4, maturita T = 0.10 anni, equivalente al portafoglio b.2.

5. Portafoglio b.5 (Delta-Hedged), maturita T = 0.10 anni, equivalente alportafoglio b.3, ma con la posizione e il numero di put sui 10 titoli ottenutiponendo Delta uguale a zero.

Nelle tabelle che seguono, indichiamo con Varianza(L), la varianza relativa allaquantita IP(L > x), Varianza(Q), quella di IP(Q+ a0 > x).

(a) Monte Carlo standard

xvi

Portafoglio x IP(L > x) Varianza(L) IP(Q+ a0 > x) Varianza(Q)

b.1 311 1.05% 0.0103 1.20% 0.0118b.2 145 0.96% 0.0094 1.25% 0.0124b.3 469 0.95% 0.0094 1.57% 0.0154b.4 148.8 1.00% 0.0101 0.90% 0.0088b.5 617 1.02% 0.0101 1.67% 0.0164

Tabella 3: Monte Carlo standard-caso di Student.

(b) Monte Carlo con Importance Sampling

Portafoglio x IP(L > x) Varianza(L) IP(Q+ a0 > x) Varianza(Q)

b.1 311 1.01% 0.0010 1.16% 0.0015b.2 145 1.02% 0.0016 1.30% 0.0022b.3 469 0.99% 0.0098 1.60% 0.0157b.4 148.8 0.97% 0.0033 0.86% 0.0028b.5 617 1.05% 0.0005 1.69% 0.0014

Tabella 4: Monte Carlo con Importance Sampling-caso di Student.

Dai risultati della Tabella 4 osserviamo che nel modello di Student, abbiamoottenuto una diminuizione della varianza dell’ordine di 10−1, tranne che per ilportafoglio b.3, dove non riuscendo a trovare il θ ottimale, nemmeno con Matlab,il programma pone θ = 0 e di conseguenza, poiche un metodo Monte Carlo conImportance Sampling con θ = 0 non e altro che un metodo Monte Carlo standard,le varianze ottenute hanno lo stesso ordine.In generale comunque in entrambi i modelli, confrontando il metodo Monte Car-lo standard con il metodo Monte Carlo con Importance Sampling, si ha unadiminuizione della varianza nel secondo caso.

Riassumiamo infine brevemente com’e organizzata questa tesi.

I Capitoli 1 e 2 sono introduttivi, il primo sulle trasformate di Laplace e sulleGrandi Deviazioni, il secondo sul calcolo stocastico e sulla finanza. La bibliografiadi riferimento di questi due capitoli e: per il Capitolo 1, Baldi [1], Bucklew [2], Dem-bo e Zeutoni [5], Grimmett[11]; per il Capitolo 2, Baldi [1], Jorion [13], Lambertone Lapeyre [14].

Nel Capitolo 3 abbiamo analizzato il metodo dell’Importance Sampling nelmodello gaussiano. In particolare: il cambio di misura esponenziale, lo stimatoredi Importance Sampling, la proprieta dell’ottimalita asintotica, la robustezza del

xvii

metodo, il campionamento stratificato e il comportamento asintotico in relazione alnumero dei fattori di rischio. La bibliografia di riferimento e: Bucklew [2], Chung[3], Glasserman, Heidelberger e Shahabuddin[6], [8], [9] e [10], Jorion [13].

Nel Capitolo 4 abbiamo trattato il modello di Student, in particolare: le gen-eralita sulla distribuzione t di Student, la rappresentazione in termini di codesottili, il cambio di misura esponenziale, l’analisi dello stimatore e la robustezzadel metodo. I relativi riferimenti bibliografici sono: Glasserman, Heidelberger eShahabuddin [6], [7] e [9].

Infine nell’ultimo capitolo, ci siamo occupati della parte numerica, facendosimulazioni Monte Carlo standard e Monte Carlo con Importance Sampling. Cisiamo riferiti alla seguente bibliografia: Glasserman, Heidelberger e Shahabuddin[6] e [7], Imhof [12].

xviii

Bibliografia

[1] P. Baldi, Equazioni differenziali stocastiche e applicazioni. Pitagora Editrice,2000.

[2] J. A. Bucklew, Large deviation techniques in decision, simulation, andestimation. John Wiley & Sons, Inc., New York, 1990.

[3] K. Chung, A course in probability theory. Academic Press, New York, secondedition, 1974.

[4] G. Dall’Aglio, Calcolo delle probabilita. Zanichelli, 1991.

[5] A. Dembo & O. Zeitouni, Large deviation techniques. Jones and BarlettPublishers, 1993.

[6] P. Glasserman, P. Heidelberger, P. Shahabuddin, Variance reduction tech-niques for estimating value-at-risk. Computer Science/Mathematics, NewYork, 1999.

[7] P. Glasserman, P. Heidelberger, P. Shahabuddin, Portfolio value-at-risk withheavy-tailed risk factors. Columbia business school, 2000.

[8] P. Glasserman, P. Heidelberger, P. Shahabuddin, Importance Sampling andstratification for Value-at-Risk. Y.S. Abu-Mostafa, B. LeBaron, A.W. Lo, A.S.Weigend editors, Computational Finance 1999, MIT Press, Cambridge, MA,1999.

[9] P. Glasserman, P. Heidelberger, P. Shahabuddin, Asymptotically optimalImportance Sampling and stratification for pricing path-dependent options.Mathematical Finance, 9:117-152, 1999.

[10] P. Glasserman, P. Heidelberger, P. Shahabuddin, Stratification issues inestimating value-at-risk. In Proceedings of the 1999 Winter SimulationConference, 1999.

xix

[11] G. R. Grimmett, D. R. Stirzaker, Probability and random processes. Oxforduniversity press, second edition, 1995.

[12] J. Imhof, Computing the distribution of quadratic forms in normal variables.Biometrika, 48:419-426, 1961.

[13] P. Jorion, Value at Risk. Mc Graw Hill, New York, 1997.

[14] D. Lamberton & B. Lapeyre, Introduction to stocastic calculus applied tofinance. Chapman & Hall, Berlin, Heidelberg, New York, 1996.

xx