Post on 23-Feb-2016
description
Ragioniamo ancora un po’ sulla hazard con un esempio Supponiamo che i contratti siano stai stipulati tutti in un mese e che ogni mese ne vengano rescissi il 5/10/15/20% (tasso di mortalità), senza nuovi contratti.
Quanti contratti “sopravvivono” ogni mese con il passare dei mesi?
Contratti in essere per numero di mesi e valore dell'hazard (coorte di 100 contratti)
0
10
20
30
40
50
60
70
80
90
100
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
mesi
cont
ratt
i 5%10%15%20%
mediana
La Hazard si comporta come un tasso di interesse composto
Se deposito 1000 euro e il tasso annuo che la banca mi paga è del 3%
Supponendo che l’interesse venga capitalizzato ogni giorno, cioè ogni giorno la banca v mi accredita il (3/365)% di quanto avevo in conto il giorno prima
Alla fine dell’anno avrò 1.030,39 € NON 1.030 come sarebbe se l’interesse fosse capitalizzato tutto a fine anno, perché nel corso dell’anno percepisco interessi sugli interessi.
Se fosse mensile avrei 1.030,42trimestrale 1.030,34
Come si vede è l’hazard (il tasso di interesse) e la scansione temporale (discreta) che guidano il processo
La Hazard si comporta come un tasso di interesse composto
Nell’esempio dei contratti la hazard è lievemente superiore del tasso di mortalità:
Quando il tasso è costante la relazione è
Log[S(t)]= -t
Poiché è costante si può calcolare in un punto, ad es la medianaQuesti sono i valori (approssimati):
Naturalmente l’ipotesi di costanza dell’hazard (o del tm) è piuttosto restrittiva
Più spesso varieranno col tempo
t.m. 5% 10% 15% 20%hazard 56% 11% 16% 22%
Data la funzione di densità di T f(t)
Ripartizione:
Sopravvivenza
Hazard
Hazard integrata
Relazioni:
t
tTdssftF0
)Pr()()(
)Pr()(1)( tTtFtS
)()(
)()()(lim)/Pr(lim)(
00 tStf
tStFtFtTttTtt
)(ln)(;)(;)()()(;)(ln)( )( tStetSttStfdt
tSdt t
t
dsst0
)()(
Modelliamo la hazard: modello semplice = rischio costante
tKetS
tktSdt
tSdt
)(
)(ln)(ln)(
Distribuzione esponenziale, caso piuttosto semplice infatti per la distribuzione esponenziale è:
ttE 1ˆ1)(
In generale, la hazard dipende da 2 parametri ( e p)
E la dipendenza della hazard dal tempo (positiva o negativa) è “governata” dal parametro p e dalla distribuzione scelta:
Esponenziale hazard costante
Weibull hazard Crescente/decrescente (dip.da p)
Log-logisticaHazard prima cresce poi cala
LognormaleHazard prima cresce poi cala
)(t
1)()( ptpt
1
1
)(1)()(
p
p
ttpt
)ln(
)ln()/()(tptptpt
NB la hazard è altamente non lineare:
hazard weibull per valori di p
0
0,005
0,01
0,015
0,02
0,025
0 20 40 60 80 100 120
t
0,75
0,85
0,95
1,05
1,15
1,25
1,35
1,45
1,55
1,65
1,75
Altre distribuzioni stima MLE tenendo conto dei dati censurati
censuraticensuratiNON
censuraticensuratiNON
tStL
tSttfdatooppure
tStfL
)/(ln)/(ln
)()()(
)/(ln)/(lnln
Esempio: durata in giorni di un insieme di scioperi (Green)
p medianaEsponenziale 0.02344 1.00000 29.6s.e. 0.003 0.000 3.522
Weibull 0.02439 0.92083 27.5s.e. 0.003 0.111 4.00
Log-logistica 0.04153 1.33148 24.1s.e. 0.007 0.172 4.102
Lognormale 0.04514 0.77206 22.2s.e. 0.008 0.089 3.95
stima hazard per sciopero
0,00000
0,00500
0,01000
0,01500
0,02000
0,02500
0,03000
0,03500
0,04000
0 20 40 60 80 100 120
t
haza
rd
Esponenziale
Weibull
Log-logistica
Lognormale
Introduciamo delle determinanti X. Le determinanti vengono introdotte nel termine , naturalmente al’esponente
Si modifica la logL che ora viene minimizzata in p, e
Nell’esempio degli scioperi, introducendo un indice della produzione industriale si ottiene, per la Weibull:
-ln() = 3.7772 – 9.3515 x ; p=1.00288
=exp(-3.772+9.3515x)
Attenzione alla lettura dei coefficienti !
Occorre ricordarsi che, nella weibull
ixi e
002.01 *)35.977.3(002.1*)35.977.3()()( txxtpt iip
iii
hazard esempio sciopero per diversi livelli della X (variazione indice produzione industriale)
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
0,04
0 20 40 60 80 100 120
tempo (giorni)
haza
rd
-0,05
-0,04
-0,03
-0,02
-0,01
0
0,01
0,02
0,03
0,04
0,05
Hazard quasi “piatta” infatti p quasi =1….come esponenziale
Ma nell’esempio dei contratti:
-ln() = 2.3314 + 0.0601 età ; p=1.19759
hazard esempio contratti per diversi livelli della X (età)
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
0,04
0,045
0,05
0 20 40 60 80 100 120
tempo (giorni)
haza
rd
20
25
30
35
40
45
50
55
60
65
70
Attenzione alla lettura dei coefficienti !
In generale la Hazard adesso dipende da t, p, e X
Il segno del coefficiente della X indica la direzione dell’effetto sulla hazard SOLO SE la hazard è MONOTONA ! (es. nelle loglog non vale!)
In ogni caso l’effetto è NON LINEARE
La interpretazione va fatta
Per valori “tipici” delle X (es.medie)
Disegnando la funzione (hazard e/o Survival)
Per strati di popolazione
Per tipologie
Analisi di specificazione:
Usuali test per stime MLE (LR, LM, WALD)
Diversi test di adattamento sono stati proposti, ma i risultati sono, in generale, condizionati alla scelta della distribuzione di partenza.
Il problema della errata specificazione del modello, cioè della eterogeneità non osservata è particolarmente rilevante nell’approccio parametrico e, in generale, non ha una soluzione semplice.