Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3)...

20
Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)= 1/3 E(X) = (1+2+3+4+5+6)*1/6 = 21/6 = 3.5 E(x/x>3)= (4+5+6)*1/3= 15/3 = 5 V(x) = 2.92 V(x/x>3)= 0.67 Sono stai “eliminati” i valori più “piccoli”

Transcript of Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3)...

Page 1: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Distribuzioni troncate: esempio

Un vecchio amico: il dado

P(x)=1/6

Se supponiamo che 3 facce (1,2,3) siano “ cancellate”

P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)= 1/3

E(X) = (1+2+3+4+5+6)*1/6 = 21/6 = 3.5

E(x/x>3)= (4+5+6)*1/3= 15/3 = 5

V(x) = 2.92

V(x/x>3)= 0.67

Sono stai “eliminati” i valori più “piccoli”

TRONCAMENTO A SINISTRA

Page 2: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Se invece immaginiamo che siano cancellate le facce 4,5,6:

P(x/x<4)= p(x)/p(x<4)= (1/6)/(3/6)= 1/3

E(X) = (1+2+3+4+5+6)*1/6 = 21/6 = 3.5

E(x/x<4)= (1+2+3)*1/3= 6/3 = 2

V(x) = 2.92

V(x/x>3)= 0.67

Sono stai “eliminati” i valori più “grandi”

TRONCAMENTO A DESTRA

Page 3: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Effetti del Troncamento:

Rispetto alla distribuzione “non troncata”

1.La funzione di densità si modifica (“aumenta”)

2.La media si modifica (aumenta se tronc.sx, diminuisce se tronc. A dx)

3. La varianza diminuisce in ogni caso

Ovviamente “ignorare” il troncamento porta a stime distorte

Page 4: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Funzione di densità di probabilità: quale relazione con la densità “non troncata”?

In generale avremo (dalla definizione di probabilità condizionata)

)()(

)()/(

)()()Prob)Prob)Prob

)Prob

)()/(

aFbF

xfbxaxf

aFbFa(xb(xbx(a

mabx(a

xfbxaxf

Page 5: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

F(a)

F(b)

Page 6: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=
Page 7: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Per un troncamento a sinistra:

Per un troncamento a destra:

Questo rapporto è noto come “Inverse Mill’s Ratio” o anche “Hazard function”

Equivale a “scalare” la troncata in modo che l’integraleassommi a 1

neripartizio

densità

aF

xf

a(x

xfaxxf

)(1

)(

)Prob

)()/(

neripartizio

densità

aF

xf

a(x

xfbxxf

)(

)(

)Prob

)()/(

Page 8: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Esempio: Distribuzione normale Troncamento a sx

Dove densità della N(0,1) NON troncata (è una funzione)

ripartizione della N(0,1) nel punto di troncamento (è un numero)

dzz

xx

xx

f

eexf

axxf

aax

a

xx

2exp

2

1

)(1

)(1

)(1

1

)(12

11

)(12

1

)(1

)()/(

)(1)(

1)(Prob)(

2

22

)(

2

2

2

2

Page 9: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Esempio: Distribuzione normale Troncamento a dx

Cambia solo il denominatore

)(

)(1

)/(

)()(

)(Prob)(

xaxxf

aax

a

Page 10: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=
Page 11: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Esempio:

Tronchiamo a sx nel punto 10 cioè circa 22.000 euro

Page 12: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Dati sulle distribuzioni (troncata nel punto ln(reddito)=10)

NON troncata TroncataNumerosità 4609 1592% 100% 35%media LN 9,767 10,364Varianza LN 0,373 0,109Sdev LN 0,611 0,330cv 6% 3%

DATIORIGINALIMedia 20800 33915Varianza 201203411 274804136Sdev 14185 16577cv 68% 49%

En passant notiamo che exp(medie dei logaritmi) ammontano rispettivamente a 17448 e 31707

Page 13: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

7347,03515,0

1578,0611,01

)10/6,10(

)(1

)(1

)/(

3515,06485,013813,01)10(Prob3813,0611,0

)767,910(

)(1)(

1)(Prob)(

xf

xaxxf

x

aax

a

Calcoliamo la funzione di densità per x=40.000 ln(x)=10,6

Nella distribuzione originale il valore standardizzato (10,6-9,77)/0.61= 1,36 e p(1,36)= 0,1578

Nella troncata:

Page 14: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Vista la relazione sulla densità è agevole ricavare quella sui parametri:

Basta calcolare l’integrale che definisce media e varianza per la troncata

Definiamo:

= E(x)

²=V(x)

(a)=p(x)/p(x>a)=(x)/(1-()) (Inverse Mill’s ratio)

(a)= (a)*((a)-a)

Allora:

E(x/x>a) = + (a)

V(x) = ²[1- (a)]

Page 15: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

-4 -2 0 2 4

1-F(x)

f(x)

delta

Lambda

Valori di e al variare del punto di troncamento

Page 16: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Valori medi al variare del punto di troncamento (normale standardizzata)

-4

-3

-2

-1

0

1

2

3

4

-3 -2 -1 0 1 2 3

E(x/x>a)

E(x/x<a)

Page 17: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

SQM al variare del punto di troncamento (normale standardizzata)

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

-3 -2 -1 0 1 2 3

sqm(x/x>a)

sqm(x/x<a)

Page 18: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Un esempio (artificiale):

Il 2% più ricco (coloro che hanno un reddito superiore a 100.000 €) della popolazione italiana ha un reddito medio di 142.000 €.

Supponendo che la distribuzione dei redditi sia log-normale, qual è una stima del reddito medio dell’intera popolazione?

Si ha: ln(100)=4,605 ln(142)=4,956

Page 19: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

I dati indicano che:

1. E( y/y > 4,605) = 4,9562. Prob(y > 4,605) = 0,02

Ricordando che:

0484.0)054,2()(

054,2)98,0(98,0)(

605,42

956,4)(1

)()605,4/(1

1

ma

conyyE

Page 20: Distribuzioni troncate: esempio Un vecchio amico: il dado P(x)=1/6 Se supponiamo che 3 facce (1,2,3) siano “ cancellate” P(x/x>3)= p(x)/p(x>3)= (1/6)/(3/6)=

Quindi le equazioni diventano:

087.22

,

959,0635,2

054,2605,4

2

956,402,0

0484,01

2/2

medioreddito

ottienesi

eeENz

sechericordando

implicanoche

con

z