Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

99
Metodi Probailistici, Statistici e Processi Stocastici 1 Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

description

Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo. Capitolo I. Introduzione. Processo Stocastico: un processo stocastico è un processo che è costituito da eventi la cui realizzazione non è deterministica, ma caratterizzata da incertezza - PowerPoint PPT Presentation

Transcript of Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Page 1: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 1

Analisi dei Dati

Università Carlo Cattaneo

Emanuele Borgonovo

Page 2: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 2

Capitolo I

Page 3: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 3

Introduzione

• Processo Stocastico: un processo stocastico è un processo che è costituito da eventi la cui realizzazione non è deterministica, ma caratterizzata da incertezza

• Esempio: i tempi di arrivo dei clienti in un grande centro commerciale o il numero di clienti che arriva al centro commerciale nell’intervallo dt attorno al tempo t.

Page 4: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 4

Elementi introduttivi di Teoria della Probabilità

Page 5: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 5

Probabilità

• E’ possibile definire la Probabilità?• Sì, ma ci sono due scuole

• La prima dice che la probabiltà è una porprietà oggettiva degli eventi (Scuola Frequentista)

• La seconda dice che la Probabilità è una misura “soggettiva”della verosimiglianza degli eventi (De Finetti)

Page 6: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 6

Gli Assiomi di Kolmogorov

)B(P)A(P)BA(P

,esclusivimutuamenteBeASe

0)A(P

1)U(P

U BA

Page 7: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 7

• Supponete di saltare dentro U a caso. Chiamate P(A) la probabilità di saltare in A. Quanto vale?

• Sarà l’area di A diviso l’area di U: P(A)=A/U• In questo caso P(U)=P(A)+ P(B)+ P(C)+ P(D)+ P(E)

Aree e rettangoli?

U

EDCBAU CA B D E

Page 8: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 8

Legge della somma delle probabilità

• Dati n eventi non mutuamente esclusivi, in generale la probabilità dell’unione di detti n eventi sarà la somma delle probabilità degli eventi singoli, cui si sottrarrà la somma delle probabilità delle doppie intersezioni, si sommeranno le probabilità delle triple intersezioni e così via.

• In termini di aree

Page 9: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 9

Legge della somma delle probbilità in termini di aree

• 2 eventi

• 3 eventi

UB

AAB

UB

AAB

C

Page 10: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 10

U

IL teorema della probabilità Totale

• Teorema probabilità totale: dati N eventi mutuamente esclusivi (A1, A2,…,AN) e esaustivi, la probabilità di un altro evento E in U è data da:

)A(P

)A(P)A(P)A(P1

4

321

A1 A2A3

A4

E

)A(P)AE(P...)A(P)AE(P)A(P)AE(P)E(P NN2211

Page 11: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 11

Esempio

• Ad una lotteria, si gioca con una scatola che contiene cappelli eleganti e sportivi in egual proporzione. Il gioco è il seguente. Si estrae un cappello. Se è elegante si ha diritto a tirare una moneta. Se esce testa, si estrae un altro cappello. Non si ha diritto ad altre estrazioni. Qual è la probabilità di vincere due cappelli eleganti?

• Soluzione: Applichiamo il teorema della probabilità totale a P(2 cappelli eleganti):• P(2 cappelli eleganti)=P(II cap. el.|1 estrazione)*P(1estrazione)+P(II cap. el.|II

estrazione)*P(II estrazioni). • Chiaramente P(2 cappelli|1 estrazione)=0, quindi:• P(II cappelli elegante)=P(II cap. el.|II estrazione)*P(IIestrazione).• P(II estrazione)= P(II estrazioni|I sprt)*P(I sprt)+P(II estrazione|I eleg)*P(I eleg)• Ora: se il primo è sportivo non si ha diritto a seconda estrazione. • Osserviamo poi che: P(II estrazione| I eleg)= P(testa) =1/2• Quindi: P(II estrazione)=1/2·1/2=0.25• Inoltre: P(II cap. el .)=P(II cap. el.|II estrazione)*P(II estrazione)=1/2*0.25=0.125• Per esercizio calcolare:

– La probabiltà di uscire con un cappello– La probabilità di uscire con un cappello elegante e con uno sportivo

• Ripetere gli stessi calcoli se I cappelli sono in proporzione 2/3 sportivi/eleganti

Page 12: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 12

Funzione di Partizione

• La funzione di partizione (cumulative distribution) di una variabile casuale risponde alla definizione di essere la probabilità che il valore della variabile casuale sia inferiore ad un valore di riefrimento.

• Scriviamo: FX(x)=P(X<=x)

• Per una variabile discreta:

• Per una variabile continua deve esistere una funzione f(u) tale che:

• La funzione f(u) è detta densità di probabilità di X

xy

X )yX(P)x(F

x

X duufxF )()(

Page 13: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 13

Relazione tra F(x) ed f(x)

• Se f(x) è continua, allora vale:

• Esempio. Sia 0<T< una variabile casuale caratterizzata da una distribuzione esponenziale, ovvero f(t) dt=e- tdt è la probabilità che T abbia un valore compreso tra t e dt.

• Qual è la probabilità che T<t?

Soluzione• P(T<t)=F(t)=

)x(f)x('F

tλt

0

uλ e1dueλ

Page 14: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 14

Valore atteso

• Il valore atteso di una variabile aleatoria continua è definito da:

• Esempio:

• Per una variabile discreta:

• Esempio: calcolare il valore atteso della variabile aleatoria in Tabella a fianco

dx)x(xf]X[E

i

ii )xX(Px]X[E

λ

1dteλt]T[E

0

i 1 2 3 4 5 6 7Xi 0.1 0.2 0.1 0.15 0.12 0.05 0.28

pi 3 4 22 46 77 89 100Xipi 0.3 0.8 2.2 6.9 9.24 4.45 28

E[X] 51.89

Page 15: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 15

Varianza

• La varianza esprime lo scostamento quadratico medio dal valor medio. E’ definita da:

• Notiamo la relazione tra V[X] e E[X2]. Si ha:

• E[X2] è detto momento di ordine 2 o secondo momento della distribuzione f(x).

dx)x(f)xEx()xEx(EXVX

22

22

X

22

X

22

XE]X[E

XEdx)x(xfXE2]X[Edx)x(f)XEXxE2x(XV

Page 16: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 16

Skewness

• E’ il parametro che misura il grado di asimmetria di una distribuzione. • La definiamo come momento centrale del III ordine:

• Se la distribuzione è simmetrica la skewness è nulIa. • Di sotto la skewness delle distribuzioni più comuni

dx)x(fμxsk 3

Distribuzione Skewness Binomiale

)p1(np

p21

Beta

ab

ba1

)ba2(

)ab(2

Esponenziale 2 Gamma

γ

2

Normale 0 Poisson

2

1

λ

Uniforme 0

Page 17: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 17

..alla distribuzione di Poisson

• P è detta distribuzione di Poisson prende il nome di rateo o tasso della

distribuzione• Significato: probabilità di avere k eventi, dato il

tasso .

)λ;k(Pe!k

λ)p;k,n(Plim λ

k

n

Page 18: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 18

Momenti della distribuzione di Poisson

• Quindi:

)λ1(λeλedt

dkE

λeλeedt

dkE

e!k

)λe(ee

!k

λe)t(Ψ

0tt)1e(λ2

0tt)1e(λ

0t)1e(λ

)1e(λ

0k

ktλλ

k

0k

tkPoisson

t

tt

t

λλλλ]k[V 22

Page 19: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 19

La distribuzione Beta

• La distribuzione beta della variabile X, con ax b è definita come segue:

(q,r) è detta funzione beta.

• Momenti della distribuzione:

∫1

0

1-1-

1-

1-1-

)-1()(),(

0

≤≤)-(

)-()-(

),(

1),;(

dxxxrq

con

altrimenti

bxaab

xbax

rqrqx

qr

rq

qr

X

[ ]( )

[ ]( )

+++=

++

=

)1qr()qr(

a-brqxV

arq

a-brxE

2

2

Page 20: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 20

La distribuzione Beta (2)

• Grafico per a=-10, b=10, q=2,r=3

• q=4,r=3

• Grafico per a=-10, b=10, q=3,r=3 (simmetrico)b(x;2,3)

0

0.002

0.004

0.006

0.008

0.01

0.012

0.014

-10

-8.8

-7.7

-6.5

-5.4

-4.2 -3

-1.9

-0.7

0.43

1.59

2.75

3.91

5.07

6.23

7.39

8.55

9.71

x

b(x;3,3)

0

0.002

0.004

0.006

0.008

0.01

0.012

0.014

0.016

-10

-8.8

-7.7

-6.5

-5.4

-4.2 -3

-1.9

-0.7

0.43

1.59

2.75

3.91

5.07

6.23

7.39

8.55

9.71

x

b(x;3,3)

0

0.002

0.004

0.006

0.008

0.01

0.012

0.014

0.016-1

0

-8.8

-7.7

-6.5

-5.4

-4.2 -3

-1.9

-0.7

0.43

1.59

2.75

3.91

5.07

6.23

7.39

8.55

9.71

x

Page 21: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 21

La distribuzione

• Una variabile continua () segue una distribuzione se la sua densità di probabilità è data da:

• Dove: (parametro di forma), (parametro di scala)>0 e () è la funzione , una funzione notevole, che generalizza il concetto di

fattoriale ai numeri non interi. () è definita come segue:

• I parametri (parametro di locazione) e sono legati al valore medio ed alla varianza di dalle seguenti relazioni:

)μλ(β1αα

e)α(Γ

)μλ(β)μ,β,α;λ(γ

αμλV

β

αμλE

0

x1α dxexαΓ

Page 22: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 22

Grafici della distribuzione

f(,2,3,2)

0

0.2

0.4

0.6

0.8

1

1.2

0

0.8

1.6

2.4

3.2 4

4.8

5.6

6.4

7.2 8

8.8

9.6

10.4

11.2 12

12.8

13.6

14.4

f(,2,1,3)

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0

0.9

1.8

2.7

3.6

4.5

5.4

6.3

7.2

8.1 9

9.9

10.8

11.7

12.6

13.5

14.4

f(,2,1,3)

0

0.2

0.4

0.6

0.8

1

1.2

0

0.8

1.6

2.4

3.2 4

4.8

5.6

6.4

7.2 8

8.8

9.6

10.4

11.2 12

12.8

13.6

14.4

Page 23: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 23

Capitolo VI:Statistica Multivariata

Page 24: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 24

Distribuzioni multivariate

• Consideriamo un fenomeno casuale in cui si combinino due variabili. Ad esempio, I ricavi di un supermercato derivano dai clienti che entrano nel supermercato e dal tipo di acquisti che i clienti effettuano. Modellizziamo il problema chiamando X la variabile aleatoria relativa al numero di clienti che entrano nel supermercato e Y quella relativa al valore dell’acquisto. Chiaramente quanto si venderà è funzione di X e Y.

• F(x,y) sarà la probabilità che arrivino X<=x clienti e che acquistino per un valore pari ad Y<=y. Se a questa funzione cumulativa corrisponde una funzione densità di probabilità, scriveremo: f(x,y)dxdy la probabilità che arrivino x clienti e comperino per un valore y.

• Qual è la probabilità che i clienti comperino X<=x indipendentemente da y?

• Analogo ragionamento si applica alla determinazione della distribuzione marginale FY(y).

x

X )'y,'x(f'dy'dx)x(F

Page 25: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 25

Distribuzioni Multivariate

• Più formalmente, se xy è il nostro spazio degli eventi, dove un evento è una combinazione dei valori di xy FXY(x,y) rappresenta la probabilità che X sia minore di x e, allo stesso tempo, Y sia minore di y:

• FXY(x,y)=P(Xx,Y y).

• Per soddisfare gli assiomi della probabilità deve essere: • F(, )=1

• F(, y)=FY(y), F(x, )=FX(x)

• F(-, -)=0,• F(-, y)=0, F(x, -)=0

• F(, y)=FY(y)

Page 26: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 26

Distribuzioni multivariate

• Ora, logicamente ci si aspetta che Y dipenda in qualche modo da X. Infatti, più clenti arrivano più sarà facile raggiungere valori alti di Y. Ma, se per caso, in un mondo poco reale, si verificasse che Y non dipende da X, ci troveremmo di fronte al fatto che P(X<=x) è indipendente dal valore di Y. Dunque:

• P(X,Y)=P(X<=x) P(Y<=y)

• Quindi: F(X,Y)=FX(x) FY(y)

• od anche: f(x,y)dxdy=f(x)dx f(y)dy• Diremo che X e Y sono indipendenti se:

fX|Y(x|y)=fX(x)

Page 27: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 27

Esempio

• Considerate due variabilie X e Y caratterizzate dalla seguente possibile densità:

• Trovate c• Sol:• X e Y sono indipendenti?

• Sono indipendenti se possiamo scrivere: fX|Y(x|y) = fX(x).

• Ovvero: Nel nostro caso è facile verificare che questa condizione non può essere verificata e quindi le due variabili non sono indipendenti. La ragione è legata alla presenza del termine di interazione y/x

c

e)y,x(f

)x

yx(

1c1dxdyec1)y,x(f)

x

yx(

(x).f(y)f

y)(x,f y)|(xf X

Y

XYYX|

Page 28: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 28

Valore atteso condizionale

• Si può dimostrare che:

• Nel caso X e Y siano indipendenti

dx)yx(xfdy)y(fXE Y

dx)yx(xfyYXE

XEdx)x(xfdx)x(xfdy)y(fYXE Y

Page 29: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 29

Parte II:Processi stocastici

Page 30: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 30

Somma di un Numero Casuale di Variabili casuali

• Siete i gestori di un supermercato. Ogni cliente spende Xi, dove I è il numero che indica l’i-esimo cliente. In media I clienti spendono 75EUR a testa. Il numero medio di clienti giornaliero è una variabile casuale N con valor medio 300. Quanto vi aspettate di incassare al giorno?

• Soluzione. L’incasso giornaliero è dato da:

• Dobbiamo quindi calcolare il valore atteso di I:

• Per farlo, condizioniamo sul valore che assumerà N. Abbiamo:

• Quindi ci attentiamo un incasso di 75*300=22500EUR/Giorno

N

1iiXI

N

1iiXEIE

NXNXXNN

X

K

1ii

K

1ii

N

μμ]N[Eμ]μN[EKNIEE

μK]X[EXEKNIE

KNIEE]I[E

Page 31: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 31

Processi di Poisson

Page 32: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 32

Processi di Conteggio

• Consideriamo un processo stocastico, in cui siamo interessati a contare arrivi e tempi di arrivo. Per esempio gli arrivi di clienti al supermercato, di telefonate ad un centralino etc.

• Denotiamo con N(t) il numero di eventi che si verificano nel tempo t, cioè nell’intervallo di tempo 0-t.

N(t)=numero di eventi tra 0 e t.• Non è difficile intuire che:

1. N(t) è un numero intero non negativo, t2. N(s)<=N(t) se s<t3. N(t)-N(s) è il numero di eventi che si sono verificati nel

tempo t-s. Si chiamerà incremento dei conteggi tra t e s.• Notazione: indicheremo con tk il tempo del k-esimo arrivo.

Page 33: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 33

Processi di Conteggio (2)

• Il tempo Xk=Tk-Tk-1 è il tempo di attesa tra il k-esimo e il k-1-esimo evento

• Es. Supponete che il supermercato apra alle 9. Il primo cliente arriva alle 9.01 e il secondo alle 9.05. Abbiamo T1=1min, T2=5min, X2=4min

• Vale che: Tn=X1+X2+…Xn

• Due proprietà sono di interesse: indipendenza e stazionarietà degli incrementi

1. Incrementi Indipendenti: Un processo viene detto ad incrementi indipendenti, se i numeri di eventi che si verificano in intervalli di tempo disgiunti sono indipendenti tra loro: P[N(t+s)-N(t)=k|N(t’+s)-N(t’)]= P[N(t+s)-N(t)=k]

2. Incrementi Stazionari: Un processo viene detto ad incrementi stazionari se il numero di eventi che si verifica in un intervallo dipende solo dalla lunghezza dell’intervallo. Sia s la lunghezza dell’intervallo. In termini di probabilità si scrive: P[N(t+s)-N(t)=k]=P[N(t’+s)-N(t’)=k]

Page 34: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 34

Processi di Poisson

• Un processo di conteggio è detto processo di Poisson se verifica le seguenti proprietà:

1. N(0)=0

2. Il processo è a incrementi indipendenti

3. Il processo è a incrementi stazionari e la probabilità di k eventi nel tempo t è data da:

è detto intensità o tasso del processo

sk

ek

sktNtsNP

!)()(

Page 35: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 35

Distribuzione dei tempi di arrivo

• Quanto dobbiamo attendere per il primo arrivo?

• In termini di probabilità, scriviamo la domanda come: qual è la probabilità che X1 sia maggiore di t): P(X1>t).

• La risposta è la distribuzione cumulativa di X1: P(X1>t)=P[N(t)=0]=P(; k=0)=e-t

• Qual è la distribuzione di X2?

• P(X2>t|X1=s)=P[N(t-s)=0|X1=s]= grazie a proprietà di intervalli indipendenti = P[N(t-s)=0]= P(;k=0)=e-(t-s)

• Ne segue:

• I tempi di arrivo X1,X2,...,Xn di un processo di Poisson sono variabili aleatorie indipendenti con legge esponenziale di tasso

Page 36: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 36

Distribuzione di Tn

• La distribuzione del tempo di attesa Tn risponde alla domanda: come è distribuita la somma degli Xi? Infatti: Tn=X1+X2+…Xn

• Dunque:P[Tn>t]=P[X1+X2+…Xn >t]

• Si dimostra che Tn~(n, )

• Ricordiamo che I tempi di arrivo sono iid esponenziali. Utilizziamo la funzione generatrice dei momenti:

N

NsXsXsXsX

sXsXsX)X...XX(sXs

sT

λeE.identiceE...eEeE.indip

e...eeEeEeEeE

1N21

N21N21

N

1ii

n

Page 37: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 37

Esempio

• Gli arrivi orari ad un supermercato sono distribuiti secondo una Poisson di media 100[1/ore].

• Qual è il tempo di attesa perchè arrivino 500 clenti?• Risposta: 5 ore

Page 38: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 38

Processi di Poisson con selezione

• Consideriamo un processo di Poisson con arrivi di tasso .

• Ad ogni arrivo associamo un tasso di successo p. Per esempio successo è se un cliente compera più di tre tipi di prodotto diverso.

• Indichiamo con M(t) il numero di successi ottenuti fino al tempo t.

• M(t) viene detto processo di Poisson con selezione.• Si dimostra che: • M(t) e un processo di Poisson di intensità p.

Page 39: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 39

Applicazione

• Supponiamo che se un cliente compera più di tre prodotti il guadagno sia G. Se compera meno di tre prodotti si ha una perdita L. Quali sono i valori del tasso di arrivo dei clienti e della probabilità p per avere il break-even, se gli arrivi orari seguono un processo di poisson di tasso e la probabilità che comperino più di tre prodotti è p?

• Sol. Poissimo dividere il processo in due sottoprocessi di tassi p e (1-p) rispettivamente. Il valore atteso degli acquisti in un’ora è dato rispettivamente da: p e (1-p). Affinchè vi sia break even occorre che

pG= (1-p)L p/(1-p)=L/G

Page 40: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 40

Processi di Poisson composti

• Consideriamo un processo in cui gli eventi costituiscono un processo di poisson di tasso . Ogni volta che un evento si realizza, si ha una conseguenza Xi . Per esempio I clienti giungono al supermercato nei tempi ti ed ognuno spende un ammontare Xi. Quanto spendono in totale i clienti, e , dunque, quanto incassa il supermercato?

• Il processo X(t) è detto processo di Poisson composto. In generale lo caratterizzeranno due distribuzioni, quella di Poisson e quella degli X i. La distribuzione degli Xi potrà essere continua o discreta.

)t(N

1iiX)t(X

)X(F

λCompostoPoissonocessoPr

Page 41: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 41

Valori Attesi

• I processi che coinvolgono la somma di variabili casuali sono più facilmente trattabili in termini della funzione generatrice dei momenti. Nel nostro caso dobbiamo calcolare:

)1)s(Ψ(tλ

0n

tλnX

0n

tλnn

X

)t(NX)t(N

)t(NsXX)t(N

sXX

sXX

sXX)t(N

sXsXsXX)t(N

)X...XX(sX)t(N

Xs

)t(N

Xs

)t(N

Xs)t(sX

X

i

N21

N21N21

)t(N

1ii

)t(N

1ii

)t(N

1ii

e!n

e)tλ)s(Ψ(

!n

e)tλ()s(Ψ

)s(ΨEeEE

eE...eEeEE

e...eeEE)t(NeEE

eEE)t(NeEEeEeE))t(X(Ψ

Page 42: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 42

Valori Attesi (cont.)

• Da cui, derivando la funzione generatrice dei momenti, è facile verificare che:

]X[tEλ)]t(X[V

]X[tEλ)]t(X[E2

Page 43: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 43

Applicazione

• I clienti che arrivano al supermercato spendono secondo la seguente tabella:

• Arrivano in media 100 clienti all’ora. Nell’arco di una giornata (8 ore), quanto incassa il supermercato?

• Risposta: 100*8*E[euro spesi]=100*8*91.6=73280 EUR• Incertezza (vedi esempio Excel)

EUR pi EUR pi

25 2% 95 5%30 3% 100 5%35 3% 105 4%40 3% 110 4%45 3% 115 4%50 4% 120 4%55 4% 125 4%60 4% 130 3%65 4% 135 3%70 4% 140 3%75 5% 145 3%80 5% 150 3%85 3% 155 3%90 3% 160 2%

Microsoft Excel Worksheet

Page 44: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 44

La rovina dell’assicuratore

The compound Poisson process is very important in insurance, as a model for the arrival of claims at an insurance office. The standard model assumes that premiums arrive at a constant rate c and looks to find the probability that the surplus

S(t) = S(0) + ct - X(t)

ever hits 0 (ruin occurs).

Page 45: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 45

Capitolo IX:Processi di Markov Discreti e Omogenei

Page 46: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 46

Gestione di Magazzino

• Siete i gestori di un concessionario di automobili di lusso. Avete posto per 7 auto. Il tempo di consegna delle automobili è di due giorni, per cui se ordinate l’auto al Venerdì, per il Lunedì mattina sono in vetrina. Se al Venerdì della n-esima settimana avete 2 auto o meno di 2 in vetrina, ne ordinate altre in modo da riportavi a 7. Le vendite arrivano secondo una distribuzione di Poisson con media 4 e sono pronta consegna.

• Chiamiamo Xn il “numero di auto in vetrina all’inizio della n-esima settimana.” Xn è una variabile aleatoria. Infatti, dipendendo dal numero di vendite, potremmo avere 7,6,5,4,3 auto in vetrina ogni Lunedì mattina. Analizziamo come si piò descrivere il comportamento di X

• Per il nostro problema, notiamo che se mettiamo sull’asse orizzontale il numero della settimana e su quello verticale le auto vendute, abbiamo un risultato del tipo:

Page 47: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 47

Evoluzione temporale: Processi Discreti

• Notiamo che il sistema procede “ a scatti nel tempo”, ovvero ogni settimana il sistema si evolve.

• Tale tipo di processo è detto discreto (ovviamente dal punto di vista temporale)

X

7

6

5

4

3

2

1

0 1 2 3 ... ... n-1 n n+1 ... t

Xn

.....

Page 48: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 48

Stati del sistema ed Evoluzione temporale

• Chiamiamo stati del sistema (S) i valori che la variabile aleatoria X può assumere.

• Nella figura della pagina precedente, si tratta dell’asse verticale.

• Nel nostro caso sono 3,4,5,6,7. Abbiamo quindi 5 stati possibili.

• In generale useremo la notazione S={1,2,…,N} per indicare gli stati del sistema

• Dato il sistema in un determinato stato alla n-esima settimana, alla n+1-esima il sistema può rimanere ancora nello stesso stato o passare ad un altro stato la settimana successiva

• Per esempio, se abbiamo 4 auto in vetrina alla 30-esima settimana (X30), e se non si presentano clienti, avremo ancora 4 auto il lunedì della n+1-esima settimana. Se vendiamo 2 auto, X31=7.

Page 49: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 49

Diagramma degli stati

• E’ una rappresentazione grafica degli stati del sistema e delle transizioni che il sistema può compiere

11 2 3

p12 p23

p33

p31

p22

Page 50: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 50

Probabilità di transizione e Processi di Markov

• Il sistema si muove da uno stato all’altro con della probabilità, che vengono dette probabilità di transizione.

• Le probabilità di transizione rispondono alla domanda: qual è la probabilità che il sistema si muova nello stato j ad n+1 dato che al tempo n era nello stato i e nei tempi precedenti in Xn-1,…X0?

• In notazione probablistica, la probabilità cercata è:

• Ora, un processo viene detto Markoviano se la probabilità che il sistema passi allo stato j al tempo n+1, dato che è nello stato i al tempo n, dipende solo dal fatto che il sistema è nello stato I al tempo n e non dipende dagli stati nei quali il sistema si trovava prima di i. Ovvero, è indipendente dal modo in cui il sistema è arrivato in i.

• In formule:

)X,...,X,iXjX(P 01nn1n

)iXjX(P)X,...,X,iXjX(P)n(p n1n01nn1nij

Page 51: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 51

La matrice di Markov

• Si definisce matrice di Markov una matrice:

• i cui elementi sono le probabilità di transizione di un sistema markoviano. La i-esima riga descrive lo stato di partenza, la j-esima colonna lo stato di arrivo.

• Si dimostra che gli elementi della matrice soddisfano le seguenti proprietà:

• La seconda proprità dice che, se il sistema è in i al tempo n, allora con probabilità 1 al tempo n+1 sarà in uno degli stati del sistema

)(...)()(

............

)(...)()(

)(...)()(

)(

21

22221

11211

kpkpkp

kpkpkp

kpkpkp

kP

nnnn

n

n

ikp

jikpN

jij

ij

1)()2

,0)()1

1

Page 52: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 52

E’ un magazzino Markoviano?• Studiamo se il processo che abbiamo a disposizione nella nostra gesione di

magazzino è un processo di Markov.• Innazitutto scriviamo Xn+1 in forma matematica:

• Dove Vn rappresenta le vendite della n-esima settimana. Ricaviamo poi la probabilità di Xn.

• P(Vn)=s dipende solo da vendite in settimana n-esima e non dalle vedntie delle settimane precedenti. Quindi possiamo scrivere:

• Si tratta quindi di un processo di Markov.• In più notiamo che la probabilità non dipende dal fatto di essere nella

settimana n-esima. Si tratta quindi di un processo di Markov omogeneo.

2VXseX

2VXse7X

nnn

nn1n

)X,...,X,iXjiV(P)X,...,X,iXjVi(P

)X,...,X,iXjVX(P)X,...,X,iXjX(P

01nnn01nnn

01nnnn01nn1n

)iXjX(P)n(p n1nij

Page 53: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 53

Definizione di Processo di Markov Omogeneo

• Un processo stocastico sullo spazio degli stati S, si dice di Markov discreto se n:

• E’ omogeneo se verifica

• ovvero la matrice di Markov non dipende dal tempo n.

)iXjX(P)X,...,X,iXjX(P)n(p n1n01nn1nij

)iXjX(Pp n1nij

Page 54: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 54

La matrice di Markov nel nostro esempio

• La matrice sarà della forma:

• dove abbiamo catalogato gli stati come X1=3,X2=4,…,X5=7

• Si ha:

555251

n22221

151211

p...pp

............

p...pp

p...pp

)n(P

)0V(P)2iV(P)7X7X(P

6,...,3i;7j)2iV(P)iX2VX(P)iX7X(P

7,...,1ji;6,..,3j)jiV(P

p

nnn1n

nnnnn1n

n

ij

Page 55: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 55

Matrice di Markov dell’esempio

• L’ultimo passo prima di riempire la matrice è quello di calcolare le pij mediante la distribuzione di Poisson.

• Infine:

21487.0073.01465.0195.0156.0

566.0018.0073.01465.0195.0

762.00018.0073.01465.0

909.000018.0073.0

981.000018.0

)n(P

k 0 1 2 3 4 5 6

=4 0.018 0.073 0.146 0.195 0.195 0.156 0.104

λk

e!k

λ)λ;kV(P 018.0)4λ;0V(Pp11

Page 56: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 56

Evoluzione temporale della matrice di transizione

• Indichiamo con ai le probabilità iniziali del sistema: ai=P(X0=i) (non è condizionale!!!)

• Qual è la probabilità che al tempo k, Xk=j dato X0=i?

• Definiamo la matrice delle probabilità di transizione a k-passi come:

• Dove

• Indichiamo la probabilità incondizionale di Xk=j con a(k)

• Che differenza c’è tra a(k) e P(k)?

nn)k(

2n)k(

1n)k(

n2)k(

22)k(

21)k(

n1)k(

12)k(

11)k(

)k(

p...pp

............

p...pp

p...pp

P

)iXjX(Pp 0k)k(

ij

Page 57: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 57

Evoluzione temporale della matrice di transizione

• Calcoliamo P(0) e P(1).

• Per P(0) notiamo che pij=P(X0=j|X0=i)=1 se i=j, altrimenti=0.

• Per P(1), notiamo che: pij(1)=P(X1=j|X0=i)=pij. Quindi P(1)=P

1...00

............

0...10

0...01

p...pp

............

p...pp

p...pp

P

nn)0(

2n)0(

1n)0(

n2)0(

22)0(

21)0(

n1)0(

12)0(

11)0(

)0(

Page 58: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 58

La distribuzione non condizionale

• Definiamo:

• a(k) è la distribuzione (discreta) della probabilità che il sistema si trovi in un determinato stato per t=k.

• Infatti, per definizione a(k) è un vettore il cui elemento s-esimo è dato da:

)k()k( Paa

)sX(p)lXsX(p)lX(ppaa k

n

1l0k0

n

1l

)k(lsl

)k(s

Page 59: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 59

Teorema: relazione tra P(k) e P

• Per un processo markoviano discreto e omogeneo vale:

che in forma matriciale equivale a scrivere:Quindi per k=2, si vede che ; per k=3,Per k=s vale:

k)k( PP

N

1ssj

)1k(is

N

1s1kk

)1k(is

N

1s01k01kk0k

)k(ij

pp)sXjX(Pp

)iXsX(P)iX,sXjX(P)iXjX(Pp

:.Dim

2)2( PPPP 32)2()3( PPPPPP

PPP )1k()k(

s)2s()1s()s( P...PPPPPP

Page 60: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 60

Un esempio

• Consideriamo il seguente gioco. Una pallina può trovarsi sulla metà superiore o inferiore del flipper, rimbalzare da una metà all’altra ed uscire. Rappresentiamo il problema con i seguenti stati:– j=1: la pallina è sulla metà superire– j=2:la pallina è sulla metà inferiore– j=3: la pallina è uscita

• Determiniamo gli stati del sistema:

• Lo stato 3 è detto assorbente, perchè il sistema può solo entrare in 3 e non uscire

11 2 3

p12 p23

100

2.03.05.0

02.08.0

P 11 2 3

0.2 0.2

0.8

0.50.3

Page 61: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 61

Equazione di Chapman-Kolmogorv

• Il teorema di C-K stabilisce che le probabilità di transizione a n passi soddisfano la seguente equazione:

E quindi, in forma matriciale:

N

1k

lkj

sik

)ls(ij ppp

ls)ls( PPP

Page 62: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 62

Evoluzione Temporale per l’esempio

0

0.2

0.4

0.6

0.8

1

X40

1 1.5 2 2.5 3j

kk

20

30

40

40

30

20

Page 63: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 63

Esiste una distribuzione di probabilità limite?

• Dettagliamo la domanda nel titolo in tre punti:– Per n che tende l’infinito, la distribuzione di Xn tende ad

una distribuzione limite?– Se esiste tale distribuzione limite, è unica?– Se esiste ed è unica, come si calcola?

• Notazione: indichiamo con

• Se il limite esiste, è detta distribuzione limite del processo

N...1j),jX(Plimπ

ovveroalimπ

kk

j

)k(

k

Page 64: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 64

Calcolo della distribuzione limite

• Teorema 1: se esiste una distribuzione limite, allora soddisfa le seguenti proprietà:

• Dimostriamo la prima.

• In forma matriciale:

1π)2

pππ)1

N

1jj

N

1iijij

.d.e.qπp)iX(Plimp)iX(Pplim)iX(Pplim

)iX(P)iXjX(Plim)jX(Plimπ)1

N

1iiij

N

1i1k

kij

N

1i1kij

k

N

1i1kij

k

N

1i1k1kk

kk

kj

P

Page 65: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 65

Esistenza della distribuzione limite

• Notiamo che dal punto di vista dell’algebra lineare la distribuzione limite deve soddisfare il sistema lineare:

• Ricordiamo che la condizione necessaria affinchè il sistema non possegga la sola soluzione nulla è:

• Quindi non è garantita l’esistenza della distribuzione limite

0)IP(π T

0)IPdet( T

Page 66: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 66

Unicità della distribuzione limite

• Anche l’unicità della distribuzione limite non è in genere garantita. Per un esempio vedi Kulkarni, p.129.

Page 67: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 67

Periodicità, Irriducibilità e Esistenza

• Un processo di Markov discreto e omogeneo è detto periodico di periodo d se >1 d è l’intero più grande per cui vale:

• Con n multiplo di d. Se d=1 il processo è detto aperiodico.

• In pratica il concetto di periodicità risponde alla domanda: è possibile tornare ad i dopo essere partiti da i? Se il processo è periodico di periodo d allora è possibile tornare ad I solo ai tempi d,2d,…kd. Non è possibile in tempi intermedi.

• Il periodo può essere calcolato per via grafica dai diagrammi di transizione. Si deve definire un ciclo diretto nel diagramma come il ciclo da un nodo a se stesso. Se tutti I cicli diretti nel diagramma sono multipli di d allora il periodo è d.

0)iXiX(P 0n

Page 68: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 68

Periodicità, Irriducibilità e Esistenza

• Un processo di Markov discreto e omogeneo è detto irriducibile se, i,j esiste k>0 tale che

• La precedente proprietà dice che è possibile muoversi dallo stato i allo stato j in uno o più passi per tutti gli stati i e j.

• Condizione sufficiente di esistenza e unicità:

un processo di Markov irriducibile e aperiodico ammette un’unica distribuzione limite.

0)( 0 iXjXP k

Page 69: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 69

Distribuzione Stazionaria

• Una distribuzione * è detta stazionaria se:

• per tutti gli stati (i) e per tutti i tempi n≥0.• Anche la distribuzione stazionaria, se esiste

soddisferà:

• Ne segue che se esiste una distribuzione limite essa è anche una distribuzione stazionaria

1*π)2

p*π*π)1

N

1jj

N

1iijij

*π)iX(P

*π)iX(P

in

i0

Page 70: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 70

Costi o ricavi associati agli stati• Spesso il fatto che il sistema sia in un determinato stato comporta

all’azienda un costo/ricavo gestionale (es. costo di magazzino delle parti di ricambio o ricavo da vendite)

• Per sapere quanto è il costo totale atteso, occorre sapere quanto tempo il sistema sta in un determinato stato. Ora notiamo che per modelli markoviani discreti il sistema scatta da uno stato all’altro ogni n. Quindi il tempo totale che il sistema trascorre in uno stato non è altro che la somma del numero di volte che, passa dallo stato di interesse. Denotiamo con j lo stato di interesse e con Xk=j l’evento: il sistema è nello stato j al tempo k. Leghiamo ad Xk la variabile Zj(k) definita come segue:

• Il numero di volte in cui il sistema passa per lo stato j è proprio la somma delle variabili Zj(k). Quindi:

• Saremo interessati al valore atteso di Nj(k)

altrimenti0

jXse1)k(Z k

j

k

0rjjjjj )r(Z)k(Z...)2(Z)1(Z)k(N

k

0rjjjjj )r(ZE)k(Z...)2(Z)1(ZE)k(NE

Page 71: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 71

Tempi di occupazione

• Il sistema patirà dallo stato X0=i. Definiamo con mij(k) il numero di volte in cui il sistema passa per lo stato j partendo dallo stato i al tempo 0.

• In forma matriciale:

• Si dimostra che:

• In forma matriciale:

iX)k(NE)k(m 0jij

N...1:j,i)k(m)k(M ij

k

0r

rP)k(M

k

0r

)r(ij

k

0r00

k

0r0

k

0r0j

k

0r0j0jij

piXj)r(XP)iXj)r(XP1(0iXj)r(XP1

iX)r(ZEiX)r(ZEiX)k(NE)k(m

k

0r

rk

0r

)r(k

0r

)r(ijij PP)k(Mp)k(m

Page 72: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 72

Esempio

• Esempio. Se k=10, scrivere la matrice di occupazione dell’esempio “Pallina da flipper”.

• Utilizziamo la formula precedente

• Notiamo il risultato. Se partiamo da 3, stiamo in 3 per 11 volte…sempre!

100

2.03.05.0

02.08.0

P

1100

7.36.27.4

8.19.13.7

100

2.03.05.0

02.08.0

...

100

2.03.05.0

02.08.0

100

2.03.05.0

02.08.0

100

010

001

P...PPPP)k(M

102

10210k

0r

r

Page 73: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 73

Costi condizionali

• Costi da associare agli stati: C(Xj) è il costo associato al fatto che il sistema è nello stato j.

• Il costo totale generato nel periodo 0..k, è:

• Il valore atteso è:

• Vettore dei costi condizionale allo stato del sistema a k=0:

• Possiamo quindi ricavare il valore atteso del costo come:• Forma matriciale

• Forma vettoriale

n

0rr )X(C

n

0rr )X(CE

N...1i,iX)X(CE)k(g)k(gn

0r0ri

)N(C...)2(C)1(Cc

N,...,1i,)s(c)K(m)k(g

c)k(M)X(CE)k(g

N

1sisi

n

0rr

Page 74: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 74

Esempio

• Nell’esempio del gioco, ogni volta che la pallina finisce nello stato 3 si perdono 2EUR, ogni volta che siete nello stato 1 o 2 vincete 1 EUR. In 10 partite, quanti soldi si perdono se si parte dallo stato 1? E dallo stato 2? E da 3? E se aveste a=[0.5 0.5 0], vi convene giocare?

22

1.0

6.5

g 75.2

22

1.0

6.5

05.05.0gaE

Page 75: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 75

La distribuzione dell’occupazione

• Sia Nj(k) il numero di volte in cui il sistema visita lo stato j nel tempo 0…k.

• L’occupazione dello stato j viene definita da:

• Interpretazione: è la frazione di tempo che il sistema spende nello stato j.

• La distribuzione di occupazione (^), se esiste, soddisfa le seguenti equazioni:

• Un processo markoviano irriducibile ammette un’unica distribuzione di occupazione che è uguale alla distribuzione stazionaria.

1k

)k(NElimπ̂ j

kj

1π̂)2

pπ̂π̂)1

N

1jj

N

1iijij

Page 76: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 76

Costo per unità di tempo

• Il costo per unità di tempo è definito come:

• Dove i denota lo stato di partenza.• Si dimostra che soddisfa la seguente eguaglianza

per un processo di Markov irriducibile ed è indipendente da i:

1n

)k(glimg i

ki

N

1ssscπ̂g

Page 77: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 77

Esempio 1

• Consideriamo un processo di Markov S={1,2,3,4}, discreto e irriducibile che sia caratterizzato dalla seguente distribuzione di occupazione degli stati: ^=[0.27 0.45 0.2 0.08] e costi per stato: c=[400 500 600 700]. Il sistema si muove su base settimanale.

• Quanto vi costa, nel lungo periodo, il sistema alla settimana?

• Sol.: 509EUR per settimana

Page 78: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 78

Problemi

• Consideriamo un gioco in cui il sistema ha tre stati e può passare da uno stato all’altro con le seguenti probabilità, k=0,1,…:

• E’ un processo irriducibile?• Se lo stato 1 dà un profitto di +10, lo stato 2 una

vincita di +15 e lo stato 3 una perdita di -20, vi conviene giocare fino a k=10 se le probabilità di partenza sono [0.3 0.3 0.4]? (Ans. 1.15, sì)

• E all’infinito? (0.1667)

3.04.03.0

4.035.025.0

5.03.02.0

Page 79: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 79

Capitolo X:Processi di Markov Continui nel Tempo

Page 80: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 80

Introduzione

• Nel caso dei processi di Markov discreti, si individuavano una serie di istanti k=0,1,…,n n cui lo stato del sistema veniva osservato. Supponiamo ora che il sistema sia osservato con continuità.

• Un esempio può essere quello di un satellite che gira nello spazio e può essere in 2 stati, funzionante o rotto. Ci chiediamo se al tempo T il satellite sia funzionante o rotto.

Page 81: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 81

Definizione: Markov continuo

• Processo di Markov continuo nel tempo:• Un processo stocastico è detto di Markov, continuo del tempo se vale:

• dove X(s+t) indica lo stato del sistema al tempo t+s. Notiamo che s+t sostituisce k al pedice nella noazione precedente.

• Interpr.: la probabilità che il sistema passi dallo stato I che occupava in s allo stato j dopo un tempo t dipende solo dallo stato in cui il sistema si trovava in s e da s.

• Matrice delle probabilità di transizione

)i)s(Xj)ts(X(P

)su0con)u(X,i)s(Xj)ts(X(P

N...1j.i)t,s(p)ts(P ij

Page 82: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 82

Definizione: Markov continuo omogeneo

• Processo di Markov continuo nel tempo è omogeneo se vale:

• Interpr.: la probabilità che il sistema passi dallo stato i che occupava in s allo stato j dopo un tempo t dipende solo di due stati e non dal tempo s.

• Matrice delle probabilità di transizione:

)i)0(Xj)t(X(P)i)s(Xj)ts(X(P

N...1j.i)t(p)ts(P ij

Page 83: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 83

Proprietà della matrice prob. transizione

• La matrice delle probailità di transizione soddisfa le seguenti proprietà:

• Dimostriamo la 3

)s(P)t(P)t(P)s(P)ts(P:matricialeforma3

)t(p)s(p)st(p3:KolmogorovChapman

1)t(p)2

j,i,t0)t(p)1

N

1rrjirij

jij

ij

N

1rrjir

N

1r

N

1r

N

1r

N

1rij

)t(P)s(Pmatricialeformain)t(p)s(p)i)0(Xr)s(X(P)r)0(Xj)t(X(P

)i)0(Xr)s(X(P)r)0(Xj)t(X(P)i)0(Xr)s(X(P)r)s(Xj)ts(X(P

)i)0(Xr)s(X(P)i)0(X,r)s(Xj)ts(X(P)i)0(Xj)ts(X(P)st(p

Page 84: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 84

Equazioni di Chapman Kolmogorov

• Valgono i due seguenti lemma:

I=tasso istantaneo di uscita dallo stato i, qij tasso di transizione dallo stato i allo stato j. Sono le probabilità condizionale che il sistema compia la transizione dallo stato I allo stato j nell’intervallo di tempo dt, dato che è nello stato i a t.

• Si dimostra che le probabilità di transizione soddisfano le seguenti equazioni:

• se si condiziona su h.

• Se si condiziona su t.

ijij

0t

iii

0t

qt

)t(plim

νt

)t(p1lim

)t(pν)t(pq)t(pdt

d:Backward iiikj

N

1k,ikikij

)t(pν)t(pq)t(pdt

d:Forward ijijk

N

1k,ikkjij

Page 85: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 85

Equazioni di C-K (2)

• Poniamo:

ij è detto rateo di transizione ed è la probabilità che nel tempo dt il sistema passi allo stato j dato che è nello stato i.

• Le equazioni di C-K si possono quindi riscrivere come:

jiseq

jiseνα

ij

iij

)t(pα)t(pdt

d:Backward kj

N

1kikij

)t(pα)t(pdt

d:Forward jk

N

1k,ikkjij

Page 86: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 86

Equazioni di C-K (3)

• Dove A e’ la matrice dei ratei di transizione del sistema, P e’ il vettore delle probabilita’ degli stati del sistema.

ΑPPΑPdt

d

Page 87: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 87

Costruzione della matrice di transizione

• Esempio: componente soggetto a rottura e riparazione. 2 stati: in funzione o in riparazione, con tassi di guasto e riparazione .

• Chi sono P12 e P21? Sono le probabilita’ di transizione in dt. Quindi:

P12= e P21= • La matrice di transizione e’ costruita con le seguenti regole:• (+) se il salto e’ in entrata allo stato, (-) se il salto e’ in uscita• Prendiamo lo stato 1: si entra in 1 da due con tasso (+), si esce con

tasso (-). • Quindi:

1 2P21

P12

1 2

Page 88: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 88

La matrice di transizione

• La matrice di transizione e’:

μμ

λλA

μμ2

λλ1

21

Page 89: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 89

Equazione delle Pi(t)

• Definiamo le probabilità incondizionali che il sistema si trovi nello stato i al tempo t come:

• Si dimostra (vedi seguito) che le equazioni soddisfatte dalle probabilità incondizionali sono:

ΑPPdt

d

)t(P)t(P)t(P)t(P Ni21

Page 90: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 90

Differenza

• Che differenza c’è tra:

• e

APPdt

d

ΑPPdt

d

Page 91: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 91

Soluzione delle equazioni

• E’ la probabilita’ che a t il componente sia nello stato 1. Occorre risolvere il sistema di equazioni differenziali lineari precedente. Modo piu’ usato in affidabilita’ e’ mediante trasformata di Laplace.

• Con trasf. Laplace, le equazioni da differenziali diventano algebriche. Dopo aver lavorato con equazioni algebriche, occorre poi antitrasformare.

• Si ottiene dunque la disponibilita’ come funzione del tempo. Il risultato per un componente singolo soggetto a riparazioni e rotture e’ il seguente:

Page 92: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 92

Risultato

• Probabilità che il sistema sia nello stato 1=Disponibilita’ istantanea:

• Disponibilita’ asintotica:

• Interpretazione: tempo che occorre in media alla riparazione diviso il tempo totale

t)(1 e)t(P

λμ

μ)t(Plim 1

t

Page 93: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 93

Probabilità limite

• Per t che tende ad infinito, se il processo Markoviano è irriducibile, le probabilità limite esistono e soddisfano le seguenti equazioni:

• ovvero, j:

• Tale relazione esprime il bilancio tra le entrate e le uscite dallo stato

1)t(π

0ΑπN

1jj

1)t(Pe,PqPνN

1jj

N

js,1ssijjj

Page 94: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 94

Esempio

• Si consideri un sistema con due componenti, con la possibilità di riparare un solo componente alla volta, nel caso si rompa. I due componenti sono identici e si rompono con tasso costante . Il tasso di riparazione è . Rappresentare il sistema come processo di Markov, scrivere le equazioni di C-K per il processo e trovare le probabilità limite.

1 2 32

2

0μ20

λ0μ

0λ20

R

μ2μ20

μμλμ

0λ2λ2

A

Page 95: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 95

Distribuzione stazionaria

• Per un processo di Markov continuo,irriducibile, la distribuzione limite è anche la distribuzione stazionaria.

Page 96: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 96

Distribuzione di occupazione

• Sia T un tempo su cui osserviamo il sistema.• Sia mij(T) il tempo speso dal sistema nello stato j dato

che è partito da I al tempo 0.• Se il processo è irriducible, vale allora che:

– la frazione di tempo che il sistema passa nello stato j al tendere di t all’infinito non dipende da i

– La frazione di tempo spesa da sistema nello stato j è:

– Quindi le probabilità limite si possono interpretare come frazione del tempo che il sistema spende in un determonato stato

jij

T

)T(mlim

Page 97: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 97

Modellazione dei Costi/Ricavo

• Il modello dei costi è il seguente.• Sia c(X(t)) dt il costo istantaneo (tasso di costo)

associato al fatto che il sistema è nello stato j al tempo t.

• Il costo/ricavo totale che il sistema sosterrà/produrrà nel tempo 0-T sarà:

T

0

dt))t(X(c)T(C

Page 98: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 98

Tasso di costo istantaneo limite

• Per un processo continuo, Markoviano, irriducibile vale:

• Esempio: supponiamo che se la macchina produce incassiamo 1000. Se si rompe spendiamo costa -5000. Calcoliamo se, a regime, conviene investire nella macchina quando =10-4 e =10-2.

• clim=+940, quindi conviene.

cπclim

01.

μλ

λ99.0

μλ

μπ 50001000c

Page 99: Analisi dei Dati Università Carlo Cattaneo Emanuele Borgonovo

Metodi Probailistici, Statistici e Processi Stocastici 99

Capitolo IX:Problemi, dimostrazioni etc.