Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3 · Statistica, a.a. 2010/2011 Docente:...

31
Politecnico di Milano sede di Piacenza Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Transcript of Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3 · Statistica, a.a. 2010/2011 Docente:...

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Definizione

(W , F , P[.]) spazio di probabilità

X: W → 𝓡 è una variabile aleatoria ⟺ ∀r∈ 𝓡 Ar={w ∈ W : X(w) ≤ r} ∈ F

Ww1

w2

w3

x3 x1 x2

𝓡

X

r𝓡

X

W

Ar

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

Esperimento: lancio di una moneta W = {T, C} X: W → 𝓡 X(T) = 1 X(C) = 0

TC

0 1Ar = ∅ ∈ F

r<0W

TC

0 1Ar = {C} ∈ F

0≤r<1

W

TC

0 1Ar = W ∈ F

r≥1

W

r

r

r

Nota: si utilizza la notazione X=x per indicare l’evento X-1(x) e, in generale, X∈A⊆𝓡 per indicare l’evento X-1(A)

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Variabili aleatorie

Non discrete

Assolutamente continue

Continue

Miste

Discrete

(assumono al piùun’infinità numerabile divalori reali)

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Ogni v.a. è caratterizzata da una legge o distribuzione che viene determinata mediantel’assegnazione di:

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

F: 𝓡 → [0;1] è una funzione di ripartizione ⟺ (i)

(ii) F(x) è monotona non decrescente

(iii) F(x) è continua da destra:

Ogni funzione di ripartizione può essere associata ad una v.a. X e alle probabilità che essaassuma determinati valori secondo la definizione:

∀x∈𝓡 P[X ≤ x]=F(x)

10

xFlimxFlimxx

xFhxFlimh

0

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Nota

P[ a<X≤b ] = FX(b)-FX(a)

Dim.: FX (b) = P[X ≤ b] = P[(X ≤ a)∪(a<X ≤ b)]= FX(a)+ P[ a<X≤b ]

11

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

f: 𝓡 → [0;1] è una funzione di massa di probabilità discreta ⟺

⟺ esiste un insieme, al più numerabile, di numeri reali x1, x2, …, xn, … tale che:

(i) f(xi) > 0 i=1, 2, ….

(ii) f(x) = 0 per x≠ xi i=1, 2, ….

(iii) ∑if(xi) = 1

Ogni funzione di massa di probabilità discreta corrisponde ad una v.a. discreta X cheassume i valori x1, x2, …, xn, … con probabilità:

P[X= xi] = f(xi)

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

0.4

0.1

0.2

0.3

Esempio

1 2 3 4

X v.a. discreta cheassume i valori 1, 2, 3, 4rispettivamente conprobabilità:

P[X=1]=0.4

P[X=2]=0.1

P[X=3]=0.2

P[X=4]=0.3

Funzione di massa di probabilità

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

Esperimento: lancio di una moneta W = {T, C} P[T]=p P[C]=1-p

X: W → 𝓡 X(T) = 1 X(C) = 0

11

101

00

0

1

01

x

xp

x

xF

altrove

xp

xp

xf

X

XFunzione di massa di probabilità associata a X

Funzione di ripartizione associata ad X

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

f: 𝓡 → [0 ; +∞[ è una funzione di densità di probabilità ⟺ (i) f (x) è integrabile su 𝓡

(ii) 1

dxxf

Area = 1

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Definizione

X continua ⇔ la sua funzione di ripartizione è continua

X assolutamente continua con densità f ⇔

Proprietà

1) Una v.a. assolutamente continua è anche continua.

2) X continua ⇒ ∀x∈𝓡 P[X=x]=0

b

abab,a

dxxfbXaP

000

εxFlimxFεxXPlimxXPxXDim.: P Xε

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Corrispondenza tra funzione densità e funzione di ripartizione

• Assegnata f(x) si può determinare F(x):

V.a. discreta V.a. assolutamente continua

xx

j

j

xfxF

x

XX dttfxF

• Assegnata F(x) si può determinare f(x):

V.a. discreta V.a. assolutamente continua

hxFlimxFxfh

0

xFdx

dxf XX

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

x 7 8 9 10

f(x) 0.17 0.43 0.35 0.05

101

109950

98600

87170

70

x

x.

x.

x.

x

xF

7 8 9 10

0.17

0.43

0.35

0.05

7 8 9 10

0.17

0.60

0.951

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

41

414

3

102

1

00

x

x

x

x

xF

0:x di va lori a l tri gl i tutti Per

4

1

4

31444

4

1

2

1

4

3111

2

10

2

1000

0

0

0

xf

hFlimFf

hFlimFf

hFlimFf

h

h

h

0.5

0.75

1

0 1 4 0 1 4

0.5

0.25

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

10

15 6

x

xxxfX

115

10

5

1

6 xsexdtt

xse

xF xX

5 5

1 1

1

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

V.a. discreta V.a. assolutamente continua

j

jXjX xfxμXE dxxfxμXE XX

NotaLa media esiste se i corrispondenti serie o integrale sono assolutamente convergenti.

Proprietà1) ∀c∈𝓡 E[c] = c

2) E[aX+bY] = a E[X]+b E[Y]

Media (valore atteso)

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Mediana Me = inf { x : FX(x) ≥ 0.5 }

Quantile a-esimo (0<a<1) o percentile a-esimo qa = inf { x : FX(x) ≥ a }

Q1 = primo quartile = q0.25 Q3 = terzo quartile = q0.75

Nota

Quando F è invertibile si ha: qa = F-1(a)

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Varianza

V.a. discreta V.a. assolutamente continua

dxxfμxσXVar XXX

22 jX

jXjX xfμxσXVar

22

NotaLa varianza esiste se i corrispondenti serie o integrale sono convergenti.

Scarto quadratico medio 2XX σσ

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Proprietà

1) ∀c∈𝓡 Var[c] = 0

2) Var[aX+b] = a2 Var[X]

3) Var[X] = E[X2] – mX2 se E[X2] esiste

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

x 7 8 9 10

f(x) 0.17 0.43 0.35 0.05

101

109950

98600

87170

70

x

x.

x.

x.

x

xF

E[X] = 7 ∙ 0.17 + 8 ∙ 0.43 + 9 ∙ 0.35 + 10 ∙ 0.05 = 8.28

Me=8 Q1 = q0.25=8 Q3 = q0.75=9

q0.05=7 q0.95=9

Var[X] = 72 ∙ 0.17 + 82 ∙ 0.43 + 92 ∙ 0.35 + 102 ∙ 0.05-8.282 = 0.6416

sX ≅ 0.801

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

altrove

NxxxxfX

0

01

1

Esempio

1 1

1

n nnn ⇒ ∄ E[X]

.........

x.

x.

x.

x

nnxF

x

nX

43750

3260

2150

10

1

1

1

Me=1 Q1 = q0.25=1 Q3 = q0.75=3

∄ Var[X]

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

11

10

10

155

6

xx

xxF

x

xxxf XX

5 2Me = FX-1(0.5) ⇒ 1-Me-5 = 0.5 ⇒ Me = ≅ 1.149

Q1 = FX-1(0.25) ⇒ 1-Q1

-5 = 0.25 ⇒ Q1 = ≅ 1.059

Q3 = FX-1(0.75) ⇒ 1-Q3

-5 = 0.75 ⇒ Q3 = ≅ 1.319

53

4

5 4

2514

5

455

1

4

1

6 .x

dxxxXE

3220

104016

25

35

16

255

1

3

1

62

.XVar

.x

dxxxXVar

X

s

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

X v.a con media mx e deviazione standard sx:

2

110

kkσμXPk XX

Esempio

X v.a con mx=2 e sx=3

88901179

11923

750844

11622

0321

.XPXPk

.XPXPk

XPk

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

altrove

bxaabxfX

0

1

X ∼ U([a;b])

a b

1/(b-a)

a b

1

bx

bxaab

ax

ax

xFX

1

0

122

2abXVar

baXE

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

Giacomo arriva alla fermata dell’autobus alle 10, e sa che ne passerà uno in unmomento distribuito uniformemente tra le 10 e le 10:30.Qual è la probabilità che debba aspettare più di 10 minuti?Qual è la probabilità che debba aspettare dai 5 ai 25 minuti?

3

2

30

1525255

3

2

30

110110

altrove0

30030

1

30;0U~ attesa di tempo

25

5

30

10

dxFFXP

dxFXP

xxfXX

XX

X

X

10

255

30

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

altrove

xeλxf

λx

X0

0X ∼ exp(l)

00

01

x

xexF

λx

X

l

2

11

λXVar

λXE

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

• La distribuzione esponenziale serve per modellizzare fenomeni in cui, a partireda un dato istante o posizione iniziale, si attende il verificarsi di un certo evento:ha distribuzione esponenziale la v.a il cui valore rappresenta l’istante, o laposizione, in cui si verifica l’evento atteso.

• La distribuzione esponenziale è caratterizzata dalla “mancanza di memoria”: laprobabilità che il tempo d’attesa superi a, sapendo che ha già superato b (a>b),è uguale alla probabilità che il tempo d’attesa superi a-b. In formula:

P[X ≥ a | X ≥ b] = P[X ≥a-b]

Dim.

baXPbaFee

e

bF

aF

bXP

aXP

bXP

bXaXPbXaXP

Xba

b

a

X

X

11

1 l

l

l

Politecnico di Milano sede di Piacenza

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 3

Esempio

La distanza tra le crepe rilevanti del manto stradale di un’autostrada segue una distribuzione esponenziale con media di 5 km.a) Qual è la probabilità che non vi siano crepe rilevanti in un tratto di 10 km?b) Qual è la probabilità che la prima crepa rilevante si trovi fra 12 e 15 km dall’inizio dell’ispezione?c) Supposto che non vi siano crepe nei primi 5 km ispezionati, qual è la probabilità che non ve ne siano anche nei successivi 10 km ispezionati?

X = distanza tra le crepe X ∼ exp(1/5)

135301011010

5

1

.eFXPa) X

041012151512 .FFXPb) XX

1353010515 .XPX|XPc)