10. VARIABILI CASUALI MULTIPLE · 10.3 Variabili casuali doppie continue Se le v.c. X e Y sono di...

197

10. VARIABILI CASUALI MULTIPLE

10.1.1 Introduzione

La definizione di v.c. può essere facilmente estesa al caso in cui a ciascun evento elementare che

costituisce è associata una coppia di numeri reali, così come schematizzato nella successiva figura.

Figura 10.1.1

Definizione di variabile casuale doppia

Considerato lo spazio di probabilità (, A, P) costituito dallo spazio fondamentale , dalla classe degli

eventi A e dalla misura di probabilità P, una v.c. doppia X,Y è una funzione definita su che associa a

ciascuno degli N eventi elementari i (i= 1, 2, …, N) una coppia di valori reali [X(i), Y(i)] = (xj, yl) che

rappresenta una determinazione della v.c. X,Y.

Il ricorso a una v.c. doppia è del tutto naturale quando sulle n unità statistiche vengono rilevate

contemporaneamente due variabili (come, per esempio: reddito e consumi, peso e altezza, numero dei

componenti delle famiglie e numero di mezzi di trasporto posseduti), ma risulta utile anche quando si

198

considera un esperimento che consiste nel lancio di due monete o di due dadi oppure nell’estrazione di

due palline da un’urna. In questo caso, infatti, la v.c. X può semplicemente rappresentare il risultato

ottenuto nella prima prova, mentre la Y può rappresentare il risultato ottenuto nella seconda.

L’uso di una v.c. doppia può risultare utile in situazioni diverse come, per esempio, considerato un

esperimento che consiste nel lancio di tre monete, si può utilizzare una v.c. X per contare “il numero di

teste ottenute” e una v.c. Y per contare il “numero di variazioni nella sequenza”, ossia il numero di volte

in cui si passa dalla faccia “testa” alla faccia “croce” o viceversa.

La tabella successiva riporta nella prima colonna i 23=8 possibili eventi connessi con questa particolare

prova (in cui la lettera “T” indica “testa” e la lettera “C” indica “croce”) mentre nella seconda e terza

colonna sono riportati i corrispondenti valori delle due v.c.

Tabella 10.1.1

Esempio di v.c. doppia

x y

1 = TTT 3 0

2 = TTC 2 1

3 = TCT 2 2

4 = CTT 2 1

5 = CCT 1 1

6 = CTC 1 2

7 = TCC 1 1

8 = CCC 0 0

In questo caso, quindi, al primo evento 1 è associata la coppia di valori (3, 0) della v.c. X,Y, al secondo

evento 2 la coppia (2, 1), …, all’ultimo evento la coppia (0, 0).

Ovviamente il discorso può essere generalizzato dal caso bivariato al caso multivariato, per comprendere

le situazioni in cui il numero di v.c. prese in esame è maggiore di due, come quando si analizzano le

risposte fornite da un certo numero di intervistati a un questionario oppure quando si replica più volte un

esperimento che consiste nel lancio di un dado o di una moneta o nell’estrazione di più palline da un’urna.

Come nei casi esaminati per le variabili statistiche, anche le v.c. multiple considerate in occasione di un

esperimento casuale possono essere dello stesso tipo (tutte discrete o tutte continue) oppure di tipo

diverso, in relazione alla situazione in esame. Nelle prossime pagine è considerato il caso bivariato (sia

per v.c. discrete, sia per v.c. continue) che verrà poi generalizzato al caso multivariato.

199

10.2 Variabili casuali doppie discrete

Date due v.c. discrete X e Y e indicati con x e y i loro campi di variazione, il campo di variazione della

v.c. doppia X,Y è pari al prodotto x × y, mentre la probabilità che in una prova si osservi la coppia di

determinazioni (xj, yl) di X,Y corrisponde a

P(X=xj, Y=yl) = p(xj, yl) (xj, yl) x × y 10.2.1

L’espressione 10.2.1, che costituisce la funzione di probabilità congiunta della v.c. doppia X,Y,

consente di ottenere la probabilità associata a qualsiasi sottoinsieme B x × y semplicemente come

somma delle probabilità associate alle singole coppie di valori che costituiscono B

Byx

lj

lj

yxpBYXP,

,, 10.2.2

Per esempio, se si considera l’esempio riportato nella tabella 10.1.1, la distribuzione di probabilità della

v.c. X,Y si ottiene facilmente dalle probabilità associate gli eventi i, tutti equiprobabili, se la moneta è

equilibrata.

Utilizzando una tabella a doppia entrata, in cui la prima colonna riporta i valori della v.c. X e la prima riga

riporta i valori della v.c. Y, la distribuzione di probabilità congiunta di X,Y assume la forma riportata nella

tabella successiva.

Tabella 10.2.1

Distribuzione di probabilità della v.c. X,Y definita nella tabella 10.1.1

X\Y 0 1 2

0 1/8 0 0 1/8

1 0 2/8 1/8 3/8

2 0 2/8 1/8 3/8

3 1/8 0 0 1/8

2/8 4/8 2/8 1.0

Questa distribuzione di probabilità congiunta si ottiene mediante lo stesso procedimento utilizzato per

determinare la distribuzione di frequenza congiunta di due variabili statistiche.

In generale, una distribuzione di probabilità bivariata di una v.c. X,Y in cui la X assume k valori diversi e

Y assume h valori diversi, può essere rappresentata mediante una tabella analoga alla 10.2.2 all’interno

200

della quale il simbolo p(xj, yl) posto all'incrocio fra la riga xj e la colonna yl (per j = 1, 2, …, k e l = 1, 2,

…, h) indica la probabilità associata alla coppia (xj, yl) della v.c. doppia X,Y, per cui risulta

xj ylx ylj yxp 1, .

Tabella 10.2.2

Esempio di distribuzione di probabilità bivariata

X\Y y1 y2 … yl … yh

x1 p(x1, y1) p(x1, y2) … p(x1, yl) … p(x1, yh) p(x1)

x2 p(x2, y1) p(x2, y2) … p(x2, yl) … p(x2, yh) p(x2)

xj p(xj, y1) p(xj, y2) … p(xj, yl) … p(xj, yh) p(xj)

xk p(xk, y1) p(xk, y2) … p(xk, yl) … p(xk, yh) p(xk)

p(y1) p(y2) … p(yl) … p(yh) 1

Talvolta, specie se il numero di associazioni dei valori di X e Y che presentano una probabilità pari a zero

è elevato, la distribuzione di probabilità congiunta viene espressa indicando le sole probabilità che

risultano maggiori di zero per cui, per esempio, la distribuzione indicata nella tabella 10.2.1 può essere

espressa anche mediante la notazione seguente

p(0, 0) = 1/8 p(1, 1) = 2/8 p(1, 2) = 1/8 p(2, 1) = 2/8 p(2, 2) = 1/8 p(3, 0) = 1/8.

Analogamente a quanto visto per il caso univariato e come si vede chiaramente dalle tabelle 10.2.1 e

10.2.2, dalla distribuzione di probabilità congiunta è possibile determinare le due distribuzioni di

probabilità marginali di X e di Y che corrispondono rispettivamente a

xjy

ljj xyxpxXP

yl

per,

ylx

ljl yyxpyYP

xj

per, .

In analogia a quanto descritto a proposito di due variabili statistiche, anche le due variabili casuali X e Y

risultano indipendenti quando la funzione di probabilità congiunta corrisponde al prodotto delle

distribuzioni di probabilità marginali, ossia quando

201

P(X = xj, Y = yl) = P(X = xj) × P(Y = yl) ylxj yx ,per .

Nel caso della tabella 10.2.1, quindi, le variabili X e Y non risultano indipendenti fra loro.

202

10.3 Variabili casuali doppie continue

Se le v.c. X e Y sono di tipo continuo e definite rispettivamente su x = (a, b) e su y = (c, d), il campo di

variazione della v.c. doppia X,Y è sempre dato da x × y che in questo caso corrisponde al prodotto

(a, b) × (c, d).

In analogia a quanto visto a proposito del caso univariato, la probabilità viene assegnata a intervalli del

tipo (, x], (, y] mediante la f.r. congiunta F(x,y). Anche in questo caso questa funzione risulta

definita per qualsiasi coppia di valori (x, y) di X,Y e assume valori compresi nell’intervallo [0, 1].

Dalla f.r. si ottiene la probabilità che la X,Y sia compresa in qualsiasi intervallo infinitesimo del tipo

(x, x+x], (y, y+y] e, facendo tendere a zero sia x sia y, si ottiene la f.d. congiunta

yx

yyYyxxXxPyxf

,, (x,y) x × y 10.3.1

che associa ad ogni coppia di valori delle due v.c. la densità di probabilità corrispondente.

Dalla f.d. congiunta 10.3.1 è possibile ottenere la f.d. marginale fx(x) della X integrando la funzione nel

campo di variazione di Y

d

c

x dyyxfxf , , a < x < b

e la f.d. marginale di Y mediante l’integrale

b

a

y dxyxfyf , , c < y < d.

Considerata per esempio la v.c. doppia X,Y con f.d. congiunta

f(x,y) = 3x2y + x 0 < x < 1, 0 < y < 1

la f.d. marginale della X corrisponde a

203

xxyxy

xydxydyxdyxyxxfx

210

1

0

22

1

0

1

0

21

0

2

2

3

2333

mentre la f.d. marginale della Y corrisponde a

2

1

23333

1

0

21

0

31

0

1

0

21

0

2

y

xxyxdxdxxydxxyxyf y .

Analogamente a quanto visto per due v.c. discrete, se le due v.c. continue X e Y sono indipendenti, la loro

f.d. congiunta corrisponde al prodotto delle due f.d. marginali

f(x,y) = fx(x) × fy(y) a < x <b, c < y < d.

Considerata per esempio la v.c. doppia X,Y con f.d. congiunta

11,4224

3, 2 yxxyyxf ,

la f.d. marginale della X corrisponde a

42per22

1

3

1

3

12

4

3

32

4

32

4

32

4

31

1

31

1

21

1

2

xxx

yxdyyxdyxyxf x

mentre la f.d. marginale della Y è

11per2

34828

4

3242

2

4

2

16

4

3

224

312

4

32

4

3

222

42

4

2

22

4

2

4

2

24

2

2

yyyy

xx

ydxdxxydxxyyf y

204

In questo caso il prodotto delle due f.d. marginali corrisponde alla f.d. congiunta, per cui le due v.c. X e Y

sono indipendenti fra loro.

Esempio 10.3.1

Data una v.c. doppia X,Y con f.d.

f(x,y) = 2(1-x) per 0 < x < 1, 0 < y < 1

si ottengano le due f.d. marginali e si verifichi se le due v.c. sono indipendenti fra loro

Risulta

10per121211212 10

1

0

1

0

xxyxdyxdyxxf x

10per12

112

221212

1

0

10

1

0

1

0

1

0

y

xxdxxdxdxxyf y

per cui X e Y sono indipendenti.

Esempio 10.3.2

Data una v.c. doppia X,Y con f.d.

f(x,y) = x+y per 0 < x < 1, 0 < y < 1

si verifichi se X e Y sono indipendenti

Le due f.d. marginali sono

10per2

1

21

1

0

210

1

0

1

0

1

0

xx

yyxdyydyxdyyxxfx

10per2

1

21 1

0

1

0

21

0

1

0

1

0

yyxy

xdxydxxdxyxyf y

Le due v.c. non sono indipendenti fra loro

205

10.4 Valori caratteristici

Data la distribuzione di probabilità congiunta della v.c. doppia X,Y, i valori degli indici di posizione, di

variabilità e di forma delle due variabili X e Y singolarmente considerate possono essere determinati sulla

base delle distribuzioni di probabilità marginali e assumono forme diverse a seconda che le variabili siano

di tipo discreto oppure continuo, analogamente a quanto visto nel capitolo precedente, relativo alle v.c.

semplici.

Inoltre, se le due v.c. non sono indipendenti fra loro, è possibile verificare se fra X e Y esiste un legame di

tipo lineare, diretto o inverso, mediante il calcolo della covarianza

xy = E[(Xx)(Yy)].

Anche in questo caso la covarianza corrisponde alla differenza fra il valore atteso del prodotto delle due

v.c. meno il prodotto dei loro valori attesi

xy = E(XY) E(X)E(Y)

dove

xj ylx yljlj yxpyxXYE ,

se le due v.c. sono entrambe discrete, mentre se sono invece continue corrisponde a

b

a

d

c

dxdyyxfxyXYE , .

Per esempio, considerata la v.c. doppia riportata nella tabella successiva,

Tabella 10.4.1

Distribuzione di probabilità bivariata

X\Y 0 1 2

1 0.000 0.250 0.125 0.375

2 0.000 0.375 0.125 0.500

3 0.125 0.000 0.000 0.125

0.125 0.625 0.250 1.000

206

si ottengono i seguenti risultati

E(X) = x = 1×0.375 + 2×0.5 + 3×0.125 = 1.75

E(Y) = y = 0×0.125 + 1×0.625 + 2×0.25 = 1.125

E(XY) = 1×1×0.25 + 1×2×0.125 + 2×1×0.375 = 1.75

xy = E(XY) E(X)E(Y) = 1.75 – 1.75×1.125 = -0.21875

da cui risulta che fra le due variabili esiste un legame lineare di tipo inverso.

Nota

Va osservato che se i valori assegnati alle v.c. sono frutto di una scelta arbitraria, come accade quando si

attribuiscono dei valori numerici ai giudizi espressi dagli individui in relazione a un certo prodotto o a un servizio,

non ha alcun senso calcolare la covarianza fra variabili, in quanto l’attribuzione di valori diversi ai vari giudizi

espressi porterebbe a risultati differenti.

Esempio 10.4.1

Calcolare la covarianza per la seguente distribuzione bivariata

X\Y 0 1

1 0.1 0.3 0.4

2 0.1 0.1 0.2

3 0.3 0.1 0.4

0.5 0.5 1.0

Risulta

E(X) = 2,

E(Y) = 0.5,

E(XY) = 0.8,

xy = -0.2

207

10.5 Variabili casuali multiple

I concetti esposti nei paragrafi precedenti possono essere estesi ai casi in cui a ciascun evento elementare

che costituisce è associato un vettore di numeri reali a k dimensioni, con k > 2, come quando sulle n

unità statistiche vengono rilevate contemporaneamente k variabili o come quando l’esperimento casuale

consiste in k repliche (estrazione di k palline da un’urna, lancio di k monete o di k dadi), per cui la v.c. X1

rappresenta il risultato ottenuto nella prima replica, X2 rappresenta il risultato ottenuto nella seconda

replica, …, Xk rappresenta il risultato ottenuto nella k-esima replica.

Considerato lo spazio di probabilità (, A, P) costituito dallo spazio fondamentale , dalla classe degli

eventi A e dalla misura di probabilità P, un vettore casuale (X1, X2, …, Xk) è una funzione definita su

che associa a ciascuno degli N eventi elementari i (i= 1, 2, …, N) k valori reali [X1(i), X2(i), …,

Xk(i)] che rappresenta una determinazione della v.c. k-variata X1, X2, …, Xk.

Quale che sia la natura delle variabili casuali considerate, il campo di variazione della v.c. multipla

corrisponde sempre al prodotto dei singoli campi di variazione delle k v.c Xj (j = 1, 2, …, k).

Se le v.c. sono tutte discrete, la loro funzione di probabilità congiunta, ossia la probabilità che in una

prova si osservi il vettore di determinazioni (x1, x2 , …, xk) corrisponde a

P(X1=x1, X2=x2, …, Xk=xk) = p(x1, x2 , …, xk) (x1, x2 , …, xk) 1×2×…×k

e, come nel caso bivariato, questa funzione di probabilità congiunta consente di ottenere la probabilità

associata a qualsiasi sottoinsieme B 1×2×…×k pari alla somma delle probabilità associate ai vettori

di valori che costituiscono B.

Se le k variabili casuali risultano tutte indipendenti fra loro la funzione di probabilità congiunta

corrisponde anche in questo caso al prodotto delle singole distribuzioni di probabilità marginali

P(X1=x1,X2=x2,…, Xk=xk)=P(X1=x1)×P(X2=x2)×… ×P(Xk=xk) (x1, x2 , …, xk) 1×2×…×k.

Se invece le k v.c. sono continue, la loro funzione di densità di probabilità congiunta

kkk xxxxxxf ...,...,,,...,, 212121

208

associa ad ogni vettore di valori delle k v.c. la densità di probabilità corrispondente.

Se le v.c. sono tutte indipendenti fra loro, questa funzione corrisponde al prodotto delle funzioni di

probabilità marginali delle k variabili

f(x1, x2,… , xk) = f1(x1) × f2(x2) × … × fk(xk) (x1, x2 , …, xk) 1×2×…×k

Anche nel caso multivariato è possibile determinare il valore atteso e la varianza di ogni singola v.c. sulla

base della sua f.d. marginale, così come è possibile calcolare la covarianza per ogni coppia di variabili.

10.6 Combinazioni lineari di variabili casuali

In alcune situazioni reali si può essere interessati a determinare le caratteristiche non di singole variabili

casuali, ma di una loro combinazione lineare.

Si consideri, per esempio, il caso di un investitore che ha destinato un quarto delle sue risorse a un fondo

azionario e i restanti tre quarti a un fondo obbligazionario. Indicata con X1 la v.c. “rendimento del fondo

azionario” avente valore atteso E(X1) = 3 e deviazione standard 1 = 3 con X2 la v.c. “rendimento del

fondo obbligazionario” avente valore atteso E(X2) = 1.5 e deviazione standard 2 = 1 si avrà interesse a

determinare il valore atteso e la deviazione standard della combinazione lineare

Z = 0.25 X1 + 0.75 X2. 10.6.1

In generale, date due v.c. X1 e X2 di valore atteso rispettivamente pari a 1x e 2x e di varianza

rispettivamente pari a 21 e 2

2 , si indichi con 12 la loro covarianza e con P(x1, x2) la loro funzione di

probabilità congiunta. Ogni combinazione lineare delle due variabili

Z = a + b1X1 + b2X2 10.6.2

è ancora una v.c. il cui valore atteso corrisponde a

209

2211222111

2122211121

2122112211

2211

22 1111 2211 22

11 22

,,,

,

xbxbaxPXbxPXba

xxPXbxxPXbxxPa

xxPXbXbaXbXbaEzZE

xx

x xx xx x

x x

mentre la sua varianza è invece pari a

122122

22

21

2121221121

212

222221

211

21

212211212

2222

211

21

212

222111

212

2211221122

2,2

,,

,2

,

,

11 22

22 1111 22

11 22

11 22

11 22

bbbbxxPxXxXbb

xxPxXbxxPxXb

xxPxXxXbbxXbxXb

xxPxXbxXb

xxPxbxbaXbXbazZEZV

x x

x xx x

x x

x x

x xz

Nel caso in cui le due v.c. X1 e X2 fossero indipendenti fra loro, la varianza della 10.6.2 risulterebbe pari a

22

22

21

21

2 bbz

in quanto la covarianza fra X1 e X2 risulterebbe pari a zero.

Sulla base dei risultati appena ottenuti, la v.c. definita nella 10.6.1 ha un valore atteso pari a

E(Z) = z = 0.25×3 + 0.75×1.5 = 1.875

mentre, se si ipotizza che la covarianza fra i due tipi di fondo sia pari a 1.5, la sua varianza è data da

2z = (0.25)2×32 + (0.75)2×12 + 2×0.25×0.75×1.5 = 1.6875

In generale, date k v.c. X1, X2, …, Xk, ogni loro combinazione lineare del tipo

Z = a + b1X1 + b2X2 + … + bkXk 10.6.3

210

è ancora una v.c. il cui valore atteso risulta pari a

k

jjj xbazZE

1

10.6.4

mentre la sua varianza è data da

1

11

22

11

222 2k

j jljllj

k

jjj

k

j jljllj

k

jjjz bbbbbbZV

Anche in questo caso, se le variabili sono tutte indipendenti fra di loro, la varianza della combinazione

10.6.3 risulta semplicemente pari a

k

jjjz bZV

1

222 10.6.5

in quanto ogni covarianza è nulla.

Come caso particolare della 10.6.3 si consideri la variabile

T = X1 + X2 + … + Xk 10.6.6

corrispondente alla somma di k v.c. Xj (j = 1, 2, …, k) di valore atteso jx e varianza 2j e tutte

indipendenti fra loro. Dalle 10.6.4 e 10.6.5 risulta immediatamente che il valore atteso e la varianza di T

sono date rispettivamente da

k

jjxTE

1

10.6.7

k

jjTV

1

2 10.6.8

Se si considera invece la variabile

211

kXXXk

X ...1

21 10.6.9

corrispondente alla media di k v.c. Xj (j = 1, 2, …, k) di valore atteso jx e varianza 2j e tutte

indipendenti fra loro, il valore atteso e la varianza di X sono

k

jjx

kXE

1

1 10.6.10

k

jj

kXV

1

2

2

1 10.6.11

Esempio 10.6.1

Si vuole calcolare il valore atteso e la deviazione standard della v.c. Z “costo unitario di un prodotto” sapendo che:

- la realizzazione di un’unità di prodotto ha un costo fisso C pari a 130 euro e che, in media, richiede 3 ore di lavoro

e 10 grammi di materia prima;

- la v.c. L “costo di un'ora di lavoro” ha un valore atteso pari a 40 euro con una deviazione standard di 2 euro;

- la v.c. M “costo delle materie prime” ha un valore atteso di 30 euro per grammo con una deviazione standard di 3

euro.

In questo caso la combinazione lineare assume la forma

Z = 3L + 10M + C

e il suo valore atteso corrisponde a

E(Z) = 3E(L) + 10E(M) + C = 3×40 + 10×30 + 130 = 550

mentre la sua varianza è

V(Z) = 32V(L) + 102V(M) = 9×22 + 100×32 = 936

per cui la deviazione standard di Z è z = √936

10. VARIABILI CASUALI MULTIPLE · 10.3 Variabili casuali doppie continue Se le v.c. X e Y sono di...

Documents

Transcript of 10. VARIABILI CASUALI MULTIPLE · 10.3 Variabili casuali doppie continue Se le v.c. X e Y sono di...