10. VARIABILI CASUALI MULTIPLE · 10.3 Variabili casuali doppie continue Se le v.c. X e Y sono di...
Transcript of 10. VARIABILI CASUALI MULTIPLE · 10.3 Variabili casuali doppie continue Se le v.c. X e Y sono di...
197
10. VARIABILI CASUALI MULTIPLE
10.1.1 Introduzione
La definizione di v.c. può essere facilmente estesa al caso in cui a ciascun evento elementare che
costituisce è associata una coppia di numeri reali, così come schematizzato nella successiva figura.
Figura 10.1.1
Definizione di variabile casuale doppia
Considerato lo spazio di probabilità (, A, P) costituito dallo spazio fondamentale , dalla classe degli
eventi A e dalla misura di probabilità P, una v.c. doppia X,Y è una funzione definita su che associa a
ciascuno degli N eventi elementari i (i= 1, 2, …, N) una coppia di valori reali [X(i), Y(i)] = (xj, yl) che
rappresenta una determinazione della v.c. X,Y.
Il ricorso a una v.c. doppia è del tutto naturale quando sulle n unità statistiche vengono rilevate
contemporaneamente due variabili (come, per esempio: reddito e consumi, peso e altezza, numero dei
componenti delle famiglie e numero di mezzi di trasporto posseduti), ma risulta utile anche quando si
198
considera un esperimento che consiste nel lancio di due monete o di due dadi oppure nell’estrazione di
due palline da un’urna. In questo caso, infatti, la v.c. X può semplicemente rappresentare il risultato
ottenuto nella prima prova, mentre la Y può rappresentare il risultato ottenuto nella seconda.
L’uso di una v.c. doppia può risultare utile in situazioni diverse come, per esempio, considerato un
esperimento che consiste nel lancio di tre monete, si può utilizzare una v.c. X per contare “il numero di
teste ottenute” e una v.c. Y per contare il “numero di variazioni nella sequenza”, ossia il numero di volte
in cui si passa dalla faccia “testa” alla faccia “croce” o viceversa.
La tabella successiva riporta nella prima colonna i 23=8 possibili eventi connessi con questa particolare
prova (in cui la lettera “T” indica “testa” e la lettera “C” indica “croce”) mentre nella seconda e terza
colonna sono riportati i corrispondenti valori delle due v.c.
Tabella 10.1.1
Esempio di v.c. doppia
x y
1 = TTT 3 0
2 = TTC 2 1
3 = TCT 2 2
4 = CTT 2 1
5 = CCT 1 1
6 = CTC 1 2
7 = TCC 1 1
8 = CCC 0 0
In questo caso, quindi, al primo evento 1 è associata la coppia di valori (3, 0) della v.c. X,Y, al secondo
evento 2 la coppia (2, 1), …, all’ultimo evento la coppia (0, 0).
Ovviamente il discorso può essere generalizzato dal caso bivariato al caso multivariato, per comprendere
le situazioni in cui il numero di v.c. prese in esame è maggiore di due, come quando si analizzano le
risposte fornite da un certo numero di intervistati a un questionario oppure quando si replica più volte un
esperimento che consiste nel lancio di un dado o di una moneta o nell’estrazione di più palline da un’urna.
Come nei casi esaminati per le variabili statistiche, anche le v.c. multiple considerate in occasione di un
esperimento casuale possono essere dello stesso tipo (tutte discrete o tutte continue) oppure di tipo
diverso, in relazione alla situazione in esame. Nelle prossime pagine è considerato il caso bivariato (sia
per v.c. discrete, sia per v.c. continue) che verrà poi generalizzato al caso multivariato.
199
10.2 Variabili casuali doppie discrete
Date due v.c. discrete X e Y e indicati con x e y i loro campi di variazione, il campo di variazione della
v.c. doppia X,Y è pari al prodotto x × y, mentre la probabilità che in una prova si osservi la coppia di
determinazioni (xj, yl) di X,Y corrisponde a
P(X=xj, Y=yl) = p(xj, yl) (xj, yl) x × y 10.2.1
L’espressione 10.2.1, che costituisce la funzione di probabilità congiunta della v.c. doppia X,Y,
consente di ottenere la probabilità associata a qualsiasi sottoinsieme B x × y semplicemente come
somma delle probabilità associate alle singole coppie di valori che costituiscono B
Byx
lj
lj
yxpBYXP,
,, 10.2.2
Per esempio, se si considera l’esempio riportato nella tabella 10.1.1, la distribuzione di probabilità della
v.c. X,Y si ottiene facilmente dalle probabilità associate gli eventi i, tutti equiprobabili, se la moneta è
equilibrata.
Utilizzando una tabella a doppia entrata, in cui la prima colonna riporta i valori della v.c. X e la prima riga
riporta i valori della v.c. Y, la distribuzione di probabilità congiunta di X,Y assume la forma riportata nella
tabella successiva.
Tabella 10.2.1
Distribuzione di probabilità della v.c. X,Y definita nella tabella 10.1.1
X\Y 0 1 2
0 1/8 0 0 1/8
1 0 2/8 1/8 3/8
2 0 2/8 1/8 3/8
3 1/8 0 0 1/8
2/8 4/8 2/8 1.0
Questa distribuzione di probabilità congiunta si ottiene mediante lo stesso procedimento utilizzato per
determinare la distribuzione di frequenza congiunta di due variabili statistiche.
In generale, una distribuzione di probabilità bivariata di una v.c. X,Y in cui la X assume k valori diversi e
Y assume h valori diversi, può essere rappresentata mediante una tabella analoga alla 10.2.2 all’interno
200
della quale il simbolo p(xj, yl) posto all'incrocio fra la riga xj e la colonna yl (per j = 1, 2, …, k e l = 1, 2,
…, h) indica la probabilità associata alla coppia (xj, yl) della v.c. doppia X,Y, per cui risulta
xj ylx ylj yxp 1, .
Tabella 10.2.2
Esempio di distribuzione di probabilità bivariata
X\Y y1 y2 … yl … yh
x1 p(x1, y1) p(x1, y2) … p(x1, yl) … p(x1, yh) p(x1)
x2 p(x2, y1) p(x2, y2) … p(x2, yl) … p(x2, yh) p(x2)
xj p(xj, y1) p(xj, y2) … p(xj, yl) … p(xj, yh) p(xj)
xk p(xk, y1) p(xk, y2) … p(xk, yl) … p(xk, yh) p(xk)
p(y1) p(y2) … p(yl) … p(yh) 1
Talvolta, specie se il numero di associazioni dei valori di X e Y che presentano una probabilità pari a zero
è elevato, la distribuzione di probabilità congiunta viene espressa indicando le sole probabilità che
risultano maggiori di zero per cui, per esempio, la distribuzione indicata nella tabella 10.2.1 può essere
espressa anche mediante la notazione seguente
p(0, 0) = 1/8 p(1, 1) = 2/8 p(1, 2) = 1/8 p(2, 1) = 2/8 p(2, 2) = 1/8 p(3, 0) = 1/8.
Analogamente a quanto visto per il caso univariato e come si vede chiaramente dalle tabelle 10.2.1 e
10.2.2, dalla distribuzione di probabilità congiunta è possibile determinare le due distribuzioni di
probabilità marginali di X e di Y che corrispondono rispettivamente a
xjy
ljj xyxpxXP
yl
per,
ylx
ljl yyxpyYP
xj
per, .
In analogia a quanto descritto a proposito di due variabili statistiche, anche le due variabili casuali X e Y
risultano indipendenti quando la funzione di probabilità congiunta corrisponde al prodotto delle
distribuzioni di probabilità marginali, ossia quando
201
P(X = xj, Y = yl) = P(X = xj) × P(Y = yl) ylxj yx ,per .
Nel caso della tabella 10.2.1, quindi, le variabili X e Y non risultano indipendenti fra loro.
202
10.3 Variabili casuali doppie continue
Se le v.c. X e Y sono di tipo continuo e definite rispettivamente su x = (a, b) e su y = (c, d), il campo di
variazione della v.c. doppia X,Y è sempre dato da x × y che in questo caso corrisponde al prodotto
(a, b) × (c, d).
In analogia a quanto visto a proposito del caso univariato, la probabilità viene assegnata a intervalli del
tipo (, x], (, y] mediante la f.r. congiunta F(x,y). Anche in questo caso questa funzione risulta
definita per qualsiasi coppia di valori (x, y) di X,Y e assume valori compresi nell’intervallo [0, 1].
Dalla f.r. si ottiene la probabilità che la X,Y sia compresa in qualsiasi intervallo infinitesimo del tipo
(x, x+x], (y, y+y] e, facendo tendere a zero sia x sia y, si ottiene la f.d. congiunta
yx
yyYyxxXxPyxf
,, (x,y) x × y 10.3.1
che associa ad ogni coppia di valori delle due v.c. la densità di probabilità corrispondente.
Dalla f.d. congiunta 10.3.1 è possibile ottenere la f.d. marginale fx(x) della X integrando la funzione nel
campo di variazione di Y
d
c
x dyyxfxf , , a < x < b
e la f.d. marginale di Y mediante l’integrale
b
a
y dxyxfyf , , c < y < d.
Considerata per esempio la v.c. doppia X,Y con f.d. congiunta
f(x,y) = 3x2y + x 0 < x < 1, 0 < y < 1
la f.d. marginale della X corrisponde a
203
xxyxy
xydxydyxdyxyxxfx
210
1
0
22
1
0
1
0
21
0
2
2
3
2333
mentre la f.d. marginale della Y corrisponde a
2
1
23333
1
0
21
0
31
0
1
0
21
0
2
y
xxyxdxdxxydxxyxyf y .
Analogamente a quanto visto per due v.c. discrete, se le due v.c. continue X e Y sono indipendenti, la loro
f.d. congiunta corrisponde al prodotto delle due f.d. marginali
f(x,y) = fx(x) × fy(y) a < x <b, c < y < d.
Considerata per esempio la v.c. doppia X,Y con f.d. congiunta
11,4224
3, 2 yxxyyxf ,
la f.d. marginale della X corrisponde a
42per22
1
3
1
3
12
4
3
32
4
32
4
32
4
31
1
31
1
21
1
2
xxx
yxdyyxdyxyxf x
mentre la f.d. marginale della Y è
11per2
34828
4
3242
2
4
2
16
4
3
224
312
4
32
4
3
222
42
4
2
22
4
2
4
2
24
2
2
yyyy
xx
ydxdxxydxxyyf y
204
In questo caso il prodotto delle due f.d. marginali corrisponde alla f.d. congiunta, per cui le due v.c. X e Y
sono indipendenti fra loro.
Esempio 10.3.1
Data una v.c. doppia X,Y con f.d.
f(x,y) = 2(1-x) per 0 < x < 1, 0 < y < 1
si ottengano le due f.d. marginali e si verifichi se le due v.c. sono indipendenti fra loro
Risulta
10per121211212 10
1
0
1
0
xxyxdyxdyxxf x
10per12
112
221212
1
0
10
1
0
1
0
1
0
y
xxdxxdxdxxyf y
per cui X e Y sono indipendenti.
Esempio 10.3.2
Data una v.c. doppia X,Y con f.d.
f(x,y) = x+y per 0 < x < 1, 0 < y < 1
si verifichi se X e Y sono indipendenti
Le due f.d. marginali sono
10per2
1
21
1
0
210
1
0
1
0
1
0
xx
yyxdyydyxdyyxxfx
10per2
1
21 1
0
1
0
21
0
1
0
1
0
yyxy
xdxydxxdxyxyf y
Le due v.c. non sono indipendenti fra loro
205
10.4 Valori caratteristici
Data la distribuzione di probabilità congiunta della v.c. doppia X,Y, i valori degli indici di posizione, di
variabilità e di forma delle due variabili X e Y singolarmente considerate possono essere determinati sulla
base delle distribuzioni di probabilità marginali e assumono forme diverse a seconda che le variabili siano
di tipo discreto oppure continuo, analogamente a quanto visto nel capitolo precedente, relativo alle v.c.
semplici.
Inoltre, se le due v.c. non sono indipendenti fra loro, è possibile verificare se fra X e Y esiste un legame di
tipo lineare, diretto o inverso, mediante il calcolo della covarianza
xy = E[(Xx)(Yy)].
Anche in questo caso la covarianza corrisponde alla differenza fra il valore atteso del prodotto delle due
v.c. meno il prodotto dei loro valori attesi
xy = E(XY) E(X)E(Y)
dove
xj ylx yljlj yxpyxXYE ,
se le due v.c. sono entrambe discrete, mentre se sono invece continue corrisponde a
b
a
d
c
dxdyyxfxyXYE , .
Per esempio, considerata la v.c. doppia riportata nella tabella successiva,
Tabella 10.4.1
Distribuzione di probabilità bivariata
X\Y 0 1 2
1 0.000 0.250 0.125 0.375
2 0.000 0.375 0.125 0.500
3 0.125 0.000 0.000 0.125
0.125 0.625 0.250 1.000
206
si ottengono i seguenti risultati
E(X) = x = 1×0.375 + 2×0.5 + 3×0.125 = 1.75
E(Y) = y = 0×0.125 + 1×0.625 + 2×0.25 = 1.125
E(XY) = 1×1×0.25 + 1×2×0.125 + 2×1×0.375 = 1.75
xy = E(XY) E(X)E(Y) = 1.75 – 1.75×1.125 = -0.21875
da cui risulta che fra le due variabili esiste un legame lineare di tipo inverso.
Nota
Va osservato che se i valori assegnati alle v.c. sono frutto di una scelta arbitraria, come accade quando si
attribuiscono dei valori numerici ai giudizi espressi dagli individui in relazione a un certo prodotto o a un servizio,
non ha alcun senso calcolare la covarianza fra variabili, in quanto l’attribuzione di valori diversi ai vari giudizi
espressi porterebbe a risultati differenti.
Esempio 10.4.1
Calcolare la covarianza per la seguente distribuzione bivariata
X\Y 0 1
1 0.1 0.3 0.4
2 0.1 0.1 0.2
3 0.3 0.1 0.4
0.5 0.5 1.0
Risulta
E(X) = 2,
E(Y) = 0.5,
E(XY) = 0.8,
xy = -0.2
207
10.5 Variabili casuali multiple
I concetti esposti nei paragrafi precedenti possono essere estesi ai casi in cui a ciascun evento elementare
che costituisce è associato un vettore di numeri reali a k dimensioni, con k > 2, come quando sulle n
unità statistiche vengono rilevate contemporaneamente k variabili o come quando l’esperimento casuale
consiste in k repliche (estrazione di k palline da un’urna, lancio di k monete o di k dadi), per cui la v.c. X1
rappresenta il risultato ottenuto nella prima replica, X2 rappresenta il risultato ottenuto nella seconda
replica, …, Xk rappresenta il risultato ottenuto nella k-esima replica.
Considerato lo spazio di probabilità (, A, P) costituito dallo spazio fondamentale , dalla classe degli
eventi A e dalla misura di probabilità P, un vettore casuale (X1, X2, …, Xk) è una funzione definita su
che associa a ciascuno degli N eventi elementari i (i= 1, 2, …, N) k valori reali [X1(i), X2(i), …,
Xk(i)] che rappresenta una determinazione della v.c. k-variata X1, X2, …, Xk.
Quale che sia la natura delle variabili casuali considerate, il campo di variazione della v.c. multipla
corrisponde sempre al prodotto dei singoli campi di variazione delle k v.c Xj (j = 1, 2, …, k).
Se le v.c. sono tutte discrete, la loro funzione di probabilità congiunta, ossia la probabilità che in una
prova si osservi il vettore di determinazioni (x1, x2 , …, xk) corrisponde a
P(X1=x1, X2=x2, …, Xk=xk) = p(x1, x2 , …, xk) (x1, x2 , …, xk) 1×2×…×k
e, come nel caso bivariato, questa funzione di probabilità congiunta consente di ottenere la probabilità
associata a qualsiasi sottoinsieme B 1×2×…×k pari alla somma delle probabilità associate ai vettori
di valori che costituiscono B.
Se le k variabili casuali risultano tutte indipendenti fra loro la funzione di probabilità congiunta
corrisponde anche in questo caso al prodotto delle singole distribuzioni di probabilità marginali
P(X1=x1,X2=x2,…, Xk=xk)=P(X1=x1)×P(X2=x2)×… ×P(Xk=xk) (x1, x2 , …, xk) 1×2×…×k.
Se invece le k v.c. sono continue, la loro funzione di densità di probabilità congiunta
kkk xxxxxxf ...,...,,,...,, 212121
208
associa ad ogni vettore di valori delle k v.c. la densità di probabilità corrispondente.
Se le v.c. sono tutte indipendenti fra loro, questa funzione corrisponde al prodotto delle funzioni di
probabilità marginali delle k variabili
f(x1, x2,… , xk) = f1(x1) × f2(x2) × … × fk(xk) (x1, x2 , …, xk) 1×2×…×k
Anche nel caso multivariato è possibile determinare il valore atteso e la varianza di ogni singola v.c. sulla
base della sua f.d. marginale, così come è possibile calcolare la covarianza per ogni coppia di variabili.
10.6 Combinazioni lineari di variabili casuali
In alcune situazioni reali si può essere interessati a determinare le caratteristiche non di singole variabili
casuali, ma di una loro combinazione lineare.
Si consideri, per esempio, il caso di un investitore che ha destinato un quarto delle sue risorse a un fondo
azionario e i restanti tre quarti a un fondo obbligazionario. Indicata con X1 la v.c. “rendimento del fondo
azionario” avente valore atteso E(X1) = 3 e deviazione standard 1 = 3 con X2 la v.c. “rendimento del
fondo obbligazionario” avente valore atteso E(X2) = 1.5 e deviazione standard 2 = 1 si avrà interesse a
determinare il valore atteso e la deviazione standard della combinazione lineare
Z = 0.25 X1 + 0.75 X2. 10.6.1
In generale, date due v.c. X1 e X2 di valore atteso rispettivamente pari a 1x e 2x e di varianza
rispettivamente pari a 21 e 2
2 , si indichi con 12 la loro covarianza e con P(x1, x2) la loro funzione di
probabilità congiunta. Ogni combinazione lineare delle due variabili
Z = a + b1X1 + b2X2 10.6.2
è ancora una v.c. il cui valore atteso corrisponde a
209
2211222111
2122211121
2122112211
2211
22 1111 2211 22
11 22
,,,
,
xbxbaxPXbxPXba
xxPXbxxPXbxxPa
xxPXbXbaXbXbaEzZE
xx
x xx xx x
x x
mentre la sua varianza è invece pari a
122122
22
21
2121221121
212
222221
211
21
212211212
2222
211
21
212
222111
212
2211221122
2,2
,,
,2
,
,
11 22
22 1111 22
11 22
11 22
11 22
bbbbxxPxXxXbb
xxPxXbxxPxXb
xxPxXxXbbxXbxXb
xxPxXbxXb
xxPxbxbaXbXbazZEZV
x x
x xx x
x x
x x
x xz
Nel caso in cui le due v.c. X1 e X2 fossero indipendenti fra loro, la varianza della 10.6.2 risulterebbe pari a
22
22
21
21
2 bbz
in quanto la covarianza fra X1 e X2 risulterebbe pari a zero.
Sulla base dei risultati appena ottenuti, la v.c. definita nella 10.6.1 ha un valore atteso pari a
E(Z) = z = 0.25×3 + 0.75×1.5 = 1.875
mentre, se si ipotizza che la covarianza fra i due tipi di fondo sia pari a 1.5, la sua varianza è data da
2z = (0.25)2×32 + (0.75)2×12 + 2×0.25×0.75×1.5 = 1.6875
In generale, date k v.c. X1, X2, …, Xk, ogni loro combinazione lineare del tipo
Z = a + b1X1 + b2X2 + … + bkXk 10.6.3
210
è ancora una v.c. il cui valore atteso risulta pari a
k
jjj xbazZE
1
10.6.4
mentre la sua varianza è data da
1
11
22
11
222 2k
j jljllj
k
jjj
k
j jljllj
k
jjjz bbbbbbZV
Anche in questo caso, se le variabili sono tutte indipendenti fra di loro, la varianza della combinazione
10.6.3 risulta semplicemente pari a
k
jjjz bZV
1
222 10.6.5
in quanto ogni covarianza è nulla.
Come caso particolare della 10.6.3 si consideri la variabile
T = X1 + X2 + … + Xk 10.6.6
corrispondente alla somma di k v.c. Xj (j = 1, 2, …, k) di valore atteso jx e varianza 2j e tutte
indipendenti fra loro. Dalle 10.6.4 e 10.6.5 risulta immediatamente che il valore atteso e la varianza di T
sono date rispettivamente da
k
jjxTE
1
10.6.7
k
jjTV
1
2 10.6.8
Se si considera invece la variabile
211
kXXXk
X ...1
21 10.6.9
corrispondente alla media di k v.c. Xj (j = 1, 2, …, k) di valore atteso jx e varianza 2j e tutte
indipendenti fra loro, il valore atteso e la varianza di X sono
k
jjx
kXE
1
1 10.6.10
k
jj
kXV
1
2
2
1 10.6.11
Esempio 10.6.1
Si vuole calcolare il valore atteso e la deviazione standard della v.c. Z “costo unitario di un prodotto” sapendo che:
- la realizzazione di un’unità di prodotto ha un costo fisso C pari a 130 euro e che, in media, richiede 3 ore di lavoro
e 10 grammi di materia prima;
- la v.c. L “costo di un'ora di lavoro” ha un valore atteso pari a 40 euro con una deviazione standard di 2 euro;
- la v.c. M “costo delle materie prime” ha un valore atteso di 30 euro per grammo con una deviazione standard di 3
euro.
In questo caso la combinazione lineare assume la forma
Z = 3L + 10M + C
e il suo valore atteso corrisponde a
E(Z) = 3E(L) + 10E(M) + C = 3×40 + 10×30 + 130 = 550
mentre la sua varianza è
V(Z) = 32V(L) + 102V(M) = 9×22 + 100×32 = 936
per cui la deviazione standard di Z è z = √936