STATISTICA esercizi svolti sulla VARIABILITA’ · 1 VARIABILITA’ 2 1 VARIABILITA’ 1.1 Esercizi...

32
STATISTICA esercizi svolti sulla VARIABILITA’ 1

Transcript of STATISTICA esercizi svolti sulla VARIABILITA’ · 1 VARIABILITA’ 2 1 VARIABILITA’ 1.1 Esercizi...

STATISTICA esercizi svolti sulla

VARIABILITA’

1

1 VARIABILITA’ 2

1 VARIABILITA’

1.1 Esercizi

1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per ilconsumo di una confezione di pasta da 250 grammi:

1 3 5 6 15 30 .

Si calcolino: lo scostamento medio dalla mediana, lo scostamento medio dalla mediaaritmetica e lo scarto quadratico medio, commentando i risultati ottenuti.

Svolgimento

Per prima cosa, notiamo che i valori forniti dal testo sono già ordinati: per maggiorechiarezza, comunque li riportiamo di seguito:

x(1) = 1 x(2) = 3 x(3) = 5 x(4) = 6 x(5) = 15 x(6) = 30.

Dato che il loro numero è pari (N = 6), si hanno due posizioni centrali:

N

2= 3 ,

N

2+ 1 = 4.

La mediana è pertanto:x(3) + x(4)

2=

5 + 6

2= 5.5.

Il valore assunto dalla mediana dice che nel 50% dei casi circa, la durata di un pac-chetto di pasta è minore di 5.5 giorni. Analogamente, nel 50% dei casi circa, la duratadi un pacchetto di pasta è superiore a 5.5 giorni.

La media aritmetica è data da

M1 =1

6

6∑

i=1

xi =1 + 3 + 5 + 6 + 15 + 30

6= 10.

Per calcolare lo scostamento medio dalla mediana e dalla media aritmetica e lo scartoquadratico medio, è necessario completare la seguente tabella:

xi |xi − Me| |xi − M1| (xi − M1)2

1 4.5 9 813 2.5 7 495 0.5 5 256 0.5 4 1615 9.5 5 2530 24.5 20 400

Totale 42 50 596

1 VARIABILITA’ 3

Si ha quindi che lo scostamento medio dalla mediana è

SMe =1

6

6∑

i=1

|xi − Me| =42

6= 7

e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano)dalla durata mediana di 7 giorni.

Lo scostamento medio dalla media aritmetica è:

SM1=

1

6

6∑

i=1

|xi − M1| =50

6= 8.3̄

e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano)dalla durata media di 8.3̄ giorni.

Lo scarto quadratico medio è:

σ =

1

6

6∑

i=1

(xi − M1)2 =

596

6= 9.967

e indica che mediamente le durate del pacchetto di pasta differiscono dalla duratamedia di 9.967 giorni.

2. La seguente tabella fornisce il reddito annuo di sette individui:individui A B C D E F Greddito (in migliaia di euro) 15 20 12 10 18 30 35

.

Calcolare lo scostamento medio dalla mediana, lo scostamento medio dalla mediaaritmetica, lo scarto quadratico medio, la devianza e la varianza.

Svolgimento

Per prima cosa, ordiniamo in ordine crescente i valori forniti dal testo:

x(1) = 10 x(2) = 12 x(3) = 15 x(4) = 18 x(5) = 20 x(6) = 30 x(7) = 35.

Dato che il loro numero è dispari (N = 7), la posizione mediana è data da:

N + 1

2=

8

2= 4.

La mediana è pertanto:x(4) = 18.

Il valore assunto dalla mediana dice che circa il 50% dei redditi (dei 7 individui presiin esame) è minore di 18 (migliaia di euro). Analogamente, circa il 50% dei redditi

1 VARIABILITA’ 4

(dei 7 individui presi in esame) è maggiore di 18 (migliaia di euro).

La media aritmetica è data da

M1 =1

7

7∑

i=1

xi =15 + 20 + 12 + 10 + 18 + 30 + 35

7= 20.

Per calcolare lo scostamento dalla mediana e dalla media aritmetica e lo scartoquadratico medio, è necessario completare la seguente tabella:

xi |xi − Me| |xi − M1| (xi − M1)2

15 3 5 2520 2 0 012 6 2 410 8 10 10018 0 8 6430 12 10 10035 17 15 225

TOTALE 48 50 518

Si ha quindi che lo scostamento medio dalla mediana è

SMe =1

7

7∑

i=1

|xi − Me| =48

7= 6.857

e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si di-scostano) dal reddito mediano di 6.857 migliaia di euro.

Lo scostamento medio dalla media aritmetica è:

SM1=

1

7

7∑

i=1

|xi − M1| =50

7= 7.143

e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si di-scostano) dal reddito medio di 7.143 migliaia di euro.

Lo scarto quadratico medio è:

σ =

1

7

7∑

i=1

(xi − M1)2 =

518

7= 8.6023

e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono dalreddito medio di 8.6023 migliaia di euro.

1 VARIABILITA’ 5

Avendo calcolato lo scarto quadratico medio, è possibile calcolare la varianza elevan-dolo al quadrato:

σ2 =1

7

7∑

i=1

(xi − M1)2 =

518

7= 74.

Dalla tabella precedente, si ricava immediatamente anche la devianza:

Dev =7

i=1

(xi − M1)2 = 518.

3. La seguente tabella fornisce la distribuzione delle 100 famiglie di un quartiere secondoil carattere X = “numero di figli”:

numero di figli 0 1 2 3 4 5 6frequenze assolute 30 15 20 12 10 9 4

.

Determinare:

a) il campo di variazione;b) la differenza interquartile;c) la varianza con il metodo indiretto;d) lo scostamento medio dalla media aritmetica;e) lo scostamento medio dalla mediana.

Svolgimento

Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo,calcolando anche le frequenze cumulate:

Numero di figli (xj) nj Cj

0 30 301 15 452 20 653 12 774 10 875 9 966 4 100

Totale 100

É possibile ora calcolare:

a) Il campo di variazione

x(N) − x(1) = x(100) − x(1) = 6 − 0 = 6.

Tale valore indica che la lunghezza dell’intervallo in cui sono compresi i valoridel carattere X (numero di figli) è pari a 6.

1 VARIABILITA’ 6

b) La differenza interquartile

Q3 − Q1 = x(3·N+1

4) − x(N+1

4) = x(75.75) − x(25.25) = 3 − 0 = 3.

Tale valore indica che il 50% delle famiglie analizzate hanno un numero di figlicompreso in un intervallo di ampiezza 3.

c) La varianza (con il metodo indiretto)

σ2 =1

N

7∑

j=1

x2jnj − M2

1 = M22 − M2

1 .

La seguente tabella

xj nj xjnj x2j x2

jnj

0 30 0 0 01 15 15 1 152 20 40 4 803 12 36 9 1084 10 40 16 1605 9 45 25 2256 4 24 36 144

TOT 100 200 732

permette di calcolare:

M1 =1

100

7∑

j=1

xjnj =200

100= 2

e

M22 =

1

100

7∑

j=1

x2jnj =

732

100= 7.32.

Quindiσ2 = 7.32 − (2)2 = 3.32

d) Lo scostamento medio dalla media aritmetica.La seguente tabella

xj nj |xj − M1| |xj − M1| · nj

0 30 2 601 15 1 152 20 0 03 12 1 124 10 2 205 9 3 276 4 4 16

TOT 100 150

1 VARIABILITA’ 7

permette di calcolare lo scostamento medio da M1:

SM1=

1

100·

7∑

j=1

|xj − M1| · nj =150

100= 1.5.

Tale valore indica che mediamente il numero di figli (delle 100 famiglie prese inesame) differisce (si discosta) dal loro valore medio di 1.5 figli.

e) Lo scostamento medio dalla mediana.

Per prima cosa, si calcola la mediana: ricordando che N = 100 e utilizzando lefrequenze cumulate precedentemente calcolate, si ha

Me = x(N+1

2) = x(50.5) = 2.

In questo caso, quindi Me = M1 = 2: si avrà di conseguenza che

SMe = SM1= 1.5.

É possibile quindi affermare che mediamente il numero di figli (delle 100 famiglieprese in esame) differisce (si discosta) dal loro valore mediano di 1.5 figli.

4. La seguente tabella riporta la distribuzione del carattere X= “numero di stanze” di120 abitazioni della provincia di Belluno:

Numero di stanze (xj) 1 2 3 4 5 6 7 8nj 5 22 32 35 16 7 2 1

.

Calcolare il campo di variazione, la differenza interquartile, lo scarto quadratico medioe lo scostamento medio dalla media aritmetica.

Svolgimento

Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo,calcolando anche le frequenze cumulate:

xj nj Cj

1 5 52 22 273 32 594 35 945 16 1106 7 1177 2 1198 1 120

TOTALE 120

1 VARIABILITA’ 8

É possibile ora calcolare:

a) Il campo di variazione

x(N) − x(1) = x(120) − x(1) = 8 − 1 = 7.

Tale valore indica che la lunghezza dell’intervallo in cui sono compresi i valoridel carattere X (numero di stanze) è pari a 7.

b) La differenza interquartile

Q3 − Q1 = x(3·N+1

4) − x(N+1

4) = x(90.75) − x(30.25) = 4 − 3 = 1.

Tale valore indica che il 50% delle abitazioni prese in esame hanno un numerodi stanze compreso in un intervallo di ampiezza pari a 1.

c) Lo scarto quadratico medio e lo scostamento medio dalla media aritmetica.Per prima cosa, è necessario calcolare la media aritmetica. Si completa pertantola seguente tabella.

xj nj xjnj

1 5 52 22 443 32 964 35 1405 16 806 7 427 2 148 1 8

TOT 120 429

la quale, permette di calcolare:

M1 =1

120

8∑

j=1

xjnj =429

120= 3.575

Completando la seguente tabella

xj nj |xj − M1| (xj − M1)2 |xj − M1| · nj (xj − M1)

2 · nj

1 5 2.575 6.63 12.875 33.15

2 22 1.575 2.48 34.65 54.56

3 32 0.575 0.33 18.4 10.56

4 35 0.425 0.18 14.875 6.3

5 16 1.425 2.03 22.8 32.48

6 7 2.425 5.88 16.975 41.16

7 2 3.425 11.73 6.85 23.46

8 1 4.425 19.58 4.425 19.58

TOT 120 131.85 221.25

1 VARIABILITA’ 9

è possibile calcolare lo scostamento medio da M1:

SM1=

1

120·

8∑

j=1

|xj − M1| · nj =131.85

120= 1.09875

(mediamente il numero di stanze delle 120 abitazioni prese in esame differiscedal valore medio di 1.09875 stanze)

e lo scarto quadratico medio:

σ =

1

120·

8∑

j=1

(xj − M1)2 · nj =

221.25

120= 1.358

(mediamente il numero di stanze delle 120 abitazioni prese in esame differiscedal valore medio di 1.358 stanze).

5. La distribuzione del reddito annuo in euro dei 1000 abitanti di un comune è laseguente:

classi di reddito redditieri

1000 |– 5000 1005000 |– 15000 40015000 |– 35000 30035000 |– 75000 200

.

Si determini la varianza del reddito dei 1000 abitanti. Si verifichi numericamente la re-lazione tra lo scarto quadratico medio e lo scostamento medio dalla media aritmetica.

Svolgimento

Per prima cosa, è necessario calcolare la media aritmetica, completando la seguente

tabella, dove xj =l−j + l+j

2indica il valore centrale della j-esima classe:

classi di reddito xj nj xj · nj

1000|–5000 3000 100 3000005000|–15000 10000 400 4000000

15000|– 35000 25000 300 750000035000 |– 75000 55000 200 11000000

TOTALE 1000 22800000

Si ha quindi che:

M1 =1

N

4∑

j=1

xj · nj =22800000

1000= 22800.

Per calcolare la varianza, e lo scostamento medio da M1 è necessario completare laseguente tabella:

1 VARIABILITA’ 10

classi di reddito xj nj |xj − M1| |xj − M1| · nj (xj − M1)2 (xj − M1)

2 · nj

1000|–5000 3000 100 19800 1980000 392040000 39204000000

5000|–15000 10000 400 12800 5120000 163840000 65536000000

15000|– 35000 25000 300 2200 660000 4840000 1452000000

35000 |– 75000 55000 200 32200 6440000 1036840000 207368000000

TOTALE 1000 14200000 313560000000

Quindi lo scostamento medio dalla media aritmetica è pari a

SM1=

1

1000·

4∑

j=1

|xj − M1| · nj =14200000

1000= 14200

e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal lorovalore medio di 14200 euro.La varianza è pari a

σ2 =1

1000

4∑

j=1

(xj − M1)2 · nj =

313560000000

1000= 313560000

e lo scarto quadratico medio è

σ =

1

1000

4∑

j=1

(xj − M1)2 · nj =

313560000000

1000= 17707.625

e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal lorovalore medio di 17707.625 euro.

É facile notare che i valori ottenuti verificano la relazione

14200 < 17707.625

e pertanto è soddisfatta la seguente relazione tra scarto quadratico medio e scosta-mento medio da M1:

SM1≤ σ.

6. La distribuzione delle fatture di una grande azienda, emesse in un mese, secondol’importo in migliaia di euro è riportata nella seguente tabella:

classi d’importo 0–|50 50–|100 100–|150 150–|200 200–|250 250–|300 300–|350 tot

n. fatture 8 70 71 62 27 7 3 248

importo totale di classe 304 5600 8946 10540 6210 1960 960.

1 VARIABILITA’ 11

Calcolare lo scostamento medio dalla mediana; lo scostamento medio dalla mediaaritmetica; la varianza e lo scarto quadratico medio. Verificare numericamente larelazione esistente tra SMe

, SM1e σ.

Svolgimento

Per prima cosa, è necessario calcolare la mediana e la media aritmetica della distri-buzione. Completiamo perciò la seguente tabella.

Classi d’importo nj Tot. di classe (Tj) Cj

0–|50 8 304 850–|100 70 5600 78100–|150 71 8946 149150–|200 62 10540 211200–|250 27 6210 238250–|300 7 1960 245300–|350 3 960 248

TOTALE 248 34520

La posizione mediana è data da

pos(Me) =N + 1

2=

248 + 1

2= 124.5.

Scorrendo la colonna delle frequenze cumulate, riconosciamo che la classe (100; 150]è la classe mediana. Il valore della mediana è pertanto:

Me = x(124.5) = 100 + [124.5 − 78 − 0.5] · (150 − 100)

71= 132.39.

Utilizzando l’informazione relativa ai totali di classe, il calcolo della media aritmeticasi può effettuare nel seguente modo:

M1 =304 + 5600 + 8946 + 10540 + 6210 + 1960 + 960

248=

34520

248= 139.19.

Utilizzando l’informazione sui totali di classe, calcoliamo per ciascuna classe un valorerappresentativo x′

j, dividendo ciascun totale di classe per la frequenza della classe.Completiamo la seguente tabella.

Classi d’importo nj Tot. di classe x′

j |x′

j − Me| |x′

j − Me| · nj

0–|50 8 304 38 94.4 755.250–|100 70 5600 80 52.39 3667.3100–|150 71 8946 126 6.39 453.69150–|200 62 10540 170 37.61 2331.82200–|250 27 6210 230 97.61 2635.47250–|300 7 1960 280 147.61 1033.27300–|350 3 960 320 187.61 562.83

TOTALE 248 11439.58

1 VARIABILITA’ 12

Lo scostamento medio dalla mediana è quindi

SMe =1

248·

7∑

j=1

|x′

j − Me| · nj =11439.58

248= 46.127

e tale valore indica che mediamente gli importi delle fatture si discostano dal lorovalore mediano di 46.127 (migliaia di euro).

Completando la seguente tabella

Classi nj x′

j |x′

j − M1| |x′

j − M1| · nj (x′

j − M1)2 (x′

j − M1)2 · nj

0–|50 8 38 101.19 809.52 10239.4161 81915.33

50–|100 70 80 59.19 4143.3 3503.4561 245241.93

100–|150 71 126 13.19 936.49 173.9761 12352.30

150–|200 62 170 30.81 1910.22 949.2561 58853.88

200–|250 27 230 90.81 2451.87 8246.4561 222654.31

250–|300 7 280 140.81 985.67 19827.4561 138792.19

300–|350 3 320 180.81 542.43 32692.2561 98076.77

TOTALE 248 11779.50 857886.71

calcoliamo agevolmente lo scostamento medio dalla media aritmetica:

SM1=

1

248·

7∑

j=1

|x′

j − M1| · nj =11779.50

248= 47.498

e tale valore indica che mediamente gli importi delle fatture si discostano dal lorovalore medio di 47.498 (migliaia di euro).

La varianza è data da:

σ2 =1

248

7∑

j=1

(x′

j − M1)2 · nj =

857886.71

248= 3459.22,

lo scarto quadratico medio

σ =

1

248

7∑

j=1

(x′

j − M1)2 · nj =

857886.71

248= 58.815

e possiamo interpretare tale valore dicendo che mediamente gli importi delle fatturedifferiscono dal loro valore medio di 58.815 (migliaia di euro).

É possibile verificare infine che vale la relazione

SMe ≤ SM1≤ σ

infatti46.127 < 47.498 < 58.815.

1 VARIABILITA’ 13

7. Sia X un carattere quantitativo con media aritmetica M1(X) = 5 e scarto quadraticomedio σ(X) = 1.5. Sia Y un altro carattere quantitativo tale che Y = 0.5 − 2X.Determinare la media aritmetica e la varianza di Y .

Svolgimento

Dalla proprietà di linearità della media aritmetica, segue immediatamente che

M1(Y ) = 0.5 − 2 · M1(X) = 0.5 − 2 · 5 = −9.5.

A questo punto, calcoliamo la varianza di X

σ2(X) = (1.5)2 = 2.25

e ricordiamo la proprietà della varianza che afferma che se tra i caratteri X e Y

sussiste una relazione del tipoY = a + b · X

allora tra le varianze di X e Y , vale la relazione:

σ2(Y ) = b2 · σ2(X).

Applicando tale proprietà, utilizzando i valori a = 0.5 e b = −2 si ricava la varianzadi Y :

σ2(Y ) = 22 · σ2(X) = 4 · 2.25 = 9.

8. In un reparto produttivo, vengono impiegate tre macchine alle quali lavorano, rispet-tivamente, 4, 5 e 3 operai. La seguente tabella riporta i dati relativi alla produzioneoraria (per operaio e per macchina):

produzione oraria macchina 1 48 49 48 47produzione oraria macchina 2 56 56 57 57 55produzione oraria macchina 3 52 51 51

Determinare la varianza della produzione oraria dell’intero sistema col metodo in-diretto; determinare inoltre la varianza fra e nei gruppi e verificare la proprietà discomposizione della varianza totale.

Svolgimento

Come prima cosa, dividiamo i 12 operai in K = 3 gruppi, a seconda della macchinaa cui lavorano: si avrà quindi il primo gruppo (di numerosità N1 pari a 4) compostodagli operai che lavorano alla prima macchina, il secondo gruppo (di numerosità N2

pari a 5) formato dagli operai che lavorano alla seconda macchina e infine il terzogruppo (di numerosità N3 pari a 3) a cui appartengono gli operai che lavorano allaterza macchina. A ciascun operaio è associato un numero che rappresenta la suaproduzione oraria.

1 VARIABILITA’ 14

É possibile a questo punto calcolare, per ciascun gruppo, la produzione oraria media(ovvero le medie parziali):

X̄1 = M1(1a macchina) =48 + 49 + 48 + 47

4=

192

4= 48

X̄2 = M1(2a macchina) =59 + 59 + 57 + 57 + 55

5=

281

5= 56.2

X̄3 = M1(3a macchina) =52 + 51 + 51

3=

154

3= 51.3̄.

La proprietà associativa della media aritmetica permette di calcolare la media arit-metica totale (ovvero la produzione media oraria complessiva):

X̄ =X̄1 · N1 + X̄2 · N2 + X̄3 · N3

N1 + N2 + N3

=48 · 4 + 56.2 · 5 + 51.3̄ · 3

12= 52.25.

Per determinare la varianza della produzione oraria complessiva con il metodo indi-retto è necessario applicare la formula:

σ2tot =

1

N

N∑

i=1

x2i − M2

1 = M22 − M2

1 .

Si completa la seguente tabella:

Numero

macchinaxi x2

i

48 23041 49 2401

48 230447 220956 313656 3136

2 57 324957 324955 302552 2704

3 51 260151 2601

TOT 628 32919

Quindi:

M22 =

1

12

12∑

i=1

x2i =

32919

12= 2743.25.

1 VARIABILITA’ 15

A questo punto si ricava immediatamente la varianza totale:

σ2tot = 2743.25 − (52.25)2 = 13.1875.

Calcoliamo ora la varianza fra le produzioni medie delle singole macchine (ovvero lavarianza fra i gruppi).Si ha quindi:

σ2F =

1

N

K∑

j=1

[X̄j − X̄]2 · Nj

=1

12

3∑

j=1

[

X̄j − X̄]2 · Nj

=(48 − 52.25)2 · 4 + (56.2 − 52.25)2 · 5 + (51.3̄ − 52.25)2 · 3

12

=152.7833

12= 12.732.

Per determinare la varianza nei gruppi, è necessario innanzitutto calcolare le varianzeparziali.Si ha quindi (utilizzando il metodo indiretto per il calcolo della varianza), che lavarianza del primo gruppo è:

σ21 =

482 + 492 + 482 + 472

4− (48)2 = 0.5

quella del secondo gruppo:

σ22 =

562 + 562 + 572 + 572 + 552

5− (56.2)2 = 0.56

e infine per il terzo gruppo:

σ23 =

522 + 512 + 512

3− (51.3̄)2 = 0.2̄.

Il calcolo della media aritmetica ponderata delle varianze parziali (varianza nei

gruppi), è pertanto:

σ2N =

1

N

K∑

j=1

σ2j · Nj =

1

N

3∑

j=1

σ2j · Nj =

0.5 · 4 + 0.56 · 5 + 0.2̄ · 312

= 0.4556.

A questo punto è possibile verificare la scomposizione della varianza totale:

1 VARIABILITA’ 16

σ2N + σ2

F = σ2tot

0.4556 + 12.732 = 13.1876 (∼= 13.1875)

Calcolando i rapporti di composizione:

• σ2N

σ2tot

=0.4556

13.1876= 0.0345 (= 3.45%)

• σ2F

σ2tot

=12.732

13.1876= 0.9655 (= 96.55%)

è possibile notare che la varianza nei gruppi è il 3.45% della varianza totale e che lavarianza fra i gruppi è il 96.55% della varianza totale.

Da tali considerazioni possiamo concludere che la produzione risulta molto omogeneaper ogni macchina (cioè operai che lavorano alla stessa macchina hanno più o menola stessa produttività) ed eterogenea fra le varie macchine (cioè operai lavoranti amacchine diverse hanno produttività differenti). Le differenze di produttività tra glioperai sono dunque principalmente imputabili al fatto che utilizzano diversi macchi-nari.

9. La seguente tabella riporta la distribuzione del numero di alberghi delle due localitàturistiche A e B di un comprensorio, secondo le classi di fatturato annuale (in milionidi Euro):

classi di fatturato fino a 1 1 |– 3 3 |– 5 5 |– 10 10 |– 20 20 |– 40 Tot

Numero di Alberghi in A 15 24 85 48 40 29 241

Numero di Alberghi in B 25 51 67 59 31 31 264

Si verifichi la scomposizione della varianza del fatturato annuo degli alberghi del com-prensorio, commentando il risultato ottenuto.

Svolgimento

Per prima cosa, dividiamo in K = 2 gruppi gli alberghi del comprensorio: ovviamenteavremo un primo gruppo (di numerosità N1 pari a 241) formato dagli alberghi dellalocalità A e un secondo gruppo (di numerosità N2 pari a 264) composto dagli alberghidella località B.

Completiamo quindi la seguente tabella per agevolare i calcoli successivi (con nAj

e con nBj si sono indicate rispettivamente le frequenze degli alberghi della località

A e quelle degli alberghi della località B corrispondenti alla j-esima classe, mentre

xj =l−j + l+j

2(j = 1, ..., 6) indica il valore centrale di ogni classe).

1 VARIABILITA’ 17

Classi di

fatturatoxj x2

j nAj nB

j nAj + nB

j

0 |– 1 0.5 0.25 15 25 401 |– 3 2 4 24 51 753 |– 5 4 16 85 67 1525 |– 10 7.5 56.25 48 59 10710 |– 20 15 225 40 31 7120 |– 40 30 900 29 31 60

Totale 241 264 505

A questo punto è possibile calcolare la media aritmetica del fatturato per gli alberghidella località A:

X̄1 =1

N1

6∑

j=1

xj · nAj =

0.5 · 15 + 2 · 24 + 4 · 85 + 7.5 · 48 + 15 · 40 + 30 · 29

241= 9.234

e per gli alberghi della località B:

X̄2 =1

N2

6∑

j=1

xj · nBj =

0.5 · 25 + 2 · 51 + 4 · 67 + 7.5 · 59 + 15 · 31 + 30 · 31

264= 8.409.

La media aritmetica del fatturato degli alberghi di tutto il comprensorio è quindi,utilizzando la proprietà associativa della media aritmetica:

X̄ =9.234 · 241 + 8.409 · 264

241 + 264= 8.803.

É possibile ora calcolare la varianza del fatturato degli alberghi di tutto il compren-sorio, utilizzando le frequenze totali nA

j + nBj (ed il procedimento indiretto):

σ2tot =

1

N

6∑

j=1

x2j · [nA

j + nBj ] − X̄2

=0.25 · 40 + 4 · 75 + 16 · 152 + 56.25 · 107 + 225 · 71 + 900 · 60

505− (8.803)2

= 78.422.

Calcoliamo ora:

• la varianza nei gruppi

Si deve innanzitutto calcolare la varianza parziale di ciascun gruppo:

σ21 =

1

N1

6∑

j=1

x2j · nA

j − X̄21

=0.25 · 15 + 4 · 24 + 16 · 85 + 56.25 · 48 + 225 · 40 + 900 · 29

241− (9.234)2

=39259.75

241− 85.267 = 77.64.

1 VARIABILITA’ 18

σ22 =

1

N2

6∑

j=1

x2j · nB

j − X̄22

=0.25 · 25 + 4 · 51 + 16 · 67 + 56.25 · 59 + 225 · 31 + 900 · 31

264− (8.409)2

=39475

264− 70.711 = 78.81

e quindi la varianza nei gruppi (σ2N):

σ2N =

σ21 · N1 + σ2

2 · N2

N1 + N2

=77.64 · 241 + 78.81 · 264

505= 78.252;

• la varianza fra gruppi

Il calcolo della varianza fra i gruppi è invece:

σ2F =

[(X̄1 − X̄)2 · N1 + (X̄2 − X̄)2 · N2]

N1 + N2

=[(9.234 − 8.803)2 · 241 + (8.409 − 8.803)2 · 264]

505

=85.750

505= 0.1698.

In base ai risultati ottenuti, si verifica la scomposizione:

σ2N + σ2

F = σ2tot

78.252 + 0.1698 = 78.4218 (∼= 78.422).

Calcolando i rapporti di composizione:

• σ2N

σ2tot

=78.252

78.422= 0.9978 (= 99.78%)

• σ2F

σ2tot

=0.1698

78.422= 0.0022 (= 0.22%)

è possibile notare che la varianza nei gruppi è il 99.78% della varianza totale e chela varianza fra i gruppi è solo lo 0.22% della varianza totale.

Da tali considerazioni possiamo concludere che la distribuzione dei fatturati deglialberghi delle località A e B è omogenea (varianza fra i gruppi molto piccola) e che inentrambe le località esistono alberghi con fatturati molto diversi (varianza nei gruppimolto grande). Le differenze tra i fatturati degli alberghi non sono dunque imputabilialla diversa collocazione geografica (località A o B).

1 VARIABILITA’ 19

10. Nel 1981 gli ospedali in Italia erano 1826 ripartiti per tipo come segue: ospedaligenerali 1345, ospedali specialistici 295, ospedali psichiatrici 186. Per ogni ospedaleè stato rilevato il numero di posti letto ottenendo le informazioni seguenti:

osp. generali osp. specialist. osp. psichiatr.n. medio di posti letto 318,51 215,58 407,22

scarto quadratico medio dei posti letto 445,96 259,54 477,84.

Si determini il numero medio di posti letto per il complesso di ospedali e la varianzadella stessa variabile, commentando il risultato.

Svolgimento

In questo caso, riconosciamo K = 3 gruppi di numerosità N1 = 1345, N2 = 295 eN3 = 186, formati rispettivamente dagli ospedali generali, dagli ospedali specialisticie dagli ospedali psichiatrici.

Avendo le medie della variabile “numeri di posti letto” per ciascun gruppo, è possibilecalcolare la media aritmetica totale, utilizzando la proprietà associativa della mediaaritmetica:

X̄ =1

N

3∑

j=1

X̄j·Nj =318.51 · 1345 + 215.58 · 295 + 407.22 · 186

1345 + 295 + 186=

567734.97

1826= 310.917.

Per calcolare la varianza totale, è necessario utilizzare la sua scomposizione in va-rianza nei gruppi più varianza fra i gruppi.

La varianza nei gruppi è perciò (indicando con σ2j la varianza del j-esimo gruppo):

σ2N =

1

N

3∑

j=1

σ2j · Nj

=(445.96)2 · 1345 + (259.54)2 · 295 + (477.84)2 · 186

1826

=329835109.2

1826= 180632.59.

La varianza fra i gruppi è:

σ2F =

1

N

3∑

j=1

[X̄j − X̄]2 · Ni

=[318.51 − 310.917]2 · 1345 + [215.58 − 310.917]2 · 295 + [407.22 − 310.917]2 · 186

1826

=4483855.323

1826= 2455.56.

La varianza totale è quindi pari a:

1 VARIABILITA’ 20

σ2tot = σ2

N + σ2F

183088.15 = 180632.59 + 2455.56.

Calcolando i rapporti di composizione:

• σ2N

σ2tot

=180632.59

183088.15= 0.9866 (= 98.66%)

• σ2F

σ2tot

=2455.56

183088.15= 0.0134 (= 1.34%)

è possibile notare che la varianza nei gruppi è il 98.66% della varianza totale e chela varianza fra i gruppi è l’1.34% della varianza totale.

Da tali considerazioni possiamo concludere che ogni gruppo è molto eterogeneo alsuo interno (varianza nei gruppi alta): nell’ambito di ciascuna tipologia di ospedale(generale, specialistico, psichiatrico) il numero di posti letto è molto variabile da ospe-dale a ospedale, mentre vi è una forte omogeneità tra le varie tipologie di ospedale(bassa varianza fra i gruppi). Le differenze tra il numero di posti letto degli ospedalinon sono dunque imputabili alla diversa tipologia degli ospedali.

11. Il reddito annuo (in migliaia di euro) di sette individui è rispettivamente pari a 15,20, 12, 10, 18, 30, 35. Determinare e interpretare la differenza media e con ripetizionedel reddito.

Svolgimento

Per agevolare i conti, completiamo la seguente tabella scrivendo nella cella (i, j), laquantità |xi − xj|:

xj

xi15 20 12 10 18 30 35

15 0 5 3 5 3 15 2020 5 0 8 10 2 10 1512 3 8 0 2 6 18 2310 5 10 2 0 8 20 2518 3 2 6 8 0 12 1730 15 10 18 20 12 0 535 20 15 23 25 17 5 0

464

Si ottiene in questo modo che:

∆ =S

N(N − 1)=

1

N(N − 1)·

N∑

i=1

N∑

j=1

|xi − xj| =1

7 · 6 · 464 = 11.048

1 VARIABILITA’ 21

e tale valore indica che mediamente i redditi dei sette individui differiscono tra loroper 11.048 migliaia di euro.Inoltre

∆R =S

N2=

1

N2·

N∑

i=1

N∑

j=1

|xi − xj| =1

72· 464 = 9.469.

e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro(e con loro stessi) per 9.469 migliaia di euro.

Un ulteriore modo per calcolare il numeratore S delle differenze medie è dato da:

S = 2 ·N

i=1

i∑

j=1

|x(i) − x(j)|.

Illustriamo il calcolo del numeratore S attraverso quest’ultima formula.

Per prima cosa, è necessario ordinare i valori xj:

x(1) = 10 x(2) = 12 x(3) = 15 x(4) = 18 x(5) = 20 x(6) = 30 x(7) = 35

e completare la parte sotto la diagonale principale della seguente tabella, scrivendonella cella (i, j) la quantità |x(i) − x(j)|.

x(j)

x(i)10 12 15 18 20 30 35

Somme parziali

per riga

10 0 0

12 2 0 2

15 5 3 0 8

18 8 6 3 0 17

20 10 8 5 2 0 25

30 20 18 15 12 10 0 75

35 25 23 20 17 15 5 0 105

232

Si ha pertanto che

S = 2 ·N

i=1

i∑

j=1

|x(i) − x(j)| = 2 · 232 = 464

e quindi, come volevasi dimostrare:

∆ =S

N(N − 1)=

464

7 · 6 = 11.048

1 VARIABILITA’ 22

∆R =S

N2=

464

72= 9.469.

Giusto per completezza, viene riportato un ulteriore metodo di calcolo per il nume-ratore S.Completando la seguente tabella:

j x(j) 2j − N − 1 x(j)(2j − N − 1)1 10 -6 -602 12 -4 -483 15 -2 -304 18 0 05 20 2 406 30 4 1207 35 6 210

232

possiamo calcolare S nel seguente modo:

S = 2 ·7

j=1

x(j)(2j − N − 1) = 2 · 232 = 464

e quindi ritrovare gli stessi valori calcolati precedentemente per ∆ e ∆R.

12. La distribuzione del prezzo del pane al chilogrammo nei capoluoghi di 27 provincenel 1970 e nel 1989 è riportata nella seguente tabella:

prezzo lire al kg. 1970 700 800 900 950 1000 1200 totfrequenze 1 4 2 3 7 10 27

prezzo lire al kg. 1989 2100 2500 2600 2950 3000 3600 totfrequenze 2 3 2 4 6 10 27

.

a) Determinare la differenza media semplice e con ripetizione del prezzo del pane nel1970;b) Si può dire che dal 1970 al 1989 ci sia stato un aumento della variabilità del feno-meno?

Svolgimento

a) Ricordando che in questo caso N = 27, completiamo la seguente tabella cheagevolerà il calcolo delle differenze medie.

1 VARIABILITA’ 23

xj nj Cj 2Cj − N − nj nj(2Cj − N − nj) xjnj(2Cj − N − nj)700 1 1 -26 -26 -18200800 4 5 -21 -84 -67200900 2 7 -15 -30 -27000950 3 10 -10 -30 -285001000 7 17 0 0 01200 10 27 17 170 204000

Totale 27 63100

Utilizzando la formula per il calcolo del numeratore S, la differenza mediasemplice è quindi data da:

∆ =S

N(N − 1)=

2

N(N − 1)·

6∑

j=1

xjnj(2Cj−N−nj) =2

27 · 26·63100 = 179.77.

Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differisconomediamente tra loro di 179.77 lire.

La differenza media con ripetizione è data da:

∆R =S

N2=

2

N2·

6∑

j=1

xjnj(2Cj − N − nj) =2

(27)2· 63100 = 173.11.

Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differisconomediamente tra loro (e con loro stessi) di 173.11 lire.

b) Osservando i valori del prezzo del pane nei due anni presi in esame, è facile ren-dersi conto che l’ordine di grandezza è differente, ragion per cui per confrontarele variabilità dei prezzi del pane nei due anni (1970 e 1989) è necessario ricorrerea indici relativi di variabilità.Poichè al punto precedente abbiamo calcolato sulla distribuzione dei prezzi del1970 gli indici ∆ e ∆R, la scelta più ovvia è quella di confrontare la variabilitàdei prezzi del 1970 e del 1989 con gli indici relativi:

M1

o∆R

M1

.

Per completezza, tuttavia, calcoliamo anche gli altri indici relativi noti:

SM1

M1

,SMe

M1

M1

.

Calcoliamo perciò la mediana e la media aritmetica relative all’anno 1970:

Me(1970) = x(N+1

2 ) = x( 27+1

2 ) = x(14) = 1000

M(1970)1 =

700 · 1 + 800 · 4 + 900 · 2 + 950 · 3 + 1000 · 7 + 1200 · 10

27= 1020.37

1 VARIABILITA’ 24

e la mediana e la media aritmetica relative all’anno 1989:

Me(1989) = x(N+1

2 ) = x( 27+1

2 ) = x(14) = 3000

M(1989)1 =

2100 · 2 + 2500 · 3 + 2600 · 2 + 2950 · 4 + 3000 · 6 + 3600 · 10

27= 3062.96

Si completa la seguente tabella, relativa all’anno 1970:

xj nj |xj − Me| |xj − Me|nj |xj − M1| |xj − M1|nj (xj − M1)2 (xj − M1)

2nj

700 1 300 300 320.37 320.37 102636.94 102636.94

800 4 200 800 220.37 881.48 48562.93 194251.72

900 2 100 200 120.37 240.74 14488.94 28977.88

950 3 50 150 70.37 211.11 4951.94 14855.82

1000 7 0 0 20.37 142.59 414.94 2904.58

1200 10 200 2000 179.63 1796.3 32266.94 322669.4

Totale 27 3450 3592.59 666296.34

grazie alla quale è possibile calcolare

S(1970)Me =

1

N

6∑

j=1

|xj − Me(1970)| · nj =3450

27= 127.7̄

S(1970)M1

=1

N

6∑

j=1

|xj − M(1970)1 | · nj =

3592.59

27= 133.059

σ(1970) =

1

N

6∑

j=1

(xj − M(1970)1 )2 · nj =

666296.34

27= 159.07.

Completiamo l’analoga tabella relativa all’anno 1989:

xj nj |xj − Me| |xj − Me|nj |xj − M1| |xj − M1|nj (xj − M1)2 (xj − M1)

2nj

2100 2 900 1800 962.96 1925.92 927291.96 1854583.92

2500 3 500 1500 562.96 1688.88 316923.96 950771.88

2600 2 400 800 462.96 925.92 214331.96 428663.92

2950 4 50 200 112.96 451.84 12759.96 51039.84

3000 6 0 0 62.96 377.76 3963.96 23783.76

3600 10 600 6000 537.04 5370.4 288411.96 2884119.6

Totale 27 10300 10740.72 6192962.92

grazie alla quale è possibile calcolare

S(1989)Me =

1

N

6∑

j=1

|xj − Me(1989)| · nj =10300

27= 381.48

S(1989)M1

=1

N

6∑

j=1

|xj − M(1989)1 | · nj =

10740.72

27= 397.8

1 VARIABILITA’ 25

σ(1989) =

1

N

6∑

j=1

(xj − M(1989)1 )2 · nj =

6192962.92

27= 478.92.

Ricordiamo infine di aver calcolato, per l’anno 1970,

∆(1970) = 179.77

e∆

(1970)R = 173.11.

Completiamo l’analoga tabella (relativa all’anno 1989):

xj nj Cj 2Cj − N − nj xjnj · (2Cj − N − nj)

2100 2 2 -25 -1050002500 3 5 -20 -1500002600 2 7 -15 -780002950 4 11 -9 -1062003000 6 17 1 180003600 10 27 17 612000

190800

grazie alla quale possiamo calcolare

∆(1989) =S

N(N − 1)=

1

N(N − 1)·2

6∑

j=1

xjnj·(2Cj−N−nj) =2 · 190800

27 · 26= 543.59

e

∆(1989)R =

S

N2=

1

N2· 2

6∑

j=1

xjnj · (2Cj − N − nj) =2 · 190800

272= 523.45.

Riassumiamo nella seguente tabella i valori calcolati sia per l’anno 1970 che perl’anno 1989:

Anno 1970 Anno 1989

Me 1000 3000M1 1020.37 3062.96SMe 127.7̄ 381.48SM1

133.059 397.805σ 157.09 478.92∆ 179.77 543.59∆R 173.11 523.45

É possibile a questo punto calcolare i seguenti indici relativi di variabilità:

1 VARIABILITA’ 26

Anno 1970 Anno 1989

SMe

M1

:127.7̄

1020.37= 0.1252 >

381.48

3062.96= 0.1245

SM1

M1

:133.059

1020.37= 0.1304 >

397.805

3062.96= 0.1299

CV =σ

M1

:157.09

1020.37= 0.1540 <

478.92

3062.96= 0.1564

M1

:179.77

1020.37= 0.1762 <

543.59

3062.96= 0.1774

∆R

M1

:173.11

1020.37= 0.1696 <

523.45

3062.96= 0.1708

Il valore 0.1252 indica che lo scostamento dalla mediana del prezzo del pane nel1970 è pari al 12.52% della media aritmetica.Il valore 0.1245 indica che lo scostamento dalla mediana del prezzo del pane nel1989 è pari al 12.45% della media aritmetica.

Il valore 0.1304 indica che lo scostamento dalla media aritmetica del prezzo delpane nel 1970 è pari al 13.04% della media aritmetica.Il valore 0.1299 indica che lo scostamento dalla media aritmetica del prezzo delpane nel 1989 è pari al 12.99% della media aritmetica.

Il valore 0.1540 indica che lo scarto quadratico medio del prezzo del pane nel1970 è pari al 15.40% della media aritmetica.Il valore 0.1564 indica che lo scarto quadratico medio del prezzo del pane nel1989 è pari al 15.64% della media aritmetica.

Il valore 0.1762 indica che la differenza media semplice del prezzo del pane nel1970 è pari al 17.62% della media aritmetica.Il valore 0.1774 indica che la differenza media semplice del prezzo del pane nel1989 è pari al 17.74% della media aritmetica.

Il valore 0.1696 indica che la differenza media con ripetizione del prezzo del panenel 1970 è pari al 16.96% della media aritmetica.Il valore 0.1708 indica che la differenza media con ripetizione del prezzo del panenel 1989 è pari al 17.08% della media aritmetica.

Attraverso il confronto dei valori assunti dagli indici relativi di variabilità cal-colati, si può concludere che la variabilità del prezzo del pane dei 27 capoluoghi

1 VARIABILITA’ 27

presi in esame nel 1989 non è sensibilmente aumentata rispetto al 1970.

13. La classificazione di due gruppi di ditte produttrici di olio d’oliva, che vendono rispet-tivamente il proprio prodotto a peso (gruppo A) e a volume (gruppo B), ha dato luogoalle seguenti distribuzioni di frequenze:

gruppo A prezzo euro al kg 2–|3 3–|3,5 3,5–|4 4–|4,5 4,5–|5n. ditte 40 90 200 110 60

gruppo B prezzo euro al litro 2–|3 3–|3,5 3,5–|4 4–|4,5 4,5–|5n. ditte 100 80 70 30 20

.

Quale delle due distribuzioni presenta maggiore variabilità? Si effettui il confrontoutilizzando indici basati sullo scostamento medio dalla media aritmetica, sullo scosta-mento medio dalla mediana, sullo scarto quadratico medio e sulla differenza mediasemplice.

Svolgimento

Per prima cosa, completiamo la seguente tabella per agevolare il calcolo della media-na e della media aritmetica per ciascuno dei due gruppi (si indicano con nA

j e nBj le

frequenze dei gruppi A e B, inoltre con NA si è indicata la numerosità complessiva del

gruppo A e con NB quella del gruppo B, infine xj =l−j + l+j

2indica il valore centrale

di ogni classe).

classi di prezzo xj nAj nB

j CAj CB

j xjnAj xjn

Bj

2–|3 2.5 40 100 40 100 100 2503–|3.5 3.25 90 80 130 180 293 2603.5–|4 3.75 200 70 330 250 750 2634–|4.5 4.25 110 30 440 280 468 1284.5–|5 4.75 60 20 500 300 285 95Totale 500 300 1895 995

É possibile ora calcolare la mediana per ciascuno dei due gruppi:

MeA = x�NA+1

2

� = x( 500+1

2 ) = x(250.5) = 3.5 + [250.5 − 130 − 0.5] · 0.5

200= 3.8

MeB = x�NB+1

2

� = x( 300+1

2 ) = x(150.5) = 3 + [150.5 − 130 − 0.5] · 0.5

80= 3.3125

e le medie aritmetiche:

MA1 =

1

NA

5∑

j=1

xjnAj =

1895

500= 3.79

1 VARIABILITA’ 28

MB1 =

1

NB

5∑

j=1

xjnBj =

995

300= 3.316̄.

Completiamo quindi la tabella relativa al gruppo A:

xj nAj |xj − Me

A| |xj − MeA|nA

j |xj − MA1 | |xj − M

A1 |nA

j x2j x

2jn

Aj

2.5 40 1.3 52 1.29 51.6 6.25 250

3.25 90 0.55 49.5 0.54 48.6 10.5625 950.625

3.75 200 0.05 10 0.04 8 14.0625 2812.5

4.25 110 0.45 49.5 0.46 50.6 18.0625 1986.875

4.75 60 0.95 57 0.96 57.6 22.5625 1353.75

Totale 500 218 216.4 7353.75

da cui ricaviamo

SAMe =

1

NA

5∑

j=1

|xj − MeA| · nAj =

218

500= 0.436

SAM1

=1

NA

5∑

j=1

|xj − MA1 | · nA

j =216.4

500= 0.4328

σA =

1

NA

5∑

j=1

x2j · nA

j − [MA1 ]2 =

7353.75

500− (3.79)2 =

√0.3434 = 0.586.

Completiamo anche la seguente tabella (sempre relativa al gruppo A):

xj nAj CA

j 2CAj − NA − nA

j xjnAj · (2CA

j − NA − nAj )

2.5 40 40 -460 -460003.25 90 130 -330 -965253.75 200 330 -40 -300004.25 110 440 270 1262254.75 60 500 440 125400

79100

grazie alla quale possiamo calcolare

∆A =S

NA(NA − 1)=

1

NA(NA − 1)·2

5∑

j=1

xjnAj ·(2CA

j −NA−nAj ) =

2 · 79100

500 · 499= 0.6341.

Calcoliamo ora le stesse grandezze per il gruppo B:

1 VARIABILITA’ 29

xj nBj |xj − Me

B| |xj − MeB|nB

j |xj − MB1 | |xj − M

B1 |nB

j x2j x

2jn

Bj

2.5 100 0.813 81.3 −0.816̄ 81.6̄ 6.25 625

3.25 80 0.063 5.04 0.06̄ 5.3̄ 10.5625 845

3.75 70 0.438 30.66 0.43̄ 30.3̄ 14.0625 984.375

4.25 30 0.938 28.14 0.93̄ 28 18.0625 541.875

4.75 20 1.438 28.76 1.43̄ 28.6̄ 22.5625 451.25

Totale 500 173.9 174 3447.5

da cui ricaviamo

SBMe =

1

NB

5∑

j=1

|xj − MeB| · nBj =

173.9

300= 0.579

SBM1

=1

NB

5∑

j=1

|xj − MB1 | · nB

j =174

300= 0.58

σB =

1

NB

5∑

j=1

x2j · nB

j − [MB1 ]2 =

3447.5

300− (3.316̄)2 =

√0.4914 = 0.701.

Completiamo anche la seguente tabella (sempre relativa al gruppo B):

xj nBj CB

j 2CBj − NB − nB

j xjnBj · (2CB

j − NB − nBj )

2.5 100 100 -200 -500003.25 80 180 -20 -52003.75 70 250 130 341254.25 30 280 230 293254.75 20 300 280 26600

34850

grazie alla quale possiamo calcolare

∆B =S

NB(NB − 1)=

1

NB(NB − 1)·2

5∑

j=1

xjnBj ·(2CB

j −NB−nBj ) =

2 · 34850

300 · 299= 0.777.

É possibile a questo punto calcolare i seguenti indici relativi di variabilità:

1 VARIABILITA’ 30

Gruppo A Gruppo B

SMe

M1

:0.436

3.79= 0.115 <

0.579

3.316̄= 0.1746

SM1

M1

:0.4328

3.79= 0.1142 <

0.58

3.316̄= 0.1749

CV =σ

M1

:0.586

3.79= 0.1546 <

0.701

3.316̄= 0.2114

M1

:0.6341

3.79= 0.1673 <

0.777

3.316̄= 0.2343

Confrontando i valori degli indici relativi di variabilità, si può concludere che presentamaggiore variabilità la distribuzione delle ditte del gruppo B.

14. Nella seguente tabella sono riportate le distribuzioni per destinazione dei viaggi divacanza (V ) e dei viaggi di lavoro (W ) effettuati dagli italiani nel 1998 (dati inmigliaia):

Destinazione V W

Italia 67682 10944Paesi UE 7238 1984Resto d’Europa 1989 378Resto del mondo 2236 501

.

Si valuti, con un opportuno indice basato sulle differenze medie, quale delle due di-stribuzioni V e W presenta la variabilità più elevata. Si interpretino i valori assuntidall’indice per le due distribuzioni.

Svolgimento

Riconosciamo innanzitutto che abbiamo a che fare con una distribuzione di unità eche la popolazione statistica è costituita da 4 unità (N = 4).Per calcolare la differenza media per i viaggi di vacanza (V ), completiamo la seguentetabella, in cui le osservazioni sono state ordinate in modo crescente secondo i valoridel carattere.

Destinazione i v(i) 2i − N − 1 v(i) · (2i − N − 1)Resto d’Europa 1 1989 -3 -5967Resto del mondo 2 2236 -1 -2236

Paesi EU 3 7238 1 7238Italia 4 67682 3 203046Totale 79145 202081

1 VARIABILITA’ 31

Possiamo pertanto calcolare la differenza media:

∆(V ) =2

N(N − 1)·

4∑

i=1

v(i) · (2i − N − 1) =2

4 · 3 · 202081 = 33680.17,

la media aritmetica:

M1(V ) =1

4

4∑

i=1

vi =79145

4= 19786.25

e quindi l’indice relativo di variabilità:

∆(V )

M1(V )=

33680.17

19786.25= 1.702

che indica che la differenza media semplice del numero di viaggi di vacanza è il 170.2%della corrispondente media aritmetica.

Consideriamo ora il carattere W :

Destinazione i w(i) 2i − N − 1 w(i) · (2i − N − 1)Resto d’Europa 1 378 -3 -1134Resto del mondo 2 501 -1 -501

Paesi EU 3 1984 1 1984Italia 4 10944 3 32832Totale 13807 33181

Possiamo pertanto calcolare la differenza media:

∆(W ) =2

N(N − 1)·

4∑

i=1

w(i) · (2i − N − 1) =2

4 · 3 · 33181 = 5530.16̄,

la media aritmetica:

M1(W ) =1

4

4∑

i=1

wi =13807

4= 3451.75

e quindi l’indice relativo di variabilità:

∆(W )

M1(W )=

5530.16

3451.75= 1.602.

che indica che la differenza media semplice del numero di viaggi di lavoro è il 160.2%della corrispondente media aritmetica.Riconoscendo che

∆(V )

M1(V )= 1.702 > 1.602 =

∆(W )

M1(W )

si può concludere che la distribuzione V presenta maggiore variabilità.

1 VARIABILITA’ 32

15. Una fabbrica produce tubi catodici televisivi di due tipi. Per il tipo A si ha unadurata media di 1495 ore e uno scarto quadratico medio di 280 ore. Per il tipo B siha una durata media di 1875 ore ed uno scarto quadratico medio di 310 ore. Fornireuna misura della variabilità relativa e commentare il risultato.

Svolgimento

Un indice di variabilità relativa per i tubi di tipo A è dato da:

σA

MA1

=280

1495= 0.19

e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo A èil 19% della corrispondente durata media.

Per quanto riguarda i tubi del tipo B si ha:

σB

MB1

=310

1875= 0.17.

e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo B èil 17% della corrispondente durata media.

Riconoscendo cheσA

MA1

= 0.19 > 0.17 =σB

MB1

si può concludere che la distribuzione delle durate dei tubi catodici del gruppo Apresenta maggiore variabilità rispetto a quella del gruppo B.