Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf ·...
Transcript of Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf ·...
![Page 1: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/1.jpg)
Indici di variabilità
10x = 10x =
Gli indici di posizione sono tanto più rappresentativi
quanto minore è la dispersione dei dati intorno ad essi.
La variabilità è l’attitudine delle osservazioni ad esse
diverse l’una dall’altra
Gli indici di variabilità misurano
1) la dispersione (rispetto alla posizione)
2) la variabilità
![Page 2: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/2.jpg)
Voti Master
Studente Matematica Algebra Probabilità Inferenza
A 25 24 28 24
B 23 24 24 25
C 25 24 30 27
D 25 24 27 23
E 28 27 26 28
F 28 24 26 24
G 26 24 26 28
H 25 24 25 26
I 26 27 27 25
L 22 21 25 21
M 26 27 23 26
N 22 21 20 20
O 20 24 25 24
P 27 24 30 25
![Page 3: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/3.jpg)
La varianzaDati n valori 1 2 nx , x , ,x… con media x , la varianza è
2 2
(2)s x x= −
dove n
i
i
x xn =
= ∑ 2(2)
1
1
( )22
1
1 n
i
i
s x xn =
= −∑
Essa indica qual è la concentrazione delle osservazioni
intorno alla media, fornendo indicazioni sull’ordine di
grandezza degli scarti.
Scarto quadratico medio
2sσ =
![Page 4: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/4.jpg)
La varianza
( )
( )
( )
����
( )
( )
22
22
1
2 2
1
2 2
1 1 1
2 2
2
2
2
1
12
1 1 12
2
n
i
i
n
i i
i
n n n
i i
i i i
x x nx
s x xn
x x x xn
x x x xn n n
x x x
x x .
=
=
= = =
= = =
= −
= − +
= − +
= − +
= −
∑
∑
∑ ∑ ∑��� ������ ������ ������ ���
![Page 5: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/5.jpg)
Esempio 4.1 - Varianza
(1, 2, 5, 6, 7, 9) 5x =Dati:
2 2 2 2
2 2 2
1(1 5) (2 5) (5 5)
6
(6 5) (7 5) (9 5) 7.67
s = − + − + −
+ − + − + − =
1. Media dei quadrati degli scarti
( ) ( )2 2 2 2 2 2
2
11 2 5 6 7 9 32.67
6x = + + + + + =
2 232 67 5 7 67s . .= − =
2. Differenza fra la media dei quadrati e il quadrato della
media
7 67 2 77. .σ = =Scarto quadratico medio
![Page 6: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/6.jpg)
Varianza
da distribuzione di frequenza
( )22
1
1 k
i i
i
s x x nn =
= −∑
2 2
2( )s x x= −
X assume
k valori x1, x2, …, xk
con frequenze n1, n2, …, nk
dove ( )
2
2
1
1 k
i i
i
x x nn =
= ∑
1.
2.
![Page 7: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/7.jpg)
Esempio 4.2 – Varianza Voti in algebra
( )22
1
1 144 3574
14
3 17
k
i i
i
s x x n .n
.
=
= − =
=
∑
Tabella 4.2 – Calcolo della varianza dei voti in Algebra.
ix
in
ix x− ( )
2
ix x− ( )
2
i ix x n−
21 2 -3.21 10.3041 20.6082
24 9 -0.21 0.0441 0.3969
27 3 2.79 7.7841 23.3523
Totale 14 44.3574
( )2
1
k
i i
i
x x n=
−∑
3 17 1 78. .σ = =Scarto quadratico medio
24.21=x
![Page 8: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/8.jpg)
Esempio 4.2 – Varianza dei voti in Probabilità
2
2
1
1 9450675
14
k
( ) i i
i
y y nn =
= = =∑2 2 2
2 675 25 86
6 26
( )s y y .
.
= − = −
=
6 26 2 50. .σ = =Scarto quadratico medio
Tabella 4.3 – Media dei quadrati
dei voti in Probabilità.
iy in 2iy 2
i iy n
20 1 400 400
23 1 529 529
24 1 576 576
25 3 625 1⋅875
26 3 676 2⋅028
27 2 729 1⋅458
28 1 784 784
30 2 900 1⋅800
Totale 14 9⋅⋅⋅⋅450
2
1
k
i i
i
y n=
∑
25.86=y
![Page 9: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/9.jpg)
Varianza da dati
raggruppati in classi
k classi
(x0 – x1), (x1 – x2), … , (xk-1 – xk)
con frequenze n1, n2, … , nk
e valori centrali x1, 2x , … , kx
( )22
1
1 k
i i
i
s x x nn =
−∑≃≃≃≃
2 2
2( )s x x−≃≃≃≃
dove 2
(2)
1
1 k
i i
i
x x nn =
∑≃
1.
2.
![Page 10: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/10.jpg)
Esempio 4.3 – varianza rendimentiTabella 4.4 – Calcolo della varianza per i rendimenti .
Classi ix
in
ix x− ( )
2
ix x− ( )
2
i ix x n−
- 1.0 |– 1.0 0.0 9 -2.83 8.01 72.09
1.0 |– 2.0 1.5 23 -1.33 1.77 40.71
2.0 |– 3.0 2.5 24 -0.33 0.11 2.64
3.0 |– 4.0 3.5 8 0.67 0.45 3.60
4.0 |– 6.0 5.0 9 2.17 4.71 42.39
6.0 |– 8.0 7.0 3 4.17 17.39 52.17
8.0 |– 10.0 9.0 3 6.17 38.07 114.21
10.0 |– 12.0 11.0 1 8.17 67.75 67.75
Totale 80 395.56
( )2
1
k
i i
i
x x n=
−∑
( )22
1
1 1395.56 4.94
80
k
i i
i
s x x nn =
− = =∑≃≃≃≃
4 94 2 22. .σ =≃≃≃≃
2 83x .=
![Page 11: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/11.jpg)
Esempio 4.3 – varianza rendimentiTabella 4.5 – Calcolo della media dei quadrati
Classi ix
in 2
ix
2
i ix n
-1.0 |– 1.0 0.0 9 0.00 0.00
1.0 |– 2.0 1.5 23 2.25 51.75
2.0 |– 3.0 2.5 24 6.25 150.00
3.0 |– 4.0 3.5 8 12.25 98.00
4.0 |– 6.0 5.0 9 25.00 225.00
6.0 |– 8.0 7.0 3 49.00 147.00
8.0 |– 10.0 9.0 3 81.00 243.00
10.0 |– 12.0 11.0 1 121.00 121.00
Totale 80 1⋅⋅⋅⋅035.75
2
1
k
i i
i
x n=
∑
2 2 2
2 12 95 2 83 4 94( )s x x . . .− = − =≃≃≃≃
2
(2)
1
1 1035.7512.95
80
k
i i
i
x x nn =
= = =∑
2 83x .=
![Page 12: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/12.jpg)
Disuguaglianza di Chebyshev
( )2
21
sfr X x ε
ε− < ≥ −
( )2
21
sfr x X xε ε
ε− < < + ≥ −
x ε−
x
x ε+
La frequenza con la quale una variabile statistica X assume
valori in un intorno della media di semi- ampiezza ε è
almeno pari a 1-s2/ ε2.
0ε >
![Page 13: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/13.jpg)
Esempio 4.4 – Disuguaglianza di Cebyshev
Tabella 4.6 – Tempo impiegato dagli operatori di un call center.
1.32 1.65 1.67 1.73 1.78 2.08 2.16 2.19 2.21 2.34 2.42 2.63
2.64 2.74 2.82 2.95 2.97 2.98 3.06 3.09 3.11 3.16 3.25 3.28
3.32 3.34 3.36 3.39 3.42 3.42 3.45 3.47 3.49 3.62 3.63 3.76
3.77 3.90 3.96 4.06 4.11 4.19 4.20 4.21 4.28 4.32 4.46 4.54
4.56 4.56 4.61 4.63 4.70 4.74 4.77 4.77 4.92 5.12 5.24 5.51
3 5x .=
( )
( )
1.5 5.5
1.022 1 0.745
4
fr X
fr X x
< <
= − < ≥ − =
2 1 02s .=
![Page 14: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/14.jpg)
Varianza
di trasformazioni lineari
Sia 2
Xs la varianza di una variabile X, la varianza di una
trasformazione lineare Y aX b= + è data da
2 2 2 2
Y aX b Xs s a s+
= =
� La varianza è indipendente dalla posizione
� La varianza cambia quando varia la scala
![Page 15: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/15.jpg)
Varianza
di trasformazioni lineari
( )
( )
( )
( )
2
22
1
2
1
2
1
22 2 2
1
1
1
1
1.
X
k
Y i i
i
k
i i
i
k
i i
i
k
i i X
i
s
s y y nn
ax b ax b nn
ax ax nn
a x x n a sn
=
=
=
=
=
= −
= + − +
= −
= − =
∑
∑
∑
∑����������������������������
![Page 16: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/16.jpg)
Sia X una variabile statistica
• che assume valori positivi, X>0,
• con media x
• scarto quadratico medio σ ,
il coefficiente di variazione è dato da
Coefficiente di variazione
CVx
σ=
Il coefficiente di variazione non dipende dall’unità di
misura
CV(X) = CV(aX), per a >0
![Page 17: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/17.jpg)
Esempio – coefficiente di variazione
Tabella 4.6 – Tempo impiegato dagli operatori di un call center.
1.32 1.65 1.67 1.73 1.78 2.08 2.16 2.19 2.21 2.34 2.42 2.63
2.64 2.74 2.82 2.95 2.97 2.98 3.06 3.09 3.11 3.16 3.25 3.28
3.32 3.34 3.36 3.39 3.42 3.42 3.45 3.47 3.49 3.62 3.63 3.76
3.77 3.90 3.96 4.06 4.11 4.19 4.20 4.21 4.28 4.32 4.46 4.54
4.56 4.56 4.61 4.63 4.70 4.74 4.77 4.77 4.92 5.12 5.24 5.51
1 020 29
3 5
.CV .
.= =
3 5x .=
2 1 02s .=
![Page 18: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/18.jpg)
MAD
Median Absolute Deviation
{ }1.483 iMAD mediana x med= −
o X: x1, x2, … , xn
o med = mediana(X)
o Se la distribuzione è “normale” il MAD
approssima lo scarto quadratico medio
o Non risente dei valori anomali
![Page 19: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/19.jpg)
Esempio - MAD
ix ix med−
58 14
64 8
68 4
70 2
71 1
71 1
72 0
74 2
76 4
78 6
87 15
103 31
121 49
{ } 4imed x med− =
1 483 4 5 932MAD . .= × =
Consumi pro-capite annui di cereali
med=72
16 335.σ =
ix med−
0
1
1
2
2
4
4
6
⋮
Scarti
ordinati
( ) 7prof med =
mediana
![Page 20: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/20.jpg)
I quartili
4
1 1Q x
=
4
3 3Q x
=2Q med=
I quartili dividono i dati in quattro parti di eguale
numerosità.
E1 Q1 med Q3 E2
1/4 1/4 1/4 1/4
Profondità del quartile
( )( )
1
prof med +1prof Q =
2
o Ottili
o Sedicili
o etc.
![Page 21: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/21.jpg)
Esempio – quartili
consumi di carne
( ) 8.5prof med =
( )[ ]
1
8.5 14.5
2prof Q
+= =
n=16
Med=87
Carne
( 55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329 )
1
3
67
1
66
29 5
68
2
107 152
2
Q
Q .
+= =
+= =
M 87
Q 67 129.5
E 55 329
Sintesi
![Page 22: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/22.jpg)
Differenza interquartile
3 1DQ Q Q= −
� x(1), x(2), … , x(n)
�Quartili Q1 e Q3
Misura la variabilità della metà centrale dei dati.
Campo di variazione
( ) ( )1nx x−
![Page 23: Indici di variabilità - Luiss Guido Carlidocenti.luiss.it/.../2016/...Indici_di_variabilita.pdf · Indici di variabilità x =10 x =10 Gli indici di posizione sono tanto più rappresentativi](https://reader035.fdocumenti.com/reader035/viewer/2022062603/5f15992cd4afcf230d49f19d/html5/thumbnails/23.jpg)
Esempio – Differenza interquartile e campo di
variazione
( ) ( )1329 55 274
nx x− = − =
3 1 129 5 67 62 5QD Q Q . .= − = − =
Carne
( 55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329)
M 87
Q 67 129.5
E 55 329
Sintesi
83.91σ =