1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L....
-
Upload
nazario-corti -
Category
Documents
-
view
216 -
download
0
Transcript of 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L....
1
Corso diAnalisi Statistica per le
Imprese
Indici di variabilita’ ed eterogeneita’
Prof. L. Neri
a.a. 2014-2015
Variabilità• La variabilità di una distribuzione esprime la
tendenza delle unità di un collettivo ad assumere diverse modalità del carattere.
• Per misurare la variabilità di una distribuzione si ricorre agli indici di variabilità che devono rispettare le seguenti caratteristiche:
-assumere valore minimo se tutte le unità della distribuzione presentano la stessa modalità del carattere
-aumentare al crescere della “diversità” tra le modalità assunte dalle varie unità
2
Variabilità
• Il calcolo di una media non esaurisce la descrizione sintetica di un fenomeno osservato in un collettivo
• Due insiemi di valori o due distribuzioni di frequenza, pur avendo lo stesso valore medio, possono essere molto differenti tra di loro
• Gli indici di variabilità forniscono informazioni complementari a quelle degli indici medi
3
Punti vendita
Ricavi Costi addetti ubicazione Genere respons.
VenditaOn-line
R.O
1 350 205 5 centro maschio si 145
2 200 100 3 periferia maschio si 100
3 600 350 10 semicentro femmina no 250
4 500 270 10 periferia femmina no 230
5 270 200 6 centro maschio no 70
6 180 120 3 centro maschio no 60
7 205 105 3 periferia maschio no 100
8 340 210 5 semicentro femmina no 120
9 280 140 4 centro femmina si 140
4
Variabilità
Ricavi
350
200
600
500
270
180
205
340
280
Ricavi(A)
Ricavi(B)
Ricavi (C)
325 300 140
325 350 270
325 400 830
325 200 605
325 300 120
325 325 200
325 300 190
325 400 200
325 350 370
Distribuzione osservata
Distribuzioni teoriche
Le 3 distribuzioni teoriche hanno la stessa media della distribuzione osservata
La sintesi con la media aritmetica porta allo stesso risultato
325x
Eppure le distribuzioni sono molto diverse tra di loro
5
Alcuni indici di variabilità
Il range (o campo di variazione)è l’ampiezza dell’intervallo che contiene tutti
i valori della distribuzione
La differenza interquartile è l’ampiezza dell’intervallo che contiene il
50% dei valori (quelli centrali)
minmax xxrange
13 QQdQ
6
EsempioRicavi
350
200
600
500
270
180
205
340
280
Ricavi(A)
Ricavi(B)
Ricavi (C)
325 300 140
325 350 270
325 400 830
325 200 605
325 300 120
325 325 200
325 300 190
325 400 200
325 350 370
xmin180 325 200 120
xmax600 325 400 830
Range=xmax-xmin420 0 200 710
Distr. AVariabilità nullaTutti i valori uguali
Passando da A a B e da B a C, aumenta la variabilità perché i valori cadono in un range sempre più ampio
7
Indici basati sullo scostamento dalla media
La varianza σ2 è funzione delle differenze (scarti) tra ogni valore xi e la media
La devianza è il numeratore della varianza
n
11
2
i2 xx
n1
n
1i
2
i xx)X(Dev
02
x
8
Indici basati sullo scostamento dalla media
La deviazione standard (o scarto quadratico medio) è la radice quadrata della varianza
Il coefficiente di variazione CV è il rapporto tra la dev. standard e la media moltiplicato per 100
n
1i
2
i xxn1
100x
CV 0x
9
Confronto tra due distribuzioni in termini di variabilità
CV si calcola per confrontare la variabilità della distribuzione del carattere X con quella del carattere Y quando sono espressi o con diversa unità di misura o con diverso ordine di grandezza
Se CVX>CVy allora la variabilità del carattere X è maggiore di quella del carattere Y
10
11
Esempio di calcolo
Ricavixj
Scarti dalla
media (xj-μ)
Quadrato degli scarti(xj-μ)2
350 25 625
200 -125 15625
600 275 75625
500 175 30625
270 -55 3025
180 -145 21025
205 -120 14400
340 15 225
280 -45 2025
325x media
0xxn
1ii
163200)X(Devxxn
1i
2
i
3,181339
163200n
)X(Devxx
n1 2
n
1i
2
i
7,1343,18133
xxn1 n
1i
2
i
Per la proprietà della media
Devianza=163200
Varianza=18133,3
Dev.std.=134,7
11
Variabilità dei ricavi dei punti vendita
• Un basso grado di variabilità indica che i punti vendita realizzano performance simili (i ricavi si discostano poco tra di loro)
• Viceversa un alto grado di variabilità fa capire che c’è una certa eterogeneità nei risultati delle vendite ottenuti nei diversi negozi
12
Varianza di una distribuzione di frequenza
10,6988,54
nxxn1
j
K
1j
2
j2
Addetti(xj)
Numero punti vendita
(nj)
3 2
4 1
6 3
7 1
10 2
(xj-μ)2*nj
19,34
4,45
0,04
0,79
30,26
11,6x
47,210,6 %43,4010011,647,2
CV
13
Box plot
Q1
max
Q3
Q2
min
L’altezza del box indica la dispersione del 50% delle osservazioni centrali intorno alla mediana. Si evidenzia una certa simmetria nella parte centrale, dato che la differenza Q2-Q1 non è molto diversa da Q3-Q2
I segmenti esterni al box indicano la dispersione dei valori estremi.Si nota una maggiore dispersione del 25% dei valori più grandi, dato che la differenza max-Q3 è molto maggiore di Q1-min
Ric
avi
14
Calcolo dei valori standardizzati
Se il carattere quantitativo X ha media
e deviazione standard σ allora è possibile sempre ottenere i suoi valori standardizzati
x
1...ni / xxy ii
La distribuzione del carattere Y avrà allora media zero e deviazione standard uguale ad 1
Confronto del rendimento di due investimenti (uguale media)
Negli ultimi cinque anni, due fondi di investimento F1 e F2 hanno avuto lo stesso rendimento medio annuo, ma le varianze sono molto diverse Var(F1)>Var(F2)
F1 F2
2003 7,7 6,4
2004 6,1 5,9
2005 0,4 3,2
2006 9,8 7,1
2007 3,5 4,9
media 5,5 5,5
var 10,7 1,8
Una varianza maggiore indica che rendimenti molto diversi dalla media sono più frequenti Maggiore volatilità Maggior rischioA parità di rendimento medio, il cliente che è disposto ad accettare un rischio più alto sceglierà di investire in F1
16
Confronto del rendimento di due investimenti (media diversa)
Il rendimento di F1 ha registrato una media e una varianza superiore a quello di F2
Si può concludere che F1 rappresenta un investimento più rischioso rispetto a F2?
F1 F2
2003 9,7 1,4
2004 7,1 1,9
2005 0,9 2,2
2006 9,9 2,1
2007 7,5 4,9
media 7,0 2,5
var 10,6 1,5 Le due medie hanno un ordine di grandezza diverso CV 46,5 49,3
la variabilità si confronta con CV A F1 è associata una variabilità (volatilità) più bassa
17
Omogeneità ed eterogeneità
Sono aspetti della variabilità di un carattere qualitativo
• Eterogeneità nulla (o massima omogeneità) → Il carattere assume un’unica modalità (tutte le unità del collettivo presentano quella modalità)
• Eterogeneità massima (o minima omogeneità) → Il carattere presenta tutte le modalità e a ciascuna di esse è associata la stessa frequenza
18
Eterogeneità
Eterogeneità nulla(tutte le unità hanno la stessa modalità)
Eterogeneità massima(a ciascuna modalità è associata la stessa frequenza)
Mod. Freq. rel.
a 1
Mod. Freq. rel.
a1 1/k
a2 1/k
…
ak 1/k
19
Indice di eterogeneità
Indice di eterogeneità di Gini
Indice relativo di eterogeneità di Gini
Mod. Freq. Freq. rel.
a1 n1 f1
a2
…
n2
…
f2
..
aj nj fj
aK nK fK
K
1j
2j1 f1E
K1K
E0 1
1KK
E
K1K
Ee 1
11
1e0 1
20
Eterogeneità dell’ubicazione dei punti vendita
Ubicazione del p.v.
F. ass. (nj)
F. rel. (fj)
Centro 4 0,45
Semicentro 2 0,22
Periferia 3 0,33
Totale 9 1,00
0,20
0,05
0,11
0,36
2jf
64,036,01f1EK
1j
2j1
96,067,064,0
e1
67,032
K1K
E0 1
21
Eterogeneità dell’ubicazione dei punti vendita
Distr. osservata
Ubicazione del p.v.
F. ass. (nj)
F. rel. (fj)
Centro 4 0,45
Semicentro 2 0,22
Periferia 3 0,33
Totale 9 1,00
Distr. con la max eterog.
F. ass. (nj)
F. rel. (fj)
3 0,33
3 0,33
3 0,33
9 1,00
C’è un elevato grado di eterogeneitàLa distribuzione osservata si avvicina a quella che si avrebbe nella situazione di massima eterogeneità
22