1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L....

22
1 Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a. 2014-2015

Transcript of 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L....

Page 1: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

1

Corso diAnalisi Statistica per le

Imprese

Indici di variabilita’ ed eterogeneita’

Prof. L. Neri

a.a. 2014-2015

Page 2: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Variabilità• La variabilità di una distribuzione esprime la

tendenza delle unità di un collettivo ad assumere diverse modalità del carattere.

• Per misurare la variabilità di una distribuzione si ricorre agli indici di variabilità che devono rispettare le seguenti caratteristiche:

-assumere valore minimo se tutte le unità della distribuzione presentano la stessa modalità del carattere

-aumentare al crescere della “diversità” tra le modalità assunte dalle varie unità

2

Page 3: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Variabilità

• Il calcolo di una media non esaurisce la descrizione sintetica di un fenomeno osservato in un collettivo

• Due insiemi di valori o due distribuzioni di frequenza, pur avendo lo stesso valore medio, possono essere molto differenti tra di loro

• Gli indici di variabilità forniscono informazioni complementari a quelle degli indici medi

3

Page 4: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Punti vendita

Ricavi Costi addetti ubicazione Genere respons.

VenditaOn-line

R.O

1 350 205 5 centro maschio si 145

2 200 100 3 periferia maschio si 100

3 600 350 10 semicentro femmina no 250

4 500 270 10 periferia femmina no 230

5 270 200 6 centro maschio no 70

6 180 120 3 centro maschio no 60

7 205 105 3 periferia maschio no 100

8 340 210 5 semicentro femmina no 120

9 280 140 4 centro femmina si 140

4

Page 5: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Variabilità

Ricavi

350

200

600

500

270

180

205

340

280

Ricavi(A)

Ricavi(B)

Ricavi (C)

325 300 140

325 350 270

325 400 830

325 200 605

325 300 120

325 325 200

325 300 190

325 400 200

325 350 370

Distribuzione osservata

Distribuzioni teoriche

Le 3 distribuzioni teoriche hanno la stessa media della distribuzione osservata

La sintesi con la media aritmetica porta allo stesso risultato

325x

Eppure le distribuzioni sono molto diverse tra di loro

5

Page 6: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Alcuni indici di variabilità

Il range (o campo di variazione)è l’ampiezza dell’intervallo che contiene tutti

i valori della distribuzione

La differenza interquartile è l’ampiezza dell’intervallo che contiene il

50% dei valori (quelli centrali)

minmax xxrange

13 QQdQ

6

Page 7: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

EsempioRicavi

350

200

600

500

270

180

205

340

280

Ricavi(A)

Ricavi(B)

Ricavi (C)

325 300 140

325 350 270

325 400 830

325 200 605

325 300 120

325 325 200

325 300 190

325 400 200

325 350 370

xmin180 325 200 120

xmax600 325 400 830

Range=xmax-xmin420 0 200 710

Distr. AVariabilità nullaTutti i valori uguali

Passando da A a B e da B a C, aumenta la variabilità perché i valori cadono in un range sempre più ampio

7

Page 8: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Indici basati sullo scostamento dalla media

La varianza σ2 è funzione delle differenze (scarti) tra ogni valore xi e la media

La devianza è il numeratore della varianza

n

11

2

i2 xx

n1

n

1i

2

i xx)X(Dev

02

x

8

Page 9: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Indici basati sullo scostamento dalla media

La deviazione standard (o scarto quadratico medio) è la radice quadrata della varianza

Il coefficiente di variazione CV è il rapporto tra la dev. standard e la media moltiplicato per 100

n

1i

2

i xxn1

100x

CV 0x

9

Page 10: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Confronto tra due distribuzioni in termini di variabilità

CV si calcola per confrontare la variabilità della distribuzione del carattere X con quella del carattere Y quando sono espressi o con diversa unità di misura o con diverso ordine di grandezza

Se CVX>CVy allora la variabilità del carattere X è maggiore di quella del carattere Y

10

Page 11: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

11

Esempio di calcolo

Ricavixj

Scarti dalla

media (xj-μ)

Quadrato degli scarti(xj-μ)2

350 25 625

200 -125 15625

600 275 75625

500 175 30625

270 -55 3025

180 -145 21025

205 -120 14400

340 15 225

280 -45 2025

325x media

0xxn

1ii

163200)X(Devxxn

1i

2

i

3,181339

163200n

)X(Devxx

n1 2

n

1i

2

i

7,1343,18133

xxn1 n

1i

2

i

Per la proprietà della media

Devianza=163200

Varianza=18133,3

Dev.std.=134,7

11

Page 12: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Variabilità dei ricavi dei punti vendita

• Un basso grado di variabilità indica che i punti vendita realizzano performance simili (i ricavi si discostano poco tra di loro)

• Viceversa un alto grado di variabilità fa capire che c’è una certa eterogeneità nei risultati delle vendite ottenuti nei diversi negozi

12

Page 13: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Varianza di una distribuzione di frequenza

10,6988,54

nxxn1

j

K

1j

2

j2

Addetti(xj)

Numero punti vendita

(nj)

3 2

4 1

6 3

7 1

10 2

(xj-μ)2*nj

19,34

4,45

0,04

0,79

30,26

11,6x

47,210,6 %43,4010011,647,2

CV

13

Page 14: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Box plot

Q1

max

Q3

Q2

min

L’altezza del box indica la dispersione del 50% delle osservazioni centrali intorno alla mediana. Si evidenzia una certa simmetria nella parte centrale, dato che la differenza Q2-Q1 non è molto diversa da Q3-Q2

I segmenti esterni al box indicano la dispersione dei valori estremi.Si nota una maggiore dispersione del 25% dei valori più grandi, dato che la differenza max-Q3 è molto maggiore di Q1-min

Ric

avi

14

Page 15: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Calcolo dei valori standardizzati

Se il carattere quantitativo X ha media

e deviazione standard σ allora è possibile sempre ottenere i suoi valori standardizzati

x

1...ni / xxy ii

La distribuzione del carattere Y avrà allora media zero e deviazione standard uguale ad 1

Page 16: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Confronto del rendimento di due investimenti (uguale media)

Negli ultimi cinque anni, due fondi di investimento F1 e F2 hanno avuto lo stesso rendimento medio annuo, ma le varianze sono molto diverse Var(F1)>Var(F2)

F1 F2

2003 7,7 6,4

2004 6,1 5,9

2005 0,4 3,2

2006 9,8 7,1

2007 3,5 4,9

media 5,5 5,5

var 10,7 1,8

Una varianza maggiore indica che rendimenti molto diversi dalla media sono più frequenti Maggiore volatilità Maggior rischioA parità di rendimento medio, il cliente che è disposto ad accettare un rischio più alto sceglierà di investire in F1

16

Page 17: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Confronto del rendimento di due investimenti (media diversa)

Il rendimento di F1 ha registrato una media e una varianza superiore a quello di F2

Si può concludere che F1 rappresenta un investimento più rischioso rispetto a F2?

F1 F2

2003 9,7 1,4

2004 7,1 1,9

2005 0,9 2,2

2006 9,9 2,1

2007 7,5 4,9

media 7,0 2,5

var 10,6 1,5 Le due medie hanno un ordine di grandezza diverso CV 46,5 49,3

la variabilità si confronta con CV A F1 è associata una variabilità (volatilità) più bassa

17

Page 18: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Omogeneità ed eterogeneità

Sono aspetti della variabilità di un carattere qualitativo

• Eterogeneità nulla (o massima omogeneità) → Il carattere assume un’unica modalità (tutte le unità del collettivo presentano quella modalità)

• Eterogeneità massima (o minima omogeneità) → Il carattere presenta tutte le modalità e a ciascuna di esse è associata la stessa frequenza

18

Page 19: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Eterogeneità

Eterogeneità nulla(tutte le unità hanno la stessa modalità)

Eterogeneità massima(a ciascuna modalità è associata la stessa frequenza)

Mod. Freq. rel.

a 1

Mod. Freq. rel.

a1 1/k

a2 1/k

ak 1/k

19

Page 20: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Indice di eterogeneità

Indice di eterogeneità di Gini

Indice relativo di eterogeneità di Gini

Mod. Freq. Freq. rel.

a1 n1 f1

a2

n2

f2

..

aj nj fj

aK nK fK

K

1j

2j1 f1E

K1K

E0 1

1KK

E

K1K

Ee 1

11

1e0 1

20

Page 21: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Eterogeneità dell’ubicazione dei punti vendita

Ubicazione del p.v.

F. ass. (nj)

F. rel. (fj)

Centro 4 0,45

Semicentro 2 0,22

Periferia 3 0,33

Totale 9 1,00

0,20

0,05

0,11

0,36

2jf

64,036,01f1EK

1j

2j1

96,067,064,0

e1

67,032

K1K

E0 1

21

Page 22: 1 Corso di Analisi Statistica per le Imprese Indici di variabilita ’ ed eterogeneita ’ Prof. L. Neri a.a. 2014-2015.

Eterogeneità dell’ubicazione dei punti vendita

Distr. osservata

Ubicazione del p.v.

F. ass. (nj)

F. rel. (fj)

Centro 4 0,45

Semicentro 2 0,22

Periferia 3 0,33

Totale 9 1,00

Distr. con la max eterog.

F. ass. (nj)

F. rel. (fj)

3 0,33

3 0,33

3 0,33

9 1,00

C’è un elevato grado di eterogeneitàLa distribuzione osservata si avvicina a quella che si avrebbe nella situazione di massima eterogeneità

22