1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di...

28
1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015

Transcript of 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di...

Page 1: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

1

Corso diAnalisi Statistica per le

Imprese

Sintesi della distribuzione di un carattere: indici di

posizioneProf. L. Neri

a.a. 2014-2015

Page 2: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Indice di tendenza centrale: la media aritmetica

Si può calcolare solo per variabili quantitative

È una media analitica cioè è funzione di tutti i valori della distribuzione

E’ il punto di equilibrio o baricentro della distribuzione

E’ l’indice più intuitivo per sintetizzare un insieme di valori

2

Page 3: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Calcolo della media dei ricavi

• Conoscendo i ricavi dei 9 punti vendita dell’azienda, posso calcolare il ricavo medio, un unico valore rappresentativo dell’intero insieme

• Si sommano i ricavi di tutti i punti vendita e il risultato si divide per il numero delle osservazioni (n=9)

3

Page 4: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Calcolo della media

Punti vendit

a

Ricavi

1 350

2 200

3 600

4 500

5 270

6 180

7 205

8 340

9 280

Somma dei ricavi (Intensità totale del carattere) = 350 + 200 + 600 + 500 + 270 + 180 + 205 + 340 + 280 = 2925

Media dei ricavi = 2925:9=325

1

2

3

45

6

7

8

9

L’intera torta rappresenta la somma dei ricavi di tutti i punti vendita

La singola fetta rappresenta la media dei ricavi

Σ=2925

4

Page 5: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Formula della media

• Dati n valori osservati x1, x2,…, xn di un carattere quantitativo X

n

1iin21a x

n1

)x...xx(n1

x

Media = 325

100 200 300 400 500 600 700

5

Page 6: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Effetto dei valori estremiSe il valore estremo fosse 800 invece di 600 la media aumenterebbe (il punto di equilibrio si sposta verso destra)

100 200 300 400 500 600 700 800

Media = 347,22

La media aritmetica risente fortemente dei valori estremi

6

Page 7: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Media di una distribuzione di frequenza

Addetti(valori xj)

Numero punti vendita

(frequenze nj)

3 2

4 1

6 3

7 1

10 2

xj*nj

3*2=6

4*1=4

6*3=18

7*1=7

10*2=20

11,69

551

1

1

n

nx

n

nx

x

K

jjj

K

jj

K

jjj

K

1jj 9nn

55nx j

K

1jj

7

Page 8: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Media di una distribuzione di frequenza con classi di valori

Classi di superficie (in ettari)

Numero aziende

(nj)

0-1 120

1-2 160

2-3 220

3-5 212

5-10 205

10-20 110

20-40 65

40-80 21

Fonte: Borra-Di Ciaccio, pag. 71

Valore centrale classi (cj)

0,5

1,5

2,5

4

7,5

15

30

60

cj*nj

60

240

550

848

1537,5

1650

1950

1260

K

1jj 1113nn 5,8095nc

K

1jjj

27,71113

5,8095

1

n

nc

x

K

jjj

a

La superficie media di una azienda agricola è di 7,27 ettari

8

Page 9: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Media ponderata

• Uno studente ha sostenuto i seguenti esami del I anno del corso di laurea di EA.

• Come calcola la media dei voti?

N. Esame voto cfu

1 Economia Aziendale 27 9

2 Ist. diritto pubblico 22 6

3 Metodi di matematica applicata 25 9

4 Macroeconomia 20 6

5 Ragioneria 28 9

9

Page 10: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Media ponderata: calcoloN.

Esamevoto(xi)

cfu(pi)

voto*cfu(xi*pi)

1 27 9 243

2 22 6 132

3 25 9 225

4 20 6 120

5 28 9 252

n

1ii 39p

n

1iii 972px

92,2439972

p

pxx n

1ii

n

1iii

a

Il voto medio (su 39 cfu) è pari a 24,92

10

Page 11: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Media ponderata i due voti più bassi pesano di meno nel calcolo della media perché sono due esami da 6 cfu

Media ponderata = 24,92

18 19 20 21 22 23 24 25 26 27 28 2930

11

Page 12: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Mediana

12

• E’ un indice di posizione

•Può essere calcolata per caratteri che siano almeno ordinabili (qualitativi su scala ordinale o quantitativi)

•E’ un indice indicato per distribuzioni che presentano valori estremi (molto grandi o molto piccoli).

•E’ un particolare quantile (2° quartile, 50° percentile)

Page 13: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Mediana

• È il valore che occupa la posizione centrale nell’insieme ordinato di tutti i valori maxn21min xx...xxx

X(1) X(n)Me

Tra x(1) e Me è contenuto il 50% dei valori

Tra Me e x(n) è contenuto il restante 50% dei valori

13

Page 14: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Mediana da una distribuzione di frequenza (con le freq. rel. cum.)

Sulla colonna delle frequenze relative cumulate si individua la prima Fj che è uguale o maggiore di 0,5

Addetti(xj)

Numero punti vendita

(nj)

Frequenze cumulate

Nj

3 2 2

4 1 3

6 3 6

7 1 7

10 2 9

Il corrispondente valore xj è la mediana della distribuzione

Mediana=6

Frequenze rel cum.

Fj

0,22

0,33

0,67

0,78

1,00

14

Page 15: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Mediana di una distribuzione di frequenza con classi di valoriClassi di

superficie (in ettari)

Numero aziende

(nj)

0-1 120

1-2 160

2-3 220

3-5 212

5-10 205

10-20 110

20-40 65

Oltre 40 21

Freq. cum.

(Nj)

Freq. rel. cum.

(Fj)

120 0,108

280 0,252

500 0,449

712 0,640

917 0,824

1027 0,923

1092 0,981

1113 1,000

15

Page 16: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

16

La scelta tra media e mediana

Fonte: Walter Kramer (2009), Le bugie della statistica, Nimesis

Page 17: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Quartili

• Sono 3 indici di posizione, Q1 Q2 e Q3

maxn21min xx...xxx

X(1) X(n)Q2=Me

Tra x(1) e Q1 è contenuto il 25% dei valori (più bassi)

Tra Q3 e x(n) è contenuto il 25% dei valori (i più alti)

Q1 Q3

Tra Q1 e Q2 è contenuto il 25% dei valori

Tra Q2 e Q3 è contenuto il 25% dei valori

17

Page 18: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Primo quartile Q1

• Q1 Primo quartile: è preceduto dal 25% dei termini (e seguito dal 75%)

• Q1 è il primo valore xi in corrispondenza del quale la frequenza cumulata relativa

25,0Fj

18

Page 19: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Terzo quartile Q3

• Q3 Terzo quartile: è preceduto dal 75% dei termini (e seguito dal 25%)

• Q3 è il primo valore xi in corrispondenza del quale la frequenza cumulata relativa

75,0Fj

19

Page 20: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Calcolo dei quartiliRicavi

350

200

600

500

270

180

205

340

280

205xQ )3(1

350xQ )7(3

Il 25% dei punti vendita con i ricavi più bassi registrano ricavi che non superano 205 mila euro

Per essere nel 25% dei punti vendita con i ricavi più alti si devono superare 350 mila euro di ricavi

Ricavi (valori

ordinati)

Freq. cum. rel.

X(1)=180 1/9=0,11

X(2)=200 2/9=0,22

X(3)=205 3/9=0,33

X(4)=270 4/9=0,44

X(5)=280 5/9=0,56

X(6)=340 6/9=0,67

X(7)=350 7/9=0,78

X(8)=500 8/9=0,89

X(9)=600 9/9=1

La prima Fi ad essere maggiore o uguale a 0,25 è la terza

La prima Fi ad essere maggiore o uguale a 0,75 è la settima

20

Page 21: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Percentili

Sono quei valori che dividono la distribuzione in cento parti di uguale numerositàMediana=50-esimo percentileQ3= 75-esimo percentile

P10 = decimo percentile: lascia alla sua sinistra il 10% dei valoriP90 = novantesimo percentile: lascia alla sua destra il 10% dei valori

21

Page 22: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Moda

• È un indice di posizione• Può essere calcolata per qualsiasi tipo di

carattere• E’ la modalità più frequente• In una distribuzione di frequenza con classi

di valori: è la modalità con più alta densità di frequenza

22

Page 23: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Moda di un insieme di valoriPunti

venditaGenere

respons.

1 maschio

2 maschio

3 femmina

4 femmina

5 maschio

6 maschio

7 maschio

8 femmina

9 femmina

La modalità del carattere “Genere del responsabile” che si ripete più volte (5 volte ) è “maschio”

La maggioranza dei punti vendita ha come responsabile un uomo

Moda=“maschio”

23

Page 24: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Moda di una distribuzione di frequenza

Addetti(valori distinti)

Numero punti vendita(frequenze)

3 2

4 1

6 3

7 1

10 2

La frequenza maggiore è 3

La modalità del carattere “Numero di addetti” cui è associata la frequenza maggiore è 6

La maggioranza dei punti vendita ha un numero di addetti pari a 6

Moda=6

24

Page 25: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Moda di una distribuzione di frequenza con classi di valori

La classe modale è 2-3

Classi di superficie (in ettari)

Numero aziende

(nj)

0-1 120

1-2 160

2-3 220

3-5 212

5-10 205

10-20 110

20-40 65

40-80 21

Ampiezza classe

(aj)

Densità di freq (dj)

1 120

1 160

1 220

2 106

5 41

10 11

20 3,25

40 0,525

In presenza di classi di ampiezza diversa, la classe modale è quella che ha la densità di frequenza maggiore

25

Page 26: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Moda

• Può non esistere• Può non essere unica• Può essere una modalità “poco

rappresentativa” del fenomeno

26

Page 27: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

27

La scelta tra media, moda e

mediana

Fonte: Magnello e Van Loon (2011), La statistica a fumetti, Raffaello Cortina Editore

Page 28: 1 Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a. 2014-2015.

Calcolo dei valori medi in base al tipo di carattere

Caratteri

Quantitativi Qualitativi ordinati

Qualitativi sconnessi

Media

Mediana

Moda

28