1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la...

42
1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002 Prof. Biasco

Transcript of 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la...

Page 1: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

1

Elementi di Statistica descrittiva

Lez. 2 - Misure di tendenza centrale

- le Medie

- la Moda

- la Mediana____________________

Anno scolastico 2001/2002

Prof. Biasco

Page 2: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

2

Valori MEDI (o indici di posizione)

Nello studio dei fenomeni collettivi è importante calcolare dei valori sintetici che siano rappresentativi dell’insieme dei dati, che diano una visione d’insiemevisione d’insieme del fenomeno.

Tali valori si dicono MEDIE

Si possono definire diversi tipi di medie, tra le più comuni si hanno: la media aritmetica, la mediana, la moda, la media geometrica, la media armonica, la media quadratica.

Page 3: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

3

Esempio Si vogliono confrontare le stature di 3 gruppi:

• Un gruppo di bambini• Un gruppo di giocatori di pallacanestro• Un gruppo di clienti di un supermercato

Page 4: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

4

Poligono di frequenza - Statura Bambini

5

810

15

30

20

10

20

5

10

15

20

25

30

35

146-

148

148-

150

150-

152

152-

154

154-

156

156-

158

158-

160

160-

162

freq

uenz

ePoligono di frequenza dei giocatori

5

12

2527

11 10

7

3

0

5

10

15

20

25

30

freq

uenz

e

Clienti di un supermercato

2

4

7

10

12

14 1413

10

8

5

10

2

4

6

8

10

12

14

16

158-

160

160-

162

162-

164

164-

166

166-

168

168-

170

170-

172

172-

174

174-

176

176-

178

178-

180

180-

182

freq

uenz

e

Poligoni di frequenza dei tre Poligoni di frequenza dei tre gruppigruppi

Page 5: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

5

Elementi per cui le tre distribuzioni Elementi per cui le tre distribuzioni differisconodifferiscono

• Valore attorno al quale si distribuiscono i datiValore attorno al quale si distribuiscono i dati

• Diversa distribuzione dei dati attorno al centroDiversa distribuzione dei dati attorno al centro

• Presenza più o meno accentuata di code a destra Presenza più o meno accentuata di code a destra

o sinistrao sinistra

• Distribuzione più o meno appuntita.Distribuzione più o meno appuntita.

Page 6: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

6

Confronto delle tre distribuzioniConfronto delle tre distribuzioni

Confronto tre distribuzioni

0

5

10

15

20

25

30

35

bambini

clienti supermercato

giocatori basket

Page 7: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

7

Le misure che permettono di valutare Le misure che permettono di valutare sinteticamente tali caratteristiche sono:sinteticamente tali caratteristiche sono:

• Misure di tendenza centrale: MEDIEMisure di tendenza centrale: MEDIE

• Misure di variabilità o dispersioneMisure di variabilità o dispersione

• Misure di forma (asimmetria, curtosi)Misure di forma (asimmetria, curtosi)

• Misure di concentrazione.Misure di concentrazione.

Page 8: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

8

Le misure di tendenza centrale possono essere distinte in due gruppi:

Media aritmeticaMedia geometricaMedia armonicaMedia quadratica

2° gruppoMedie lasche o di posizione

Moda

Mediana

1° gruppoMedie ferme o analitiche

Page 9: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

9

Quali di queste è la Media “più giusta”?

Non esiste la “media migliore”, ma la media da utilizzare deve essere scelta in relazione al problema che si sta risolvendo.

La media più adatta, “più giusta”, va scelta a seconda dei DATI e degli SCOPI dell’elaborazione statistica.

Page 10: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

10

La Media aritmetica(semplicemente Media)

La Media geometrica

La Media Armonica

La Media quadratica

La Moda

La Mediana

Noi vedremo le seguenti medie:

Page 11: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

11

Partiamo da un esempio:

Esempio 1

Una società di ricerca statistica deve determinare la ricchezza degli abitanti di alcuni paesi al fine di decidere dove aprire alcuni punti vendita per una ditta operante nel settore commerciale.

I dati raccolti sono riportati nella seguente tabella

Page 12: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

12

.

reddito in milioni freq. 1° paese freq. 2° paese

0 11 45 8 16

10 13 3415 24 4620 16 2430 32 1240 12 1050 4 4

totali 120 150

Esempio 1 - Tabella dei redditi rilevati

Page 13: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

13

Diagramma delle frequenze

0

10

20

30

40

50

0 10 20 30 40 50 60

reddito (milioni)

freq

uenz

e

1° paese

2° paese

Esempio 1 - Diagramma delle frequenze dei redditi

Page 14: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

14

Vogliamo calcolare dei valori numerici che siano indicativi del grado di ricchezza/povertà della popolazione del paese considerato.

Gli indici più utili potrebbero essere:

– il reddito medio

– il reddito più diffuso

– il reddito rispetto al quale la popolazione risulta divisa in due parti uguali.

Page 15: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

15

La Media Aritmetica

La media aritmetica rappresenta il reddito che ogni abitante avrebbe se il reddito totale del paese venisse equamente suddiviso tra tutti gli abitanti

cioè nel caso in cui

1- ciascun abitante versa al sindaco tutto il suo reddito (reddito totale non cambia),

2- Il sindaco divide in parti uguali il reddito totale della città e lo ridistribuisce ai singoli cittadini.

Page 16: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

16

Vediamo come calcolarlo.

Se x1, x2, … xn sono i redditi degli n abitanti

il Reddito medio (la MEDIA dei redditi) viene calcolata nel modo seguente:

1. Calcoliamo il reddito totale della popolazione:

n

i 1in21 xx...x x totaleReddito

Page 17: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

17

2. Dividiamolo per il numero degli abitanti

nn

x...xx

n

in

1

i21

x

abitanti num.

totaleReddito capite pro Reddito

nn

x...xx

n

in

1

i21

xredditi dei Media medio Reddito

Quindi la media dei redditi è:

Page 18: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

18

Tornando all’esempio 1

Reddito relativo al 1° paese.

milioni... 2490450131085110 totaleReddito

milmil

75,20120

2490 redditi dei Media

Page 19: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

19

In generale,

se x1, x2, … xn sono n dati numerici,

la loro Media aritmetica (media aritmetica semplice) si ottiene sommando tutti i dati numerici e dividendo la somma per il numero dei dati:

i1 2 1

xMedia

n

n ix x ... xM x

n n

Page 20: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

20

Dalla formula precedente avremo:

Nxxxx N ...21

Page 21: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

21

In particolare se gli n dati numerici sono tali che:

il dato x1 compare f1 volte, x2 f2 volte,…. xk fk volte,

la Media Aritmetica (Media aritmetica ponderata) è data da:

n

f

f...ff

fx...fxfx

k

ii

k

kk

1i

21

2211

xM

Page 22: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

22

Proprietà della media aritmetica

1. La media aritmetica è sempre compresa tra il valore minimo e il valore massimo

x min media xmax

2. La somma degli scarti dalla media è sempre zero

posto xi = xi – media = xi – M (scarto dalla media)

si ha che:

0xmedia dalla scarti Somma1

i

n

i

Page 23: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

23

3. La somma dei quadrati degli scarti dalla media è

minore della somma dei quadrati degli scarti da qualsiasi altro valore numerico

Cioè se M è la media e A un qualsiasi altro numero allora

n

i

n

i

AM1

2i

1

2i xx

minimo valoreha x scarti Somma1

2i

2

n

i

M

Page 24: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

24

La Media Geometrica

Def. Siano x1, x2, … xn gli n valori, tutti >0, assunti da una variabile numerica

La media geometrica G di questi valori è:

Vediamo qualche esempio:

1- Se x1 e x2 sono i due lati di un rettangolo, la media geometrica rappresenta il lato del quadrato equivalente al rettangolo.

nnxxxG .........21

Page 25: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

25

x1

x2

G

G

G · G = x1 · x2

1- Se x1 e x2 sono i due lati di un rettangolo,

la media geometrica rappresenta il lato del quadrato

equivalente al rettangolo.

221 xxG

Page 26: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

26

G · G · G = x1 · x2 · x3

Esempio 2

Se x1, x2. x3 sono i tre lati di un parallelepipedo rettangolo allora G è il lato di un cubo avente lo stesso volume.

3321 xxxG

Page 27: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

27

• se gli n dati numerici positivi sono tali che: il dato x1 compare f1 volte, x2 f2 volte,…. xk fk volte,

la Media Geometrica è data da:

N fkk

ff xxxG ..........22

11

Page 28: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

28

Esempio 3

Un capitale iniziale di 5.000 euro viene investito ad interesse composto. Sapendo che il tasso d’interesse il primo anno è del 2%, del 4% il secondo anno e del 6% il terzo anno, calcolare il tasso medio relativo ai tre anni.

C0 = 5000 capitale iniziale:

C1 = C0 + C0 *r1 = C0(1 + r1) = 5000(1 + r1) capitale alla fine del 1°anno

C2 = C1 + C1*r2 = C1(1 + r2) = C0(1 + r1)(1 + r2) capitale alla fine del 2° anno

C3 = C2 + C2*r3 = C2(1 + r3) = C0(1 + r1)(1 + r2) (1 + r3)

capitale alla fine del 3° anno

Page 29: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

29

se indichiamo con r il tasso medio annuo costante deve risultare:

Per cui da C3 = C0(1 + r1)(1 + r2) (1 + r3)= C0(1 + r)3

C3 = C0(1 + r)3

quindi (1 + r)3 = 5622,24/5000 da cui

1 + r = 31,124 r 3,9 %

diversa dalla media aritmetica dei tassi = 4%

avremo che (1+r) è la media geometrica

(1 + r) = 3(1 + r1)(1 + r2) (1 + r3)

Page 30: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

30

Esempio 4

Il numero di microrganismi di una certa coltura è aumentato da 2000 a 9000 in 3 giorni. Calcolare l’incremento medio giornaliero.

n0 = 2000 numero iniziale batteri:

n1 = n0 + n0 *r = n0(1 + r) = 2000(1 + r) batteri alla fine del 1°giorno

n2 = n1 + n1*r = n1(1 + r) = n0(1 + r)2= 2000(1 + r)2 batteri alla fine del 2° giorno

n3 = n2 + n2*r = n2(1 + r) = n0(1 + r)3 = 2000(1 + r)3

batteri alla fine del 3° giorno

Page 31: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

31

Esempio 4

E poiché alla fine del 3° giorno ci sono 9000 batteri

2000(1 + r)3 = 9000

(1 + r)3 = 9000/2000

1 + r = 34,5 r = 65,1 %

Page 32: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

32

La Media Armonica

Def. Siano x1, x2, … xn gli n valori, tutti >0, assunti da una variabile numerica

La media armonica H di questi valori è:

iNx

N

Nxxx

H111

...11

1

21

Page 33: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

33

La Media Quadratica

Def. Siano x1, x2, … xn gli n valori assunti da una variabile numerica

La media quadratica Q di questi valori è:

N

xxxQ N

222

21 ...

Page 34: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

34

La Moda (o valore modale)

La moda è uguale al dato che, nella distribuzione, compare con frequenza più elevata, cioè è il dato più rilevante, il dato più diffuso.

Nel caso dell’ Esempio 1 - 2° paese

Moda= = 15 milioni

infatti 15 milioni è il reddito più diffuso

Cioè il gruppo di abitanti con un reddito di 15 mil. è il più numeroso.

x)

Page 35: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

35

Diagramma a colonne

4

16

34

46

24

12 104

05

101520253035404550

0 5 10 15 20 30 40 50

reddito (milioni)

freq

uenz

e

Moda = 15 mil.

L’ortogramma dei redditi del secondo paese mostra chiaramente

un valore modale

Page 36: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

36

Osservazioni

La MODA è un valore medio interessante

Se la moda è un reddito basso allora c’è un gruppo consistente di cittadini poveri

Se la moda è un valore alto c’è un gruppo consistente di cittadini ricchi.

Se il reddito è legato al tipo di attività potrebbe indicare che in quel paese una certa attività è la più diffusa, o indicare il ceto sociale prevalente.

Page 37: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

37

Esempio:

Se in 100 lanci di un dado otteniamo come valore modale “significativo” il numero 5 allora con molta probabilità il dado è truccato.

Page 38: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

38

La MedianaLa Mediana è una media di posizione, è uguale al valore che si trova al centro di una distribuzione ordinata in modo crescente (o decrescente)

La Mediana divide i dati in due parti tali che : • il numero di osservazioni della Mediana

è uguale al• numero di osservazioni della Mediana

ˆx x%

x~

Page 39: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

39

.

voti conseguiti freq. 1° prova freq. 2° prova

2 1 03 1 54 2 35 4 26 3 57 2 38 2 49 0 4

totali 15 26

Esempio 1 - Tabella dei voti

Page 40: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

40

Esempio:

2 3 4 4 5 5 5 5 6 6 6 8 8 9 9

Mediana

2 3 4 4 5 5 5 5 6 6 6 8 8 9 9 9

Madiana = 5 + 6 = 5,5 2

Page 41: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

41

Io sono il valore

MEDIANO

Page 42: 1 Elementi di Statistica descrittiva Lez. 2 - Misure di tendenza centrale - le Medie - la Moda - la Mediana ____________________ Anno scolastico 2001/2002.

42

Fine lezione