Valori Medi

38
Valori Medi

description

Valori Medi. LE MEDIE La media aritmetica La media geometrica La mediana La moda I percentili. Introduzione. Medie di posizione. non richiedono operazioni algebriche sulle modalità - Moda- Mediana- Quantili. calcolate con operazioni - PowerPoint PPT Presentation

Transcript of Valori Medi

Page 1: Valori Medi

Valori Medi

Page 2: Valori Medi

2/3

LE MEDIE

La media aritmetica

La media geometrica

La mediana

La moda

I percentili

Page 3: Valori Medi

3/3

Introduzione

Medie di posizione

non richiedono operazioni

algebriche sulle modalità- Moda- Mediana-

Quantili

Medie analitiche

calcolate con operazioni

algebriche sulle modalità, richiedono dei caratteri quantitativi

Media aritmetica- Media armonica - Media geometrica - Media quadratica

Page 4: Valori Medi

MkMMMxxx k *......21

La media aritmetica è quel valore che sostituito alle singole osservazioni ne lascia inalterata la SOMMA

k

x

M

k

ii

1

Page 5: Valori Medi

5/3 La Media Aritmetica

tempo impiegato (min.) tempo impiegato (min.)

giorno auto metro giorno auto metro

1 23 22 7 28 24

2 32 24 8 33 28

3 44 22 9 45 32

4 21 33 10 34 31

5 36 26 11 29 37

6 30 31 12 31 24

)auto(xa

Tempo impiegato per raggiungere il posto di lavoro

(23+32+44+21+36+30+28+33+45+34+29+31)/12 = =386/12 = 32,17

(22+24+22+33+26+31+24+28+32+31+37+24)/12 = 334/12 = 27,83 )metro(xa

Page 6: Valori Medi

6/3

Media aritmetica

n

iina x

nx...xx

n 121

11x

Se il carattere X è quantitativo discreto e conosciamo la sua distribuzione di frequenza:

K

jjja nx

n 1

1x

K

jjja fx

1x

La media aritmetica di un insieme di n valori x1, x2, … xn di un carattere

quantitativo X è data da:

Page 7: Valori Medi

Esempio

Esempio 1. In un campione di 30 studenti si rileva il voto di maturità. Si riporta la distribuzione di frequenze assolute:

x i ni xi*ni

62 2 12466 2 13270 3 21073 3 21975 4 30076 4 30479 1 7981 2 16283 3 24986 2 17292 1 9294 3 282

Totale 30 2325Media aritmetica 77.5

x i ni fi fi% xi*fi xi*fi%62 2 0.067 6.7 4.13 413.333366 2 0.067 6.7 4.40 44070 3 0.100 10.0 7.00 70073 3 0.100 10.0 7.30 73075 4 0.133 13.3 10.00 100076 4 0.133 13.3 10.13 1013.33379 1 0.033 3.3 2.63 263.333381 2 0.067 6.7 5.40 54083 3 0.100 10.0 8.30 83086 2 0.067 6.7 5.73 573.333392 1 0.033 3.3 3.07 306.666794 3 0.100 10.0 9.40 940

Totale 30 1.000 100.0 77.50 7750.00

5.7730:2325

*

1

1

k

ii

k

iii

n

nx

M 5.77*1

k

iii fxM

5.77100

7750

100

%*1

k

iii fx

M

Page 8: Valori Medi

8/3

Valore centrale della classeNel caso di una distribuzione di frequenze per un carattere X suddiviso in classi, possiamo approssimare la media utilizzando il valore centrale della classe cj

K

jjjna

1x nc

1

Page 9: Valori Medi

9/3

Prezzi di farmaci e quantità acquistate da unospedale

v.c. Prezzo a confezione

(€)

Numero Confezioni(migliaia)

Ammontare carattere

(costo) ml. (€)

25 20 – 30 11 25*11= 275.0

32.5 30 – 35 5 32.5*5= 162.5

37.5 35 – 40 15 37.5*15= 562.5

45 40 – 50 9 45*9 = 405.0

Totale 40 1405

= 1405/40 = 35.72 € (a confezione) (approssimato)

Esempio

ax

Page 10: Valori Medi

10/3

Media aritmetica ponderata

k

jj

k

jjj

k

kka

p

px

ppppxpxpx

1

1

21

2211x

La media aritmetica ponderata di un insieme di n valori osservati di un carattere

quantitativo X con pesi non negativi, è data da:

Page 11: Valori Medi

11/3

Considerazioni

La Media aritmetica dipende da tutti i valori osservati e quindi risente dei valori estremi (valori anomali);

La Media aritmetica sintetizza la distribuzione di un carattere con un solo valore;

Page 12: Valori Medi

Proprietà della media aritmetica

1) La somma dei valori osservati è uguale al valore medio moltiplicato per il numero di unità ;

2) La somma delle differenze tra i valori e la loro media aritmetica, è pari a zero;

3) La somma degli scarti al quadrato dei valori da una costante c è minima quando c è uguale alla media aritmetica;

4) Se un collettivo viene suddiviso in L sottoinsiemi disgiunti, allora la media aritmetica generale si può ottenere come media ponderata delle medie dei sottoinsiemi con pesi uguali alle loro numerosità.

xnx i

k

ii

1

k

ii xx

1

0

k

iii nxx

1

0

k

ii

k

ii cxxx

1

2

1

2

Page 13: Valori Medi

Proprietà della media aritmetica

5) E’ associativa x1+ (x2+x3)=(x1+x2).+x3

7) È invariante per traslazioni, cioè per cambiamenti dell’origine:

x1, x2….xk M=

x1+b, x2+b,….xk+b M= + b

8) È invariante per cambiamenti dell’unità di misura:

x1, x2….xk M=

x1b, x2b,….xkb M= b

9) la media è sempe un valore compreso tra il valore minimo e massimo della distribuzione;

Page 14: Valori Medi

nggggn XXXXxxx *...***...** 21

La media geometrica è quel valore che sostituito alle singole osservazioni ne lascia inalterato il PRODOTTO

Page 15: Valori Medi

15/3

La media geometrica calcolo sulla distribuzione unitaria

nng xxxx 21

K

K

fK

ffg

oppure

n nK

nng

.... xxxx

... xxxx

21

21

21

21

calcolo sulla distribuzione di frequenze

Page 16: Valori Medi

16/3

Proprietà della media geometrica

1)

2)

ngn x x xx 21

n

iig )(xlog

nxlog

1

1

Un modo semplice per calcolare la mediageometrica si ottiene dalla proprietà 2)

Page 17: Valori Medi

Valori medi

La media geometrica può essere anche calcolata anche ricorrendo ai logaritmi, essendo equivalente alla quantità:

PROPRIETA’

a) La media geometrica è non superiore alla media aritmetica (Mg≤M)

b) E’ non esterna all’intervallo (x1, xk), ossia compresa tra il valore

minimo e massimo della distribuzione

c) Non è invariante per le traslazioni

d) E’ invariante per cambiamenti dell’unità di misura:

x1, x2….xk Mg=

x1b, x2b,….xkb Mg= b con b>0

N

xnxnxnM kk

g

log...logloglog 2211

Page 18: Valori Medi

Esempio: i numeri Indice A base fissa: consentono di confrontare tutte le osservazioni di una serie storica ( o

geografica) con un’unica osservazione di riferimento

1000

x

xI t

La variazione relativa= I-1

Per calcolare la variazione media nel periodo 2000-2008 occorre calcolare la Mg degli 8 indici a base fissa

R.O. Indice Variazione %2000 123 1 -2001 143 1.162601626 16.262002 143 1.162601626 16.262003 134 1.089430894 8.942004 115 0.93495935 -6.502005 162 1.317073171 31.712006 140 1.138211382 13.822007 132 1.073170732 7.322008 139 1.130081301 13.01

Media geometrica1.121523041Varizione media 12.2

Page 19: Valori Medi

Esempio: i numeri Indice A base mobile: consentono di confrontare ciascuna osservazione di una serie storica ( o

geografica) con la precedente, assunta come osservazione di riferimento

1001

t

t

x

xI

La variazione relativa= I-1

Per calcolare la variazione annuale media nel periodo 2000-2008 occorre calcolare la Mg degli 8 indici a base mobile

R.O. Indice Variazione %2000 123 - -2001 143 1.1626 0.1626016262002 143 1 02003 134 0.9371 -0.062937062004 115 0.8582 -0.141791042005 162 1.4087 0.4086956522006 140 0.8642 -0.135802472007 132 0.9429 -0.057142862008 139 1.053 0.053030303

media geometrica 1.015403629 1.13

Page 20: Valori Medi

20/3

E’ la modalità presentata dall’unità centrale del collettivo. Essa divide il collettivo in due

sottoinsiemi di uguale numerosità: uno con modalità di ordine più basso e l’altro con

modalità di ordine più alto.

Il calcolo della mediana è possibile solo per caratteri quantitativi o qualitativi ordinabili.

La Mediana

Page 21: Valori Medi

Esempio

Esempio 2. Distribuzione secondo la spesa delle Unità sanitarie. Calcolare la spesa media

Classe di spesa (in migliaia di euro)

(valore centrale classe) xi

N. Unità sanitarie ni

xi *ni

0-3 1,5 7.976 11.964

3-6 4,5 8.763 39.433,5

6-9 7,5 4.130 30.975

9-15 12 1.176 14.112

15-25 20 297 5.940

25-50 37,5 105 3.937,5

50-100 75 18 1.350

Oltre 100 125 3 325

Totale 22.468 108.087

M = 108.087 : 22.468 = 4,81 mila reddito medio

Si ipotizza che tutte le unità di

ogni classe siano equidistribuite al’interno della

classe

Tuttavia si perde

informazione

Page 22: Valori Medi

Esempio

Esempio 2 bis. Distribuzione secondo il reddito dei dichiaranti dei redditi percepiti. Calcolare il reddito medio

Classe di spesa (in migliaia di euro)

N. Unità ni Ammontare spesa Xi

(in migliaia di euro)

Reddito medio

0-3 7.976 12.792 1,60

3-6 8.763 40.650 4,64

6-9 4.130 29.320 7,10

9-15 1.176 12.932 11,0

15-25 297 5.580 18,79

25-50 105 3.405 32,43

50-100 18 1.172 65,11

Oltre 100 3 532 177,33

Totale 22.468 106.383

iii nXx

Non è necessaria nessuna ipotesi,

perché si conosce

l’ammontare totale della

classe

Il valore del reddito medio è

più preciso

M= 106.383 : 22.468 = 4,73 mila diverso dal reddito medio calcolato nell’es. 2

Page 23: Valori Medi

Carattere - Voto

Frequenza assoluta

Frequenza cumulata

Frequenza relativa

Frequenza relativa cumulata

62 2 2 0.067 0.06766 2 4 0.067 0.13370 3 7 0.100 0.23373 3 10 0.100 0.33375 4 14 0.133 0.46776 4 18 0.133 0.60079 1 19 0.033 0.63381 2 21 0.067 0.70083 3 24 0.100 0.80086 2 26 0.067 0.86792 1 27 0.033 0.90094 3 30 0.100 1.000

Totale 30 1.000Mediana = 76

Esempio

Page 24: Valori Medi

Mediana

Distribuzione per classi di valori del carattere osservato (classi della stessa ampiezza). Si può individuare la classe mediana oppure ipotizzando la distribuzione uniforme all’interno dell’intervallo si calcola il valore puntuale della mediana.

Quindi:

Dove x(r) e x(r+1) sono gli estremi inferiore e superiore della classe

mediana ed nr la frequenza assoluta della classe mediana. Se N è pari,

si deve sostituire a (N+1)/2 una volta N/2 e una volta (N/2+1) e poi fare la semisomma dei due valori mediani.

L’ultimo termine della formula rappresenta la frequenza cumulata della classe che precede la classe mediana.

1

1

)1()( 2

1 r

ii

r

rrr n

N

n

xxxMe

Distribuzione per classi di valori

Page 25: Valori Medi

Voto x i ni fi Fi

60-|70 7 0.233 0.23370-|80 12 0.400 0.63380-|90 7 0.233 0.86790-|100 4 0.133 1.000

30 1.000

Distribuzione per classi di valori

70 Me 80

.50.23 .63

)23.50(.:23.63.70:7080 Me

23.05.04.0

708070

Me

Equivale alla formula:Con la proporzione:

Page 26: Valori Medi

Moda

La moda di un collettivo è quella modalità del carattere alla quale è associata la massima frequenza.

Se la distribuzione è per classi di valori del carattere osservato

(tutte della stessa ampiezza) la classe modaleclasse modale è quella con la

maggiore frequenza. Se le classi hanno diversa ampiezza, si divide

la frequenza per l’ampiezza della classe e si sceglie il valore

massimo dei quozienti ottenuti, detti densità di frequenza

Se la distribuzione presenta una sola moda, è detta unimodale.

Se vi sono due mode è detta bimodale, se ve sono tre è trimodale,…

La moda può essere individuata anche graficamente.

Ad es.: in un grafico a colonne o a nastri, la colonna più alta o il nastro più lungo individua la moda della distribuzione.

Page 27: Valori Medi

27/3

La moda fornisce informazioni solo su una modalità del carattere;

La moda dipende solo dalle frequenze;

La moda acquista validità solo se vi è una netta prevalenza di una modalità/intensità;

La moda si calcola su tutti i tipi di caratteri;

Considerazioni sulla moda

Page 28: Valori Medi

28/3

Tipologia di farmaco Numero reparti Frequenze %

Antidolorifico 100 25

Antibiotico 200 50

Antiblastico 80 20

Altro 20 5

Totale 400 100

Consumi ml.(€)

N. reparti

10 20

12 80

31 90

40 140

52 70

Totale 400

Consumi ml.(€)

N. reparti Ampiezza classe

Densità frequenza

5 – 25 100 20 100/20 = 5

25 – 35 90 10 90/10 = 9

35 – 60 210 25 210/25 = 8.4

Totale 400

La moda La moda è la è la

modalità modalità prevalente prevalente

del del caratterecarattere

La moda

Page 29: Valori Medi

Distribuzione uni-modale

0

5

10

15

20

25

Page 30: Valori Medi

Distribuzione bi-modale

0

5

10

15

20

25

30

Page 31: Valori Medi

Classi) Frequenze Densità di frequenza

<3 3138 1046

3-6 4084 1361

6-10 5740 1435

10-20 10269 1027

20-30 6302 630

30 e oltre 3237 324

Si sceglierà il valore max tra le

densità di frequenza.

La classe modale è 6-10 anni

ES. Distribuzione per classi

Calcolo della moda

Page 32: Valori Medi

Quantili

Quantili

Un quantile-p, dove p[0,1] è quel valore che divide una distribuzione statistica in p parti uguali, ognuna delle quali contiene la p-esima parte della numerosità della distribuzione totale

E’ un numero più grande del 100 x p % dei valori osservati e più piccolo del restante 100 (1-p) %.

Es. Un quantile di 0,1 deve essere un valore che lascia a sinistra il 10% delle osservazioni e a destra il rimanente 90%

Page 33: Valori Medi

Quantili

Se p= 4 Quartili: dividono la distribuzione in quattro parti uguali

Se p=10 Decili: dividono la distribuzione in dieci parti uguali Se p=100 Percentili: dividono la distribuzione in cento parti

uguali

In generale si definisce -percentile quel valore a destra del quale cade (1- )% dei casi e a sinistra l’ % dei casi.

(p=0,01, 0,02…..0,99) La mediana si può considerare il 2° quartile e il 50° percentile.

Quartili

Le quattro distribuzioni individuate dai quartili contengono ognuna il 25% della numerosità totale.

Così il 1° quartile contiene il 25% e la distribuzione rimanente è il 75% del totale

Page 34: Valori Medi

Capacità di informazione delle medie

Tutte le medie sono capaci di fornire la stessa quantità di informazione sulla distribuzione o la capacità informativa è diversa da una media all’altra?

Scala di misura del Carattere

Misura di tendenza

Capacità di informazione

Robustezza

Nominale Moda

Ordinale Mediana

Intervallo/

Rapporti

Media

Page 35: Valori Medi

Studente M MeX 18 18 18 18 18 18 18 18 18 18 30 30 30 30 30 30 30 30 23.65 18Y 18 18 18 18 18 18 18 18 18 30 30 30 30 30 30 30 30 30 24.35 30Z 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30W 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18

Cautela nell’utilizzo della mediana

La mediana non va bene quando la differenza tra due popolazioni è rilevante proprio nel centro della distribuzione ordinata delle modalità

Page 36: Valori Medi

Il box plot

mediana

1° quartile

3° quartile

Q3+1.5IR

Q1-1.5IR

Page 37: Valori Medi

è un grafico caratterizzato da tre elementi principali:1. Una linea o un punto, che indicano la posizione del centro della distribuzione (mediana);2. Un rettangolo (box) la cui altezza indica la variabilità dei valori “prossimi” alla media (IR= terzo quartile-primo quartile);3. Due segmenti (baffi) che partono dai lati minori del rettangolo e che terminano in corrispondenza del più piccolo e del più grande valore non outlier.4. Dei punti, detti outliers, che giacciono 1,5*IR al di sotto del primo quartile e 1,5*IR al di sopra del terzo quartile

Il box plot

Page 38: Valori Medi

Rapporti statistici

1. di composizione: esprimono il rapporto tra la quantità relativa ad una modalità e l’ammontare complessivo. Si applica alle distribuzioni di quantità

2. di coesistenza: esprime il rapporto tra la frequenza (quantità) relativa ad una modalità e la frequenza (quantità) relativa ad una altra modalità. Esempio: rapporto di mascolinità Pm/Pf*100; indice di vecchiaia P>=65/P<=14*100

3. di derivazione o tasso: numero di casi di un evento che si verifica in un determinato periodo di tempo rapportato alla popolazione totale di quel periodo. Esempi: tasso di mortalità M/P*1000; quoziente di natalità N/P*1000; tasso di abortività ab/P*1000; tasso di mortalità infantile M0-365/NV*1000