Gli indici di posizione

17
Gli indici di posizione Quando si considerano dati quantitativi, non è sufficiente presentare adeguatamente i dati e trarre indicazioni su questi a partire dall’osservazione di tali rappresentazioni. Una buona analisi dei dati richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano adeguatamente analizzate e interpretate. Gli indici di posizione sintetizzano la posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità del fenomeno e tale da riassumere gli aspetti ritenuti più importanti. Di seguito si esaminano le misure di posizione: MEDIA MODA MEDIANA 1 Cos’è la Statistica - G. Garau, L. Schirru

Transcript of Gli indici di posizione

Gli indici di posizione

Quando si considerano dati quantitativi, non è sufficiente presentareadeguatamente i dati e trarre indicazioni su questi a partire dall’osservazionedi tali rappresentazioni.

Una buona analisi dei dati richiede anche che le caratteristiche principali delleosservazioni siano sintetizzate con opportune misure e che tali misure sianoadeguatamente analizzate e interpretate.

Gli indici di posizione sintetizzano la posizione di una distribuzione difrequenza mediante un valore reale rappresentativo della globalità delfenomeno e tale da riassumere gli aspetti ritenuti più importanti.

Di seguito si esaminano le misure di posizione:– MEDIA

– MODA

– MEDIANA

1Cos’è la Statistica - G. Garau, L. Schirru

La media

Nella media aritmetica la relazione è la somma:

Nella media geometrica è il prodotto:

Nella media armonica la proprietà che rimane inalterata è la somma dei reciproci.

Si dice che M è la media di n dati (xi, … xn,), se il risultato della funzione che delinea il tipo di

media, assume lo stesso valore quando al posto di xi, … xn, si pone M. La media è quella

quantità che, sostituita a ciascuna modalità del carattere, lascia inalterata una proprietà.

2Cos’è la Statistica - G. Garau, L. Schirru

La media aritmetica

La media aritmetica si calcola facendo lasomma delle modalità e dividendo il totaleper in numero di modalità.

Se però le modalità si ripetono più volte si utilizza la media aritmeticaponderata, che ci calcola moltiplicando le modalità per le rispettivefrequenze e dividendo il valore ottenuto per il totale delle frequenze.

n

nxM

ii

n

xMMnx

in

i

i

cui da ;1

ii fxM

Utilizzando le frequenze assolute

Utilizzando le frequenze relative

n

1i

e iii ff

n

nperché la somma delle frequenze relative è uguale ad 1.

3Cos’è la Statistica - G. Garau, L. Schirru

EsempioLa tabella seguente riporta i tempi (in minuti) registrati da 20 operai per la riparazione di una componente meccanica.

Calcolare la media aritmetica:

xi ni

2 3

3 3

4 5

5 4

6 3

8 2

tot 20

Se si usano le frequenze assolute:

Se si usano le frequenze relative … occorre prima calcolarle:xi ni fi

2 3 0.15

3 3 0.15

4 5 0.25

5 4 0.2

6 3 0.15

8 2 0.1

N=20 1

N

nf ii

45,420

89

)234543(

)28()36()45()54()33()32(

i

ii

n

nxM

45,48,09,01145,03,0

)10,08()15,06()20,05()25,04()15,03()15,02(

ii fxM

4Cos’è la Statistica - G. Garau, L. Schirru

Media per valori raggruppati in classi.

(xi + xi+1] ni

[0 – 2] 40

(2 – 3] 80

(3 – 5] 60

(5 – 7] 20

La distribuzione presenta il tempo di attesa in minuti presso

la fermata Y della metropolitana per un operaio, in 200

giornate lavorative.

Calcolare il tempo medio di attesa.

In questo caso, in cui la distribuzione di frequenze ha le modalità ripartite in classi, la prima operazione da

fare è calcolare il valore centrale (o valore medio) delle singole classi.

(xi + xi+1] ni xc

[0 – 2] 40 1

(2 – 3] 80 2,5

(3 – 5] 60 4

(5 – 7] 20 6

Una volta calcolati i valori centrali (indicati con xc) si procede al calcolo della

media aritmetica ponderata, così come presentato nella precedente slide.

3200

600

)20608040(

)206()604()805,2()401(

i

ii

n

nxM

5Cos’è la Statistica - G. Garau, L. Schirru

La media geometrica

n

n

i

in

ng xxxM

1

1 ...

La media geometrica si utilizza quando si vuole calcolare la media di processi di tipo moltiplicativo (es.: inflazione, remunerazione del capitale, crescita di popolazioni) su vari periodi di tempo.

n

n

i

n

in n

n

n

g xxxM n

1

1 ...1ponderata

n

i

f

i

f

n

f

gin xxxM

1

11 ...1

ponderata

Se le modalità si ripetono più volte si utilizza la media geometrica ponderata

Utilizzando le frequenze assolute

Utilizzando le frequenze relative

6Cos’è la Statistica - G. Garau, L. Schirru

Esempio

La tabella riporta il tasso di incremento del prodotto interno lordo

(PIL) in una nazione negli anni dal 95 al 2002.

Determinare il tasso di incremento medio.

anni tasso

1995 2%

1996 3%

1997 1%

1998 2%

1999 4%

2000 5%

2001 6%

2002 4%

%95,2576046542132... 88

1

1

n

n

i

in

ng xxxM

Utilizzando la formula della media geometrica semplice si ottiene

95,25760654321...ponderata 88 22

1

11

n

n

i

ni

n nn

ng xxxM n

Utilizzando la formula della media geometrica ponderata si ottiene

Il risultato non cambia. Il tasso di incremento medio è uguale al 2,95%

7Cos'è la Statistica - G. Garau, L. Schirru

La media armonica

La media armonica si utilizza quando le grandezze sono inversamenteproporzionali, ad es. si può calcolare la velocità media di un tragitto,conoscendo le velocità medie tenute nei vari intervalli spaziali che costituisconoil tragitto.

i

a

x

nM

1

i

ia

x

n

nM ponderata

8Cos'è la Statistica - G. Garau, L. Schirru

Esempio

Una persona spende per il riscaldamento di tre anni consecutivi sempre la stessa cifra:2000 euro all’anno, acquistando il combustibile a Euro 0.55 il primo anno, Euro 0.61 ilsecondo, Euro 0.68 il terzo. Determinare il costo medio di un litro di combustibile perl’intero periodo.

Sono stati acquistati:

•il primo anno n = 2000/0.55 = 3636 litri;•il secondo anno n = 2000/0.61 = 3279 litri;•il terzo anno n = 2000/0.68 = 2941 litri

Il costo medio al litro per l’intero periodo sarà:

Questo stesso risultato si ottiene molto più rapidamente con la media armonica del costo al litro:

euro 0,6088294132793636

20003

litri totale

totalecosto medio costo

euro 0,6088

68,0

1

61,0

1

55,0

1

3 medio costo

9Cos'è la Statistica - G. Garau, L. Schirru

Alcune proprietà della media

La media è un operatore lineare per il quale valgono le seguenti proprietà:

PROPRIETA’ DIMOSTRAZIONI

10Cos'è la Statistica - G. Garau, L. Schirru

La moda• Il valore modale, o moda:

• La classe modale:

Si calcola per i caratteri qualitativi o quantitatividiscreti e corrisponde alla modalità a cui èassociata la massima frequenza.

Si calcola per i caratteri raggruppati inclassi (siano quantitativi discreti o continui).

Se le classi hanno la stessa ampiezza, si individua la classe modale in corrispondenza della massima frequenza.

Se le classi hanno la ampiezze diverse, si assume come classe modale quella con la massima densità di frequenza.

La moda corrisponde a 4

11Cos’è la Statistica - G. Garau, L. Schirru

La mediana

In una sequenza di dati ordinati dal più piccolo al più grande la mediana, o valore mediano, occupa la posizione

intermedia, nel senso che è quel valore che bipartisce in parti uguali la totalità delle frequenze.

Nel caso di dati quantitativi discreti:

Se n (totale delle osservazioni) è dispari, la mediana

corrisponde all’osservazione di rango (o posizione

2

)1(

nMe

Se n (totale delle osservazioni) è pari, sia n=2h,

allora la mediana è, per convenzione, uguale alla

media aritmetica dei due termini in posizione

centrale:

2 quindi 1

21 ;

2

1 hh xx

Men

hn

h

Nel caso di dati raggruppati in classi

Si individua la classe mediana, quella cui corrisponde il

50% delle frequenze, e poi si ottiene il valore mediano,

interpolando all’interno della classe mediana (si ipotizza

che, all’interno delle classi, vi sia ripartizione uniforme

delle frequenze).

12Cos'è la Statistica - G. Garau, L. Schirru

Esempio

Partendo dalla seguente distribuzione per classi di età, fornireuna adeguata rappresentazione grafica e calcolare la classemediana, la classe modale e la media aritmetica:

Trattandosi di dati quantitativi raggruppati in classi l’adeguata rappresentazionegrafica è l’Istogramma, che si può costruire se si hanno a disposizione le densità difrequenza e le ampiezze di classe, riportati nella seguente tabella.

Con queste informazioni si può ora costruire l’istogramma.

relativa frequenza di densità

assoluta. frequenza di densità

i

ii

i

ii

a

fh

a

nd

13Cos'è la Statistica - G. Garau, L. Schirru

La media, per dati raggruppati in classi, si calcola utilizzando come xi i valori centrali delle classi, xc:

N.B. Da adesso in poi si utilizzeranno, indifferentemente, i simboli M, ẋ e μ per indicare la media. Il simbolo μ si utilizza solitamente per indicare il valore medio della popolazione, e il simbolo ẋ per indicare il valore medio di dati

campionari.

14Cos'è la Statistica - G. Garau, L. Schirru

Calcolo della mediana mediante interpolazione.

Per le variabili continue, il raggruppamento in classi delle modalità consente di determinare solo la classe mediananella quale ricade l’unità statistica che bipartisce la distribuzione ordinata delle modalità.

Un singolo indice sintetico può essere ottenuto approssimando la funzione di ripartizione attorno alla mediana.

mediana. classe della cumulata frequenza la e inferiore valoreil invece, indicano 1 e 1

mediana; classe della cumulata frequenza la e superiore valoreil mente,rispettiva indicano e

MeMe

MeMe

Fx

Fx

15Cos’è la Statistica - G. Garau, L. Schirru

Per concludere l’esercizio precedente calcoliamo il valore mediano della distribuzione per classi dietà.

16Cos’è la Statistica - G. Garau, L. Schirru

Altri indici di posizione

Il midrangeUn altro indice di posizione che considera però solo i valori estremi assunti dalla variabile è il midrange, che èdato dalla media tra la più piccola e la più grande delle osservazioni (modalità) di un insieme di dati.Si calcola così:

I quartili sono le misure di posizione non centrale più ampiamente usate. Vengono impiegati in particolar modoquando si sintetizzano o si descrivono le caratteristiche di ampi insiemi di dati quantitativi. Mentre la mediana è unvalore che divide a metà la serie ordinata delle osservazioni, i quartili dividono i dati ordinati in quattro parti. Altriquantili usati di frequenza sono i decili, che dividono i dati ordinati in dieci parti, e i percentili, che dividono i datiordinati in cento parti.

Il primo quartile, Q1 è il valore tale che il 25% delle osservazioni è più piccolo di Q1 e il 75% è più grande di Q1.

Il terzo quartile, Q3 è il valore tale che il 75% delle osservazioni è più piccolo di Q3 e il 25% delle osservazioni è più grande di Q3.

17Cos’è la Statistica - G. Garau, L. Schirru