Gli indici di posizione
Transcript of Gli indici di posizione
Gli indici di posizione
Quando si considerano dati quantitativi, non è sufficiente presentareadeguatamente i dati e trarre indicazioni su questi a partire dall’osservazionedi tali rappresentazioni.
Una buona analisi dei dati richiede anche che le caratteristiche principali delleosservazioni siano sintetizzate con opportune misure e che tali misure sianoadeguatamente analizzate e interpretate.
Gli indici di posizione sintetizzano la posizione di una distribuzione difrequenza mediante un valore reale rappresentativo della globalità delfenomeno e tale da riassumere gli aspetti ritenuti più importanti.
Di seguito si esaminano le misure di posizione:– MEDIA
– MODA
– MEDIANA
1Cos’è la Statistica - G. Garau, L. Schirru
La media
Nella media aritmetica la relazione è la somma:
Nella media geometrica è il prodotto:
Nella media armonica la proprietà che rimane inalterata è la somma dei reciproci.
Si dice che M è la media di n dati (xi, … xn,), se il risultato della funzione che delinea il tipo di
media, assume lo stesso valore quando al posto di xi, … xn, si pone M. La media è quella
quantità che, sostituita a ciascuna modalità del carattere, lascia inalterata una proprietà.
2Cos’è la Statistica - G. Garau, L. Schirru
La media aritmetica
La media aritmetica si calcola facendo lasomma delle modalità e dividendo il totaleper in numero di modalità.
Se però le modalità si ripetono più volte si utilizza la media aritmeticaponderata, che ci calcola moltiplicando le modalità per le rispettivefrequenze e dividendo il valore ottenuto per il totale delle frequenze.
n
nxM
ii
n
xMMnx
in
i
i
cui da ;1
ii fxM
Utilizzando le frequenze assolute
Utilizzando le frequenze relative
n
1i
e iii ff
n
nperché la somma delle frequenze relative è uguale ad 1.
3Cos’è la Statistica - G. Garau, L. Schirru
EsempioLa tabella seguente riporta i tempi (in minuti) registrati da 20 operai per la riparazione di una componente meccanica.
Calcolare la media aritmetica:
xi ni
2 3
3 3
4 5
5 4
6 3
8 2
tot 20
Se si usano le frequenze assolute:
Se si usano le frequenze relative … occorre prima calcolarle:xi ni fi
2 3 0.15
3 3 0.15
4 5 0.25
5 4 0.2
6 3 0.15
8 2 0.1
N=20 1
N
nf ii
45,420
89
)234543(
)28()36()45()54()33()32(
i
ii
n
nxM
45,48,09,01145,03,0
)10,08()15,06()20,05()25,04()15,03()15,02(
ii fxM
4Cos’è la Statistica - G. Garau, L. Schirru
Media per valori raggruppati in classi.
(xi + xi+1] ni
[0 – 2] 40
(2 – 3] 80
(3 – 5] 60
(5 – 7] 20
La distribuzione presenta il tempo di attesa in minuti presso
la fermata Y della metropolitana per un operaio, in 200
giornate lavorative.
Calcolare il tempo medio di attesa.
In questo caso, in cui la distribuzione di frequenze ha le modalità ripartite in classi, la prima operazione da
fare è calcolare il valore centrale (o valore medio) delle singole classi.
(xi + xi+1] ni xc
[0 – 2] 40 1
(2 – 3] 80 2,5
(3 – 5] 60 4
(5 – 7] 20 6
Una volta calcolati i valori centrali (indicati con xc) si procede al calcolo della
media aritmetica ponderata, così come presentato nella precedente slide.
3200
600
)20608040(
)206()604()805,2()401(
i
ii
n
nxM
5Cos’è la Statistica - G. Garau, L. Schirru
La media geometrica
n
n
i
in
ng xxxM
1
1 ...
La media geometrica si utilizza quando si vuole calcolare la media di processi di tipo moltiplicativo (es.: inflazione, remunerazione del capitale, crescita di popolazioni) su vari periodi di tempo.
n
n
i
n
in n
n
n
g xxxM n
1
1 ...1ponderata
n
i
f
i
f
n
f
gin xxxM
1
11 ...1
ponderata
Se le modalità si ripetono più volte si utilizza la media geometrica ponderata
Utilizzando le frequenze assolute
Utilizzando le frequenze relative
6Cos’è la Statistica - G. Garau, L. Schirru
Esempio
La tabella riporta il tasso di incremento del prodotto interno lordo
(PIL) in una nazione negli anni dal 95 al 2002.
Determinare il tasso di incremento medio.
anni tasso
1995 2%
1996 3%
1997 1%
1998 2%
1999 4%
2000 5%
2001 6%
2002 4%
%95,2576046542132... 88
1
1
n
n
i
in
ng xxxM
Utilizzando la formula della media geometrica semplice si ottiene
95,25760654321...ponderata 88 22
1
11
n
n
i
ni
n nn
ng xxxM n
Utilizzando la formula della media geometrica ponderata si ottiene
Il risultato non cambia. Il tasso di incremento medio è uguale al 2,95%
7Cos'è la Statistica - G. Garau, L. Schirru
La media armonica
La media armonica si utilizza quando le grandezze sono inversamenteproporzionali, ad es. si può calcolare la velocità media di un tragitto,conoscendo le velocità medie tenute nei vari intervalli spaziali che costituisconoil tragitto.
i
a
x
nM
1
i
ia
x
n
nM ponderata
8Cos'è la Statistica - G. Garau, L. Schirru
Esempio
Una persona spende per il riscaldamento di tre anni consecutivi sempre la stessa cifra:2000 euro all’anno, acquistando il combustibile a Euro 0.55 il primo anno, Euro 0.61 ilsecondo, Euro 0.68 il terzo. Determinare il costo medio di un litro di combustibile perl’intero periodo.
Sono stati acquistati:
•il primo anno n = 2000/0.55 = 3636 litri;•il secondo anno n = 2000/0.61 = 3279 litri;•il terzo anno n = 2000/0.68 = 2941 litri
Il costo medio al litro per l’intero periodo sarà:
Questo stesso risultato si ottiene molto più rapidamente con la media armonica del costo al litro:
euro 0,6088294132793636
20003
litri totale
totalecosto medio costo
euro 0,6088
68,0
1
61,0
1
55,0
1
3 medio costo
9Cos'è la Statistica - G. Garau, L. Schirru
Alcune proprietà della media
La media è un operatore lineare per il quale valgono le seguenti proprietà:
PROPRIETA’ DIMOSTRAZIONI
10Cos'è la Statistica - G. Garau, L. Schirru
La moda• Il valore modale, o moda:
• La classe modale:
Si calcola per i caratteri qualitativi o quantitatividiscreti e corrisponde alla modalità a cui èassociata la massima frequenza.
Si calcola per i caratteri raggruppati inclassi (siano quantitativi discreti o continui).
Se le classi hanno la stessa ampiezza, si individua la classe modale in corrispondenza della massima frequenza.
Se le classi hanno la ampiezze diverse, si assume come classe modale quella con la massima densità di frequenza.
La moda corrisponde a 4
11Cos’è la Statistica - G. Garau, L. Schirru
La mediana
In una sequenza di dati ordinati dal più piccolo al più grande la mediana, o valore mediano, occupa la posizione
intermedia, nel senso che è quel valore che bipartisce in parti uguali la totalità delle frequenze.
Nel caso di dati quantitativi discreti:
Se n (totale delle osservazioni) è dispari, la mediana
corrisponde all’osservazione di rango (o posizione
2
)1(
nMe
Se n (totale delle osservazioni) è pari, sia n=2h,
allora la mediana è, per convenzione, uguale alla
media aritmetica dei due termini in posizione
centrale:
2 quindi 1
21 ;
2
1 hh xx
Men
hn
h
Nel caso di dati raggruppati in classi
Si individua la classe mediana, quella cui corrisponde il
50% delle frequenze, e poi si ottiene il valore mediano,
interpolando all’interno della classe mediana (si ipotizza
che, all’interno delle classi, vi sia ripartizione uniforme
delle frequenze).
12Cos'è la Statistica - G. Garau, L. Schirru
Esempio
Partendo dalla seguente distribuzione per classi di età, fornireuna adeguata rappresentazione grafica e calcolare la classemediana, la classe modale e la media aritmetica:
Trattandosi di dati quantitativi raggruppati in classi l’adeguata rappresentazionegrafica è l’Istogramma, che si può costruire se si hanno a disposizione le densità difrequenza e le ampiezze di classe, riportati nella seguente tabella.
Con queste informazioni si può ora costruire l’istogramma.
relativa frequenza di densità
assoluta. frequenza di densità
i
ii
i
ii
a
fh
a
nd
13Cos'è la Statistica - G. Garau, L. Schirru
La media, per dati raggruppati in classi, si calcola utilizzando come xi i valori centrali delle classi, xc:
N.B. Da adesso in poi si utilizzeranno, indifferentemente, i simboli M, ẋ e μ per indicare la media. Il simbolo μ si utilizza solitamente per indicare il valore medio della popolazione, e il simbolo ẋ per indicare il valore medio di dati
campionari.
14Cos'è la Statistica - G. Garau, L. Schirru
Calcolo della mediana mediante interpolazione.
Per le variabili continue, il raggruppamento in classi delle modalità consente di determinare solo la classe mediananella quale ricade l’unità statistica che bipartisce la distribuzione ordinata delle modalità.
Un singolo indice sintetico può essere ottenuto approssimando la funzione di ripartizione attorno alla mediana.
mediana. classe della cumulata frequenza la e inferiore valoreil invece, indicano 1 e 1
mediana; classe della cumulata frequenza la e superiore valoreil mente,rispettiva indicano e
MeMe
MeMe
Fx
Fx
15Cos’è la Statistica - G. Garau, L. Schirru
Per concludere l’esercizio precedente calcoliamo il valore mediano della distribuzione per classi dietà.
16Cos’è la Statistica - G. Garau, L. Schirru
Altri indici di posizione
Il midrangeUn altro indice di posizione che considera però solo i valori estremi assunti dalla variabile è il midrange, che èdato dalla media tra la più piccola e la più grande delle osservazioni (modalità) di un insieme di dati.Si calcola così:
I quartili sono le misure di posizione non centrale più ampiamente usate. Vengono impiegati in particolar modoquando si sintetizzano o si descrivono le caratteristiche di ampi insiemi di dati quantitativi. Mentre la mediana è unvalore che divide a metà la serie ordinata delle osservazioni, i quartili dividono i dati ordinati in quattro parti. Altriquantili usati di frequenza sono i decili, che dividono i dati ordinati in dieci parti, e i percentili, che dividono i datiordinati in cento parti.
Il primo quartile, Q1 è il valore tale che il 25% delle osservazioni è più piccolo di Q1 e il 75% è più grande di Q1.
Il terzo quartile, Q3 è il valore tale che il 75% delle osservazioni è più piccolo di Q3 e il 25% delle osservazioni è più grande di Q3.
17Cos’è la Statistica - G. Garau, L. Schirru