Indici di Posizione - Lezione 2

16
Indici di Posizione

description

Corso di Statistica Lezione: 2 di 15 Argomento: Indici di posizione

Transcript of Indici di Posizione - Lezione 2

Page 1: Indici di Posizione - Lezione 2

1

Indici di Posizione

Gli indici si posizione sono misure sintetiche (‘valori caratteristici’) che descrivono la tendenza centrale di un fenomeno

La tendenza centrale è, in prima approssimazione, la modalità della variabile verso la quale i casi tendono a gravitare, ossia il ‘baricentro’ della distribuzione

Page 2: Indici di Posizione - Lezione 2

2

MODA

È la modalità della variabile alla quale è associata la maggior frequenza, cioè quella che si è manifestata piùvolte in sede di rilevazione

{ : max( ) 1,...., }i ii

Mo x n i k= =

• Può essere calcolato per qualsiasi tipo di variabile

• È un indice elementare e non molto ‘informativo’

MODA

In caso di carattere raggruppato in classi la moda è il valore medio (centrale) della classe a cui èassociata la densità di frequenza li (di) più elevata

1{ : max( ) 1,...., }2

i ii

i

x xMo l i k++= =

Page 3: Indici di Posizione - Lezione 2

3

ESEMPI

CORSO ni fi piSAM 137 0,19 19%SPO 251 0,34 34%ORU 186 0,25 25%IES 159 0,22 22%

733 1,00 100%

Mo=SPO

0 50 100 150 200 250 300

SAM

SPO

ORU

IES

VARIABILI QUALITATIVE SCONNESSE O RETTILINEE

rendim ni fi pi Ni Fi Pisufficiente 40 0.05 5.47% 40 0.05 5.47%discreto 150 0.21 20.52% 190 0.26 25.99%buono 293 0.40 40.08% 483 0.66 66.07%ottimo 248 0.34 33.93% 731 1.00 100.00%

731 1.00 100.00%

Mo=Buono

0%10%20%30%40%50%60%70%80%90%

100%

pi

ottimo

buono

discreto

sufficiente

Diagramma a basto

0,0%

2,0%

4,0%

6,0%

8,0%

10,0%

12,0%

14,0%

16,0%

161718192021222324252627282930313233

media vo

ESEMPIO DISTRIBUZIONE BIMODALE

MEDIA VOTI ni pi Ni Pi18 11 1,50% 11 1,50%19 11 1,50% 22 3,00%20 18 2,46% 40 5,46%21 29 3,96% 69 9,41%22 47 6,41% 116 15,83%23 75 10,23% 191 26,06%24 105 14,32% 296 40,38%25 84 11,46% 380 51,84%26 105 14,32% 485 66,17%27 85 11,60% 570 77,76%28 94 12,82% 664 90,59%29 49 6,68% 713 97,27%30 20 2,73% 733 100,00%

(vuote) 0,00%Totale complessivo 733 100,00%

Sono presenti due valori modali, Mo=24 e Mo=26

Page 4: Indici di Posizione - Lezione 2

4

ESEMPIO

VARIABILE QUANTITATIVA RAGGRUPPATA IN CLASSI

Fonte; ISTAT, indagine sulla lettura e su altro impiego del tempo libero, 1986

classi età numero lettori6-|11 22111-|14 57314-|20 288320-|25 286425-|35 544935-!45 538445-|55 460755-|65 369265 -|80 2694totale 28367

classi età numero lettori ai li6-|11 221 5 44.211-|14 573 3 19114-|20 2883 6 480.520-|25 2864 5 572.825-|35 5449 10 544.935-!45 5384 10 538.445-|55 4607 10 460.755-|65 3692 10 369.265 -|80 2694 15 179.6totale 28367

Classe modale: 20-|25

Mo=(20+25)/2=22.5

MEDIANA

La mediana di una variabile è la modalità che occupa la posizione centrale nella distribuzione ordinata della variabile.

• non può essere calcolata per le variabili sconnesse perchénon posseggono in via naturale un ordine

• è un indice più informativo della moda

Page 5: Indici di Posizione - Lezione 2

5

ESEMPIOmodalità che occupa il posto centrale nella distribuzione ordinata di frequenza

(50% delle Pi)

Giudizio Frequenza Giudizio FrequenzaFreq. Cum Freq. Cum

SCARSO

SUFF

BUONO

OTTIMO

INSUFF

SCARSO

SUFF

BUONO

OTTIMO

INSUFF

7

35

30

25

3

30

35

7

3

25

SAM/ORU SPO

10

45

75

100

3

55

90

97

100

25

MEDIANA

Se il numero di unità statistiche n è dispari, c’è una sola posizione centrale P = (n+1)/2.

Se il numero di di unità statistiche n è pari, ci sono due posizioni centrali: n/2 e n/2+1. Se le unità corrispondenti a queste due posizioni presentano la stessa modalità, tale modalità è la mediana; se presentano modalità diverse: la mediana è indeterminata (se la variabile è ordinale), la mediana è la media delle due modalità (se la variabile è quantitativa).

Page 6: Indici di Posizione - Lezione 2

6

MEDIANAPER DATI RAGGRUPPATI IN CLASSI

1. Si calcola il valore (n+1)/2

2a. Se il valore cade a cavallo di due classi contigue xi-1-|xi e xi-|xi+1, si sceglie il valore separatore delle due calssi (xi) come mediana

2b. Se la cumulata di ordine (n+1)/2 cade nella classe i di estremi xi-|xi+1 la mediana è fornita dalla seguente formula

12 ii

i

n NMe x

l

−−= +

PERCENTILI

(o frattili o quantili)

Sono dei particolari valori della variabile X che dividono la distribuzione di frequenza in 100 parti tendenzialmente di uguale numerosità. Casi particolari:

•Percentile di ordine 50 che corrisponde alla mediana;

•Quartili che dividono la distribuzione di frequenza in quattro parti tendenzialmente della stessa numerosità n/4

Page 7: Indici di Posizione - Lezione 2

7

QUARTILIQ1

25% 75%

Q3

25% 75%

Q2=Me

50% 50%

QUARTILI

0.00%

25.00%

50.00%

75.00%

100.00%

Q1=modalità di X a cui corrisponde la prima frequenza cumulata percentuale (relativa)>25% (0.25)

Q2=modalità di X a cui corrisponde la prima frequenza cumulata percentuale (relativa)>50% (0. 5)

Q3=modalità di X a cui corrisponde la prima frequenza cumulata percentuale (relativa)>75% (0.75)

Q2 Q3Q1

Page 8: Indici di Posizione - Lezione 2

8

PRIMO QUARTILE Q1

1. Si calcola il valore (n+1)

2. Si procede come per la mediana tenendo come riferimento sempre la posizione (n+1).

Per i dati raggruppati in classe la formula è

11

14 i

ii

n NQ x

l−−

= +

14

14

TERZO QUARTILE Q3

1. Si calcola il valore (n+1)

2. Si procede come per la mediana tenendo come riferimento sempre la posizione (n+1).

Per i dati raggruppati in classe la formula è

13

34 i

ii

n NQ x

l−−

= +

34

34

Page 9: Indici di Posizione - Lezione 2

9

ESEMPI

Non si calcolano Mediana e Quartili delle variabili Corso ei Laurea e Sesso perchésono variabili sconnesse (nominali)

MEDIA VOTI ni pi Ni Pi18 11 1,50% 11 1,50%19 11 1,50% 22 3,00%20 18 2,46% 40 5,46%21 29 3,96% 69 9,41%22 47 6,41% 116 15,83%23 75 10,23% 191 26,06%24 105 14,32% 296 40,38%25 84 11,46% 380 51,84%26 105 14,32% 485 66,17%27 85 11,60% 570 77,76%28 94 12,82% 664 90,59%29 49 6,68% 713 97,27%30 20 2,73% 733 100,00%Totale complessivo 733 100,00%

Q1=23

Q2=Me=25

Q3=27

rendim ni fi pi Ni Fi Pisufficiente 40 0,05 5,47% 40 0,05 5,47%discreto 151 0,21 20,52% 191 0,26 25,99%buono 294 0,40 40,08% 485 0,66 66,07%ottimo 248 0,34 33,93% 733 1,00 100,00%

733 1,00 100,00%

Q1=‘discreto’

Q2=Me=‘buono’

Q3=‘ottimo’

( )

( )

( )

1 1 18341 1 36723 1 5504

n

n

n

+ =

+ =

+ =

ESEMPI

Q1=18

Q2=Me=37

Q3=78

crediti ni fI pi Ni Fi Pi0-|20 207 0,28 28,24% 207 0,28 28,24%20-|40 183 0,25 24,97% 390 0,53 53,21%40-|60 84 0,11 11,46% 474 0,65 64,67%60-|80 83 0,11 11,32% 557 0,76 75,99%80-|100 64 0,09 8,73% 621 0,85 84,72%100-|120 42 0,06 5,73% 663 0,90 90,45%120-|140 29 0,04 3,96% 692 0,94 94,41%140-|160 24 0,03 3,27% 716 0,98 97,68%160-|180 17 0,02 2,32% 733 1,00 100,00%

733 1,00 100,00%

( )

( )

( )

1 1 18341 1 36723 1 5504

n

n

n

+ =

+ =

+ =

1

2

3

1 733 040 17, 7207 / 20

1 733 207220 37, 4

183 / 203 733 474460 78, 2

83 / 20

Q

Q Me

Q

−= + =

−= = + =

−= + =

Page 10: Indici di Posizione - Lezione 2

10

MEDIA ARITMETICA

•La media è il valore caratteristico più noto e più impiegato fra quelli che rilevano la tendenza centrale

•E’ la parte del totale delle intensità che spetta a ciascuna unità

Può essere calcolata solo per variabili quantitative

ATTENZIONE: Molto spesso è comodo associare alle modalità qualitative codici numerici (es. numero di matricola, codice identificativo cliente). Nonostante la ricodifica, la variabile rimane connotata secondo la caratteristica intrinseca del fenomeno di cui essa è rilevazione.

NON HA SENSO FARE LA MEDIA DEL NUMERO DI MATRICOLA!!!!!!!!!!

MEDIA ARITMETICA SEMPLICE

Se si considera una tabella di rilevazione, la media aritmetica è data dalla seguente formula

1

1( )n

ii

x xn

µ=

= = ∑

22 24 21 26 27( ) 245

M Voti + + + += =

ID VOTI CREDITI1 22 62 24 713 21 194 26 275 27 22 6 71 19 27 22( ) 29

5M Crediti + + + +

= =

Page 11: Indici di Posizione - Lezione 2

11

MEDIA ARITMETICA PONDERATA

Se si considera una tabella di frequenza, la media aritmetica è data dalla seguente formula

1

1( )k

i ii

x x nn

µ=

= = ∑

19 10 21 20 24 50 25 80 26 20 27 10 30 10( ) 24,5200

MVoti ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅= =

VOTI ni19 1021 2024 5025 8026 2027 1030 10Totale comp 200

40 20 80 105 120 60 160 15( ) 94200

M Crediti ⋅ + ⋅ + ⋅ + ⋅= =

crediti xi ni20-|60 40 2060-|100 80 105

100-|140 120 60140-|180 160 15

totale 200

Per le variabili raggruppate in calsse si considerano i valori centrali

ESEMPIO: MEDIA ARITMETICA (excel)Dati

VOTI ni pi Ni Pi xini18 11 1.50% 11 1.50% 19819 11 1.50% 22 3.00% 20920 18 2.46% 40 5.46% 36021 29 3.96% 69 9.41% 60922 47 6.41% 116 15.83% 103423 75 10.23% 191 26.06% 172524 105 14.32% 296 40.38% 252025 84 11.46% 380 51.84% 210026 105 14.32% 485 66.17% 273027 85 11.60% 570 77.76% 229528 94 12.82% 664 90.59% 263229 49 6.68% 713 97.27% 142130 20 2.73% 733 100.00% 600

Totale com 733 100.00% 18433

INDICI DI POSIZIONE

MEDIA 25.147 25.147Formula della media aritmetica semplice, partendo dalla rilevazione

Formula della media artimetica ponderata, calcolata a partire dalla tabella di frequenza

Page 12: Indici di Posizione - Lezione 2

12

ESEMPIO: MEDIA ARITMETICA (excel)

crediti ni fI pi Ni Fi Pi ai li xi xini0 -| 20 207 0.28 28.24% 207 0.28 28.24% 20 10.35 10 207020 -| 40 183 0.25 24.97% 390 0.53 53.21% 20 9.15 30 549040 -| 60 84 0.11 11.46% 474 0.65 64.67% 20 4.2 50 420060 -| 80 83 0.11 11.32% 557 0.76 75.99% 20 4.15 70 5810

80 -| 100 64 0.09 8.73% 621 0.85 84.72% 20 3.2 90 5760100 -| 120 42 0.06 5.73% 663 0.90 90.45% 20 2.1 110 4620120 -| 140 29 0.04 3.96% 692 0.94 94.41% 20 1.45 130 3770140 -| 160 24 0.03 3.27% 716 0.98 97.68% 20 1.2 150 3600160 -| 180 17 0.02 2.32% 733 1.00 100.00% 20 0.85 170 2890

733 1 100.00% 38210

MEDIA 51.836 51.836 52.128

OsservazioneSe si utilizza una variabile quantitativa raggruppata in classi, si perde l'informazione numerica sulle singole unità statistiche (classi=categorie), pertanto gli indicidi posizione calcolati sulla tabella ragruppata in classi possono differire da quelli originari, e dipendono dal raggruppamento.

Formula della media aritmetica semplice, partendo dalla rilevazione

Formula della media artimetica ponderata, calcolata a partire dalla tabella di frequenza

MEDIA calcolata dalla tebella di frequenza raggruppata in classi utilizzando come xi i valori centrali delle classi

MEDIA ARITMETICA: PROPRIETA’1. La media aritmetica di una variabile è sempre compresa tra il

valore minimo e il valore massimo assunti dalla variabile stessa, cioè

2. La media di una costante è uguale alla costante stessa, inoltre se una variabile X viene moltiplicata per una costante anche la sua media risulta moltiplicata per la stessa costante, cioè

min maxx x x≤ ≤

( ) ( ), dove si dice operatore media aritmetica e e sono due costanti, vale quindi

( )( ) ( )

M a bX a bM XM

a bM a aM bX bM X

+ = +

==

Page 13: Indici di Posizione - Lezione 2

13

MEDIA ARITMETICA: PROPRIETA’

3. La somma algebrica degli scarti dei valori xi dalla loro media aritmetica è uguale a zero

4. La somma dei quadrati degli scarti dei valori xi dalla loro media aritmetica è minima (proprietà dei minimi quadrati)

( )1 1

0n n

i ii i

x x x nx nx nx= =

− = − = − =∑ ∑

( )2

1minimo

n

ii

x x=

− =∑

ESEMPIO: PROPRIETA’ 2

13500€ELENA

14000€STEFANO

15500€DAVIDE

16700€FRANCESCA

15000€CHIARA

Salario Le persone elencate nella tabella costituiscono un equipe di lavoro, se realizzeranno un progetto riceveranno un premio fisso di 1000 € ciascuno e un incremento del salario del 5% . A quanto ammonterà il salario medio percepito dai componenti dell’equipe in caso si realizzazione?

15000 16700 15500 14000 13500( ) 149405

( ) (1000 1,05 ) 1000 1,05 ( ) 1000 1,05 14940 16687

M X

M Y M X M X

+ + + += =

= + ⋅ = + ⋅ = + ⋅ =

X=‘Salario’

Y=‘Salario dopo la realizzazione’=1000+1,05 X

1,05 = 1 + 0.05

(salario +incremento)

Page 14: Indici di Posizione - Lezione 2

14

MEDIA ARITMETICA: TEOREMITeorema 1

La media aritmetica di un miscuglio di k gruppi (o sottopopolazioni), per ciascuno dei quali è già noto il valore

della media aritmetica, è uguale alla media aritmetica ponderata delle media dei singoli gruppi

1

1 media aritmetica dell' -esimo gruppo di numerosità in

i ij ii j

x x i nn =

= ∑

1 numerosità del miscuglio di gruppi

k

ii

n n k=

=∑

1 1 1

1 1ink k

ij i ii j i

x x x nn n= = =

= =∑∑ ∑

MEDIA ARITMETICA: TEOREMI

Teorema 2

La media aritmetica della somma (o della differenza) di due (o più variabili) è uguale alla somma (o alla differenza) della

media aritmetica delle singole variabili.

1 1

Se

1 1( ) ( ) ( ) ( )n m

i ji j

Z X Y

M Z M X Y M X M Y x yn m= =

= +

= + = + = +∑ ∑

Page 15: Indici di Posizione - Lezione 2

15

ESEMPIO: TEOREMA 1

CORSO LAUREA MEDIA ETA' niIES 24.34 159ORU 24.45 186SAM 24.46 137SPO 26.55 251

Si ricorda che la media complessiva della variabile età calcolata sulle 733 unità non suddivise per corso di laurea era 25.147, verifichiamo ora che la media del miscuglio coincide

24,34 159 24,45 186 24,46 137 26,55 251 25,147733

x ⋅ + ⋅ + ⋅ + ⋅= =

Miscuglio di k=4 corsi di laurea, variabile X=‘età’

ESEMPIO: TEOREMA 2La tabella mostra il tempo (in minuti) di percorrenza a piedi per raggiungere le sede di lavoro (X) e il tempo di percorrenza con i mezzi (Y) di 5 individui.

Calcolare il tempo medio complessivo di percorrenza per raggiungere la sede di lavoro

X 5 10 15 10 8Y 15 15 5 10 12

5 10 15 10 8( ) 9,65

15 15 5 10 12( ) 11, 45

( ) ( ) ( ) ( ) 9,6 11, 4 21

M X

M Y

M Z M X Y M X M Y

+ + + += =

+ + + += =

= + = + = + =

Page 16: Indici di Posizione - Lezione 2

16

ESEMPIO RIEPILOGATIVO TEOREMINel prospetto sono riportati i tempi di percorrenza in minuti relativi a 10 convogli EurostarItalia sulle tratte Roma-Bologna e Bologna-Milano, indicati rispettivamente con X e Y.

X: tempo percorrenza RM-BO 164 183 153 177 167 166 168 156 152 156Y: tempo percorrenza BO-MI 110 106 117 126 120 119 109 130 120 112

Sapendo che il tempo di percorrenza teorico dell’intero tragitto, RM-MI, è pari a 270 minuti, si indichi con W la variabile “ritardo totale riportato dai convogli”. Si calcoli il ritardo medio complessivo sulla tratta RM-MI

W=X+Y-270

M(W)=M(X+Y-270)=M(X)+M(Y)-270=164,2+116,9-270=11,1

164 183 153 177 167 166 168 156 152 156( ) 164, 210

M X + + + + + + + + += =

110 106 117 126 120 119 109 130 120 112( ) 116,910

M Y + + + + + + + + += =