Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli...

Post on 09-Sep-2019

5 views 0 download

Transcript of Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli...

Indici di …posizione:-quantili-decili-percentili

tendenza centrale:-Media-Moda-Mediana

variabilità e dispersione:-Devianza- Varianza-Deviazione standard

Indici di tendenza centrale

Indici di tendenza centrale

Scale di misura

Nominale Ordinale Intervalli Rapporti

ModaMedianaMedia

x xx

xxx

xxx

Media� punto di equilibrio centrale dell’insieme dei valor i

considerati (somma dei valori di ogni osservazione)

(numero di osservazioni)

n

Σi=1

nX =

X = media

Xi = valore i-esimo della distribuzione X

n

Σ = sommatoria di tutti i dati dal primo (i=1) a ni=1

n = numerosità totale del campione

Xi

Se i dati sono raggruppati in classi …n

Σi=1

nX =

X = media

Xi = valore i-esimo della distribuzione X

n

Σ = sommatoria di tutti i dati dal primo (i=1) a ni=1

n = numerosità totale del campione

fi Xi

fi = frequenza relativa della classe i-esima

Come si procede …I valori della variabile su cui calcolare la media sono determinati dalla somma dei limiti (inferiore e superiore) /2 dell’intervallo di classe che va moltiplicata per la frequenza ad esso associata.

Classi Xi fi Xi * fi45-49 (45+49)/2 47 1 47

40-44 (40+44)/2 42 2 84

35-39 (35+39)/2 37 3 111

30-34 (30+34)/2 32 5 160

25-29 (25+29)/2 27 4 108

20-24 (20+24)/2 22 1 22

16 532

X = 532/16= = 33.25

Mediana� Divide la distribuzione in due parti di uguale

numerosità e corrisponde al 50° percentile.� Determina semplicemente il valore che divide i

dati in due parti numericamente uguali,prescindendo dal valore dei dati e dal fatto chequesti siano bilanciati rispetto ad essa.

� Diversamente dalla media che non dividenecessariamente i dati in due partinumericamente uguali, ma li divide in base adun valore medio della variabile.

rappresenta il valore per cui si ha il picco di frequenza.

Moda

Indici di variabilità e di dispersione

Varianza

DS = Σ (x- M)2 = devianza = varianzaN-1 gradi di libertà

oscillazione media intorno alla media

SS = Σ (x- M)2 oppure Σx2 - (Σx)2

N

s2= MS = Σ (x- M)2 = devianzaN-1 gradi di libertà

Devianza scarti quadratici della media

Radice quadrata della varianza

Deviazione standard

� Gruppo A:

� Gruppo B:

11

1+0+12

2

1

0

1

0

1

0

-11

10100200

100100+0+1002

100

0

100

0

10

0

-10

-5

-5

-5

-5

-5

-5

deviazione standard

varianzadevianzascarti dalla media

Deviazione standard

varianzadevianzascarti dalla media

Media= (4+5+6)/3=

5

Media= (-5+5+15)/3=

5

Σ6

15

5

4

15Σ15

5

-5

DS=1

DS=10

Gruppi

1120

Media deviazione standard

varianzadevianzascarti dalla

media

5A

B 5 0 200 100 10

1) Perché calcoliamo iquadrati degli scarti dallamedia (devianza) ?Per poter evidenziare ledifferenze fra i gruppi.La sommatoria degli scartiè sempre uguale a 0.Calcolando la devianza ivalori negativi diventanopositivi e la somma nonsarà più 0.

2) Perché calcoliamo la deviazione standard ?L’utilizzo di scarti elevati al quadrato (devianza) rende la varianza non omogenea con l’unità di misura dei dati di partenza, pertanto si utilizza la radice quadrata delle varianze (deviazione standard).

3) Per garantire l’indipendenza delle osservazioni (dati) si calcolano i G.d.L. togliendo 1 dato al n° totale delle osservazioni.

A 4

5

6

Σ 15

B -5

5

15

Σ 15

Distribuzione normale

Distribuzione normale� unimodale� simmetrica (media, mediana e moda coincidono)� mesocurtica (la varianza è circa ¼ della media)

-3 -2 -1 0 1 2 3

68 %

95 %

99 %

Simmetrica

Se è bimodale… non c’è rimedio� Moda : rappresenta il valore per cui si ha il picco di

frequenza. Una distribuzione più essere unimodale o bimodale a seconda che sia presente un solo picco o due picchi intercalati da un avvallamento.

Bimodale

Media=Mediana

Se non è simmetrica ….Per correggere la simmetria e/o la curtosi:� se media = varianza si estrae la radice quadrata� se varianza > media si fa il log x o log x + C

(Anscombe)

Asimmetrica positivaMODA

MEDIANA

MEDIA

Asimmetria negativaMODA

MEDIANA

MEDIA

Rappresentazione della curtosi

LEPTOCURTICA

PLATICURTICA

MESOCURTICA

Teorema Bernouille

Dato un universo di media µ e deviazionestandard σ se si estraggono n campioni lamedia delle medie sarà uguale alla mediadella popolazione e l’errore standard ugualealla deviazione standard della popolazione.

Indici di posizioneper conoscere la posizione che una

osservazione occupa all’internodi una distribuzione

Primi passi …

� Calcolare il valore mediano� Stabilire se il nostro valore appartiene

nella metà inferiore o superiore di una distribuzione.

� Gli indici di posizione dividono la distribuzione in quattro (quantili), dieci (decili) o cento (percentili) parti.

Q1 Q2 Q3

Quantili (Q)

25 %25 % 25 % 25 %

D1 D2 D3 D4 D5 D6 D7 D8 D9

Decili (D)

10%

50 %

P10 P20 P30 P40 P50 P60 P70 P80 P90

Percentili (P)

10%

50 %

ALCUNE CONSIDERAZIONI

� MEDIANA = Q2 = D5 = P50 = 50 %� Q1 = P25

� Q2 = P50

� Q3 = P25

Calcolo degli indici di posizioni� Se non sono raggruppati in classi …a) Disporre i dati della distribuzione in

ordine crescenteb) Identificare la posizione mediante la

formula:

c) Identificare il valore che corrisponde alla posizione

P Perc = Perc (n +1)100

Perc = percentile (1 -99)n= numero dei dati della

distribuzione

Valore percentile = XPPerc

Calcolo degli indici di posizioni� Se sono raggruppati in classi …a) Identificare la posizione mediante la

formula:

Perc = percentile (1 -99)n= numero dei dati della distribuzionel inf = limite reale inferiore della classe che contiene il percentilefc inf = frequenza cumulata della classe precedente a quella del percentilei = ampiezza della classe che contiene il percentile (limite reale superiore

meno limite reale inferiore)f = frequenza della classe che contiene il percentile

Valore percentile= X PPerc = l inf

Perc n100

+

- fcinf ** i

f

EsercizioClassi Limiti reali fi fc3-6 7

7-10 9

11-14 5

15-18 3

24

7

16

21

24

2.5 – 6.5

6.5 – 10.5

10.5 – 14.5

14.5 – 18.5

7

7+9 =

7+9+5 =

7+9+5+3 =

Valore percentile= X PPerc = l inf

Perc n100

+

- fcinf ** i

f

1) Individuare la classe che contiene Q3 o P75

Perc n100

* = (75 * 24)100

= 18

(75 * 24)100 16 (14.5 -10.5)4

5

10.5

12.1Ricordiamoci di procedere

per interpolazione

Ranghi

� Corrispondono alle posizioni occupate dalle singole osservazioni.

� Se due o più valori sono uguali (cadono sullo stesso rango) bisogna calcolare il rango medio

� Il rango dipende dal n° delle osservazione

Ranghi percentili

� Libera le singole osservazioni dal denominatore

� Consente di confrontare direttamente la prestazione di un soggetto

* 100(n – R)

n - 1R= Rango

n = numerosità delle osservazioniR %= Rango percentile

R %=

Esempio : calcolare il rango percentile corrispondente al valore 20

� Il rango percentile del punteggio 20 corrisponde al 64% circa

=� Sotto al punteggio 20 cadono il

64% dei valori della distribuzione=

� Il punteggio 20 corrisponde in percentuale al 36 – esimo posto della distribuzione (64-100=36)

X = 27 – 11 – 26 – 12 – 24 – 16 - 21 – 20 – 17 – 14 – 13 – 22 – 19 – 18 - 15

X = 27 – 26 – 24 – 22 - 21 – 20 – 19 – 18 – 17 –16– 15 – 14 – 13 –12- 11

* 100(n – R)

n - 1R %=

* 100 =(15 – 6)

15 - 1R %=

= 64.28