Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da...

21
Gli indici di dispersione

Transcript of Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da...

Page 1: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Gli indici di dispersione

Page 2: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

La variabilità

• Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati

a) 5, 5, 5, 5, 5

b) 1, 3, 5, 7, 9

c) 1, 1, 1,1, 21 X = 5

d) 1, 2, 3, 4,15

Page 3: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

La variabilità

• È la capacità di un fenomeno di assumere valori quantitativi o caratteri qualitativi diversi

Variabilità nell’individuo

statura nell’età evolutiva

Variabilità nel gruppo

statura in un gruppo di individui della stessa età

Page 4: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

La variabilità

• Occorre un criterio per quantificare la variabilità delle misure rispetto a un termine di riferimento :

indice di tendenza centrale

• La forma della variabilità è visibile ponendo su un piano cartesiano i valori della distribuzione

• La variabilità delle misure può essere valutata in base alla loro dispersione rispetto ai valori medi e misurata dagli indici di dispersione

Page 5: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

LA VARIABILITÀ

X

0 x1 x2... ..... x i ..... x n

L’indice di variabilità rappresenta quanto ciascun termine è

distante, in media, da X

Page 6: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Distribuzione simmetricala maggior parte delle

osservazioni si avvicina alla media

Ci sono tanti soggetti inciascuna classe

Molte osservazionisono lontane dalla media

Molti soggetti nella classeiniziale e pochi nelle altreLa maggior parte delle

osservazioni sonolontane dalla media

Variabilità rispetto alla media

Page 7: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Indici di variabilità

• La più elementare misura di dispersione è l’intervallo di variazione (range): differenza tra valore più alto e più basso

Es: la statura di 5 persone adulte in cm.

150 168 170 171 172

R = 22

Page 8: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Intervallo di variazione

• Lo scarto indica la dimensione della variabilità ma non fornisce informazioni circa la variabilità della distribuzione

• Considera solo i dati estremi e non informa circa

i valori intermedi

• Scarsamente utile, utilizzata solo in alcuni casi (es. temperature)

Page 9: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Scarto medio semplice assoluto • Definiamo lo SCARTO come la differenza tra la singola

osservazione e la media della distribuzione

• Dati n valori xi di media aritmetica x , si chiama scarto

semplice medio assoluto la media aritmetica dei valori

assoluti degli scarti xi – x

N

xx

N

xxxxxxs

n

ii

nim

)()(....)()(

_

1

__

2

_

Page 10: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

SCARTO E DEVIANZA

• Gli SCARTI esprimono la distanza di ciascuna osservazione dalla media della distribuzione.

• Potremmo rappresentare la variabilità totale della distribuzione come la somma di tutti gli scarti, e cioè:

Variabilità totale =

Ma, per una proprietà della Media aritmetica, risultasempre essere = 0 la somma degli scarti:

)(_

xx

0)(_

xx

Page 11: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Devianza

• Per superare il problema dei valori negativi alle differenze dalla media si possono elevare al quadrato i valori

• La Devianza è un indice di valutazione della variabilità di una distribuzione

• Da essa discendono la Varianza e la Deviazione Standard

2_

)( xx

Page 12: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Varianza

• La devianza non contiene l’informazione sul numero di osservazioni utilizzato per il calcolo

• La varianza è una devianza media che si rapporta al numero di osservazioni

• Essa da informazioni circa la variabilità dei singoli valori invece che per quella complessiva

Nxxs \)( 22

Page 13: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Varianza corretta• In campo biostatistico la formula

viene modificata in considerazione della minore numerosità delle distribuzioni che penalizzerebbero l’informazione sulla variabilità

• Viene introdotto il concetto di gradi di libertà nel denominatore per valutare al massimo il grado di dispersione

• I gradi di libertà rappresentano il numero di osservazioni indipendenti della distribuzione

( N-1) poiché sui dati disponibili è già stata calcolata la media

1

)( 22

N

xxs

Page 14: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

I gradi di libertà

• Date 6 osservazioni vincolate dalla media x =25

N. misura attribuzione arbitraria

1 1 54 2 2 - 9 3 . ... 11 4 ..... 86 5 N – 1 1 6 N ?

54 – 9+11+86+1=143

La sesta misura si ricava indirettamente

Allora Σx= N x = 6 25 =150Pertanto considerati i valori arbitrari la sesta misura sarà

X6=150 – 143=7

5

1iix

625

6

1

6

1_

iii xi

N

xx

Page 15: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Deviazione standardo

Scarto Quadratico Medio• E’ più conveniente esprimere

la variabilità nello stesso ordine di grandezza dei dati e della loro media

• La varianza è espressa con un ordine di grandezza al quadrato rispetto ai dati originali

• Per esprimere la variabilità nello stesso ordine di grandezza si applica alla varianza la trasformazione inversa al quadrato: la radice quadrata

1

)( 2

N

xxs i

Page 16: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Esempi di variabilità di distribuzioni

• Modalità 1 2 3

Frequenze 3 5 3 si ha x =

s =

• Modalità 0 2 4

frequenze 3 5 3 si ha x =2

s =

211

335231

738.011

3)23(5)22(3)21( 222

477.111

3)24(5)22(3)20( 222

Page 17: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

VARIANZA E DEVIAZIONE STANDARD DI DATIRAGGRUPPATI IN CLASSI

Come fatto per il calcolo della media anche in questo caso andremo amodificare la formula per il calcolo della VARIANZA e dello SCARTO

QUADRATICO MEDIO considerando le “Frequenze” (fi) di ciascunaclasse. Abbiamo pertanto:

Varianza

Scarto quadratico medio

mi = valori centrali delle singole classi

i i

iii

f

fxmi1

2

2

1

2

2

i

fi

f

xm

i

iii

Page 18: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Calcolo e interpretazione di s

• 5 reparti di un ospedale secondo il numero di posti letto

12 60 42 54 32

X = (12 + 60 + 42 + 54 + 32) / 5 = 200 / 5 = 40

Se tutti i reparti avessero lo stesso numero di posti letto, avrebbero 40

posti letto ciascuno

Dev.=(12 – 40)2 + (60 -40)2 + (42 – 40)2 + (54 - 40)2 + (32 – 40)2 =1448

s = 1448 / 5 = 289,6 s = 289,6 = 17

Ciascun reparto ha un numero di posti letto che è diverso da quello

medio (40) in media di 17

Page 19: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Coefficiente di variazione

Es: una popolazione di adulti ha un peso medio di 75 Kg. una di neonati con peso medio 3.2Kg.s adulti = 4 Kg s neonati = 0.6

Si può affermare che la variabilità per gli adulti è maggiore rispetto a quella dei neonati?

Si possono confrontare i rapporti con le medie

1875.0

2.3

6.0

La variabilità del peso degli adulti è inferiore

x

sCV

053.075

4

Page 20: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Coefficiente di variazione

• Gli indici di variabilità sono espressi nella stessa unità di misura delle osservazioni e non consentono confronti fra la variabilità di due distribuzioni espresse in unità di misura diverse

• Non consentono il confronto di distribuzioni che hanno medie diverse: sono influenzate dall’intensità del carattere

• Il CV è una misura relativa di variabilità: esprime la variabilità in proporzione alla dimensione media del carattere

• Il CV può essere definito come il rapporto tra la deviazione standard e la media (in %)

• E’ una misura adatta a confrontare la variabilità fra popolazioni diverse o fra caratteri diversi

Page 21: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Coefficiente di variazione• ES : Si considerino i dati relativi a un gruppo di studenti a cui siano stati

rilevati la statura e il peso. Conoscendo media e scarto quadratico medio si vuole stabilire quale fra i caratteri in studio ha minore variabilità

Carattere media deviazione standard

statura 168,59 6,49

peso 64,48 7,27

C. V..(statura)

C. V.(peso)

85,310059,168

49,6

27,1110048,64

27,7

La statura è il carattereche presenta una minore

variabilità