Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da...
-
Upload
mafalda-chiari -
Category
Documents
-
view
214 -
download
0
Transcript of Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da...
Gli indici di dispersione
La variabilità
• Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati
a) 5, 5, 5, 5, 5
b) 1, 3, 5, 7, 9
c) 1, 1, 1,1, 21 X = 5
d) 1, 2, 3, 4,15
La variabilità
• È la capacità di un fenomeno di assumere valori quantitativi o caratteri qualitativi diversi
Variabilità nell’individuo
statura nell’età evolutiva
Variabilità nel gruppo
statura in un gruppo di individui della stessa età
La variabilità
• Occorre un criterio per quantificare la variabilità delle misure rispetto a un termine di riferimento :
indice di tendenza centrale
• La forma della variabilità è visibile ponendo su un piano cartesiano i valori della distribuzione
• La variabilità delle misure può essere valutata in base alla loro dispersione rispetto ai valori medi e misurata dagli indici di dispersione
LA VARIABILITÀ
X
0 x1 x2... ..... x i ..... x n
L’indice di variabilità rappresenta quanto ciascun termine è
distante, in media, da X
Distribuzione simmetricala maggior parte delle
osservazioni si avvicina alla media
Ci sono tanti soggetti inciascuna classe
Molte osservazionisono lontane dalla media
Molti soggetti nella classeiniziale e pochi nelle altreLa maggior parte delle
osservazioni sonolontane dalla media
Variabilità rispetto alla media
Indici di variabilità
• La più elementare misura di dispersione è l’intervallo di variazione (range): differenza tra valore più alto e più basso
Es: la statura di 5 persone adulte in cm.
150 168 170 171 172
R = 22
Intervallo di variazione
• Lo scarto indica la dimensione della variabilità ma non fornisce informazioni circa la variabilità della distribuzione
• Considera solo i dati estremi e non informa circa
i valori intermedi
• Scarsamente utile, utilizzata solo in alcuni casi (es. temperature)
Scarto medio semplice assoluto • Definiamo lo SCARTO come la differenza tra la singola
osservazione e la media della distribuzione
• Dati n valori xi di media aritmetica x , si chiama scarto
semplice medio assoluto la media aritmetica dei valori
assoluti degli scarti xi – x
N
xx
N
xxxxxxs
n
ii
nim
)()(....)()(
_
1
__
2
_
SCARTO E DEVIANZA
• Gli SCARTI esprimono la distanza di ciascuna osservazione dalla media della distribuzione.
• Potremmo rappresentare la variabilità totale della distribuzione come la somma di tutti gli scarti, e cioè:
Variabilità totale =
Ma, per una proprietà della Media aritmetica, risultasempre essere = 0 la somma degli scarti:
)(_
xx
0)(_
xx
Devianza
• Per superare il problema dei valori negativi alle differenze dalla media si possono elevare al quadrato i valori
• La Devianza è un indice di valutazione della variabilità di una distribuzione
• Da essa discendono la Varianza e la Deviazione Standard
2_
)( xx
Varianza
• La devianza non contiene l’informazione sul numero di osservazioni utilizzato per il calcolo
• La varianza è una devianza media che si rapporta al numero di osservazioni
• Essa da informazioni circa la variabilità dei singoli valori invece che per quella complessiva
Nxxs \)( 22
Varianza corretta• In campo biostatistico la formula
viene modificata in considerazione della minore numerosità delle distribuzioni che penalizzerebbero l’informazione sulla variabilità
• Viene introdotto il concetto di gradi di libertà nel denominatore per valutare al massimo il grado di dispersione
• I gradi di libertà rappresentano il numero di osservazioni indipendenti della distribuzione
( N-1) poiché sui dati disponibili è già stata calcolata la media
1
)( 22
N
xxs
I gradi di libertà
• Date 6 osservazioni vincolate dalla media x =25
N. misura attribuzione arbitraria
1 1 54 2 2 - 9 3 . ... 11 4 ..... 86 5 N – 1 1 6 N ?
54 – 9+11+86+1=143
La sesta misura si ricava indirettamente
Allora Σx= N x = 6 25 =150Pertanto considerati i valori arbitrari la sesta misura sarà
X6=150 – 143=7
5
1iix
625
6
1
6
1_
iii xi
N
xx
Deviazione standardo
Scarto Quadratico Medio• E’ più conveniente esprimere
la variabilità nello stesso ordine di grandezza dei dati e della loro media
• La varianza è espressa con un ordine di grandezza al quadrato rispetto ai dati originali
• Per esprimere la variabilità nello stesso ordine di grandezza si applica alla varianza la trasformazione inversa al quadrato: la radice quadrata
1
)( 2
N
xxs i
Esempi di variabilità di distribuzioni
• Modalità 1 2 3
Frequenze 3 5 3 si ha x =
s =
• Modalità 0 2 4
frequenze 3 5 3 si ha x =2
s =
211
335231
738.011
3)23(5)22(3)21( 222
477.111
3)24(5)22(3)20( 222
VARIANZA E DEVIAZIONE STANDARD DI DATIRAGGRUPPATI IN CLASSI
Come fatto per il calcolo della media anche in questo caso andremo amodificare la formula per il calcolo della VARIANZA e dello SCARTO
QUADRATICO MEDIO considerando le “Frequenze” (fi) di ciascunaclasse. Abbiamo pertanto:
Varianza
Scarto quadratico medio
mi = valori centrali delle singole classi
i i
iii
f
fxmi1
2
2
1
2
2
i
fi
f
xm
i
iii
Calcolo e interpretazione di s
• 5 reparti di un ospedale secondo il numero di posti letto
12 60 42 54 32
X = (12 + 60 + 42 + 54 + 32) / 5 = 200 / 5 = 40
Se tutti i reparti avessero lo stesso numero di posti letto, avrebbero 40
posti letto ciascuno
Dev.=(12 – 40)2 + (60 -40)2 + (42 – 40)2 + (54 - 40)2 + (32 – 40)2 =1448
s = 1448 / 5 = 289,6 s = 289,6 = 17
Ciascun reparto ha un numero di posti letto che è diverso da quello
medio (40) in media di 17
Coefficiente di variazione
Es: una popolazione di adulti ha un peso medio di 75 Kg. una di neonati con peso medio 3.2Kg.s adulti = 4 Kg s neonati = 0.6
Si può affermare che la variabilità per gli adulti è maggiore rispetto a quella dei neonati?
Si possono confrontare i rapporti con le medie
1875.0
2.3
6.0
La variabilità del peso degli adulti è inferiore
x
sCV
053.075
4
Coefficiente di variazione
• Gli indici di variabilità sono espressi nella stessa unità di misura delle osservazioni e non consentono confronti fra la variabilità di due distribuzioni espresse in unità di misura diverse
• Non consentono il confronto di distribuzioni che hanno medie diverse: sono influenzate dall’intensità del carattere
• Il CV è una misura relativa di variabilità: esprime la variabilità in proporzione alla dimensione media del carattere
• Il CV può essere definito come il rapporto tra la deviazione standard e la media (in %)
• E’ una misura adatta a confrontare la variabilità fra popolazioni diverse o fra caratteri diversi
Coefficiente di variazione• ES : Si considerino i dati relativi a un gruppo di studenti a cui siano stati
rilevati la statura e il peso. Conoscendo media e scarto quadratico medio si vuole stabilire quale fra i caratteri in studio ha minore variabilità
Carattere media deviazione standard
statura 168,59 6,49
peso 64,48 7,27
C. V..(statura)
C. V.(peso)
85,310059,168
49,6
27,1110048,64
27,7
La statura è il carattereche presenta una minore
variabilità