3_DISPENSA - Indici Di Tendenza Centrale 2010-2011
Transcript of 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011
Corso di Statistica
I Facoltà di Medicina e Chirurgia
CORSO DI STATISTICADott.sa Laura Perrotta
- Lezione 3 - Indici di tendenza centrale -
A.A. 2010/2011
Corso di Statistica
GLI INDICI DI TENDENZA CENTRALE•Lo scopo della statistica è di evidenziare determinate situazioni ricavandole da un insieme di osservazioni e da un collettivo di misure.
•Le tabelle e le rappresentazioni grafiche di un fenomeno costituiscono un notevole strumento di illustrazione e di divulgazione ma non di sintesi dell’informazione.
•Le misure di tendenza centrale servono per individuare il valore intorno al quale i dati sono raggruppati.
• La tendenza centrale è la misura più appropriata per sintetizzare l’insieme delle osservazioni se una distribuzione di dati dovesse essere descritta con un solo valore.
• Le medie costituiscono una prima indicazione della dimensione del fenomeno pur comportando una perdita di informazione.
Corso di Statistica
GLI INDICI DI TENDENZA CENTRALE
L’obiettivo degli indici tendenza è di sintetizzare le informazioni contenute nelle misure.
La sintesi porta una perdita di informazione.
La scelta dell’indice deve cadere su quello che minimizza la perdita di informazione pur rappresentando correttamente un insieme di manifestazioni di una stessa variabile.
Il dato di sintesi deve soddisfare alcune condizioni:
deve essere compreso tra il valore più piccolo e quello più grande
deve identificarsi, in qualche modo, con i valori più frequenti localizzati al centro delle misure quando sono ordinabili.
Corso di Statistica
Il calcolo delle medie va distinto per il tipo di variabile utilizzata:
Le medie analitiche (di calcolo): la cui applicazione è ammessa solo per misure quantitative; il loro calcolo si basa sul concorso di tutte le unità: per esempio la media aritmetica
Gli indici di posizione (lasche):sono l’unica sintesi possibile in caso di classificazioni ordinali e qualitative; sono identificate in ragione di particolari posizioni ordinali nella successione crescente o decr. di tutte le modalità: moda, mediana, quantili
Corso di Statistica
MEDIE ANALITICHE INDICI DI POSIZIONE
VALORE INTERMEDIO
MEDIA ARITMETICA
MEDIA GEOMETRICA
MEDIA ARMONICA
MODA
MEDIANA
QUANTILI
Corso di Statistica
IL VALORE INTERMEDIO
Il valore intermedio tra due misure estreme è pari a:
(operatore simile al calcolo del valore centrale delle classi)
Nota: questo indice trascura tutti i valori escluso il max e il min; se i due valori estremi risultano molto scostati dal complesso delle osservazioni, il valore ottenuto non rispecchia la centralità dell’insieme
21 nxx
Corso di Statistica
LA MEDIA ARITMETICA SEMPLICE
E’ l’indice di tendenza più usato, rappresenta il valore da attribuire a ciascuna delle misure come se fossero tutte uguali.
Dal momento che esprime la tendenza centrale si può ipotizzare che la maggior parte dei risultati è concentrata su tale valore
Corso di Statistica
MEDIA ARITMETICA PER DISTRIBUZIONI UNITARIE
Si ottiene come la sommatoria di tutte le osservazioni (xi) divisa per il loro numero (N).Indichiamo le singole osservazioni con x1 ; x2; … ; xi; … xn; :
n
xxm
n
i
i 1
Corso di Statistica
Ore di lavoro straordinario
Gennaio 10
Febbraio 12
Marzo 11
Aprile 5
Maggio 7
Giugno 10
Luglio 5
Agosto 0
Settembre 7
Ottobre 10
Novembre 7
Dicembre 12
Totale 96
Tab. 1 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale
Ore di lavoro straordinario
Gennaio x1
Febbraio x2
Marzo x3
Aprile …
Maggio …
Giugno …
Luglio …
Agosto …
Settembre …
Ottobre …
Novembre …
Dicembre xn
Totale 96
Corso di Statistica
812
96
12
127107051075111210
12
1
n
xi
i
APPLICAZIONE DELLA FORMULA
n
xxm
n
i
i 1
L’infermiere ha fatto in media 8 ore di straordinario al mese
Formula della media aritmetica per distribuzioni unitarie
Corso di Statistica
k
i
ii
k
i
ii
fxn
nx
1
1
MEDIA ARITMETICA PER DISTRIBUZIONI DI FREQUENZE
k
i
k
k
k
kk
ii
iik
k
i
fxfxfxfx
n
nx
n
nx
n
nx
n
nxnxnxnx
n
nx
1
1
2
2
1
1
...332211
...221
1
...
Corso di Statistica
Ore di lavoro straordinario
Frequenza
assoluta
0 1
5 2
7 3
10 3
11 1
12 2
Totale 12
Tab. 2 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale
XFrequenza
assoluta
x1 n1
x2 n2
x3 n3
x4 n4
x5 n5
x6 n6
Totale n
Esempio di calcolo della media aritmetica mediante la formula
n
nxk
i
ii 1
Corso di Statistica
812
96
12
212111310372510
6
1
n
nxi
ii
APPLICAZIONE DELLA FORMULA
k
i
ii
k
i
ii
fxn
nx
1
1 Formula della media aritmetica per distribuzioni di frequenza
n indica la numerosità totale delle osservazioni;K indica il numero di classi
Corso di Statistica
Tab. 3 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale
Ore di lavoro straordinarioFrequenza
assoluta
Frequenza
relativa
0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1
Esempio di calcolo della media aritmetica mediante la formula
k
i
iifx1
Corso di Statistica
8167,012083,011250,010250,07167,05083,00
1
k
i
iifx
APPLICAZIONE DELLA FORMULA
k
i
ii
k
i
ii
fxn
nx
1
1 Formula della media aritmetica per distribuzioni di frequenza
Corso di Statistica
Ore di lavoro straordinario
Gennaio 10
Febbraio 12
Marzo 11
Aprile 5
Maggio 7
Giugno 10
Luglio 5
Agosto 0
Settembre 7
Ottobre 10
Novembre 7
Dicembre 12
Totale 96
Ore di lavoro straordinario
Frequenza
assoluta
Frequenza
relativa
0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1
812
96
12
127107051075111210
12
1
n
xi
i
8167,012083,011250,010250,07167,05083,001
k
i
iifx
Tab. 2 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale
Tab. 1 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale
812
96
12
212111310372510
6
1
n
nxi
ii
Corso di Statistica
1° Esempio di calcolo della media aritmetica in una distribuzione in classi
Classe (cm) Frequenze
assoluteni
150-154 2
155-159 6
160-164 11
165-169 18
170-174 25
175-179 13
180-184 7
82
Corso di Statistica
Classe (cm) Frequenze
assoluteni
Valore centrale
della classexi xi*ni
150-154 2 152 304
155-159 6 157 942
160-164 11 162 1.782
165-169 18 167 3.006
170-174 25 172 4.300
175-179 13 177 2.301
180-184 7 182 1.274
13.909
62,169 82
909.13
82
274.1...942304
82
7182...615721521
n
nxk
i
ii
2
164160
Corso di Statistica
2° Esempio di calcolo della media aritmetica in una distribuzione in classi
Classi peso Frequenza assoluta
[69,5 – 72,5) 3
[72,5 – 75,5) 4
[75,5 – 78,5) 22
[78,5 – 81,5) 53
[81,5 – 84,5) 92
[84,5 – 87,5) 71
[87,5 – 90,5) 46
[90,5 – 93,5) 15
[93,5 – 96,5) 4
Totale 310
Tab. 4a – Distribuzione di frequenze del peso (Kg) di una casistica di 310 soggetti affetti da diabete manifesto
Corso di Statistica
Classi peso Frequenza assoluta Valore centrale
[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310
Tab. 4b – Distribuzione di frequenze del peso (Kg) di una casistica di 310 soggetti affetti da diabete manifesto
9,83 310
495...2277474371
Corso di Statistica
PROPRIETA’ FONDAMENTALI DELLA MEDIA ARITMETICA
1. La somma di tutti gli scarti dalla media aritmetica è nulla
2. La somma dei quadrati degli scarti,
qualunque sia il valore a, assume il suo minimo per
3. Indicato con a1 il valore più piccolo della distribuzione e
con an quello più grande, si ha
ossia la media aritmetica è non esterna all’intervallo (a1, an )
01
n
i
ix
2
1
n
i
i ax
a
nxx 1
Corso di Statistica
La media aritmetica è la più nota e facile da calcolare.
Viene sempre utilizzata salvo che in presenza di:
• dati non quantitativi
• misure di ordine di grandezza molto diverse es. 0,8 7 58 124
• valori estremi molto scostati o indeterminati es. 28 34 22,5 299
• valori estremi indeterminati o infiniti es. 9 6 4 7 >100
• distribuzioni di frequenza con classi aperte
Corso di Statistica
MEDIA ARITMETICA PONDERATA
E’ una media aritmetica che attribuisce ad ogni valore un peso o importanza diversa. Nei casi più semplici il peso è costituito dalla frequenza dei singoli valori, in altri frangenti è determinato dall’importanza che si vuole o si deve attribuire a ciascun valore.In generale la media aritmetica dei valori x1, x2 , … , xk con i pesiπ1, π2 , … , πk è data da
k
kkxxx
...
...
21
2211
Corso di Statistica
Corso integrato di
Infermieristica materno-infantileVoto Crediti Ore
Pediatria generale e specialistica 27 1,2 18
Ginecologia ed ostetricia 21 1,2 18
Infermieristica pediatrica e neonatale 30 0,6 9
Totale 3 45
2,256,02,12,1
6,0302,1212,127 PONDERATA ARITMETICA
263
302127
MEDIA
ARITMETICAMEDIA
Esempio di calcolo della media aritmetica ponderata
Corso di Statistica
Esercizio 1 (d)Corso di Statistica 3
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta, registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse, (a). si dica se e’quantitativa o qualitativa, discreta o continua.(b). dopo aver definito opportunamente le classi di modalita’, calcolare(c) le frequenze assolute e le frequenze relative;(d) la media aritmetica di X;(e) la moda, la mediana.
Media Aritmetica: 2,1
può essere calcolata in 3 modi differenti
Corso di StatisticaCorso di Statistica 3
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2
(d) Xi ni fi
1 3 0,3
2 4 0,4
3 2 0,2
4 1 0,1
Tot 10 1
1,2)1,04()2,03()4,02()3,01(
1,210
)14()23()42()31(
10
1,210
2312143221
10
4
11
4
11
10
11
iii
n
iii
iii
n
iii
ii
N
ii
fxfx
nx
N
nx
x
N
x
Corso di Statistica
LA MEDIA GEOMETRICA
Si preferisce utilizzare la media geometrica per i dati
distribuiti su diversi ordini di grandezza e quando i dati
appaiono legati tra loro da un fattore moltiplicativo
(esempio di successione geometrica del fattore
moltiplicativo 2: 2, 4, 8, 16, 32, 64…).
La media geometrica non è altro che la radice ennesima
del prodotto delle N osservazioni.
Corso di Statistica
MEDIA GEOMETRICA PER DISTRIBUZIONI UNITARIE
n
n
i
in xn xxxMG
1
21 ...
La media geometrica della distribuzione unitaria x1,x2,…,xn ,
in cui le x1,x2,…,xn sono tutte positive, è la radice n-esima del
prodotto x1,x2,…,xn
Corso di Statistica
MEDIA GEOMETRICA PER DISTRIBUZIONI IN CLASSI
Si utilizza in caso di distribuzioni in classi o
osservazioni ripetute
Nota: la media geometrica non ha significato in presenza
di valori nulli o negativi
N fn
f nxxMG ......1
1
Corso di Statistica
Esempio di applicazione della media geometrica
Consideriamo tre valori
10, 100, 1000
3703
1110
3
100010010
100100010010101010
...
33 32
1
21
n
n
i
in xn xxxMG
Corso di Statistica
MEDIA ARMONICA
n
i ix
nMA
1
1
La media armonica della quantità a1,a2,…,an è l’inverso della
media aritmetica degli inversi nxxx
1,...,
1,
1
21
La media armonica è definita come il reciproco della media aritmetica dei reciproci delle misure.
Tale media trova una applicazione nella valutazione dei tempi di reazione o di risposta (in prove di sopravvivenza post operatoria).In genere si utilizza per i fenomeni che dovrebbero preferibilmente esaurirsi in un arco di tempo definito.
Corso di Statistica
RELAZIONI TRA LE MEDIE ANALITICHE
Tra le medie aritmetica, geometrica e armonica, calcolate su una stessa serie di misure, esiste la relazione:
dove il caso di uguaglianza vale solo nel caso in cui le osservazionisiano tutte uguali.
MGMA
Corso di Statistica
SCHEMA DI UTILIZZO DEGLI INDICI DI TENDENZA CENTRALE RISPETTO ALLA TIPOLIGIA DI CARATTERE
Caratteri quantitativi
Caratteri qualitativi
Medie analitiche
Aritmetica si no
Geometrica si no
Armonica si no
Indici di posizione
Moda si si
Mediana si si
Quantili si si
Corso di Statistica
In presenza di misure non quantitative non è possibile applicare le medie analitiche.
In alternativa sono state introdotte le medie di posizione:
Moda
Mediana
Quantili
INDICI DI POSIZIONE
Corso di Statistica
LA MODA
La moda è l’indice di tendenza centrale che minimizza le perdite di informazioni.
In alcune distribuzioni può accedere che siano presenti una o più mode all’aumentare del numero di osservazioni: distribuzioni unimodale, bimodale, plurimodale
La moda è un indice di tendenza centrale che individua il gruppo o il dato che compare con maggior frequenza
Per caratteri qualitativi:
Per caratteri quantitativi:
la moda è la modalità che si presenta con maggior frequenza
la moda è il valore che si presenta con maggior frequenza
Corso di Statistica
Dove:
Nel caso di distribuzioni in classi di diversa ampiezza
la classe modale è quella con la più alta densità di frequenza
(la frequenza assoluta in rapporto all’ampiezza della classe)
Per le distribuzioni in classi di uguale ampiezza, si
calcola la classe modale come segue:
successiva la e modale classe della frequenza la tradifferenza
precedente la e modale classe della frequenza la tradifferenza
modale classe della ampiezzac
modale classe della inferiore confine
moda
2
1
21
1
1
1
L
cL
Corso di Statistica
Cause di morte Frequenze assolute
Tumori 315
Malattie sistema circolatorio 418
Malattie sistema respiratorio 82
Malattie sistema digerente 49
Non definite 19
Accidentali 57
La moda è “Malattie sistema circolatorio”
1° Esempio di calcolo della moda (carattere qualitativo)
Corso di Statistica
Tab. 5 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale
Ore di lavoro straordinarioFrequenza
assoluta
Frequenza
relativa
0 1 0,083
5 2 0,167
7 3 0,250
10 3 0,250
11 1 0,083
12 2 0,167
Totale 12 1
La prima moda è “7”, la seconda moda è “10”
2° Esempio di calcolo della moda (carattere quantitativo)
Corso di Statistica
Classi peso Frequenza assoluta Valore centrale
[69,5 – 72,5) 3 71
[72,5 – 75,5) 4 74
[75,5 – 78,5) 22 77
[78,5 – 81,5) 53 80
[81,5 – 84,5) 92 83
[84,5 – 87,5) 71 86
[87,5 – 90,5) 46 89
[90,5 – 93,5) 15 92
[93,5 – 96,5) 4 95
Totale 310
4,83371925392
53925,81
84,5-81,5
21
1
1
cL moda -
modale classe -
3° Esempio di calcolo della classe modale e della moda in una distribuzione in classi (classi della stessa ampiezza)
Corso di Statistica
Numero posti letto Frequenza assoluta
Ampiezza della classe
Densità di frequenza
26-50 251 25 10,04
51-100 368 50 7,36
101-150 288 50 5,76
151-200 159 50 3,18
201-300 304 100 3,04
301-500 173 200 0,87
501-800 99 300 0,33
La classe modale apparente è “51-100”
La classe modale corretta è “26-50”
Tab. 6 - Strutture di degenza classificate in base al numero di posti letto
300
9933,0
4° Esempio di calcolo della classe modale in una distribuzione in classi (classi con ampiezze diverse)
Corso di Statistica
Individuare la moda nelle seguenti rappresentazioni grafiche:
Corso di Statistica
LA MEDIANA
La mediana per definizione occupa il valore centrale in una serie ordinata di dati.
Le osservazioni vengono separate dal valore mediano in due parti numericamente uguali, il 50% con valori inferiori e il 50% con valori superiori.
La mediana non risente dei valori estremi di una serie ordinata ed è preferita in tali casi alla media aritmetica.
Corso di Statistica
Il procedimento di calcolo della mediana
passa per 3 fasi:
1. ordinamento dei dati in modo crescente
2. calcolo della posizione della mediana
3. identificazione del valore corrispondente a tale posizione
Corso di Statistica
Per il calcolo della posizione mediana bisogna tener conto della numerosità delle osservazioni n
Se n è dispari si avrà una sola posizione mediana
Se n è pari si avranno due posizioni mediane
12
2
2
1
n
n
n
La mediana è data dal “valore/modalità/classe” corrispondente alla posizione mediana (o alle posizioni mediane).
Corso di Statistica
LA MEDIANA PER CARATTERI QUALITATIVI:
1. Nel caso di distribuzioni qualitative unitarie: dopo aver ordinato i dati, se la numerosità delle
osservazioni è dispari, la mediana è data dalla modalità corrispondente alla posizione mediana
quando la numerosità del collettivo è dato da un numero pari, se i due posti centrali sono occupati da dati relativi ad una stessa modalità, questa è la mediana; altrimenti le modalità relative ai due dati che occupano i posti centrali sono dette “modalità mediane”
2. Nel caso di distribuzioni di frequenza, le modalità sono già ordinate, quindi si procede all’identificazione della classe mediana, nella quale cade l’osservazione mediana, avvalendosi delle frequenze cumulate della distribuzione.
Corso di Statistica
Paziente Età Sesso Titolo di studio …
1 54 M Nessun titolo …
2 57 F Laurea …
3 62 F Laurea …
4 46 F Nessun titolo …
5 39 F Diploma …
6 54 M Licenza elementare …
7 57 F Licenza elementare …
8 60 M Nessun titolo …
9 51 F Licenza media …
1° Esempio di calcolo della mediana (carattere qualitativo)
dispari) numero( 9n
Corso di Statistica
Posizione Titolo di studio
1 Nessun titolo
2 Nessun titolo
3 Nessun titolo
4 Licenza elementare
5 Licenza elementare
6 Licenza media
7 Diploma
8 Laurea
9 Laurea
Paziente Titolo di studio
1 Nessun titolo
2 Laurea
3 Laurea
4 Nessun titolo
5 Diploma
6 Licenza elementare
7 Licenza elementare
8 Nessun titolo
9 Licenza media
"ELEMENTARELICENZA " è mediana La 52
19
2
1
dispari) numero( 9n
n
IN O
RD
INE
CR
ES
CE
NT
E
Corso di Statistica
Paziente Età Sesso Livello Creatininemia …
1 54 M Basso …
2 57 F Basso …
3 62 F Alto …
4 46 F Medio …
5 39 F Medio …
6 54 M Basso …
7 57 F Medio …
8 60 M Medio …
9 51 F Alto …
10 54 F Alto …
2° Esempio di calcolo della mediana (carattere qualitativo)
pari) numero( 10n
Corso di Statistica
Posizione Livello Creatininemia
1 Basso
2 Basso
3 Basso
4 Medio
5 Medio
6 Medio
7 Medio
8 Alto
9 Alto
10 Alto
PazienteLivello
Creatininemia
1 Basso
2 Basso
3 Alto
4 Medio
5 Medio
6 Basso
7 Medio
8 Medio
9 Alto
10 Alto
Medio"" è Mediana La
Medio"" é entecorrispond modalità la 612
101
2
Medio"" é entecorrispond modalità la 52
10
2
pari) (numero 10 n
n
n
IN O
RD
INE
CR
ES
CE
NT
E
Corso di Statistica
Paziente Età Sesso Umore …
1 54 M Buono …
2 57 F Buono …
3 62 F Ottimo …
4 46 F Ottimo …
5 39 F Normale …
6 54 M Basso …
7 57 F Discreto …
8 60 M Buono …
9 51 F Discreto …
10 54 F Basso …
3° Esempio di calcolo della mediana (carattere qualitativo)
pari) numero( 10n
Corso di Statistica
Posizione Umore
1 Basso
2 Basso
3 Normale
4 Discreto
5 Discreto
6 Buono
7 Buono
8 Buono
9 Ottimo
10 Ottimo
Paziente Umore
1 Buono
2 Buono
3 Ottimo
4 Ottimo
5 Normale
6 Basso
7 Discreto
8 Buono
9 Discreto
10 Basso
Buono"" e Discreto"" sono mediane modalità Le
Buono"" é entecorrispond modalità la 612
101
2
Discreto"" é entecorrispond modalità la 52
10
2
pari) (numero 10 n
n
n
Corso di Statistica
Titolo di studio Frequenza assoluta
Nessun titolo 1.862
Licenza elementare 9.903
Licenza media 4.491
Diploma 3.093
Laurea 1.160
Totale 20.509
4° Esempio di calcolo della mediana (carattere qualitativo) in una distribuzione di frequenza
Corso di Statistica
Titolo di studio Frequenza assoluta
Frequenza assoluta cumulata
Nessun titolo 1.862 1.862
Licenza elementare 9.903 11.765
Licenza media 4.491 16.256
Diploma 3.093 19.349
Laurea 1.16020.509
Totale 20.509
1.862 + 9.903
1.862 + 9.903 + 4.491
1.862
…
"ELEMENTARELICENZA " è mediana La 255.102
1509.20
2
1
dispari) numero( 509.20n
n
La modalità “licenza elementare” è la mediana.La mediana della distribuzione è la modalità relativa al dato statistico che nell’ordinamento stabilito occupa il posto di mezzo.
Corso di Statistica
LA MEDIANA PER CARATTERI QUANTITATIVI:
1. Nel caso di una serie di misure singole e ordinate (o caratteri continui) per n dispari la mediana
corrisponde al valore in posizione
per n pari la mediana
si colloca tra le due posizioni centrali e
(si parla di modalità mediane)
il valore mediano viene calcolato come media aritmetica dei valori corrispondenti a queste due posizioni
2
1n
2
n1
2n
Corso di Statistica
2. Per le distribuzioni in classi si identifica la classe mediana; nel caso di classi di uguali ampiezza si calcola il valore mediano tra quelli compresi nell’intervallo di classe utilizzando la formula:
mediana classe della frequenza
mediana classe la precedono che classi delle cumulata frequenza
mediana classe della ampiezzac
mediana classe della inferiore confine
2 mediana
1
1
med
cum
med
cum
f
f
L
cf
fn
L
Corso di Statistica
Paziente Sesso Età PA diastolica
(mmHg)
PA sistolica (mmHg)
1 M 63 70 110
2 F 56 90 95
3 F 48 80 130
4 F 48 85 85
5 M 50 70 95
6 F 54 70 85
7 M 58 65 100
8 M 67 90 130
9 F 61 90 85
5° Esempio di calcolo della mediana (carattere quantitativo)
Corso di Statistica
Posizione PA sistolica
(mmHg)
1 85
2 85
3 85
4 95
5 95
6 100
7 110
8 130
9 130
52
19
2
1
n“95” è la modalità mediana
50%
50%
IN O
RD
INE
CR
ES
CE
NT
E
Corso di Statistica
Classi peso Valore centrale Frequenza assoluta
Frequenza cumulata
[69,5 – 72,5) 71 3 3
[72,5 – 75,5) 74 4 7
[75,5 – 78,5) 77 22 29
[78,5 – 81,5) 80 53 82
[81,5 – 84,5) 83 92 174
[84,5 – 87,5) 86 71 245
[87,5 – 90,5) 89 46 291
[90,5 – 93,5) 92 15 306
[93,5 – 96,5) 95 4 310
Totale 310
9,83392
821555,812 mediana 1
cf
fn
Lmed
cum
6° Esempio di calcolo della mediana nel caso di una distribuzione in classi
Esercizio 1 (e.)Corso di Statistica 3
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2
Moda = 2
Mediana: dopo aver ordinato in senso crescente le unità
calcoliamo le due posizioni mediane n/2 = 5 (n/2)+1 = 6, al posto 5 e 6 corrispondono i valori 2 e 2, Trattandosi di un carattere qualitativo si fa la media aritmetica dei due valori mediani: Me= 2
Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Lunghez. in cm 1 1 1 2 2 2 2 3 3 4
(e)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta, registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse, (a). si dica se e’quantitativa o qualitativa, discreta o continua.(b). dopo aver definito opportunamente le classi di modalita’, calcolare(c) le frequenze assolute e le frequenze relative;(d) la media aritmetica di X;(e) la moda, la mediana.
Corso di Statistica
I QUANTILI
I quantili sono un’estensione della mediana. I quantili suddividono la distribuzione in q distribuzioni parziali, aventi ognuno la q-esima parte della numerosità totale.
I più utilizzati sono sono i :
Percentili/Centili con q = 100Decili con q = 10Quartili con q = 4
Il quartile divide la distribuzione in quattro parti, aventi ognuna il 25% della numerosità
Corso di Statistica
I° Quartile ripartisce la distribuzione in due distribuzioni, la prima costituita dal 25% della distribuzione complessiva, l’altra dal 75%
2° Quartile coincide con la Mediana
3° Quartile ripartisce la distribuzione in due distribuzioni, la prima costituita dal 75% della distribuzione complessiva, l’altra dal 25%
Il procedimento di calcolo è simile al calcolo della mediana:
Quantili Decili Percentili
14
Ni
Qi 110
Ni
Di 1
10 N
iPi
Corso di Statistica
Le possibili relazioni tra i valori medi di una distribuzione dipendono dalla sua forma e nel caso di una distribuzione unimodale si presentano tre casi:
1_curva simmetrica media = moda = mediana
2_curva obliqua a destra, con asimmetria positiva (a destra)
moda < mediana < media
3_In una curva obliqua a sinistra, con asimmetria negativa (a sinistra)
media < mediana < moda
RELAZIONI TRA INDICI DI TENDENZA CENTRALE
Corso di Statistica
RELAZIONI TRA INDICI DI TENDENZA CENTRALE
Le code (estremi della distribuzione) sono uguali;
La coda di destra è più lunga di quella di sinistra;
La coda di sinistra è più lunga di quella di destra.
Corso di Statistica
INDICI DI TENDENZA CENTRALE E LORO UTILIZZAZIONE
IN RELAZIONE ALLA SCALA DI MISURA DEI DATI
INDICI DI TENDENZA
CENTRALE UTILIZZABILI
Qualitativi sconnessi moda
Qualitativi ordinati indici di posizione
Quantitativi medie analitiche, indici di posizione