3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

64
Corso di Statistica I Facoltà di Medicina e Chirurgia CORSO DI STATISTICA Dott.sa Laura Perrotta - Lezione 3 - Indici di tendenza centrale - A.A. 2010/2011

Transcript of 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Page 1: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICADott.sa Laura Perrotta

- Lezione 3 - Indici di tendenza centrale -

A.A. 2010/2011

Page 2: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

GLI INDICI DI TENDENZA CENTRALE•Lo scopo della statistica è di evidenziare determinate situazioni ricavandole da un insieme di osservazioni e da un collettivo di misure.

•Le tabelle e le rappresentazioni grafiche di un fenomeno costituiscono un notevole strumento di illustrazione e di divulgazione ma non di sintesi dell’informazione.

•Le misure di tendenza centrale servono per individuare il valore intorno al quale i dati sono raggruppati.

• La tendenza centrale è la misura più appropriata per sintetizzare l’insieme delle osservazioni se una distribuzione di dati dovesse essere descritta con un solo valore.

• Le medie costituiscono una prima indicazione della dimensione del fenomeno pur comportando una perdita di informazione.

Page 3: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

GLI INDICI DI TENDENZA CENTRALE

L’obiettivo degli indici tendenza è di sintetizzare le informazioni contenute nelle misure.

La sintesi porta una perdita di informazione.

La scelta dell’indice deve cadere su quello che minimizza la perdita di informazione pur rappresentando correttamente un insieme di manifestazioni di una stessa variabile.

Il dato di sintesi deve soddisfare alcune condizioni:

deve essere compreso tra il valore più piccolo e quello più grande

deve identificarsi, in qualche modo, con i valori più frequenti localizzati al centro delle misure quando sono ordinabili.

Page 4: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Il calcolo delle medie va distinto per il tipo di variabile utilizzata:

Le medie analitiche (di calcolo): la cui applicazione è ammessa solo per misure quantitative; il loro calcolo si basa sul concorso di tutte le unità: per esempio la media aritmetica

Gli indici di posizione (lasche):sono l’unica sintesi possibile in caso di classificazioni ordinali e qualitative; sono identificate in ragione di particolari posizioni ordinali nella successione crescente o decr. di tutte le modalità: moda, mediana, quantili

Page 5: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

MEDIE ANALITICHE INDICI DI POSIZIONE

VALORE INTERMEDIO

MEDIA ARITMETICA

MEDIA GEOMETRICA

MEDIA ARMONICA

MODA

MEDIANA

QUANTILI

Page 6: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

IL VALORE INTERMEDIO

Il valore intermedio tra due misure estreme è pari a:

(operatore simile al calcolo del valore centrale delle classi)

Nota: questo indice trascura tutti i valori escluso il max e il min; se i due valori estremi risultano molto scostati dal complesso delle osservazioni, il valore ottenuto non rispecchia la centralità dell’insieme

21 nxx

Page 7: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

LA MEDIA ARITMETICA SEMPLICE

E’ l’indice di tendenza più usato, rappresenta il valore da attribuire a ciascuna delle misure come se fossero tutte uguali.

Dal momento che esprime la tendenza centrale si può ipotizzare che la maggior parte dei risultati è concentrata su tale valore

Page 8: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

MEDIA ARITMETICA PER DISTRIBUZIONI UNITARIE

Si ottiene come la sommatoria di tutte le osservazioni (xi) divisa per il loro numero (N).Indichiamo le singole osservazioni con x1 ; x2; … ; xi; … xn; :

n

xxm

n

i

i 1

Page 9: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Ore di lavoro straordinario

Gennaio 10

Febbraio 12

Marzo 11

Aprile 5

Maggio 7

Giugno 10

Luglio 5

Agosto 0

Settembre 7

Ottobre 10

Novembre 7

Dicembre 12

Totale 96

Tab. 1 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale

Ore di lavoro straordinario

Gennaio x1

Febbraio x2

Marzo x3

Aprile …

Maggio …

Giugno …

Luglio …

Agosto …

Settembre …

Ottobre …

Novembre …

Dicembre xn

Totale 96

Page 10: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

812

96

12

127107051075111210

12

1

n

xi

i

APPLICAZIONE DELLA FORMULA

n

xxm

n

i

i 1

L’infermiere ha fatto in media 8 ore di straordinario al mese

Formula della media aritmetica per distribuzioni unitarie

Page 11: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

k

i

ii

k

i

ii

fxn

nx

1

1

MEDIA ARITMETICA PER DISTRIBUZIONI DI FREQUENZE

k

i

k

k

k

kk

ii

iik

k

i

fxfxfxfx

n

nx

n

nx

n

nx

n

nxnxnxnx

n

nx

1

1

2

2

1

1

...332211

...221

1

...

Page 12: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Ore di lavoro straordinario

Frequenza

assoluta

0 1

5 2

7 3

10 3

11 1

12 2

Totale 12

Tab. 2 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale

XFrequenza

assoluta

x1 n1

x2 n2

x3 n3

x4 n4

x5 n5

x6 n6

Totale n

Esempio di calcolo della media aritmetica mediante la formula

n

nxk

i

ii 1

Page 13: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

812

96

12

212111310372510

6

1

n

nxi

ii

APPLICAZIONE DELLA FORMULA

k

i

ii

k

i

ii

fxn

nx

1

1 Formula della media aritmetica per distribuzioni di frequenza

n indica la numerosità totale delle osservazioni;K indica il numero di classi

Page 14: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Tab. 3 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale

Ore di lavoro straordinarioFrequenza

assoluta

Frequenza

relativa

0 1 0,083

5 2 0,167

7 3 0,250

10 3 0,250

11 1 0,083

12 2 0,167

Totale 12 1

Esempio di calcolo della media aritmetica mediante la formula

k

i

iifx1

Page 15: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

8167,012083,011250,010250,07167,05083,00

1

k

i

iifx

APPLICAZIONE DELLA FORMULA

k

i

ii

k

i

ii

fxn

nx

1

1 Formula della media aritmetica per distribuzioni di frequenza

Page 16: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Ore di lavoro straordinario

Gennaio 10

Febbraio 12

Marzo 11

Aprile 5

Maggio 7

Giugno 10

Luglio 5

Agosto 0

Settembre 7

Ottobre 10

Novembre 7

Dicembre 12

Totale 96

Ore di lavoro straordinario

Frequenza

assoluta

Frequenza

relativa

0 1 0,083

5 2 0,167

7 3 0,250

10 3 0,250

11 1 0,083

12 2 0,167

Totale 12 1

812

96

12

127107051075111210

12

1

n

xi

i

8167,012083,011250,010250,07167,05083,001

k

i

iifx

Tab. 2 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale

Tab. 1 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale

812

96

12

212111310372510

6

1

n

nxi

ii

Page 17: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

1° Esempio di calcolo della media aritmetica in una distribuzione in classi

Classe (cm) Frequenze

assoluteni

150-154 2

155-159 6

160-164 11

165-169 18

170-174 25

175-179 13

180-184 7

82

Page 18: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Classe (cm) Frequenze

assoluteni

Valore centrale

della classexi xi*ni

150-154 2 152 304

155-159 6 157 942

160-164 11 162 1.782

165-169 18 167 3.006

170-174 25 172 4.300

175-179 13 177 2.301

180-184 7 182 1.274

13.909

62,169 82

909.13

82

274.1...942304

82

7182...615721521

n

nxk

i

ii

2

164160

Page 19: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

2° Esempio di calcolo della media aritmetica in una distribuzione in classi

Classi peso Frequenza assoluta

[69,5 – 72,5) 3

[72,5 – 75,5) 4

[75,5 – 78,5) 22

[78,5 – 81,5) 53

[81,5 – 84,5) 92

[84,5 – 87,5) 71

[87,5 – 90,5) 46

[90,5 – 93,5) 15

[93,5 – 96,5) 4

Totale 310

Tab. 4a – Distribuzione di frequenze del peso (Kg) di una casistica di 310 soggetti affetti da diabete manifesto

Page 20: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Classi peso Frequenza assoluta Valore centrale

[69,5 – 72,5) 3 71

[72,5 – 75,5) 4 74

[75,5 – 78,5) 22 77

[78,5 – 81,5) 53 80

[81,5 – 84,5) 92 83

[84,5 – 87,5) 71 86

[87,5 – 90,5) 46 89

[90,5 – 93,5) 15 92

[93,5 – 96,5) 4 95

Totale 310

Tab. 4b – Distribuzione di frequenze del peso (Kg) di una casistica di 310 soggetti affetti da diabete manifesto

9,83 310

495...2277474371

Page 21: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

PROPRIETA’ FONDAMENTALI DELLA MEDIA ARITMETICA

1. La somma di tutti gli scarti dalla media aritmetica è nulla

2. La somma dei quadrati degli scarti,

qualunque sia il valore a, assume il suo minimo per

3. Indicato con a1 il valore più piccolo della distribuzione e

con an quello più grande, si ha

ossia la media aritmetica è non esterna all’intervallo (a1, an )

01

n

i

ix

2

1

n

i

i ax

a

nxx 1

Page 22: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

La media aritmetica è la più nota e facile da calcolare.

Viene sempre utilizzata salvo che in presenza di:

• dati non quantitativi

• misure di ordine di grandezza molto diverse es. 0,8 7 58 124

• valori estremi molto scostati o indeterminati es. 28 34 22,5 299

• valori estremi indeterminati o infiniti es. 9 6 4 7 >100

• distribuzioni di frequenza con classi aperte

Page 23: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

MEDIA ARITMETICA PONDERATA

E’ una media aritmetica che attribuisce ad ogni valore un peso o importanza diversa. Nei casi più semplici il peso è costituito dalla frequenza dei singoli valori, in altri frangenti è determinato dall’importanza che si vuole o si deve attribuire a ciascun valore.In generale la media aritmetica dei valori x1, x2 , … , xk con i pesiπ1, π2 , … , πk è data da

k

kkxxx

...

...

21

2211

Page 24: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Corso integrato di

Infermieristica materno-infantileVoto Crediti Ore

Pediatria generale e specialistica 27 1,2 18

Ginecologia ed ostetricia 21 1,2 18

Infermieristica pediatrica e neonatale 30 0,6 9

Totale 3 45

2,256,02,12,1

6,0302,1212,127 PONDERATA ARITMETICA

263

302127

MEDIA

ARITMETICAMEDIA

Esempio di calcolo della media aritmetica ponderata

Page 25: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Esercizio 1 (d)Corso di Statistica 3

Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°

Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta, registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse, (a). si dica se e’quantitativa o qualitativa, discreta o continua.(b). dopo aver definito opportunamente le classi di modalita’, calcolare(c) le frequenze assolute e le frequenze relative;(d) la media aritmetica di X;(e) la moda, la mediana.

Media Aritmetica: 2,1

può essere calcolata in 3 modi differenti

Page 26: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di StatisticaCorso di Statistica 3

Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°

Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

(d) Xi ni fi

1 3 0,3

2 4 0,4

3 2 0,2

4 1 0,1

Tot 10 1

1,2)1,04()2,03()4,02()3,01(

1,210

)14()23()42()31(

10

1,210

2312143221

10

4

11

4

11

10

11

iii

n

iii

iii

n

iii

ii

N

ii

fxfx

nx

N

nx

x

N

x

Page 27: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

LA MEDIA GEOMETRICA

Si preferisce utilizzare la media geometrica per i dati

distribuiti su diversi ordini di grandezza e quando i dati

appaiono legati tra loro da un fattore moltiplicativo

(esempio di successione geometrica del fattore

moltiplicativo 2: 2, 4, 8, 16, 32, 64…).

La media geometrica non è altro che la radice ennesima

del prodotto delle N osservazioni.

Page 28: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

MEDIA GEOMETRICA PER DISTRIBUZIONI UNITARIE

n

n

i

in xn xxxMG

1

21 ...

La media geometrica della distribuzione unitaria x1,x2,…,xn ,

in cui le x1,x2,…,xn sono tutte positive, è la radice n-esima del

prodotto x1,x2,…,xn

Page 29: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

MEDIA GEOMETRICA PER DISTRIBUZIONI IN CLASSI

Si utilizza in caso di distribuzioni in classi o

osservazioni ripetute

Nota: la media geometrica non ha significato in presenza

di valori nulli o negativi

N fn

f nxxMG ......1

1

Page 30: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Esempio di applicazione della media geometrica

Consideriamo tre valori

10, 100, 1000

3703

1110

3

100010010

100100010010101010

...

33 32

1

21

n

n

i

in xn xxxMG

Page 31: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

MEDIA ARMONICA

n

i ix

nMA

1

1

La media armonica della quantità a1,a2,…,an è l’inverso della

media aritmetica degli inversi nxxx

1,...,

1,

1

21

La media armonica è definita come il reciproco della media aritmetica dei reciproci delle misure.

Tale media trova una applicazione nella valutazione dei tempi di reazione o di risposta (in prove di sopravvivenza post operatoria).In genere si utilizza per i fenomeni che dovrebbero preferibilmente esaurirsi in un arco di tempo definito.

Page 32: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

RELAZIONI TRA LE MEDIE ANALITICHE

Tra le medie aritmetica, geometrica e armonica, calcolate su una stessa serie di misure, esiste la relazione:

dove il caso di uguaglianza vale solo nel caso in cui le osservazionisiano tutte uguali.

MGMA

Page 33: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

SCHEMA DI UTILIZZO DEGLI INDICI DI TENDENZA CENTRALE RISPETTO ALLA TIPOLIGIA DI CARATTERE

Caratteri quantitativi

Caratteri qualitativi

Medie analitiche

Aritmetica si no

Geometrica si no

Armonica si no

Indici di posizione

Moda si si

Mediana si si

Quantili si si

Page 34: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

In presenza di misure non quantitative non è possibile applicare le medie analitiche.

In alternativa sono state introdotte le medie di posizione:

Moda

Mediana

Quantili

INDICI DI POSIZIONE

Page 35: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

LA MODA

La moda è l’indice di tendenza centrale che minimizza le perdite di informazioni.

In alcune distribuzioni può accedere che siano presenti una o più mode all’aumentare del numero di osservazioni: distribuzioni unimodale, bimodale, plurimodale

La moda è un indice di tendenza centrale che individua il gruppo o il dato che compare con maggior frequenza

Per caratteri qualitativi:

Per caratteri quantitativi:

la moda è la modalità che si presenta con maggior frequenza

la moda è il valore che si presenta con maggior frequenza

Page 36: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Dove:

Nel caso di distribuzioni in classi di diversa ampiezza

la classe modale è quella con la più alta densità di frequenza

(la frequenza assoluta in rapporto all’ampiezza della classe)

Per le distribuzioni in classi di uguale ampiezza, si

calcola la classe modale come segue:

successiva la e modale classe della frequenza la tradifferenza

precedente la e modale classe della frequenza la tradifferenza

modale classe della ampiezzac

modale classe della inferiore confine

moda

2

1

21

1

1

1

L

cL

Page 37: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Cause di morte Frequenze assolute

Tumori 315

Malattie sistema circolatorio 418

Malattie sistema respiratorio 82

Malattie sistema digerente 49

Non definite 19

Accidentali 57

La moda è “Malattie sistema circolatorio”

1° Esempio di calcolo della moda (carattere qualitativo)

Page 38: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Tab. 5 - Distribuzione dei mesi secondo le ore di straordinario effettuate da un infermiere di un ospedale

Ore di lavoro straordinarioFrequenza

assoluta

Frequenza

relativa

0 1 0,083

5 2 0,167

7 3 0,250

10 3 0,250

11 1 0,083

12 2 0,167

Totale 12 1

La prima moda è “7”, la seconda moda è “10”

2° Esempio di calcolo della moda (carattere quantitativo)

Page 39: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Classi peso Frequenza assoluta Valore centrale

[69,5 – 72,5) 3 71

[72,5 – 75,5) 4 74

[75,5 – 78,5) 22 77

[78,5 – 81,5) 53 80

[81,5 – 84,5) 92 83

[84,5 – 87,5) 71 86

[87,5 – 90,5) 46 89

[90,5 – 93,5) 15 92

[93,5 – 96,5) 4 95

Totale 310

4,83371925392

53925,81

84,5-81,5

21

1

1

cL moda -

modale classe -

3° Esempio di calcolo della classe modale e della moda in una distribuzione in classi (classi della stessa ampiezza)

Page 40: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Numero posti letto Frequenza assoluta

Ampiezza della classe

Densità di frequenza

26-50 251 25 10,04

51-100 368 50 7,36

101-150 288 50 5,76

151-200 159 50 3,18

201-300 304 100 3,04

301-500 173 200 0,87

501-800 99 300 0,33

La classe modale apparente è “51-100”

La classe modale corretta è “26-50”

Tab. 6 - Strutture di degenza classificate in base al numero di posti letto

300

9933,0

4° Esempio di calcolo della classe modale in una distribuzione in classi (classi con ampiezze diverse)

Page 41: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Individuare la moda nelle seguenti rappresentazioni grafiche:

Page 42: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

LA MEDIANA

La mediana per definizione occupa il valore centrale in una serie ordinata di dati.

Le osservazioni vengono separate dal valore mediano in due parti numericamente uguali, il 50% con valori inferiori e il 50% con valori superiori.

La mediana non risente dei valori estremi di una serie ordinata ed è preferita in tali casi alla media aritmetica.

Page 43: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Il procedimento di calcolo della mediana

passa per 3 fasi:

1. ordinamento dei dati in modo crescente

2. calcolo della posizione della mediana

3. identificazione del valore corrispondente a tale posizione

Page 44: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Per il calcolo della posizione mediana bisogna tener conto della numerosità delle osservazioni n

Se n è dispari si avrà una sola posizione mediana

Se n è pari si avranno due posizioni mediane

12

2

2

1

n

n

n

La mediana è data dal “valore/modalità/classe” corrispondente alla posizione mediana (o alle posizioni mediane).

Page 45: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

LA MEDIANA PER CARATTERI QUALITATIVI:

1. Nel caso di distribuzioni qualitative unitarie: dopo aver ordinato i dati, se la numerosità delle

osservazioni è dispari, la mediana è data dalla modalità corrispondente alla posizione mediana

quando la numerosità del collettivo è dato da un numero pari, se i due posti centrali sono occupati da dati relativi ad una stessa modalità, questa è la mediana; altrimenti le modalità relative ai due dati che occupano i posti centrali sono dette “modalità mediane”

2. Nel caso di distribuzioni di frequenza, le modalità sono già ordinate, quindi si procede all’identificazione della classe mediana, nella quale cade l’osservazione mediana, avvalendosi delle frequenze cumulate della distribuzione.

Page 46: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Paziente Età Sesso Titolo di studio …

1 54 M Nessun titolo …

2 57 F Laurea …

3 62 F Laurea …

4 46 F Nessun titolo …

5 39 F Diploma …

6 54 M Licenza elementare …

7 57 F Licenza elementare …

8 60 M Nessun titolo …

9 51 F Licenza media …

1° Esempio di calcolo della mediana (carattere qualitativo)

dispari) numero( 9n

Page 47: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Posizione Titolo di studio

1 Nessun titolo

2 Nessun titolo

3 Nessun titolo

4 Licenza elementare

5 Licenza elementare

6 Licenza media

7 Diploma

8 Laurea

9 Laurea

Paziente Titolo di studio

1 Nessun titolo

2 Laurea

3 Laurea

4 Nessun titolo

5 Diploma

6 Licenza elementare

7 Licenza elementare

8 Nessun titolo

9 Licenza media

"ELEMENTARELICENZA " è mediana La 52

19

2

1

dispari) numero( 9n

n

IN O

RD

INE

CR

ES

CE

NT

E

Page 48: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Paziente Età Sesso Livello Creatininemia …

1 54 M Basso …

2 57 F Basso …

3 62 F Alto …

4 46 F Medio …

5 39 F Medio …

6 54 M Basso …

7 57 F Medio …

8 60 M Medio …

9 51 F Alto …

10 54 F Alto …

2° Esempio di calcolo della mediana (carattere qualitativo)

pari) numero( 10n

Page 49: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Posizione Livello Creatininemia

1 Basso

2 Basso

3 Basso

4 Medio

5 Medio

6 Medio

7 Medio

8 Alto

9 Alto

10 Alto

PazienteLivello

Creatininemia

1 Basso

2 Basso

3 Alto

4 Medio

5 Medio

6 Basso

7 Medio

8 Medio

9 Alto

10 Alto

Medio"" è Mediana La

Medio"" é entecorrispond modalità la 612

101

2

Medio"" é entecorrispond modalità la 52

10

2

pari) (numero 10 n

n

n

IN O

RD

INE

CR

ES

CE

NT

E

Page 50: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Paziente Età Sesso Umore …

1 54 M Buono …

2 57 F Buono …

3 62 F Ottimo …

4 46 F Ottimo …

5 39 F Normale …

6 54 M Basso …

7 57 F Discreto …

8 60 M Buono …

9 51 F Discreto …

10 54 F Basso …

3° Esempio di calcolo della mediana (carattere qualitativo)

pari) numero( 10n

Page 51: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Posizione Umore

1 Basso

2 Basso

3 Normale

4 Discreto

5 Discreto

6 Buono

7 Buono

8 Buono

9 Ottimo

10 Ottimo

Paziente Umore

1 Buono

2 Buono

3 Ottimo

4 Ottimo

5 Normale

6 Basso

7 Discreto

8 Buono

9 Discreto

10 Basso

Buono"" e Discreto"" sono mediane modalità Le

Buono"" é entecorrispond modalità la 612

101

2

Discreto"" é entecorrispond modalità la 52

10

2

pari) (numero 10 n

n

n

Page 52: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Titolo di studio Frequenza assoluta

Nessun titolo 1.862

Licenza elementare 9.903

Licenza media 4.491

Diploma 3.093

Laurea 1.160

Totale 20.509

4° Esempio di calcolo della mediana (carattere qualitativo) in una distribuzione di frequenza

Page 53: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Titolo di studio Frequenza assoluta

Frequenza assoluta cumulata

Nessun titolo 1.862 1.862

Licenza elementare 9.903 11.765

Licenza media 4.491 16.256

Diploma 3.093 19.349

Laurea 1.16020.509

Totale 20.509

1.862 + 9.903

1.862 + 9.903 + 4.491

1.862

"ELEMENTARELICENZA " è mediana La 255.102

1509.20

2

1

dispari) numero( 509.20n

n

La modalità “licenza elementare” è la mediana.La mediana della distribuzione è la modalità relativa al dato statistico che nell’ordinamento stabilito occupa il posto di mezzo.

Page 54: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

LA MEDIANA PER CARATTERI QUANTITATIVI:

1. Nel caso di una serie di misure singole e ordinate (o caratteri continui) per n dispari la mediana

corrisponde al valore in posizione

per n pari la mediana

si colloca tra le due posizioni centrali e

(si parla di modalità mediane)

il valore mediano viene calcolato come media aritmetica dei valori corrispondenti a queste due posizioni

2

1n

2

n1

2n

Page 55: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

2. Per le distribuzioni in classi si identifica la classe mediana; nel caso di classi di uguali ampiezza si calcola il valore mediano tra quelli compresi nell’intervallo di classe utilizzando la formula:

mediana classe della frequenza

mediana classe la precedono che classi delle cumulata frequenza

mediana classe della ampiezzac

mediana classe della inferiore confine

2 mediana

1

1

med

cum

med

cum

f

f

L

cf

fn

L

Page 56: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Paziente Sesso Età PA diastolica

(mmHg)

PA sistolica (mmHg)

1 M 63 70 110

2 F 56 90 95

3 F 48 80 130

4 F 48 85 85

5 M 50 70 95

6 F 54 70 85

7 M 58 65 100

8 M 67 90 130

9 F 61 90 85

5° Esempio di calcolo della mediana (carattere quantitativo)

Page 57: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Posizione PA sistolica

(mmHg)

1 85

2 85

3 85

4 95

5 95

6 100

7 110

8 130

9 130

52

19

2

1

n“95” è la modalità mediana

50%

50%

IN O

RD

INE

CR

ES

CE

NT

E

Page 58: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Classi peso Valore centrale Frequenza assoluta

Frequenza cumulata

[69,5 – 72,5) 71 3 3

[72,5 – 75,5) 74 4 7

[75,5 – 78,5) 77 22 29

[78,5 – 81,5) 80 53 82

[81,5 – 84,5) 83 92 174

[84,5 – 87,5) 86 71 245

[87,5 – 90,5) 89 46 291

[90,5 – 93,5) 92 15 306

[93,5 – 96,5) 95 4 310

Totale 310

9,83392

821555,812 mediana 1

cf

fn

Lmed

cum

6° Esempio di calcolo della mediana nel caso di una distribuzione in classi

Page 59: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Esercizio 1 (e.)Corso di Statistica 3

Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°

Lunghez. in cm 1 2 2 3 4 1 2 1 3 2

Moda = 2

Mediana: dopo aver ordinato in senso crescente le unità

calcoliamo le due posizioni mediane n/2 = 5 (n/2)+1 = 6, al posto 5 e 6 corrispondono i valori 2 e 2, Trattandosi di un carattere qualitativo si fa la media aritmetica dei due valori mediani: Me= 2

Foglie 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°

Lunghez. in cm 1 1 1 2 2 2 2 3 3 4

(e)

Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta, registrate al centimetro piu’ prossimo. Si definisca la variabile X di interesse, (a). si dica se e’quantitativa o qualitativa, discreta o continua.(b). dopo aver definito opportunamente le classi di modalita’, calcolare(c) le frequenze assolute e le frequenze relative;(d) la media aritmetica di X;(e) la moda, la mediana.

Page 60: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

I QUANTILI

I quantili sono un’estensione della mediana. I quantili suddividono la distribuzione in q distribuzioni parziali, aventi ognuno la q-esima parte della numerosità totale.

I più utilizzati sono sono i :

Percentili/Centili con q = 100Decili con q = 10Quartili con q = 4

Il quartile divide la distribuzione in quattro parti, aventi ognuna il 25% della numerosità

Page 61: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

I° Quartile ripartisce la distribuzione in due distribuzioni, la prima costituita dal 25% della distribuzione complessiva, l’altra dal 75%

2° Quartile coincide con la Mediana

3° Quartile ripartisce la distribuzione in due distribuzioni, la prima costituita dal 75% della distribuzione complessiva, l’altra dal 25%

Il procedimento di calcolo è simile al calcolo della mediana:

Quantili Decili Percentili

14

Ni

Qi 110

Ni

Di 1

10 N

iPi

Page 62: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

Le possibili relazioni tra i valori medi di una distribuzione dipendono dalla sua forma e nel caso di una distribuzione unimodale si presentano tre casi:

1_curva simmetrica media = moda = mediana

2_curva obliqua a destra, con asimmetria positiva (a destra)

moda < mediana < media

3_In una curva obliqua a sinistra, con asimmetria negativa (a sinistra)

media < mediana < moda

RELAZIONI TRA INDICI DI TENDENZA CENTRALE

Page 63: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

RELAZIONI TRA INDICI DI TENDENZA CENTRALE

Le code (estremi della distribuzione) sono uguali;

La coda di destra è più lunga di quella di sinistra;

La coda di sinistra è più lunga di quella di destra.

Page 64: 3_DISPENSA - Indici Di Tendenza Centrale 2010-2011

Corso di Statistica

INDICI DI TENDENZA CENTRALE E LORO UTILIZZAZIONE

IN RELAZIONE ALLA SCALA DI MISURA DEI DATI

INDICI DI TENDENZA

CENTRALE UTILIZZABILI

Qualitativi sconnessi moda

Qualitativi ordinati indici di posizione

Quantitativi medie analitiche, indici di posizione