LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica...

52
LIBRO – BIOSTATISTICA [Pagano- Gauvreau] Pag Parag. Argomento 33 3. Misure di sintesi numerica 33 3.1 Misure di tendenza centrale 33 3.1.1 Media 35 3.1.2 Mediana 35 3.1.3 Moda 37 3.2 Misure di dispersione 37 3.2.1 Campo di variazione (Range) 37 3.2.2 Campo di variazione inter quartile (Range inter quartile). 38 3.2.3 Varianza e Deviazione standard 40 3.2.4 Coefficiente di variazione 41 3.3 Dati raggruppati 41 3.3.1 Media raggruppata 42 3.3.2 Varianza raggruppata 43 3.4 Disuguaglianza di Chebychev 44 3.5 Altre applicazioni

Transcript of LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica...

Page 1: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

LIBRO – BIOSTATISTICA [Pagano-Gauvreau]

Pag Parag. Argomento 33 3. Misure di sintesi numerica 33 3.1 Misure di tendenza centrale 33 3.1.1 Media 35 3.1.2 Mediana 35 3.1.3 Moda 37 3.2 Misure di dispersione 37 3.2.1 Campo di variazione (Range)

37 3.2.2 Campo di variazione inter quartile (Range inter quartile).

38 3.2.3 Varianza e Deviazione standard 40 3.2.4 Coefficiente di variazione 41 3.3 Dati raggruppati 41 3.3.1 Media raggruppata 42 3.3.2 Varianza raggruppata 43 3.4 Disuguaglianza di Chebychev 44 3.5 Altre applicazioni 48 3.6 Esercizi

Page 2: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

SintassiSintassi

Media aritmetica  Media aritmetica 

Media GeometricaMedia Geometrica

Media ArmonicaMedia Armonica

mediana mediana

modamoda

STATISTICA DESCRITTIVASTATISTICA DESCRITTIVA

frattili e percentili frattili e percentili

intervallo di intervallo di

variazionevariazione

varianzavarianza

deviazione standard

intervallo

interquartile

Obiettivi della lezione: CENTRO DI UNA DISTRIBUZIONE

quale misura di posizione usare?

Page 3: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Frequenza assoluta:

j0 n N

Si considerino N=60 dati da analizzare. I dati vengono suddivisi in un numero M=8 opportuno di classi; per ogni classe si ha, per j=1,2,…,M ,

Frequenza relativa:

jj

nf (x )

N

j0 f (x ) 1

M

=j

j=1n N

M M

j

jj 1 j 1

nf (x ) 1

N

Sintassi (1)Sintassi (1)Dato un insieme di N elementi {x1, x2, ... xN}

nj numero di elementi di tipo j-esimo

51 49.4 49 52.5 51.5 51.8 55 50.2 50.3 47.746.5 47.8 49.7 44.5 49.8 53 50.2 53.4 47.4 50.548.7 50 52.9 50.8 46.2 48.9 44.4 49.2 50.5 49.554.5 48.2 48.9 51.2 49.5 56.3 54 46.5 51.5 50.946 52.2 47 50.8 50 52.5 48.5 52.9 53.8 50.5

51.2 51.1 54.7 52.3 48.2 50.8 51.7 51.6 49.5 52.7

51 49.4 49 52.5 51.5 51.8 55 50.2 50.3 47.746.5 47.8 49.7 44.5 49.8 53 50.2 53.4 47.4 50.548.7 50 52.9 50.8 46.2 48.9 44.4 49.2 50.5 49.554.5 48.2 48.9 51.2 49.5 56.3 54 46.5 51.5 50.946 52.2 47 50.8 50 52.5 48.5 52.9 53.8 50.5

51.2 51.1 54.7 52.3 48.2 50.8 51.7 51.6 49.5 52.7

Page 4: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Si dice media aritmetica semplice di N numeri il numero che si ottiene dividendo la loro somma per N.

1 2 Nx x xx

N

dato un insieme di n elementi {x1, x2, ... xN}

Centro di una distribuzioneCentro di una distribuzione

Page 5: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Si dice media aritmetica pesata

1 1 2 2 m m

1 2 m

x p + x p +...+ x px =

p + p +...+ p

dato un insieme di m elementi {x1, x2, ... xm}

, e dato un insieme di m di numeri reali {p1, p2, ... pm}

che utilizza un peso pj o la frequenza di ogni dato xj per j=1,…,m

Page 6: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

La media della lunghezza di un gruppo di f1= 7 neonati m1=48.0 cm

e di altri f2= 3 neonati m2=49.5 cm.  Per calcolare la media delle lunghezze dell'insieme totale di 10 neonati pur senza avere la conoscenza dei valori delle lunghezze individuali, si utilizzano le proprietà della media aritmetica : la somma delle lunghezze dei primi 7 è 48.0×7 = 336.0la somma delle lunghezze dei secondi 3 è 49.5×3 = 148.5la somma delle lunghezze di tutti i 10 è = 484 .5

La media della lunghezza di tutti i 10 neonati è = 484.5/10 = 48.45

Ovvero Media = (f1×m1 + f2×m2)/(f1+ f2) 

Media = (7×48.0 + 3×49.5)/(7+3)

Esempio di media pesataEsempio di media pesata

Page 7: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

la media aritmetica dei primi 6 valori di lunghezza di 6 neonati è: = (51.0+49.4+49.0+52.5+51.5+51.8)/6 = 305.2/6 = 50.87

 la media aritmetica di tutti i 60 valori di lunghezza è:

= (55.9+51.3+53.0+50.5+54.9+53.4+…+53.8)/60 = 3021.8 /60

= 50.363

x

x

La media aritmetica di N dati distinti è …

N

ii 1

xx

N

esempio di media aritmetica

esempio di media aritmetica

Lunghezza(cm) in un campione di 60 neonati.

51.0 49.4 49.0 52.5 51.5 51.846.5 47.8 49.7 44.5 49.8 53.048.7 50.0 52.9 50.8 46.2 48.954.5 48.2 48.9 51.2 49.5 56.346.0 52.2 47.0 50.8 50.0 52.551.2 51.1 54.7 52.3 48.2 50.855.0 50.2 50.3 47.7 48.5 53.850.2 53.4 47.4 50.5 51.7 49.544.4 49.2 50.5 49.5 52.9 50.554.0 46.5 51.5 50.9 51.6 52.7

Page 8: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

45.0 2 46.5 5 ... 57.0 1 3022.5

x 50.3752 3 ... 1 60

MEDIA per dati

raggruppati

in classi

limiti di classe xi f(xj) f(xj) xif(xj)44.25- 45.75 45.0 2 0.0333 90.045.75- 47.25 46.5 5 0.0500 232.547.25- 48.75 48.0 7 0.2000 336.048.75- 50.25 49.5 14 0.2500 693.050.25- 51.75 51.0 16 0.2330 816.051.75- 53.25 52.5 9 0.1667 472.553.25- 54.75 54.0 5 0.0833 270.054.75- 56.25 55.5 1 0.0666 55.556.25- 57.75 57.0 1 0.0167 57.0

60 1.00 3022.5

ALTEZZA(cm) di un campione di 60 neonati.

Nell'esempio del campione di 60 misure di lunghezza dei neonati:

La media per dati raggruppati in m classi è …

m

j jj=1

m

jj=1

x f(x )

x=f(x )

se f(xi) indica le frequenze assolute,

se f(xi) indica le frequenze relative.

m

jj=1

f(x )=N

1

1m

jj

f ( x )

dove m è il numero di classi e ,

oppure

Page 9: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Dalla definizione consegue che la somma degli scarti di ogni elemen-to del campione dalla media aritmetica è 0:

In questo senso la media rappresenta il baricentro della distribuzione.

m

j jj 1

(x x) f(x ) 0

m m

j j jj 1 j 1

x f(x ) Somma _Totale x f(x )

Per molte variabili (es.: statura adulta, emoglobinemia), il baricentro si trova dove si addensano i valori e si può considerare un valore tipico della variabile.

proprietà della media aritmeticaproprietà della media aritmetica

Nota: valgono anche le seguenti relazioni:

m

j jj=1

m

jj=1

x f(x )

x=f(x )

Page 10: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Media Aritmetica

Per effettuare la correzione di errori accidentali.

Permette di sostituire i valori di ogni elemento senza cambiare il totale.

Sostituzione di valori NULL

Monotona crescente

Page 11: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Si dice mediana il valore che occupa il posto centrale in una distribuzione statistica di frequenza i cui valori sono disposti in ordine crescente

La media aritmetica è la misura di posizione più usata ma. A volte, altre misure come la mediana e la moda si dimostrano utili.

… centro di una distribuzione : LA MEDIANA

… centro di una distribuzione : LA MEDIANA

Page 12: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Si consideri un campione di valori di VES (velocità di eritrosedimen-tazione, mm/ora) misurati in 7 pazienti

{8, 5, 7, 6, 35, 5, 4}

In questo caso, la media ( = 10 mm/ora) non è un valore tipico della distribuzione: soltanto un valore su 7 è superiore alla media!

x

Per calcolare la mediana si dispongono i dati in ordine crescente:ordine originale: {8, 5, 7, 6, 35, 5, 4} ordine crescente: {4, 5, 5, 6, 7, 8, 35}

media aritmetica e medianamedia aritmetica e mediana

Conviene usare come indice del centro la mediana, definita come quel valore che divide a metà la distribuzione, sicché l'insieme dei valori è per metà minore e per metà maggiore della mediana.

Page 13: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Se n è dispari, la mediana è il valore che occupa la posizione (n+1)/2 nell'insieme ordinato.

 

Nell'esempio, poiché (n+1)/2=4, la mediana è 6 mm/ora, ed è tipica nel senso che si avvicina a buona parte dei valori del campione.

 

Se n è pari, la mediana è la media dei valori che occu pano le posizioni (n/2) ed [(n/2)+1] nell'insieme ordinato dei numeri.

Se, nell'esempio, si esclude il valore più alto, si ottiene l'insieme ordinato {4, 5, 5, 6, 7, 8},

(n/2)=3 e [(n/2)+1]=4, e la mediana vale (5+6)/2=5.5.

medianamediana

Page 14: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

mediana

La mediana è semplicemente il dato centrale della distribuzione. Dopo aver disposto i dati in ordine crescente la mediana è quel

valore che lascia alla sua sinistra e alla sua destra un ugual numero di termini.

51 49.4 49 52.5 51.5 51.8 55 50.2 50.3 47.746.5 47.8 49.7 44.5 49.8 53 50.2 53.4 47.4 50.548.7 50 52.9 50.8 46.2 48.9 44.4 49.2 50.5 49.554.5 48.2 48.9 51.2 49.5 56.3 54 46.5 51.5 50.946 52.2 47 50.8 50 52.5 48.5 52.9 53.8 50.5

51.2 51.1 54.7 52.3 48.2 50.8 51.7 51.6 49.5 52.7

mediana non è tra 54.5 e 49.5 cm di lunghezza

[=(54.5 + 49.5)/2= 52.0]

Page 15: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Il 30° e il 31° valore nella serie ordinata è di 50.5 e 50.5 giorni: la mediana è perciò 50.5

Nota Bene La mediana NON è il valore intermedio tra i valori di lunghezza del 30mo e 31mo neonato esaminato, ma il valore intermedio tra la 30ª e 31ª osserva-zione, dopo aver ordinato i dati in verso crescente.

mediana

44.4 44.5 46.0 46.2 46.5 46.5 47.0 47.4 47.7 47.8 48.2 48.2 48.5 48.7 48.9 48.9 49.0 49.2 49.4 49.5 49.5 49.5 49.7 49.8 50.0 50.0 50.2 50.2 50.3 50.5 50.5 50.5 50.8 50.8 50.8 50.9 51.0 51.1 51.2 51.2 51.5 51.5 51.6 51.7 51.8 52.2 52.3 52.5 52.5 52.7 52.9 52.9 53.0 53.4 53.8 54.0 54.5 54.7 55.0 56.3

Page 16: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

limiti di classe Xj f(xj) f(xj) NjF(xj)

44.25- 45.75 45.0 2 0.0333 2 0.033345.75- 47.25 46.5 5 0.0233 5 0.116747.25- 48.75 48.0 7 0.1167 14 0.233348.75- 50.25 49.5 14 0.2333 28 0.466750.25- 51.75 51.0 16 0.2667 44 0.733351.75- 53.25 52.5 9 0.1500 53 0.883353.25- 54.75 54.0 5 0.0833 58 0.966754.75- 56.25 55.5 1 0.0167 59 0.983356.25- 57.75 57.0 1 0.0167 60 1

j j-1

50 j-1j j-1

w 0.50 (x )x =x

(x ) (x )

F

F F

Mediana

= 50.25

Mediana per dati raggruppati in classi Mediana per dati raggruppati in classi

.4667)-(.73330.4667)(0.50*1.5

50.25

Page 17: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

0.4

0.5

0.6

0.7

0.8

0.9

48.75 50.25 51.75 53.25

freq

uen

za r

elat

iva

cum

ula

ta

wj =xj -xj -1

F(xj)

F(xj-1)

f(xj)

xj-1 xj

?

wj

interpolazione lineare della MEDIANA

Page 18: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Mediana=

1.5 (50.00-46.66)50.25

26.67= 50.25

Mediana per dati raggruppati in classi Mediana per dati raggruppati in classi

Page 19: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Una delle leggi fondamentali della fisiologia afferma che la risposta eccitatoria di un organismo ad uno stimolo è proporzio-nale al logaritmo dello stimolo:

Legge di Weber-Fechner: Risposta log(stimolo)

Tale legge è valida anche in altri ambiti, quali la farmaco logia (l'effetto di un principio attivo è proporzionale non alla sua dose ma al logaritmo della dose), la microbiologia, l'enzimologia e l'immunologia.

Media geometricaMedia geometrica

Page 20: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Si riportano i valori (ng/ml) di concentrazione minima di penicillina-G inibente la Neissaria gonorrhoeae (MIC) presente nell'urina di 7 pazienti:

{31.25, 62.5, 125, 250, 500, 1000, 2000}. 

Tali dati risentono del fatto che il metodo di determinazione della MIC è basato su diluizioni (1:1) successive della concentrazione iniziale di penicillina G (si noti che la differenza tra 31.25 e 62.5 è la metà di quella tra 62.5 e 125, e così via).

Esempio di media geometricaEsempio di media geometrica

In scala logaritmica,invece, le differenze tra le concentrazioni log10(MIC)

sono uguali:

{1.495, 1.796, 2.097, 2.398, 2.699, 3.000, 3.301}

e la media aritmetica dei logaritmi è (2.398) e coincide con il logaritmo della mediana

La media aritmetica (566.96) risente dei valori più alti ed è più del doppio della mediana (250).

Page 21: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Neisseria gonorrhoeae Neisseria gonorrhoeae (NG) is a Gram-negative diplococcus

that commonly infects the mucosa of the urethra, cervix, rectum, and throat.

It frequently presents as an uncomplicated, symptomatic infection at one or more of these sites.

In women, untreated lower genital tract infection, which more often may be asymptomatic, may progress to pelvic inflamma-tory disease (PID).

Repeated cases of PID increase the risk for chronic pelvic pain, ectopic pregnancy, and infertility

Page 22: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Si dice media geometrica l'antilogaritmo della media aritmetica dei logaritmi:

Media geometricaMedia geometrica

Y

0 500 1000 1500 2000

scala aritmeticamedia aritmetica

mediana

1000 10000 100000 100000010050 100050010 5000l l l

scala logaritmica

mediana

media geometrica

1

nii

g

log xx antilog

n

Page 23: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Media geometricaMedia geometrica

Dalla definizione di logaritmo si ricava che la media geometrica di n valori si può calcolare come radice n-ma del loro prodotto:

n

n

=1iig xx

Nell'esempio: antilog10(2.398)=250.034

1677 31.25 62.5 ... 2000 6.103516 10 250

dove la differenza è dovuta ad errori di arrotondamento.

Page 24: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Tasso di incremento di colture di batteriSe il tasso di incremento in 4 giorno consecutivi risulta pari a 1.75, 2.0, 1.5, 1.25, quale è il tasso medio di incremento?

Giorno 1 2 3 4

Tasso incr. 1.75 2 1.5 1.25

N° batt eff. 1750 3500 5250 6562

N° batt calc 1601 2562 4102 6562

4 1.75 2 1.5 1.25 1.6005429gx

Page 25: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

media di N proporzioni

Esempio:P1= 0.1% ed P2=0.05% ovveroP1=1/10 e p2=1/20 hanno media aritmetica 3/40 ovvero PMEDIA= 0.075

La Media armonica MH e’ = 1/15

H

N1

M

1

N

p1

...p1

HM.. 1

1

15

20501

101

… centro di una distribuzione : Media Armonica

… centro di una distribuzione : Media Armonica

Page 26: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Media Armonica:Costo medio di prodotti confezionati

Avendo speso 24 euro nell’acquisto di confezioni del costo di 4 euro, ed altrettanto per l’acquisto di confezioni del costo di 6 euro ed ancora per l’acquisto confezioni del costo di 8 euro.

Quale sarà il prezzo medio globale?

35.538

1 1 14 6 8

ax

Page 27: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Problema di Briatore

Una macchina da corsa esegue un giro di pista a 100 km/ora ed un secondo giro di pista a 300 km/ora.

Qual è stata la sua velocità media ?

A voi la risposta … … … … …

Page 28: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Problema di Briatore risposta)

Una macchina da corsa esegue un giro di pista a 100 km/ora ed un secondo giro di pista a 300 km/ora.

Qual è stata la sua velocità media ?

A voi la risposta … 2/(1/100+1/300)= 150… … … …

Page 29: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Media Armonica (Una gita in montagna )

•Ieri è partito alle 3 del pomeriggio ha fatto un bel tratto piano, poi è salito su un monte, ne è ridisceso ed è ritornato a casa alle 9 di sera senza fermarsi.

•Nei tratti piani avanza a 8 chilometri l'ora ed è facile stargli dietro, ma anche su una salita ripida, come quella di ieri, mantiene una media di 6 km/h.

• In discesa, poi allunga il passo e fa 12 Km/ora, senza stancarsi mai.

•Quanti chilometri era lunga la gita di mio suocero ?

•A che ora era sulla cima del monte (mezz'ora più o meno)?

Mio suocero è un buon camminatore. È capace di fare gite lunghissime cammi-nando sempre con quel suo passo svelto ed instancabile. Ieri …

Page 30: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Risposte & riflessioni (Una gita in Montagna )

Supponiamo che la salita fosse di 6 km.

Avrebbe impiegato un'ora a salire e mezz'ora a scendere.

Quindi nel tratto in salita/discesa avrebbe percorso 12 km in un'ora e mezza. La sua velocità media, quindi sarebbe stata di 8 km/h, come sul piano.

Pertanto lui ha camminato sempre ad una velocità media di 8km/h.

Partito alle tre e tornato alle nove di sera, ha camminato per 48 km. Se il tratto fosse stato tutto piano, si sarebbe trovato a tornare indietro dopo 3 ore. Se il tratto fosse stato tutto in salita si sarebbe trovato a tornare indietro dopo 4 ore. Pertanto, se diciamo che dopo 3 ore e mezza era sulla cima, abbiamo risposto correttamente.

Per gli amanti della statistica ed i cultori di Chisini e della sua splendida defi-nizione di media, la velocità media nel tratto in salita e discesa si calcola con la media armonica, se vogliamo che la velocità media conservi i tempi di percorrenza.

Page 31: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

INFINE PER CHI NON è CONVINTO

La gita è lunga 48 km = x (in piano) + y (in salita)DATISpazio = vel*t , t = spazio / vel e vel=Spazio/tempo t1=x/8

t2=y/6

8*t1+6*t2+12*(t2/2)+8*t1=48 ovvero 4*t1+3*t2=12

quindi t2=(12-4*t1)/3

t1 t2 t1+t20 4 42 4/3 10/31 8/3 11/33 0 3

-------------------------------------------------

Y

X

Page 32: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Una distribuzione può essere descritta per mezzo dei suoi frattili.

Si dice frattile (sinonimi: centile, percentile e quantile) p-esimo di una distribuzione quel valore xp tale che la frequenza relativa cumulata F(xp )= p.

Ad esempio, il 50° centile di una distribuzione è il valore che, sull'asse dei numeri reali, ha alla sua sinistra il 50% dei valori della distribuzione, e coincide con la mediana.

Il 10° centile è il valore che ha alla sinistra il 10% della distribuzione.

Frattili di una distribuzioneFrattili di una distribuzione

Page 33: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Nei grafici cumulati, i valori riportati sull'asse verticale indicano la frequenza delle rilevazioni con valore pari o minore ai valori in corrispondenza sull'asse orizzontale

10090807060504030201000

Page 34: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

calcolo dei frattili Per il frattile di una seriazione di frequenza si ricorre all'interpolazione lineare

xj-1 e xj sono i limiti inferiore e superiore della classe …

F(xj) e F(xj-1) sono le frequenze cumulate della classe … e della classe

contigua precedente

f(xj) = F(xj)-F(xj-1) è la frequenza della classe …

wj = xj - xj-1 è l'ampiezza della classe…

… classe j che contiene il frattile

j j-1

p j-1j

w p F(x )x =x

f(x )

j-1 p j-1

j j

p F(x ) x x

f(x ) w

ricavabile dalla proporzione:

Page 35: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

una distribuzione in breve

Un insieme di dati può essere descritto con 5 frattili: la mediana, i quartili 1° e 3° , e due centili estremi (es.: il 10° ed il 90°).

Si danno così indicazioni su localizzazione, dispersione e forma della distribuzione.

limiti di classe xj f(xj) f(xj) Nj F(xj)44.25- 45.75 48.0 2 0.0333 2 0.03333345.75- 47.25 49.5 5 0.0500 5 0.11666747.25- 48.75 51.0 7 0.2000 17 0.23333348.75- 50.25 52.5 14 0.2500 32 0.46666750.25- 51.75 54.0 16 0.2330 46 0.73333351.75- 53.25 55.5 9 0.1667 56 0.88333353.25- 54.75 57.0 5 0.0833 61 0.96666754.75- 56.25 58.5 1 0.0666 65 0.98333356.25- 57.75 60.0 1 0.0167 66 1

Page 36: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Con riferimento all'esempio delle lunghezze dei

neonati:

25

1.5 (0.25-0.0758)x =47.25 =48.687

0.1818

50

1.5 ( 0.5 - 0.4648 ) x = 50.25 + = 50.250

0.2667

75

1.5 (0.75-0.6969)x =51.75 = 52.275

0.1515

10

1.5 (0.10-0.0758)x =47.25 =47.449

0.1818

90

1.5 (0.90-0.8448)x = 53.25 = 54.342

0.0758

25° centile= 1° quartile

10° centile

75°centile= 3° quartile

90° centile

50°centile= mediana

47.449 48.687 50.250 53.275 54.342

Page 37: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

0

25

50

75

100

47.25 48.75 50.25 51.75 53.25 54.75 56.25 57.75 59.25 60.75

F(x

)

cm

mediana

1° quartile

3° quartile

intervallointerquartile

47.449 8.687 50.250 53.275 54.342

Un indice di dispersione di uso comune è l'intervallo interquartile, dato dalla differenza tra 3° e 1° quartile (cioè tra 75° e 25° centile): tale intervallo contiene la metà dei valori inclusi nel campione, indipendentemente dalla forma della distribuzione della variabile.

l'intervallo interquartile

Page 38: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

L’efficienza e la immediatezza delle distribuzioni cumulative

Il primo quintile 40 verso 54 anni per il tumore al seno verso il tumore all’ovaio

Page 39: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Si dice moda di una distribuzione statistica di frequenza il valore che compare con la massima frequenza

… centro di una distribuzione : La Moda

… centro di una distribuzione : La Moda

Page 40: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Più di rado si incontra una terza misura di posizione, la moda; è il valore che si verifica più spesso (frequenza assoluta più elevata); la modalità della variabile in cui si registra il maggior numero di casi. Quanto sono usualmente lunghi i bimbi alla nascita?Guardando i dati a nostra disposizione, è subito evidente maggior numero (16) di bimbi è lungo tra i 50.3 cm e i 51.7 cm. la classe modale è dunque 50.25-51.75.

 Se la distribuzione ha più di due valori massimi o se la

frequenza più alta riscontrata nell’insieme considerato non supera di molto le altre la moda non è un buon indicatore di

tendenza centrale.

La ModaLa Moda

Page 41: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

amp = ampiezza della classe modale .

xinf = limite inferiore della classe modale

La moda di seriazioni statistiche

moda = xinf + ampD

D + D(-)

(-) (+)

Page 42: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Lunghezza supina (cm) in un campione di 60 neonati. Valori ottenuti con l'infantometro Harpenden.

La moda

1,5 16 1450,25+ = 50,583

16-14 16-9

Estremi Valore Freq Semplici Freq cumulatedi classe Centrale n % n %44.3-45.7 45.0 2 0.033333 2 0.03333345.8-47.2 46.5 5 0.083333 7 0.11666747.3-48.7 48.0 7 0.116667 14 0.23333348.8-50.2 49.5 14 0.233333 28 0.46666750.3-51.7 51.0 16 0.266667 44 0.73333351.8-53.2 52.5 9 0.15 53 0.88333353.3-54.7 54.0 5 0.083333 58 0.96666754.8-56.2 55.5 1 0.016667 59 0.98333356.3-57.7 57.0 1 0.016667 60 1

Nella classe 50.3-51.7 , piu’ vicino alla casse con freq=14

Page 43: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Il proprietario di una ditta afferma "Lo stipendio mensile nella nostra ditta è 2.700 euro"

Il sindacato dei lavoratori dice che “lo stipendio medio è di 1.700 euro”. L'agente delle tasse dice che “lo stipendio medio è stato di 2.200 euro”.

Queste risposte diverse sono state ottenute tutte dai dati della seguente tabella.

A quale misura di tendenza centrale ci riferiamo?

Stipendio mensile

N° di lavoratori

1.300 21.700 222.200 192.600 36.500 29.400 1

23.000 1

Media aritmetica= lire 2.700

Mediana = lire 2.200

Moda = lire 1.700

quale misura di posizione usare?quale misura di posizione usare?

Page 44: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

interpretazione delle misure di posizione

La media aritmetica indica che, se il denaro fosse distribuito in modo che ciascuno ricevesse la stessa somma, ciascun dipendente avrebbe avuto 2.700 euro

La moda ci dice che la paga mensile più comune è di 1.700.euro

La moda si considera spesso come il valore tipico dell'insieme di dati poiché è quello che si presenta più spesso. Non tiene però conto degli altri valori e spesso in un insieme di dati vi è più di un valore che corrisponde alla definizione di moda.

La mediana indica che circa metà degli addetti percepiscono meno di 2.200.euro, e metà di più.

La mediana non è influenzata dai valori estremi eventualmente presenti ma solo dal fatto che essi siano sotto o sopra il centro dell'insieme dei dati.

Page 45: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

In quale ordine si dispongono le misure di tendenza cetrale ?

Page 46: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

FINE DELL’ARGOMENTO MISURE DI TENDENZA

CETRALE

Page 47: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

La percentuale è una misura molto semplice e di facile comprensione Se ci dicono che il 10% della popolazione è composta da “Mancini” , è

facile calcolare che il 90% è costituita da “Destrimani” Immaginiamo quindi di classificare 1000 adolescenti in accordo alla

osservanza delle leggi: “Delinquenti” o “Rispettosi della Legge”.810 Osservanti Destri e 90 Delinquenti Destri , 80 Osservanti Mancini e 20 Delinqunti Mancini

A quale misura di tendenza centrale ci riferiamo?

Destrimani Mancini

Osservanti 810 80

Delinquenti 90 20

100 =10%La tabella non ci aiuta molto a capi-re il fenomeno: appare che siano più delinquenti i destrimani ?

quale misura di posizione usare?quale misura di posizione usare?

Page 48: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Passiampo alle percentuali

A quale misura di tendenza centrale ci riferiamo?

Destrimani Mancini Totale

Osservanti 91% [810] 9% [80] 100% [900]

Delinquenti 82% [ 90] 18% [ 20] 100% [ 100]

La tabella ci informa sulla probabilità

quale misura di posizione usare?quale misura di posizione usare?

Che ha un Osservante di essere mancino

Che ha un Delinquente di essere mancino

% RIGHE

Page 49: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

cambiamo il verso della proporzionalità

A quale misura di tendenza centrale ci riferiamo?

Destrimani Mancini

Rispettoso 90% [810] 80% [80]

Delinquente 10% [ 90] 20% [ 20]

Totale 100% [900] 100% [100]

quale misura di posizione utilizzare?

quale misura di posizione utilizzare?

La tabella ci informa sulla probabilità …

Che ha un Destrimano di essere Rispettoso della LeggeChe ha un Mancino di essere Rispettoso della Legge

% COLONNE

Page 50: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Principali indici statistici

di posizione

di forma

di dispersione

MODA

MEDIANA

MEDIA

SCARTO QUADRATICO MEDIO

VARIANZA

RANGE

ASIMMETRIA (SKEWNESS)

CURTOSI ( KURTOSIS)

INDICI

Page 51: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

SintassiSintassi

PreamboloPreambolo

media  media 

mediana mediana

modamoda

STATISTICA DESCRITTIVASTATISTICA DESCRITTIVA

frattili e percentili frattili e percentili

intervallo di variazioneintervallo di variazione

varianzavarianza

deviazione standard

intervallo interquartile

Obiettivi della lezione:

Fine dell’argomento

Page 52: LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica 333.1Misure di tendenza centrale 333.1.1Media 353.1.2Mediana.

Siméon-Denis Poisson (1781-1840)