LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica...
-
Upload
dona-de-rosa -
Category
Documents
-
view
270 -
download
0
Transcript of LIBRO – BIOSTATISTICA [Pagano-Gauvreau] PagParag. Argomento 333.Misure di sintesi numerica...
LIBRO – BIOSTATISTICA [Pagano-Gauvreau]
Pag Parag. Argomento 33 3. Misure di sintesi numerica 33 3.1 Misure di tendenza centrale 33 3.1.1 Media 35 3.1.2 Mediana 35 3.1.3 Moda 37 3.2 Misure di dispersione 37 3.2.1 Campo di variazione (Range)
37 3.2.2 Campo di variazione inter quartile (Range inter quartile).
38 3.2.3 Varianza e Deviazione standard 40 3.2.4 Coefficiente di variazione 41 3.3 Dati raggruppati 41 3.3.1 Media raggruppata 42 3.3.2 Varianza raggruppata 43 3.4 Disuguaglianza di Chebychev 44 3.5 Altre applicazioni 48 3.6 Esercizi
SintassiSintassi
Media aritmetica Media aritmetica
Media GeometricaMedia Geometrica
Media ArmonicaMedia Armonica
mediana mediana
modamoda
STATISTICA DESCRITTIVASTATISTICA DESCRITTIVA
frattili e percentili frattili e percentili
intervallo di intervallo di
variazionevariazione
varianzavarianza
deviazione standard
intervallo
interquartile
Obiettivi della lezione: CENTRO DI UNA DISTRIBUZIONE
quale misura di posizione usare?
Frequenza assoluta:
j0 n N
Si considerino N=60 dati da analizzare. I dati vengono suddivisi in un numero M=8 opportuno di classi; per ogni classe si ha, per j=1,2,…,M ,
Frequenza relativa:
jj
nf (x )
N
j0 f (x ) 1
M
=j
j=1n N
M M
j
jj 1 j 1
nf (x ) 1
N
Sintassi (1)Sintassi (1)Dato un insieme di N elementi {x1, x2, ... xN}
nj numero di elementi di tipo j-esimo
51 49.4 49 52.5 51.5 51.8 55 50.2 50.3 47.746.5 47.8 49.7 44.5 49.8 53 50.2 53.4 47.4 50.548.7 50 52.9 50.8 46.2 48.9 44.4 49.2 50.5 49.554.5 48.2 48.9 51.2 49.5 56.3 54 46.5 51.5 50.946 52.2 47 50.8 50 52.5 48.5 52.9 53.8 50.5
51.2 51.1 54.7 52.3 48.2 50.8 51.7 51.6 49.5 52.7
51 49.4 49 52.5 51.5 51.8 55 50.2 50.3 47.746.5 47.8 49.7 44.5 49.8 53 50.2 53.4 47.4 50.548.7 50 52.9 50.8 46.2 48.9 44.4 49.2 50.5 49.554.5 48.2 48.9 51.2 49.5 56.3 54 46.5 51.5 50.946 52.2 47 50.8 50 52.5 48.5 52.9 53.8 50.5
51.2 51.1 54.7 52.3 48.2 50.8 51.7 51.6 49.5 52.7
Si dice media aritmetica semplice di N numeri il numero che si ottiene dividendo la loro somma per N.
1 2 Nx x xx
N
dato un insieme di n elementi {x1, x2, ... xN}
Centro di una distribuzioneCentro di una distribuzione
Si dice media aritmetica pesata
1 1 2 2 m m
1 2 m
x p + x p +...+ x px =
p + p +...+ p
dato un insieme di m elementi {x1, x2, ... xm}
, e dato un insieme di m di numeri reali {p1, p2, ... pm}
che utilizza un peso pj o la frequenza di ogni dato xj per j=1,…,m
La media della lunghezza di un gruppo di f1= 7 neonati m1=48.0 cm
e di altri f2= 3 neonati m2=49.5 cm. Per calcolare la media delle lunghezze dell'insieme totale di 10 neonati pur senza avere la conoscenza dei valori delle lunghezze individuali, si utilizzano le proprietà della media aritmetica : la somma delle lunghezze dei primi 7 è 48.0×7 = 336.0la somma delle lunghezze dei secondi 3 è 49.5×3 = 148.5la somma delle lunghezze di tutti i 10 è = 484 .5
La media della lunghezza di tutti i 10 neonati è = 484.5/10 = 48.45
Ovvero Media = (f1×m1 + f2×m2)/(f1+ f2)
Media = (7×48.0 + 3×49.5)/(7+3)
Esempio di media pesataEsempio di media pesata
la media aritmetica dei primi 6 valori di lunghezza di 6 neonati è: = (51.0+49.4+49.0+52.5+51.5+51.8)/6 = 305.2/6 = 50.87
la media aritmetica di tutti i 60 valori di lunghezza è:
= (55.9+51.3+53.0+50.5+54.9+53.4+…+53.8)/60 = 3021.8 /60
= 50.363
x
x
La media aritmetica di N dati distinti è …
N
ii 1
xx
N
esempio di media aritmetica
esempio di media aritmetica
Lunghezza(cm) in un campione di 60 neonati.
51.0 49.4 49.0 52.5 51.5 51.846.5 47.8 49.7 44.5 49.8 53.048.7 50.0 52.9 50.8 46.2 48.954.5 48.2 48.9 51.2 49.5 56.346.0 52.2 47.0 50.8 50.0 52.551.2 51.1 54.7 52.3 48.2 50.855.0 50.2 50.3 47.7 48.5 53.850.2 53.4 47.4 50.5 51.7 49.544.4 49.2 50.5 49.5 52.9 50.554.0 46.5 51.5 50.9 51.6 52.7
45.0 2 46.5 5 ... 57.0 1 3022.5
x 50.3752 3 ... 1 60
MEDIA per dati
raggruppati
in classi
limiti di classe xi f(xj) f(xj) xif(xj)44.25- 45.75 45.0 2 0.0333 90.045.75- 47.25 46.5 5 0.0500 232.547.25- 48.75 48.0 7 0.2000 336.048.75- 50.25 49.5 14 0.2500 693.050.25- 51.75 51.0 16 0.2330 816.051.75- 53.25 52.5 9 0.1667 472.553.25- 54.75 54.0 5 0.0833 270.054.75- 56.25 55.5 1 0.0666 55.556.25- 57.75 57.0 1 0.0167 57.0
60 1.00 3022.5
ALTEZZA(cm) di un campione di 60 neonati.
Nell'esempio del campione di 60 misure di lunghezza dei neonati:
La media per dati raggruppati in m classi è …
m
j jj=1
m
jj=1
x f(x )
x=f(x )
se f(xi) indica le frequenze assolute,
se f(xi) indica le frequenze relative.
m
jj=1
f(x )=N
1
1m
jj
f ( x )
dove m è il numero di classi e ,
oppure
Dalla definizione consegue che la somma degli scarti di ogni elemen-to del campione dalla media aritmetica è 0:
In questo senso la media rappresenta il baricentro della distribuzione.
m
j jj 1
(x x) f(x ) 0
m m
j j jj 1 j 1
x f(x ) Somma _Totale x f(x )
Per molte variabili (es.: statura adulta, emoglobinemia), il baricentro si trova dove si addensano i valori e si può considerare un valore tipico della variabile.
proprietà della media aritmeticaproprietà della media aritmetica
Nota: valgono anche le seguenti relazioni:
m
j jj=1
m
jj=1
x f(x )
x=f(x )
Media Aritmetica
Per effettuare la correzione di errori accidentali.
Permette di sostituire i valori di ogni elemento senza cambiare il totale.
Sostituzione di valori NULL
Monotona crescente
Si dice mediana il valore che occupa il posto centrale in una distribuzione statistica di frequenza i cui valori sono disposti in ordine crescente
La media aritmetica è la misura di posizione più usata ma. A volte, altre misure come la mediana e la moda si dimostrano utili.
… centro di una distribuzione : LA MEDIANA
… centro di una distribuzione : LA MEDIANA
Si consideri un campione di valori di VES (velocità di eritrosedimen-tazione, mm/ora) misurati in 7 pazienti
{8, 5, 7, 6, 35, 5, 4}
In questo caso, la media ( = 10 mm/ora) non è un valore tipico della distribuzione: soltanto un valore su 7 è superiore alla media!
x
Per calcolare la mediana si dispongono i dati in ordine crescente:ordine originale: {8, 5, 7, 6, 35, 5, 4} ordine crescente: {4, 5, 5, 6, 7, 8, 35}
media aritmetica e medianamedia aritmetica e mediana
Conviene usare come indice del centro la mediana, definita come quel valore che divide a metà la distribuzione, sicché l'insieme dei valori è per metà minore e per metà maggiore della mediana.
Se n è dispari, la mediana è il valore che occupa la posizione (n+1)/2 nell'insieme ordinato.
Nell'esempio, poiché (n+1)/2=4, la mediana è 6 mm/ora, ed è tipica nel senso che si avvicina a buona parte dei valori del campione.
Se n è pari, la mediana è la media dei valori che occu pano le posizioni (n/2) ed [(n/2)+1] nell'insieme ordinato dei numeri.
Se, nell'esempio, si esclude il valore più alto, si ottiene l'insieme ordinato {4, 5, 5, 6, 7, 8},
(n/2)=3 e [(n/2)+1]=4, e la mediana vale (5+6)/2=5.5.
medianamediana
mediana
La mediana è semplicemente il dato centrale della distribuzione. Dopo aver disposto i dati in ordine crescente la mediana è quel
valore che lascia alla sua sinistra e alla sua destra un ugual numero di termini.
51 49.4 49 52.5 51.5 51.8 55 50.2 50.3 47.746.5 47.8 49.7 44.5 49.8 53 50.2 53.4 47.4 50.548.7 50 52.9 50.8 46.2 48.9 44.4 49.2 50.5 49.554.5 48.2 48.9 51.2 49.5 56.3 54 46.5 51.5 50.946 52.2 47 50.8 50 52.5 48.5 52.9 53.8 50.5
51.2 51.1 54.7 52.3 48.2 50.8 51.7 51.6 49.5 52.7
mediana non è tra 54.5 e 49.5 cm di lunghezza
[=(54.5 + 49.5)/2= 52.0]
Il 30° e il 31° valore nella serie ordinata è di 50.5 e 50.5 giorni: la mediana è perciò 50.5
Nota Bene La mediana NON è il valore intermedio tra i valori di lunghezza del 30mo e 31mo neonato esaminato, ma il valore intermedio tra la 30ª e 31ª osserva-zione, dopo aver ordinato i dati in verso crescente.
mediana
44.4 44.5 46.0 46.2 46.5 46.5 47.0 47.4 47.7 47.8 48.2 48.2 48.5 48.7 48.9 48.9 49.0 49.2 49.4 49.5 49.5 49.5 49.7 49.8 50.0 50.0 50.2 50.2 50.3 50.5 50.5 50.5 50.8 50.8 50.8 50.9 51.0 51.1 51.2 51.2 51.5 51.5 51.6 51.7 51.8 52.2 52.3 52.5 52.5 52.7 52.9 52.9 53.0 53.4 53.8 54.0 54.5 54.7 55.0 56.3
limiti di classe Xj f(xj) f(xj) NjF(xj)
44.25- 45.75 45.0 2 0.0333 2 0.033345.75- 47.25 46.5 5 0.0233 5 0.116747.25- 48.75 48.0 7 0.1167 14 0.233348.75- 50.25 49.5 14 0.2333 28 0.466750.25- 51.75 51.0 16 0.2667 44 0.733351.75- 53.25 52.5 9 0.1500 53 0.883353.25- 54.75 54.0 5 0.0833 58 0.966754.75- 56.25 55.5 1 0.0167 59 0.983356.25- 57.75 57.0 1 0.0167 60 1
j j-1
50 j-1j j-1
w 0.50 (x )x =x
(x ) (x )
F
F F
Mediana
= 50.25
Mediana per dati raggruppati in classi Mediana per dati raggruppati in classi
.4667)-(.73330.4667)(0.50*1.5
50.25
0.4
0.5
0.6
0.7
0.8
0.9
48.75 50.25 51.75 53.25
freq
uen
za r
elat
iva
cum
ula
ta
wj =xj -xj -1
F(xj)
F(xj-1)
f(xj)
xj-1 xj
?
wj
interpolazione lineare della MEDIANA
Mediana=
1.5 (50.00-46.66)50.25
26.67= 50.25
Mediana per dati raggruppati in classi Mediana per dati raggruppati in classi
Una delle leggi fondamentali della fisiologia afferma che la risposta eccitatoria di un organismo ad uno stimolo è proporzio-nale al logaritmo dello stimolo:
Legge di Weber-Fechner: Risposta log(stimolo)
Tale legge è valida anche in altri ambiti, quali la farmaco logia (l'effetto di un principio attivo è proporzionale non alla sua dose ma al logaritmo della dose), la microbiologia, l'enzimologia e l'immunologia.
Media geometricaMedia geometrica
Si riportano i valori (ng/ml) di concentrazione minima di penicillina-G inibente la Neissaria gonorrhoeae (MIC) presente nell'urina di 7 pazienti:
{31.25, 62.5, 125, 250, 500, 1000, 2000}.
Tali dati risentono del fatto che il metodo di determinazione della MIC è basato su diluizioni (1:1) successive della concentrazione iniziale di penicillina G (si noti che la differenza tra 31.25 e 62.5 è la metà di quella tra 62.5 e 125, e così via).
Esempio di media geometricaEsempio di media geometrica
In scala logaritmica,invece, le differenze tra le concentrazioni log10(MIC)
sono uguali:
{1.495, 1.796, 2.097, 2.398, 2.699, 3.000, 3.301}
e la media aritmetica dei logaritmi è (2.398) e coincide con il logaritmo della mediana
La media aritmetica (566.96) risente dei valori più alti ed è più del doppio della mediana (250).
Neisseria gonorrhoeae Neisseria gonorrhoeae (NG) is a Gram-negative diplococcus
that commonly infects the mucosa of the urethra, cervix, rectum, and throat.
It frequently presents as an uncomplicated, symptomatic infection at one or more of these sites.
In women, untreated lower genital tract infection, which more often may be asymptomatic, may progress to pelvic inflamma-tory disease (PID).
Repeated cases of PID increase the risk for chronic pelvic pain, ectopic pregnancy, and infertility
Si dice media geometrica l'antilogaritmo della media aritmetica dei logaritmi:
Media geometricaMedia geometrica
Y
0 500 1000 1500 2000
scala aritmeticamedia aritmetica
mediana
1000 10000 100000 100000010050 100050010 5000l l l
scala logaritmica
mediana
media geometrica
1
nii
g
log xx antilog
n
Media geometricaMedia geometrica
Dalla definizione di logaritmo si ricava che la media geometrica di n valori si può calcolare come radice n-ma del loro prodotto:
n
n
=1iig xx
Nell'esempio: antilog10(2.398)=250.034
1677 31.25 62.5 ... 2000 6.103516 10 250
dove la differenza è dovuta ad errori di arrotondamento.
Tasso di incremento di colture di batteriSe il tasso di incremento in 4 giorno consecutivi risulta pari a 1.75, 2.0, 1.5, 1.25, quale è il tasso medio di incremento?
Giorno 1 2 3 4
Tasso incr. 1.75 2 1.5 1.25
N° batt eff. 1750 3500 5250 6562
N° batt calc 1601 2562 4102 6562
4 1.75 2 1.5 1.25 1.6005429gx
media di N proporzioni
Esempio:P1= 0.1% ed P2=0.05% ovveroP1=1/10 e p2=1/20 hanno media aritmetica 3/40 ovvero PMEDIA= 0.075
La Media armonica MH e’ = 1/15
H
N1
M
1
N
p1
...p1
HM.. 1
1
15
20501
101
… centro di una distribuzione : Media Armonica
… centro di una distribuzione : Media Armonica
Media Armonica:Costo medio di prodotti confezionati
Avendo speso 24 euro nell’acquisto di confezioni del costo di 4 euro, ed altrettanto per l’acquisto di confezioni del costo di 6 euro ed ancora per l’acquisto confezioni del costo di 8 euro.
Quale sarà il prezzo medio globale?
35.538
1 1 14 6 8
ax
Problema di Briatore
Una macchina da corsa esegue un giro di pista a 100 km/ora ed un secondo giro di pista a 300 km/ora.
Qual è stata la sua velocità media ?
A voi la risposta … … … … …
Problema di Briatore risposta)
Una macchina da corsa esegue un giro di pista a 100 km/ora ed un secondo giro di pista a 300 km/ora.
Qual è stata la sua velocità media ?
A voi la risposta … 2/(1/100+1/300)= 150… … … …
Media Armonica (Una gita in montagna )
•Ieri è partito alle 3 del pomeriggio ha fatto un bel tratto piano, poi è salito su un monte, ne è ridisceso ed è ritornato a casa alle 9 di sera senza fermarsi.
•Nei tratti piani avanza a 8 chilometri l'ora ed è facile stargli dietro, ma anche su una salita ripida, come quella di ieri, mantiene una media di 6 km/h.
• In discesa, poi allunga il passo e fa 12 Km/ora, senza stancarsi mai.
•Quanti chilometri era lunga la gita di mio suocero ?
•A che ora era sulla cima del monte (mezz'ora più o meno)?
Mio suocero è un buon camminatore. È capace di fare gite lunghissime cammi-nando sempre con quel suo passo svelto ed instancabile. Ieri …
Risposte & riflessioni (Una gita in Montagna )
Supponiamo che la salita fosse di 6 km.
Avrebbe impiegato un'ora a salire e mezz'ora a scendere.
Quindi nel tratto in salita/discesa avrebbe percorso 12 km in un'ora e mezza. La sua velocità media, quindi sarebbe stata di 8 km/h, come sul piano.
Pertanto lui ha camminato sempre ad una velocità media di 8km/h.
Partito alle tre e tornato alle nove di sera, ha camminato per 48 km. Se il tratto fosse stato tutto piano, si sarebbe trovato a tornare indietro dopo 3 ore. Se il tratto fosse stato tutto in salita si sarebbe trovato a tornare indietro dopo 4 ore. Pertanto, se diciamo che dopo 3 ore e mezza era sulla cima, abbiamo risposto correttamente.
Per gli amanti della statistica ed i cultori di Chisini e della sua splendida defi-nizione di media, la velocità media nel tratto in salita e discesa si calcola con la media armonica, se vogliamo che la velocità media conservi i tempi di percorrenza.
INFINE PER CHI NON è CONVINTO
La gita è lunga 48 km = x (in piano) + y (in salita)DATISpazio = vel*t , t = spazio / vel e vel=Spazio/tempo t1=x/8
t2=y/6
8*t1+6*t2+12*(t2/2)+8*t1=48 ovvero 4*t1+3*t2=12
quindi t2=(12-4*t1)/3
t1 t2 t1+t20 4 42 4/3 10/31 8/3 11/33 0 3
-------------------------------------------------
Y
X
Una distribuzione può essere descritta per mezzo dei suoi frattili.
Si dice frattile (sinonimi: centile, percentile e quantile) p-esimo di una distribuzione quel valore xp tale che la frequenza relativa cumulata F(xp )= p.
Ad esempio, il 50° centile di una distribuzione è il valore che, sull'asse dei numeri reali, ha alla sua sinistra il 50% dei valori della distribuzione, e coincide con la mediana.
Il 10° centile è il valore che ha alla sinistra il 10% della distribuzione.
Frattili di una distribuzioneFrattili di una distribuzione
Nei grafici cumulati, i valori riportati sull'asse verticale indicano la frequenza delle rilevazioni con valore pari o minore ai valori in corrispondenza sull'asse orizzontale
10090807060504030201000
calcolo dei frattili Per il frattile di una seriazione di frequenza si ricorre all'interpolazione lineare
xj-1 e xj sono i limiti inferiore e superiore della classe …
F(xj) e F(xj-1) sono le frequenze cumulate della classe … e della classe
contigua precedente
f(xj) = F(xj)-F(xj-1) è la frequenza della classe …
wj = xj - xj-1 è l'ampiezza della classe…
… classe j che contiene il frattile
j j-1
p j-1j
w p F(x )x =x
f(x )
j-1 p j-1
j j
p F(x ) x x
f(x ) w
ricavabile dalla proporzione:
una distribuzione in breve
Un insieme di dati può essere descritto con 5 frattili: la mediana, i quartili 1° e 3° , e due centili estremi (es.: il 10° ed il 90°).
Si danno così indicazioni su localizzazione, dispersione e forma della distribuzione.
limiti di classe xj f(xj) f(xj) Nj F(xj)44.25- 45.75 48.0 2 0.0333 2 0.03333345.75- 47.25 49.5 5 0.0500 5 0.11666747.25- 48.75 51.0 7 0.2000 17 0.23333348.75- 50.25 52.5 14 0.2500 32 0.46666750.25- 51.75 54.0 16 0.2330 46 0.73333351.75- 53.25 55.5 9 0.1667 56 0.88333353.25- 54.75 57.0 5 0.0833 61 0.96666754.75- 56.25 58.5 1 0.0666 65 0.98333356.25- 57.75 60.0 1 0.0167 66 1
Con riferimento all'esempio delle lunghezze dei
neonati:
25
1.5 (0.25-0.0758)x =47.25 =48.687
0.1818
50
1.5 ( 0.5 - 0.4648 ) x = 50.25 + = 50.250
0.2667
75
1.5 (0.75-0.6969)x =51.75 = 52.275
0.1515
10
1.5 (0.10-0.0758)x =47.25 =47.449
0.1818
90
1.5 (0.90-0.8448)x = 53.25 = 54.342
0.0758
25° centile= 1° quartile
10° centile
75°centile= 3° quartile
90° centile
50°centile= mediana
47.449 48.687 50.250 53.275 54.342
0
25
50
75
100
47.25 48.75 50.25 51.75 53.25 54.75 56.25 57.75 59.25 60.75
F(x
)
cm
mediana
1° quartile
3° quartile
intervallointerquartile
47.449 8.687 50.250 53.275 54.342
Un indice di dispersione di uso comune è l'intervallo interquartile, dato dalla differenza tra 3° e 1° quartile (cioè tra 75° e 25° centile): tale intervallo contiene la metà dei valori inclusi nel campione, indipendentemente dalla forma della distribuzione della variabile.
l'intervallo interquartile
L’efficienza e la immediatezza delle distribuzioni cumulative
Il primo quintile 40 verso 54 anni per il tumore al seno verso il tumore all’ovaio
Si dice moda di una distribuzione statistica di frequenza il valore che compare con la massima frequenza
… centro di una distribuzione : La Moda
… centro di una distribuzione : La Moda
Più di rado si incontra una terza misura di posizione, la moda; è il valore che si verifica più spesso (frequenza assoluta più elevata); la modalità della variabile in cui si registra il maggior numero di casi. Quanto sono usualmente lunghi i bimbi alla nascita?Guardando i dati a nostra disposizione, è subito evidente maggior numero (16) di bimbi è lungo tra i 50.3 cm e i 51.7 cm. la classe modale è dunque 50.25-51.75.
Se la distribuzione ha più di due valori massimi o se la
frequenza più alta riscontrata nell’insieme considerato non supera di molto le altre la moda non è un buon indicatore di
tendenza centrale.
La ModaLa Moda
amp = ampiezza della classe modale .
xinf = limite inferiore della classe modale
La moda di seriazioni statistiche
moda = xinf + ampD
D + D(-)
(-) (+)
Lunghezza supina (cm) in un campione di 60 neonati. Valori ottenuti con l'infantometro Harpenden.
La moda
1,5 16 1450,25+ = 50,583
16-14 16-9
Estremi Valore Freq Semplici Freq cumulatedi classe Centrale n % n %44.3-45.7 45.0 2 0.033333 2 0.03333345.8-47.2 46.5 5 0.083333 7 0.11666747.3-48.7 48.0 7 0.116667 14 0.23333348.8-50.2 49.5 14 0.233333 28 0.46666750.3-51.7 51.0 16 0.266667 44 0.73333351.8-53.2 52.5 9 0.15 53 0.88333353.3-54.7 54.0 5 0.083333 58 0.96666754.8-56.2 55.5 1 0.016667 59 0.98333356.3-57.7 57.0 1 0.016667 60 1
Nella classe 50.3-51.7 , piu’ vicino alla casse con freq=14
Il proprietario di una ditta afferma "Lo stipendio mensile nella nostra ditta è 2.700 euro"
Il sindacato dei lavoratori dice che “lo stipendio medio è di 1.700 euro”. L'agente delle tasse dice che “lo stipendio medio è stato di 2.200 euro”.
Queste risposte diverse sono state ottenute tutte dai dati della seguente tabella.
A quale misura di tendenza centrale ci riferiamo?
Stipendio mensile
N° di lavoratori
1.300 21.700 222.200 192.600 36.500 29.400 1
23.000 1
Media aritmetica= lire 2.700
Mediana = lire 2.200
Moda = lire 1.700
quale misura di posizione usare?quale misura di posizione usare?
interpretazione delle misure di posizione
La media aritmetica indica che, se il denaro fosse distribuito in modo che ciascuno ricevesse la stessa somma, ciascun dipendente avrebbe avuto 2.700 euro
La moda ci dice che la paga mensile più comune è di 1.700.euro
La moda si considera spesso come il valore tipico dell'insieme di dati poiché è quello che si presenta più spesso. Non tiene però conto degli altri valori e spesso in un insieme di dati vi è più di un valore che corrisponde alla definizione di moda.
La mediana indica che circa metà degli addetti percepiscono meno di 2.200.euro, e metà di più.
La mediana non è influenzata dai valori estremi eventualmente presenti ma solo dal fatto che essi siano sotto o sopra il centro dell'insieme dei dati.
In quale ordine si dispongono le misure di tendenza cetrale ?
FINE DELL’ARGOMENTO MISURE DI TENDENZA
CETRALE
La percentuale è una misura molto semplice e di facile comprensione Se ci dicono che il 10% della popolazione è composta da “Mancini” , è
facile calcolare che il 90% è costituita da “Destrimani” Immaginiamo quindi di classificare 1000 adolescenti in accordo alla
osservanza delle leggi: “Delinquenti” o “Rispettosi della Legge”.810 Osservanti Destri e 90 Delinquenti Destri , 80 Osservanti Mancini e 20 Delinqunti Mancini
A quale misura di tendenza centrale ci riferiamo?
Destrimani Mancini
Osservanti 810 80
Delinquenti 90 20
100 =10%La tabella non ci aiuta molto a capi-re il fenomeno: appare che siano più delinquenti i destrimani ?
quale misura di posizione usare?quale misura di posizione usare?
Passiampo alle percentuali
A quale misura di tendenza centrale ci riferiamo?
Destrimani Mancini Totale
Osservanti 91% [810] 9% [80] 100% [900]
Delinquenti 82% [ 90] 18% [ 20] 100% [ 100]
La tabella ci informa sulla probabilità
quale misura di posizione usare?quale misura di posizione usare?
Che ha un Osservante di essere mancino
Che ha un Delinquente di essere mancino
% RIGHE
cambiamo il verso della proporzionalità
A quale misura di tendenza centrale ci riferiamo?
Destrimani Mancini
Rispettoso 90% [810] 80% [80]
Delinquente 10% [ 90] 20% [ 20]
Totale 100% [900] 100% [100]
quale misura di posizione utilizzare?
quale misura di posizione utilizzare?
La tabella ci informa sulla probabilità …
Che ha un Destrimano di essere Rispettoso della LeggeChe ha un Mancino di essere Rispettoso della Legge
% COLONNE
Principali indici statistici
di posizione
di forma
di dispersione
MODA
MEDIANA
MEDIA
SCARTO QUADRATICO MEDIO
VARIANZA
RANGE
ASIMMETRIA (SKEWNESS)
CURTOSI ( KURTOSIS)
INDICI
SintassiSintassi
PreamboloPreambolo
media media
mediana mediana
modamoda
STATISTICA DESCRITTIVASTATISTICA DESCRITTIVA
frattili e percentili frattili e percentili
intervallo di variazioneintervallo di variazione
varianzavarianza
deviazione standard
intervallo interquartile
Obiettivi della lezione:
Fine dell’argomento
Siméon-Denis Poisson (1781-1840)