Variabile divisa in classi: varianza...Pagina 119 Esempio: quartili per una distribuzione di...
Transcript of Variabile divisa in classi: varianza...Pagina 119 Esempio: quartili per una distribuzione di...
Pagina 115
Distribuzione semplice di frequenze assolute del carattere X raggruppato in classi
Valori
centrali
c 1
c 2
…c i
…c K
��� = � = ��������� = σ�=� �� −�� = � −� � + � −� � +⋯+ �� −� �� +⋯+ �� −� ���
Variabile divisa in classi: varianza
(ci - M)2 (ci - M)2 ni
(c1 - M)2 (c1 - M)2 n1
(c2 - M)2 (c2 - M)2 n2
… …(ci - M)2 (ci - M)2 ni
… …(cK - M)2 (cK - M)2 nK
Car. X n i
(x 0, x 1] n 1
(x 1, x 2] n 2
… …(x i -1, x i ] n i
… …(x K -1, x K ] n K
Totale n
Scarto quadrativo medio= � = �
Pagina 116
EsempioDistribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Voto di Maturità
283n 5K
Voto
Maturitàn i
[60-70] 72
(70-80] 78
(80-90] 65
(90-95] 18
(95-100] 50
Totale 283
(c i - M )2
220,25
23,44
26,62
160,25
311,84
(c i - M )2n i
15858,36
1827,94
1730,00
2884,51
15592,03
37892,84
� = σ�=5 ��−� �=
, = ,�= ��−� �� = , + , + , + , + , = ,
� = � = , =11,57
84,79M
Pagina 117
QuartiliPrimo quartile Q1: modalità che nella graduatoria(crescente o decrescente) bipartisce il 50% delleosservazioni con modalità più piccole o al più ugualialla Mediana
Terzo quartile Q3: modalità che nella graduatoria(crescente o decrescente) bipartisce il 50% delleosservazioni con modalità più grandi o al più ugualialla Mediana
U.S. A G I F B D L H E M C
xj 1 2 3 4 5 6 7 8 9 10 11
MeQ1Q3
Pagina 118
EsempioDistribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti
U.S. Affitto
U1 40
U2 43
U3 35
U4 33
U5 45
U6 40
U7 36
U8 36
U9 42
U10 38
U11 48
U12 51
U13 39
U14 42
U15 46
U16 59
U17 53
U18 55
U19 42
Senza ordine
Posto U.S. Affitto
1 U4 33
2 U3 35
3 U7 36
4 U8 36
5 U10 38
6 U13 39
7 U1 40
8 U6 40
9 U9 42
10 U14 42
11 U19 42
12 U2 43
13 U5 45
14 U15 46
15 U11 48
16 U12 51
17 U17 53
18 U18 55
19 U16 59
Ordine crescente
La mediana è
“42”
Primo Quartile è “38”
Terzo Quartile
è “48”
42
42
43
45
46
48
51
53
55
59
33
35
36
36
38
39
40
40
42
Affitto
Pagina 119
Esempio: quartili per una distribuzione di frequenza
Distribuzione dei laureati del 2011 secondo il voto assegnato al prestigio dell’ateneo nel quale si sono laureati
VOTO n i p i N i P i
0 6 21,43 6 21,43
1 1 3,57 7 25,00
5 5 17,86 12 42,86
6 3 10,71 15 53,57
7 3 10,71 18 64,29
8 6 21,43 24 85,71
9 1 3,57 25 89,29
10 3 10,71 28 100,00
TOT 28 100,00
Primo Quartile è “1”
Terzo Quartile è “8”
La frequenza percentuale cumulata corrispondente alla modalità “1” è la prima frequenza percentuale cumulata maggiore o uguale a 25%
La frequenza percentuale cumulata corrispondente alla modalità “8” è la prima frequenza percentuale cumulata maggiore o uguale a 75%
Mediana è “6”
La frequenza percentuale cumulata corrispondente alla modalità “6” è la prima frequenza percentuale cumulatamaggiore o uguale a 50%
Pagina 120
Indici di variabilità relativaConsentono di effettuare confronti sulla variabilità di fenomeni che
presentano unità di misura differenti
pur avendo la stessa unità di misura hanno valori medi differenti e quindi distribuzioni differenti
In alcune situazioni è fuorviante utilizzare la deviazione standard per il confronto:
della variabilità di una variabile osservata su due collettivi differenti di u.s.
della variabilità di due o più variabili osservate sul medesimo collettivo di u.s.
Pagina 121
Indici di variabilità relativa
Ci permettono di misurare la variabilità indipendentemente dalla grandezza e dalla scala di misura del carattere
Indici percentuali di variabilità o dispersione
Indici di variabilità o dispersione relativa
Sono numeri puri non hanno unità di misura
Pagina 122
Indici di variabilità relativaIndici percentuali di variabilità o dispersione ottenuti dividendo l’indice di variabilità (dispersione) assoluto per la media rispetto alla quale è stato calcolato
Coefficiente di variazione
100M
CV
)max(
Indici di variabilità o dispersione relativa ottenuti dividendo l’indice di variabilità (dispersione) assoluto per il valore massimo che esso può assumere in una situazione ipotetica
Deviazione standard relativa
Numero compreso tra 0 e 1
Pagina 123
Esempio: due variabili diverse
In un collettivo di 91 ragazze
la media del peso è pari a 55,1 Kg e la deviazione standard è pari a 5,7 Kg
La media della statura è pari a 166,1 cm e la deviazione standard è pari a 6,1 cm
E’ maggiore la variabilità del peso o la variabilità della statura?
Le variabili misurate sono diverse perché espresse in diverse unità di misura
Pagina 124
Esempio: due gruppi con valori molto distanti
Tre neonati pesano rispettivamente 3, 4 e 5 Kg (media=4 Kg e =1 Kg)
Tre bambini di 1 anno pesano 10, 11 e 12 Kg (media=11 Kg e =1 Kg)
La variabile misurata è la stessa ma i valori medi delle osservazioni nei due gruppi sono molto distanti (le osservazioni nei due gruppi sono su diversi ordini di grandezza)
La deviazione standard è uguale nei due gruppi ma il buon senso suggerisce che la variabilità del peso sia maggiore nei neonati!!
Pagina 125
Soluzione
Media Dev. Standard CV
Peso 55,1 Kg 5,7 Kg 10,3%
Statura 166,1 cm 6,1 cm 3,7%
Media Dev. Standard CV
Neonati 4 Kg 1 Kg 25%
Bambini di 1 anno 11 Kg 1 Kg 9%
La variabilità del Peso è maggiore della variabilità della Satura
La variabilità del Peso è maggiore nel collettivo dei neonati
Pagina 126
Altri indici di variabilitàCampo di Variazione� = ��� �� −��� ��
oppure� = � �� − � �Differenza Interquartilica
R 0
R=0 non c’è variabilità W rappresenta il campo di
variazione per il 50% delle unità centrali
13 QQW
Pagina 127
Mutabilità
Sinonimo di eterogeneità
Le misure di mutabilità si basano sull’analisi delle frequenze
Mutabilità nulla = tutte le u.s. presentano la stessa modalità Massima omogeneità
Tutte le ni sono uguali a zero tranne una che è pari a n
Mutabilità massima = le frequenze delle varie modalità sono tutte uguali Minima omogeneità
n1= n2=…= ni=…= nK= n/K
Pagina 128
Indici di mutabilità o eterogeneità
Devono esser nulli tutte le u.s. presentano la stessa modalità
Crescere all’aumentare della mutabilità o eterogeneità
Indice di Gini
Pagina 129
Indici di mutabilità o eterogeneità
Indice di GiniAssume valori tra 0 e 1-(1/K)
Indice di Gini
RelativoAssume valori tra 0 e 1
K
j
j
n
nG
1
2
1
K
G
G
G
11
)max(
Pagina 130
BoxPlot
Tasso di variazione annua della produttività del lavoro
Pagina 131
Box PlotRappresentazione grafica della distribuzione di uncarattere quantitativo che mette in evidenza la suavariabilità
Elementi caratteristici
1) 1 punto che individua la posizione della media(aritmetica o mediana) della distribuzione
2) 1 rettangolo (box) la cui altezza rappresenta lavariabilità dei valori prossimi alla media scelta
3) 2 segmenti che partono dai lati maggiori delrettangolo e i cui estremi sono rappresentati dai
valori minimo e massimo della distribuzione
Pagina 132
BoxPlot
Tasso di variazione annua della produttività del lavoro
MedianaTerzo quartile
Primo quartile
Pagina 133
Quale Box Plot?Box plot con mediana
1) Media = mediana
2) Altezza box = differenza interquartile W
Estremo sup.= Q3 Estremo inf.=Q1
3) Estremi dei segmenti
Superiore=valore max Inferiore=valore min
Box plot con media aritmetica
1) Media = media aritmetica
2) Altezza box = 2
Estremo sup.= M+ Estremo inf.=M-3) Estremi dei segmenti
Superiore=M+1,96 Inferiore=M-1,96
Pagina 134
Esempio
A B C D E F G H I L M
4 1 0 1 2 8 5 2 1 5 12
Distribuzione delle nascite in 11 ospedali
C B D I E H A G L F M
0 1 1 1 2 2 4 5 5 8 12
2Me 11 Q 53 Q
Distribuzione ordinata delle nascite in 11 ospedali
Pagina 135
Box Plot
Terzo quartile
Mediana
Primo quartile
Box Plot con valori anomaliValori anomali:LSR + (LSR - LIR) = 5 + 1,5 (5 - 1) = 11LIR - (LSR - LIR) = 1 - 1,5 (5 - 1) = -5E’ anomalo il solo valore 12 dell’unità F!
Outlier
Unità F
Terzo quartile
Mediana
Primo quartile
Pagina 136
Pagina 137
Box Plot: variabilità a confronto
Tasso di variazione annua della produttività del lavoro per tre diversi settori produttivi
La costruzione di misure relative
I rapporti statistici(capitolo 10)
Pagina 138
X1 X2 … Xj … Xk
u1 x11 x12… x1j
… x1k
u2 x21 X22… x2j
… x2k
… … … … … … …
ui xi1 Xi2… xij
… xik
… … … … … … …
un xn1 xn2… xnj
… xnk
Costruire nuove variabili
I2
I12
I22
…
Ii2
…
In2
I1
I11
I21
…
Ii1
…
In1
A partire da una matrice di dati, mediante opportune operazioni compiute sui
valori delle variabili originarie, si possono ottenere nuove variabili, più
adeguate alla rappresentazione di un fenomeno
Iq
I1q
I2q
…
Iiq
…
Inq
Pagina 139
Nuove variabili
Le nuove variabili possono derivare da:
semplici trasformazioni di una sola variabile originaria
Esempi:
• Ij= Xj / max(Xj)
• Ij= Xj / Media(Xj)
• Ij= Ammontare di Xj / Numero u.s.
operazioni che tengono conto di più variabili
Esempi:
– Ij= X1/X2*100
– Ij= (X1+X2)/2
Pagina 140
Variabili costruite a partire da altre: esempi di uso nella misurazione dei fenomeni
Invecchiamento della popolazione
Densità abitativa di un certo luogo
Reddito pro-capite
Indice dei prezzi al consumo
Tasso di occupazione
Share
In tutti i casi suddetti i fenomeni sono espressi mediante
“variabili” ottenute rapportando diversi valori di una singola
variabile oppure valori di variabili differenti
Per questa loro caratteristica, vengono denominati RAPPORTI
STATISTICI
Essi offrono una immediata ed efficace rappresentazione
sintetica dei fenomeni
Pagina 141
Rapporti Statistici:che cosa sono?
Sono rapporti tra due “quantità”a) tra esse esiste un nesso logico
b) almeno una delle due si riferisce ad un collettivo
NON TUTTI I RAPPORTI SONO RAPPORTI STATISTICI
circonferenza n. nati
diametro popolazione
almeno una delle due quantità poste a confronto deve riferirsi ad un collettivo
Pagina 142
Esempi di rapporti statistici
Denominazione Come si calcolano
Reddito pro capite Reddito /popolazione residente
Tasso di divorzialità Divorzi /tot. popolazione*1000
Tasso di occupazione Occupati/Pop. > 15 anni *100
Tasso di scolarità Popolazione iscritta e frequentate un livello scolastico/ Pop. residente di età corrispondente *100
Tasso di mortalità infantile Morti nel I° anno di vita/nati vivi nello stesso periodo *1000
Indice invecchiamento Pop. 65 anni +/pop. *100
Indice di vecchiaia Pop. 65 anni +/pop. da 0 a 14 * 100
Densità automobilistica Autovetture immatricolate/pop.residente*1000
Pagina 143
Rapporti statistici: a cosa servono?
1. Confrontare un fenomeno su collettivi di numerosità
differente poiché sono misure “relative”:mettono a confronto variabili che esprimono intensità (es:
reddito) o frequenze (es: numero di laureati) tra diverse
unità di analisi o delle stesse unità in tempi diversi
Esempi:
comparare il livello di istruzione (o il reddito) degli
abitanti in due regioni diverse nello stesso anno
oppure
confrontare il livello di istruzione (o il reddito) degli
abitanti della stessa regione nel 2001 e nel 2011
2. Costruire nuove variabili che hanno un significato
differente da quelle originarie
Pagina 144
Costruire misure relative: i rapporti statistici nella comparazione
Esempio
Analizziamo il numero di occupati nelle seguenti regioni
Fonte: Istat, Forze di Lavoro, Media 2003 *dati assoluti in migliaia
In quale regione la situazione occupazionale è migliore?
Osserviamo che il numero di occupati è influenzato innanzitutto dall’ ammontare della popolazione
nelle regioni considerate
Pagina 145
Numero occupati(*)
Valle d’Aosta 55
Lombardia 4064
Sicilia 1405
Italia 22054
Popolazione 15 anni e più
Valle d’Aosta 104
Lombardia 7877
Sicilia 4139
Italia 49208
Eliminare l’effetto della diversa numerosità della popolazione, significa relativizzare il dato assoluto: calcoliamo un rapporto statistico rapportando il numero di occupati alla popolazione in età attiva
Il rapporto, moltiplicato per 100 per facilitarne la lettura, è il tasso di
occupazione: ci indica quale valore assume O (la popolazione
occupata) per ogni 100 unità di P (Popolazione in età attiva)
Si è così eliminata l’influenza del diverso ammontare delle
popolazioni delle unità territoriali confrontate
Costruire misure relative: i rapporti statistici nella comparazione
Esempio (segue)
Pagina 146
Numerooccupati (O)
Popolazione 15 anni e più (P)
Tasso di Occupazione (O/P*100)
Valle d’Aosta 55 104 52,88
Lombardia 4064 7877 51,59
Sicilia 1405 4139 33,95
Italia 22054 49208 44,82