Esempio: distribuzione di frequenze · frequenza (assoluta o relativa o percentuale)...
Transcript of Esempio: distribuzione di frequenze · frequenza (assoluta o relativa o percentuale)...
Esempio: distribuzione di frequenze
Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi Frequentati
36,3283
952
283
)27()86()325()804()1033()432()151(
M
283n 7K
Num. Corsi
Freq.n i
1 15
2 43
3 103
4 80
5 32
6 8
7 2
Totale 283
x i n i
1*15=15
2*43=86
3*103=309
4*80=320
5*32=160
6*8=48
7*2=14
952�= �� � = + + + + + + =
� = σ�=7 �� �= = ,Pagina 90
Pagina 91
Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Voto di Maturità
40n 24K
Voto
Maturitàn i
60 1
62 2
66 1
67 3
68 2
70 2
71 2
72 1
73 2
74 1
75 2
76 1
79 1
80 1
81 1
82 1
83 1
86 1
87 1
90 2
92 3
93 2
94 1
100 5
Totale 40
x i n i
60
124
66
201
136
140
142
72
146
74
150
76
79
80
81
82
83
86
87
180
276
186
94
500
3201
� = σ�= �� �= = ,�= �� � =
Esempio: distribuzione di frequenze
Pagina 92
Proprietà della media aritmetica E’ espressa nella stessa unità di misura dei dati perché è il risultato
di una operazione matematica; può non essere una modalità numerica della variabile realmente osservata nel collettivo in esame
E’ sempre compresa tra la modalità minima e la modalità massima del carattere
La somma delle differenze tra le modalità del carattere per ciascuna unità statistica e la media aritmetica è uguale a 0
�= �� −� = u.s. Voto Maturità (x i -M)
1 98 17,2
2 100 19,2
3 70 -10,8
4 72 -8,8
5 70 -10,8
6 100 19,2
7 85 4,2
8 65 -15,8
9 60 -20,8
19 88 7,2
0,0
M=80,8σ�= �� −� =(98-80,8)+(100-80,8)+(70- , +…+ -80,8)=
=17,2+19,2-10,8-8,8-10,8+19,2+4,2-15,8-20,8+7,2=0
Pagina 93
Proprietà associativa della media aritmetica
Voto
Maturitàn i
67 2
68 3
72 2
75 2
76 1
80 1
83 1
87 1
90 1
100 2
Totale 16
x i n i
134
204
144
150
76
80
83
87
90
200
1248
Voto
Maturitàn i
60 1
62 2
66 1
67 1
68 1
70 2
71 2
73 2
74 1
75 1
79 1
81 1
82 1
86 2
90 3
92 3
93 2
94 2
100 3
Totale 32
x i n i
60
124
66
67
68
140
142
146
74
75
79
81
82
172
270
276
186
188
300
2596
Maschi Femmine
� � = σ�=9 �� �� = = ,12� ���ℎ� = σ�= �� ����ℎ� = = ,
� ���ℎ� +� � = , + , = , � � � = σ�=9 �� �= = ,08���� = � ���ℎ� ���ℎ�+� � � = + =80,08
Pagina 94
…segue proprietà associativa della media aritmetica
La media di un collettivo è la media aritmetica delle medie dei sottogruppi in cui si può ripartire il collettivo stesso ponderata per le numerosità dei sottogruppi
Gruppo 1 2 3 h L
Medie M1 M2 M3 Mh ML
Numerosità n1 n2 n3 nh nL
n
nM
M
L
h
hh 1
L
h
hnn1
con
Pagina 95
Distribuzione di una variabile divisa in classi
Voto Laurea ni
[87-98] 18
(98-102] 27
(102-105] 25
(105-109] 35
(109-111] 25
Totale 130
Distribuzione di laureati di SDC nell’a.a. 2003/2004 per Voto di Laurea
Car. X n i
(x 0, x 1] n 1
(x 1, x 2] n 2
… …(x i -1, x i ] n i
… …(x K -1, x K ] n K
Totale n
Pagina 96
Distribuzione di una variabile divisa in classi : classe Modale
Se il carattere è una variabile divisa in classi
Classe modale: classe di modalità a cui corrisponde la max densità media di frequenza
Densità media di frequenza di per la classe di modalità (xi-1, xi): è il rapporto tra la frequenza assoluta e l’ampiezza della classe calcolata come
di = estremo sup - estremo inf = xi - xi-1
Pagina 97
Esempio: classe modaleVoto Laurea n
i
[87-98] 18
(98-102] 27
(102-105] 25
(105-109] 35
(109-111] 25
Totale 130
ai
11
4
3
4
2
di
1,64
6,75
8,33
8,75
12,50
Distribuzione di laureati di SDC nell’a.a. 2003/2004 per Voto di Laurea
Qual è la classe modale?
La classe modale è “(109-111]”
VotoLaurea ni
[87-98] 18
(98-102] 27
(102-105] 25
(105-109] 35
(109-111] 25
Totale 130
Pagina 98
Distribuzione semplice di frequenze assolute del carattere X raggruppato in classi
Valori
centrali
c 1
c 2
…c i
…c K
� = + +⋯+ � � +⋯+ � �= σ�=� � �
� = ��− + ��Variabile divisa in classi: media aritmetica
Car. X n i
(x 0, x 1] n 1
(x 1, x 2] n 2
… …(x i -1, x i ] n i
… …(x K -1, x K ] n K
Totale n
Pagina 99
Esempio
Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Voto di Maturità
283n 5K
Voto
Maturitàn i
[60-70] 72
(70-80] 78
(80-90] 65
(90-95] 18
(95-100] 50
Totale 283
c i
65,0
75,0
85,0
92,5
97,5
c i n i
4680
5850
5525
1665
4875
22595
652
70601
c1i� = ��− + ��
� = σ�= �� �= = ,�= � � = + + + + =
Pagina 100
Rappresentazione grafica della distribuzione di una variabile quantitativa : istogrammi
Ogni barra corrisponde ad una classe di valori della variabile
Nell’esempio, le basi delle barre hanno uguale ampiezza come le classi di valori e l’altezza è proporzionale alla frequenza di ogni classe di valori
Per classi di ampiezza diversa la base di ciascuna barra dovrebbe essere proporzionale all’ampiezza della classe
La somma delle aree di tutti i rettangoli è uguale alla frequenza totale del carattere
Anche l’asse delle ascisse è graduato
101
IstogrammaDistribuzione di frequenza di caratteri quantitativi, in particolare variabili continue raggruppate in classi
Consiste nel riportare tanti rettangoli contigui quante sono le classi
Il rettangolo associato ad una generica classe ha
base uguale (o proporzionale) all’ampiezza della classe corrispondente
area totale uguale o proporzionale alla frequenza (assoluta o relativa o percentuale) corrispondente
102
Costruzione di un istogrammaLe classi di modalità possono avere ampiezza differente
Si consideri la generica i-esima classe (xi-1 , xi): il rettangolo che rappresenta tale classe ha
Base = ampiezza della classe
o o
Altezza = densità media di frequenza
Area = frequenza (ni o fi o pi)
� = ��� � = ��� � = ���� = �� − ��−
103
Esempio
La classe “60 e oltre” èstata chiusa a 80
Classe di età n j f j p j a j d j
30-39
[30 , 40)6 0.30 30 10 0.60
40 - 49
[40 , 49]3 0.15 15 9 0.33
50 - 59
(49 , 59]7 0.35 35 10 0.70
60 ed oltre
(59, 80]4 0.20 20 21 0.19
Totale 20 1.00 100
Pagina 104
Punti deboli della media aritmetica
Robustezza: sensibilità ai valori estremi
Rappresentatività nei confronti di distribuzioni asimmetriche
La media aritmetica è un valore rappresentativo nei confronti di distribuzioni simmetriche che sono speculari rispetto ad un asse verticale
OK
105
Esempio
Classi n i f i N i c i c i n i
(0,100] 143,0 0,281 143,0 50 7150
(100, 200] 120,0 0,236 263,0 150 18000
(200,300] 57,0 0,112 320,0 250 14250
(300,400] 48,0 0,094 368,0 350 16800
(400,500] 22,0 0,043 390,0 450 9900
(500, 600] 12,4 0,024 402,4 550 6820
(600, 700] 12,4 0,024 414,8 650 8060
(700, 800] 12,4 0,024 427,2 750 9300
(800, 900] 12,4 0,024 439,6 850 10540
(900, 1000] 12,4 0,024 452,0 950 11780
(1000, 1100] 11,4 0,022 463,4 1050 11970
(1100, 1200] 11,4 0,022 474,8 1150 13110
(1200, 1300] 11,4 0,022 486,2 1250 14250
(1300, 1400] 11,4 0,022 497,6 1350 15390
(1400, 1500] 11,4 0,022 509,0 1450 16530
509,0 1,000 183850� = σ�= �� �= = ,
Distribuzione dei titolari di una carta di fedeltà per classi di spesa (euro)
Me= 193,33
106
Istogramma di frequenze relative: classi di uguale ampiezza (100 euro)
2,361M
33,193Me
Pagina 107
La media aritmetica non è rappresentativa di distribuzioni asimmetriche
Pagina 108
Variabilità o DispersioneDefinizione
Attitudine di un fenomeno ad assumere diverse modalità
Pagina 109
Le medie non bastano … Esempio: caratteri quantitativi
Condominio Au.s.
Numero televisori
u1 8
u2 8
u3 8
u4 8
u5 8
Me=M=8
Condominio Bu.s.
Numero televisori
u1 3
u2 5
u3 8
u4 10
u5 14
Me=M=8
Le due distribuzioni hanno medie uguali ma la tendenza delle unità statistiche ad assumere valori diversi dalla media aritmetica è diversa nei due collettivi
La variabilità La variabilità o la mutabilità di una distribuzione esprime la
tendenza dei caratteri o dei fenomeni ad assumere differenti valori o determinazioni
Requisiti di un indice di variabilità:
assume valore minimo se tutte le unità presentano uguale modalità del carattere
positivo se c’è variabilità o dispersione aumenta all’aumentare della diversità tra modalità
Attenzione
ogni indice di variabilità esprime un concetto diverso pertanto non è corretto confrontare la variabilità
ottenuta con indici diversi
Pagina 110
La variabilità
Pagina 111
Indici di variabilità e dispersioneIndici di variabilità
La variabilità si misura considerando tutte le differenze tra le modalità della distribuzione presentate dalle u.s. prese due a due Differenze Medie
Indici di dispersione
La dispersione si misura con gli scarti tra le modalità presentate dalle u.s. e un indice di dimensione della distribuzione (M o Me)
Varianza
Scostamento (scarto) quadratico medio
Pagina 112
U.S. Temperatura
Minima
A 9
B -2
C 4
D -3
E -2
F 0
G 6
H 4
I -4
J 9
(xi - M)
6,9
-4,1
1,9
-5,1
-4,1
-2,1
3,9
1,9
-6,1
6,9
(xi - M)2
47,61
16,81
3,61
26,01
16,81
4,41
15,21
3,61
37,21
47,61
218,90
10n
679,489,21 Varianza
Esempio: calcolo della varianza
� = σ�= ��= = ,����� �� = � = σ�= ��−� =
, = ,Devianza
Pagina 113
Esempio: calcolo della varianza per distribuzioni di frequenza
Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi Frequentati
283n 7K
Num.
Corsi
Freq.
n i
1 15
2 43
3 103
4 80
5 32
6 8
7 2
Totale 283
x i n i
15
86
309
320
160
48
14
952
(x i -M )2
5,57
1,85
0,13
0,41
2,69
6,97
13,25
(x i -M )2n i
83,55
79,55
13,39
32,80
86,08
55,76
26,50
377,63
15,133,12
� = σ�=7 �� �= = ,� = σ�=7 ��−� �
=, =1,33
Devianza
Pagina 114
Scarto quadratico medio e varianzaDistribuzione unitaria
Scostamento quadratico medio (deviazione standard)
Varianza (non ha la stessa unità di misura del carattere)
Devianza
n
MxMxMx n
22
2
2
1
n
MxMxMx n
22
2
2
12
22
2
2
1 MxMxMxDevianza n
n
nMxnMxnMx KKii22
12
1
n
nMxnMxnMx KKii
22
1
2
12
KKii nMxnMxnMxDevianza22
1
2
1
Distribuzione semplice di frequenze
Scostamento quadratico medio (deviazione standard)
Varianza (non ha la stessa unità di misura del carattere)
Devianza