Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse...
Transcript of Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse...
1
Bibliografia: Cicchitelli G. (2008). Statistica. Principi e Metodi”. Pearson Education [Capitoli 1, 3, 4, 5 (fino a § 5.12), 6 (escluso § 6.3), 7, 9, 10-11] Di Ciaccio A, Borra S. (2008). Statistica. Metodologie per le Scienze Economiche e Sociali”. McGraw-Hill, Milano. [Capitolo 1 (fino a § 1.4), 2, 3 (escluso § 3.4), 4 (esclusi § 4.4 e 4.7), 6 (escluso § 6.7), 16 (fino a § 16.5)] Leti G, Cerbara L. (2009). Elementi di Statistica Descrittiva. Il Mulino [Capitoli 1-8, 10, 11 (fino a § 5.5), 13 (fino a § 6.3), 14-15] Zenga M. (2007). Lezioni di Statistica Descrittiva. Giappichelli
2
Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni:
l’enumerazione a scopi fiscali e militari.
Tra le varie civiltà ricordiamo:
Medio Oriente: Egitto ( III° millennio A.C. ) Mesopotamia ( 2800 A.C. ) Ebrei ( 1200 A.C. ) Oriente India ( 313 A.C. ) Cina
3
Roma I° censimento 578 A.C.
Alto Medioevo
Guglielmo il Conquistatore “Domesday Book” 1086 Registri Veneziani 1268 Basso Medioevo Il ruolo della Chiesa e quello degli Stati Nazionali. Lo sviluppo dei traffici.
Dopo la Rivoluzione Francese I° censimento Americano 1790 I° censimento Inglese 1801
4
XVIII° Secolo Aritmetica Politica
Statistica
Sviluppi Moderni Corrado Gini (Scuola Italiana)
R.A. Fisher (Scuola Inglese) Neyman-Pearson (Scuola Americana)
5
La Statistica nel mondo
contemporaneo ( applicazioni )
6
Statistica descrittiva. - Rappresentazione sintetica dei dati rilevati.
- Studio della relazione tra due fenomeni. Concetti elementari: Unità statistica Popolazione statistica Unità di rilevazione Campione Censimento Indagine campionaria Piano degli esperimenti Collettivo statistico
7
Concetti elementari: Carattere
Modalità del carattere Carattere: qualitativo o quantitativo
N.B. alcuni caratteri qualitativi sono ordinabili
Caratteri quantitativi: discreti o continui esempio di carattere discreto con molte modalità è il reddito.
8
Rappresentazione tabellare
Esempio: 50 famiglie classificate per il n° dei figli (carattere discreto):
3 1 3 2 2 0 2 1 5 4 2 2 3 1 1 2 2 0 2 1 4 2 1 2 1 4 3 2 1 3 0 4 3 2 0 3 2 2 1 2 3 1 0 2 2 1 2 2 1 3
9
Distribuzione di frequenze
N° figli Frequenze
0 5
1 12
2 19
3 9
4 4
5 1 Totale 50
10
Esempio: Pezzi di un lotto classificati a seconda della qualità (carattere qualitativo). (legenda: b= buono, r= riutilizzabile, d= difettoso)
b b d r b d b r r b b r b r b b r b b b d b r b d
11
Distribuzione di frequenze del carattere qualitativo dei pezzi del lotto:
Qualità pezzo frequenze
difettoso 4
riutilizzabile 7
buono 14
Totale 25
12
Frequenze relative
N° figli Freq.
ass.
Freq.
relat.
0 5 0.10
1 12 0.24
2 19 0.38
3 9 0.18
4 4 0.08
5 1 0.02 Totale 50 1.00
Qualità pezzo freq. ass. freq. relat.
difettoso 4 0.16
riutilizzabile 7 0.28
buono 14 0.56
Totale 25 1.00 13
5
12
19
9
4
1
0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4 5
N° di figli per famiglia
14
10%
24%
38%
18%
8%
2%
N° di figli per famiglia
0
1
2
3
4
5
15
4
7
14
0
2
4
6
8
10
12
14
16
difettoso riutilizzabile buono
Qualità pezzo
16
16%
28% 56%
Qualità pezzo
difettoso
riutilizzabile
buono
17
Solo per caratteri quantitativi: Frequenze cumulate e Frequenze cumulate relative
N° figli Freq.
ass.
Freq.
relat.
Freq.
cum.
Freq.
cum. rel.
0 5 0.10 5 0.10
1 12 0.24 17 0.34
2 19 0.38 36 0.72
3 9 0.18 45 0.90
4 4 0.08 49 0.98
5 1 0.02 50 1.00 Totale 50 1.00 -- --
Domanda: Qual è la % di famiglie con più di 3 figli?
18
Carattere quantitativo discreto con numerose modalità.
Esempio: età in anni compiuti rilevati su 60 individui.
5 13 22 30 26 20 11 24 14 29 31 53 0 34 1 17 62 27 37 46
15 65 27 21 34 25 1 51 16 7 6 43 17 66 69 49 10 19 28 55
73 30 75 33 3 70 54 28 8 32 67 80 33 40 64 18 67 26 12 14
19
Possibile divisione in classi: (meno di 6) età prescolare ( 6 - 14 ) età scuola d’obbligo ( 14 - 24 ) età scuola sup. e Univ. ( 24 - 40 ) Ia età produttiva ( 40- 65 ) IIa età produttiva ( oltre 65 ) età del pensionamento (NB:per convenzione l’estremo superiore non appartiene alla classe)
classi freq. ass. freq. rel. freq. cum. freq. cum.
rel.
amp.
classi
h
densità
meno di 6 5 0.08 5 0.08 6 0.013
6-14 7 0.12 12 0.20 8 0.015
14-24 11 0.18 23 0.38 10 0.018
24-40 18 0.30 41 0.68 16 0.019
40-65 10 0.17 51 0.85 25 0.007
oltre 65 9 0.15 60 1.00 35 0.004
totale 60 1.00 -.- -.- -.- -.- 20
h =freq.rel.
amp.cla.= densità di Frequenza
A= amp.cla. X h = amp.cla. X freq.rel.
amp.cla.= freq. rel.
21
Ogiva delle frequenze.
L’ogiva delle frequenze è la spezzata congiungente i punti di ascissa pari
all’estremo superiore della classe e di ordinata pari alla frequenza
cumulata relativa.
Domanda: Quanti hanno meno di 50 anni ?
Domanda: Qual è l’età cui corrisponde una frequenza relativa cumulata
uguale a 0.5 ?
22
Caratteri quantitativi continui. E’ possibile soltanto una distribuzione di frequenza divisa in classi. Il trattamento è analogo a quelle dei caratteri quantitativi discreti con molte modalità.
Esempio: altezza di 60 studenti (in cm.)
158 160 157 154 160 158 151 156 165 161 170 171 148 152 174 145 146 153 162 149
155 173 179 178 146 144 153 157 158 167
154 157 151 163 154 160 155 156 166 154 159 164 149 161 162 156 170 160 148 176
153 160 160 158 166 164 158 163 165 167
classi fr. ass. fr. rel. fr. cum. fr.cum. rel. h
140-148 4 0.07 4 0.07 0.009
148-156 16 0.26 20 0.33 0.034
156-164 25 0.42 45 0.75 0.053
164-172 11 0.18 56 0.93 0.023
172-180 4 0.07 60 1.00 0.009
Totali 60 1.00 -.- -.- -.- 23
24
25
Nota: Area Istogramma = Area poligonale = Area curva di frequenza = 1
26
Distribuzioni di quantità (solo per caratteri trasferibili)
Per ogni classe viene fornito l’ammontare del carattere che
compete alla classe.
Esempio: distribuzione del reddito.
Classi di
reddito
Freq. Ass. Ammontare
0 - 10 15 120
10 - 30 45 1170
30 - 80 30 1470
oltre 80 10 950
TOTALI 100 3710
Nota: con riferimento alla frequenza assoluta si ha una distribuzione di frequenza, mentre con l’ammontare si ha una distribuzione di quantità.
27
Esempi di Distribuzioni di Frequenze
e
Distribuzioni di Quantità
28
Carattere quantitativo: Distribuzione Seriazione di frequenze o di quantità. Carattere qualitativo: Distribuzione Serie di frequenze o di quantità. Serie temporale ( o storica ) Serie territoriali
29
30
0
500
1000
1500
2000
2500
3000
Delitti Totali (in migliaia)
31
Delitti Totali (in migliaia)
0
500
1000
1500
2000
2500
3000
32
Variazioni del prezzo della benzina senza piombo dal 1988 al 2003 negli USA 33
34
35
36
37
0
100
200
300
400
500
600
Superficie Paesi EU (in Migliaia Km quad.)
38
Cartogramma
39
Sintesi numeriche di una distribuzione:
Misure di centralità
La Mediana
n = numero di unità del collettivo.
Ordiniamo le modalità in senso crescente:
se n è dispari: mediana= unica modalità centrale
se n è pari:
mediana=1/2 (somma delle modalità centrali)
40
Esempi:
I° collettivo:
n=15 (dispari)
7 - 3 - 3 - 11 - 4 - 4 - 2 - 9 - 7 - 10 - 9 - 1 - 1 - 4 - 10
ordiniamo:
Modalità 1 1 2 3 3 4 4 4 7
Rango 1 2 3 4 5 6 7 8 9
7 9 9 10 10 11
10 11 12 13 14 15
mediana= modalità di rango [ ( 15+1
2) = 8 ] = 4
41
II° collettivo:
n=16 ( pari )
13 - 2 - 2 - 12 - 1 - 10 - 7 - 4 - 7 - 8 - 12 - 15 – 68 - 4 - 3 - 55
ordiniamo le modalità:
Modalità 1 2 2 3 4 4 7 7 8
Rango 1 2 3 4 5 6 7 8 9
10 12 12 13 15 55
10 11 12 13 14 15
68
16
mod. di rango[( 16
2
12
3
Mediana = ½ )] + mod. di rango[( 16
2+1)]
12
3
=
= ½ [ 7 + 8 ] = 7,5
mediana= centro ordinale 42
Distribuzione di modalità in simboli:
x1,x2,…,xi,…,xn
dove:
n indica la numerosità del collettivo statistico e
xi indica la modalità assunta dal carattere X nell’i-esima
unità del collettivo.
Distribuzione delle modalità ordinate in simboli:
Se n è dispari: Me = y(n+1)/2
Se n è pari : Me =½ [yn/2+y(n/2)+1]
y1≤y2≤…≤yi≤…≤yn
43
Mediana nelle distribuzioni di frequenze:
N° figli Freq.
ass.
Freq.
relat.
Freq.
cum.
Freq.
cum. rel.
0 5 0.10 5 0.10
1 12 0.24 17 0.34
2 19 0.38 36 0.72
3 9 0.18 45 0.90
4 4 0.08 49 0.98
5 1 0.02 50 1.00 Totale 50 1.00 -- -- n = 50 (pari), le modalità centrali hanno rango:
50/2=25 ; 50/2 + 1=26 Mediana = ½[mod.rango (25)+mod.rang(26)]=½[2+2]=2
(OPERATIVAMENTE: cerchiamo la modalità la cui frequenza cumulata relativa è
immediatamente superiore 0,5) 44
Mediana nelle distribuzioni di frequenze divise in classi:
classi freq. ass. freq. rel. freq. cum. freq. cum.
rel.
meno di 6 5 0.08 5 0.08
6-14 7 0.12 12 0.20
14-24 11 0.18 23 0.38
24-40 18 0.30 41 0.68
40-65 10 0.17 51 0.85
oltre 65 9 0.15 60 1.00
totale 60 1.00 -.- -.-
n=60 (pari); le modalità centrali hanno rango: 60/2=30 e (60/2)+1=31
Quindi la classe mediana è: (24-40)
45
con l’ipotesi di uniforme distribuzione all’interno della classe
possiamo determinare il valore (approssimato) della Mediana
all’interno della Classe Mediana grazie alle proporzioni che
legano i cateti di triangoli simili
46
47
48
Me
0,68
0,50
0,38
24 40
(Me-24):(0,50-0,38)=((40-24):(0,68-0,38)
Me=24+(0,50-0,38)x(40-24)/(0,68-0,38)=24+0,12x16/0,30=30,4 49
In generale:
Me=EI+(ES-EI)x(0,5-FI)/(FS-FI)
Dove:
ES,EI= estremi superiore ed inferiore della classe mediana
FI= frequenza cumulata relativa della classe precedente a quella
mediana.
FS= frequenza cumulata relativa della classe mediana.
50
Richiami di matematica:
Il Valore Assoluto di un numero (positivo o negativo
che sia) è uguale alla sua determinazione POSITIVA.
Esempio:
333 aaa ;
Il simbolo indica, sinteticamente, la sommatoria di un
certo numero di addendi:
----.----
n
i
in yyyy1
21 ...
51
Proprietà della sommatoria:
n
i
i
n
i
in ykkykykyky11
21 ...
knkkkkn
i
1
...
n
i
n
i
iin y
aa
y
a
y
a
y
a
y
1 1
21 1...
Se k=1/a :
52
Peculiarità della mediana.
Il valore della mediana dipende soltanto da quello delle
unità centrali
Siano:
(y1,y2,...,yn)
le modalità ordinate e
(y1-Me), (y2-Me),..., (yn-Me)
gli scarti (o scostamenti) dalla mediana, la proprietà è:
Cioè per c qualsiasi si ha sempre:
cyMey i
n
i
i
153
n
i
i Mey1
Dimostrazione:
Consideriamo solo y1 e yn. Affinché c minimizzi:
|y1-c|+|yn-c|
deve essere: y1 < c < yn.
Infatti se:
y1 < c < yn segue che:
|y1-c|+|yn-c|=c-y1+yn-c=yn- y1.
Se c < y1 < yn segue che:
|y1-c|+|yn-c|=y1-c+yn-c>y1-y1+yn-y1=yn-y1.
Se, infine, y1< yn< c segue che:
|y1-c|+|yn-c|=c-yn+c-y1>yn-y1+yn-yn=yn-y1.
54
esemplificazione
5 10
1)c=7 : |5-7|+|10-7|=2+3=5
2)c=3 : |5-3|+|10-3|=2+7=9
3)c=12 : |5-12|+|10-12|=7+2=9
Consideriamo la coppia (y2, yn-1), anche in questo caso,
affinché c minimizzi: |y2-c|+|yn-1-c| , deve essere: y2 < c < yn-1,
ma così deve essere per tutte le coppie (yi, yn-i+1), quindi:
c.d.d.
55
𝐂 ≡ 𝐌𝐞𝐝𝐢𝐚𝐧𝐚
Altri indici di posizione:
Moda (Md)
Classe modale
Distribuzione unimodale
Distribuzione plurimodale
Md M d 56
I percentili I° Quartile = Q1 è il valore tale che il 25% delle unità del
collettivo hanno modalità ≤ Q1;
II° Quartile = Q2=Me è il valore tale che il 50% delle unità
del collettivo hanno modalità ≤ Q2;
III° Quartile = Q3 è il valore tale che il 75% delle unità del
collettivo hanno modalità ≤ Q3;
Q1 Q2 Q3
25% 25% 25% 25%
57
Calcolo dei Quartili
n = pari ed (n/2) = dispari
Q1 non è altro che la mediana delle prime (n/2) modalità
ordinate, con (n/2)=dispari, quindi:
Q1=y[(n/2)+1]/2=y(n+2)/4
Q2 è la mediana quindi:
Q2=Me=[yn/2+y(n/2)+1]/2
Q3 non è altro che la mediana delle ultime (n/2) modalità
ordinate, quindi:
Q3=y(n/2)+[(n/2)+1]/2=y(3n+2)/4
58
Calcolo dei Quartili
n = pari ed (n/2) = pari
Q1 non è altro che la mediana delle prime (n/2) modalità
ordinate, con (n/2)=pari, quindi:
Q1=[y[(n/2)/2]+y[(n/2)/2]+1]/2=[yn/4+yn/4+1]/2
Q2 è la mediana quindi:
Q2=Me=[yn/2+y(n/2)+1]/2
Q3 non è altro che la mediana delle ultime (n/2) modalità
ordinate, quindi:
Q3=[y(n/2)+[(n/2)]/2+y(n/2)+[(n/2)/2]+1]/2
Cioè: Q3=[y3n/4+y(3n+4)/4]/2
59
Calcolo dei Quartili
n = dispari e (n+1)/2 = pari
Q1 non è altro che la mediana delle prime (n+1)/2-1=(n-1)/2
modalità ordinate, con (n-1)/2 = dispari, quindi:
Q1=y[(n-1)/2+1]/2=y(n+1)/4
Q2 è la mediana quindi:
Q2=Me=y(n+1)/2
Q3 non è altro che la mediana delle ultime (n-1)/2 modalità
ordinate, quindi:
Q3=y(n+1)/2+[(n-1)/2]+1]/2=y3(n+1)/4
60
Calcolo dei Quartili
n = dispari e (n+1)/2 = dispari
Q1 non è altro che la mediana delle prime (n+1)/2-1=(n-1)/2
modalità ordinate, con (n-1)/2=pari, quindi:
Q1=[y[(n-1)/2]/2+y[(n-1)/2]/2+1]/2=[y(n-1)/4+y(n+3)/4]/2
Q2 è la mediana quindi:
Q2=Me=y(n+1)/2
Q3 non è altro che la mediana delle ultime (n-1)/2 modalità
ordinate, quindi:
Q3=[y (n+1)/2+[(n-1)/2]/2+y(n+1)/2+[(n-1)/2]/2+1]/2
cioè: Q3=[y(3n+1)/4+y(3n+5)/4]/2
61
Esempi:
I° collettivo: n=15=dispari, (n+1)/2=8=pari
Modalità ordinate:
Ranghi:
, quindi: Q1= y4=3;
, quindi: Q3= y12=9;
, quindi: Q2= Me=y8=4;
62
Esempi:
II° collettivo: n=16=dispari, n/2=8=pari
Modalità ordinate:
Ranghi: Q1 Me Q3
, quindi: Q1=[y4+y5]/2=3,5
, quindi: Q2=Me=[y8+y9]/2=7,5
, quindi: Q3=[y12+y13]/2=12,5
63
Nel caso di distribuzioni divise in classi di modalità, si applica
lo stesso criterio visto per la mediana.
33
33333
11
11111
FI-FS
FI-0.75)EI-(ES+EI =Q
FI-FS
FI-0.25)EI-(ES+EI =Q
EI1,ES1= Estremo inf. e sup. della classe contenente Q1
EI3,ES3= Estremo inf. e sup. della classe contenente Q3
FS1,FI1= Freq. cum. rel. della classe contenente Q1 e di quella
precedente.
FS3,FI3= Freq. cum. rel. della classe contenente Q3 e di quella
precedente.
64
Esempio: Distribuzione di frequenza per classi di modalità
Classi
d’età
freq.
ass.
freq. cum. freq. cum.
relat.
Meno di 6 5 5 0.08
6 - 14 7 12 0.20
14 - 24 11 23 0.38 Q1
24 - 40 18 41 0.68 Q2=Me
40 - 65 10 51 0.85 Q3
oltre 65 9 60 1.00
Totali 60 -- -- 65
29.5068.0-85.0
0.68-0.7540)-(65+40=Q
78.1620.0-38.0
0.20-0.2514)-(24+14=Q
3
1
Dopo aver ricordato che la Mediana è pari
Me=24+(40-24)x(0,50-0,38)/(0,68-0,38)=
=Me= Q2= 30,4
calcoliamo gli altri due quartili:
66
La media aritmetica
Misura di centralità che dipende da tutte le modalità
Esempio:
I° collettivo:
M=1/15(7+3+3+11+4+4+2+9+7+10+9+1+1+4+10)=5.67
II° collettivo:
M=(13+2+2+12+1+10+7+4+7+8+12+15+
+68+4+3+55)/16=13.94
mentre la mediana (media lasca) era Me=4 nel I° collettivo e
Me=7.5 nel II°.
Media : sensibile ai valori estremi
Eliminando i valori 68 e 55 nel II° collettivo:
Me=7.0 , M=7.14
67
Media aritmetica per distribuzione di frequenza
n° figli freq. ass. freq. rel.
0 5 0.10
1 12 0.24
2 19 0.38
3 9 0.18
4 4 0.08
5 1 0.02
Totali 50 1.00 68
M=1/50(0+0+0+0+0+1+1+..........+3+3+4+4+4+4+5)
=1/50[(0*5)+(1*12)+(2*19)+(3*9)+(4*4)+(5*1)]=98/50
M=1,96
Alternativamente, molto più facilmente si può calcolare la
Media pesata o ponderata:
M=(0*0.10)+(1*0.24)+(2*0.38)+(3*0.18)+(4*0.08)+(5*0.02)
che porta allo stesso risultato:
In simboli indicheremo con: (x1, x2,…,xi,…,xn) le modalità
rilevate del carattere X relative alle n unità del collettivo
e con M la Media Aritmetica calcolata da:
n
i
ini xn
xxxn
M1
1
1)......(
1
69
di seguito indicheremo, anche, con:
(x1,x2,…,xi,…,xk)
e con:
(n1,n2,…,ni,…,nk) , con ,
le k modalità diverse del carattere X rilevato sulle n unità
statistiche del collettivo. La formula di calcolo della media
aritmetica è pertanto:
: dove fi sono le frequenze relative.
k
i
i nn1
i
k
i
ii
k
i
i
k
i
iikkii
fxn
nxM
nxn
nxnxnxnxn
M
11
1
2211
1)........(
1
70
X Fr(X)=ni Fr.r(X)=fi
x1 n1 f1
x2 n2 f2
… --- ---
xi ni fi
… … ---
xk nk fk
Totale n 1
Distribuzione di frequenze di modalità
(in simboli)
71
Distribuzione di freq per classi di modalità
distribuzione delle altezze
classi fr. ass. fr. rel. val. cent.
140-148 4 0.07 144
148-156 16 0.26 152
156-164 25 0.42 160
164-172 11 0.18 168
172-180 4 0.07 176
Totali 60 1.00 ---
72
Calcolo della Media, in modo esatto:
M=(158+160+..+165+167)/60=158.98
alternativamente:
M=[(144*4)+(152*16)+(160*25)+
+(168*11)+(176*4)]/60=159.33
Dove 144,152, 160, 168 e 176 sono i valori centrali delle
classi.
73
Simbologia: ci = (xi + xi+1 ) /2 ;
Classi
Modalità:
xi-1 xi
Frequenze
Assolute:
ni
Frequenze
Relative:
fi
Valori centrali
delle Classi: ci
x1 x2 n1 f1 c1
x2 x3 n2 f2 c2
… … … …
xi xi+1 ni fi ci
… … … …
xk-1 xk nk-1 fk-1 ck-1
xk xk+1 nk fk ck
totale n 1 …
74
Proprietà di M:
1)Internalità della Media
Siano (x1, x2,…,xi,…,xn) modalità rilevate del carattere X e
y1 , yn , rispettivamente, la modalità più piccola e quella più
grande, allora: y1 ≤ M ≤ yn .
Dimostrazione
per definizione:
y1 ≤ x1 ≤ yn;..….…..; y1 ≤ xi ≤ yn;……… ; y1 ≤ xn ≤ yn .
Sommando membro a membro le diseguaglianze si ha che:
e dividendo per n si ottiene:
, da cui y1 ≤ M ≤ yn , c.d.d.
75
2)Proprietà di Invarianza
La media aritmetica, se sostituita a ciascuna delle singole
modalità osservate, lascia invariata la somma delle modalità.
Dimostrazione
Si indichi la funzione somma delle modalità rilevate con:
, sostituendo al posto delle xi la media
M si ottiene: , c.d.d.
76
3)Proprietà della Nullità della Somma degli Scarti
La somma degli scarti dalla media è nulla.
Dimostrazione:
c.d.d.
77
4)Proprietà del minimo
La somma degli scarti al quadrato delle modalità da una
costante c assume il valore minimo quando c = M , cioè:
, c per qualsiasi.
Dimostrazione:
78
ma il secondo termine è nullo (per la terza proprietà della
media aritmetica) ed il terzo è certamente positivo, quindi:
cioè:
c.d.d.
0
79
Se anziché considerare le n modalità rilevate (x1, x2,…,xi,..,xn)
del carattere X si considerino le k modalità diverse e le
rispettive frequenze (n1,n2,…,ni,…,nk), le precedenti proprietà
hanno dimostrazioni del tutto analoghe:
1)Internalità: y1 ≤ M ≤ yn ;
Dimostrazione:
per ogni i si ha: y1 ≤ xi ≤ yn , da cui: ni y1 ≤ ni xi ≤ ni yn ,
da cui anche:
cioè:
da cui infine: y1 ≤ M ≤ yn , c.d.d. 80
2)Invarianza:
3)Nullità della somma degli scarti:
81
4)Minimo:
cioè
Dimostrazione:
c.d.d. 82
La media geometrica
Serie temporale:
Indice a base mobile:
Periodo Consumi di
energia elettrica
Num. Indice a
Base Mobile
Incremento
/Decremento %
Gennaio 3657 ---- ----
Febbraio 4534 1.24 24%
Marzo 4262 0.94 -6%
Aprile 5754 1.35 35%
Maggio 6963 1.21 21%
Giugno 6058 0.87 -13%
83
cioè: 1,656=1,24*0,94*1,35*1,21*0,87
Calcolo del valore degli indici a base mobile:
Si noti che:
84
Mg =Indice mensile medio ?
Sarebbe auspicabile che Mg sostituito ai singoli indici mensili
lasciasse invariato il prodotto, cioè:
Mg*Mg*Mg*Mg*Mg=1,656 , ovvero: Mg5 = 1,656 da cui:
che fornisce un aumento medio mensile del 10,6%. Si noti:
Mg non è la media aritmetica (che lascia invariata la somma)
Mg = Media Geometrica
(che lascia invariato il prodotto). 85
Richiami di matematica: i logartmi
Si ricorda che diremo che: lga b = c se ac = b, dove a è la
base che usualmente assume i valori: a=10, dando luogo ai
logaritmi in base 10, ovvero a = e = 2,71828…= costante di
Nepero, dando luogo ai logaritmi naturali.
Proprietà dei logaritmi:
lg(a1*a2)=lg a1+lg a2
lg(a1/a2)=lg a1-lg a2
lg a1a2=a2 lg a1
a lg
n
1alg
1
n
nn aa
86
Proprietà della media geometrica
Usando la simbologia più generale della distribuzione di
frequenze di modalità, nella quale (x1,…,xk) [xi>0] sono le
modalità diverse e (n1,…,nk) sono le corrispondenti frequenze,
(*) avremo:
1)Proprietà dell’invarianza
La media geometrica sostituita alle singole modalità lascia
invariata la funzione prodotto. Dimostrazione: Siano
e
(*)
Il caso particolare della distribuzione di modalità si ottiene per
ni=1 per tutti gli i e per k=n.
n
k
i
innn
xk
1
nk...21
in21 xxx=Mg
87
ma si ha anche:
c.d.d.
2)Il lg della Mg è la Media Aritmetica dei lg xi
Dimostrazione:
c.d.d.
3)La Mg di (z1,…,zi,…,zn) con zi=xi/yi , per i=1,…,n , è:
Mg(z)=Mg(x)/Mg(Y).
Dimostrazione:
c.d.d.
88
Dispersione o Variabilità
Definizione:
Le Misure di Dispersione:
• sono pari a zero in caso di dispersione nulla
• si utilizzano per confrontare le distribuzioni
• permettono di valutare la rappresentatività delle misure di
centralità.
89
Esempio:
Classificazione del collettivo A e del collettivo B per classi di
reddito.
classi di
reddito
val. cent.
ci
A
ni
B
ni’
A
ni ci
B
ni’ ci
0 - 10 5 10 4 50 20
10 - 20 15 25 7 375 105
20 - 30 25 40 85 1000 2125
30 - 40 35 15 2 525 70
40 - 50 45 8 1 360 45
50 - 60 55 2 1 110 55
Totali --- 100 100 2420 2420
90
Misure di Dispersione:
1)Campo di variazione: (E2-E1)
2)Distanza interquartilica: (Q3-Q1)
Collettivo A:
E1=0 , E2=60; (E2-E1)=60;
Q1=10 + 10 x (0.25-0.10) / (0.35-0.10)=16
Q3=20 + 10 x (0.75-0.35) / (0.75-0.35)=30
(Q3-Q1)=14
Collettivo B:
E1=0 , E2=60; (E2-E1)=60;
Q1=20+10 x (0.25-0.11) / (0.96-0.11)=21.65
Q3=20+10 x (0.75-0.11) / (0.96-0.11)=27.53
(Q3-Q1)=5.88
91
3)La Varianza: media degli scarti al quadrato dalla media
della distribuzione
Dipende da tutte le modalità quindi è molto sensibile ai valori
abnormi.
Calcolo semplificato:
k
=1i
ii nM-xn
1=xV
2
)(
22
i
i
2
i
i
i
2
i
ii
i
i
2
i
i
i
2
i
2
i
i
i
2
i
M+2M-nxn
1=
=nn
1M+nx
n
12M-nx
n
1=
=nM+2Mx-xn
1=
=nM-xn
1=xV )(
2
i
k
=1i
2
i M-nxn
1=V
92
Nell’esempio precedente, il campo di variazione è =60 sia nel
collettivo “A” che in quello “B”, la distanza interquartilica,
invece, varia da un collettivo all’altro mettendo in luce la
maggiore variabilità del collettivo “A” rispetto al collettivo
“B”. La varianza è una misura di variabilità più precisa. In
riferimento ai due collettivi “A” e “B”, avremo:
val. cent. Xi2 A
Xi2ni
B
Xi2ni
’
5 25 250 100
15 225 5.625 1.575
25 625 25.000 53.125
35 1.225 18.375 2.450
45 2.025 16.200 2.025
55 3.025 6.050 3.025
--- ---- 71.500 62.300
VA=71500/100-24.202=129.36; VB=62300/100-24.202=37.36
Variabilità di A > Variabilità di B 93
Difetti della varianza.
a)Dipende, eventualmente, dai valori abnormi. b)È espressa
con dimensionalità al quadrato. c)E’ una misura assoluta di
variabilità.
Alternative
Scarto Quadratico Medio: [b) è ok]
Coefficiente di Variazione: [c) è ok]
SQM e CV non sono esenti dal difetto a).
Scarto Semplice Mediano: SSM=Medianai=1,..,n [ ]
V =SQM
M
SQM CV
|xi-Me|
94
Classi d'altezza (cm)
Valori centrali
Frequenze relative
Sardegna Friuli meno di 160 157,5 0,064 0,007
160 - 165 162,5 0,182 0,035 165 - 170 167,5 0,302 0,117 170 - 175 172,5 0,269 0,274 175 - 180 177,5 0,136 0,287 180 - 185 182,5 0,040 0,188 185 - 190 187,5 0,006 0,071 più di 190 192,5 0,001 0,021
Totali --- 1,000 1,000
Distribuzione della statura degli iscritti alla leva militare
della Sardegna e del Friuli nati nel 1962 (dati ISTAT, 1985)
95
Valori centrali Freq. rel.
Sardegna
Freq. rel.
cumulate
( a )
( b )
( c )
( a ) x ( b )
(a) x (a) x (b)
157,5 0,064 0,064 10,08 1587,6
162,5 0,182 0,246 29,58 4805,9
167,5 0,302 0,548 50,59 8473,0
172,5 0,269 0,817 46,40 8004,4
177,5 0,136 0,953 24,14 4284,9
182,5 0,040 0,993 7,30 1332,3
187,5 0,006 0,999 1,13 210,9
192,5 0,001 1,000 0,19 37,1
--- 1,000 --- 169,41 28736,1
M=169,41;
Me=165+(0,500-0,246)(170-165)/(0,548-0,246)=169,21;
Q1=165+(0,250-0,246)(170-165)/(0,548-0,246)=165,07;
Q3=170+(0,750-0,548)(175-170)/(0,817-0,548)=173,75;
E2-E1=195-155=40; Q3-Q1=173,75-165,07=8,69; V=28736,1-M2=36,36;
SQM=√36,36=6,03; CV=6,03/169,41=0,036; 96
Valori
centrali
Freq. rel.
Sardegna
Scarti
assoluti da
Me
( a )
( b )
( c )
157,5 0,064 11,71
162,5 0,182 6,71
167,5 0,302 1,71
172,5 0,269 3,29
177,5 0,136 8,29
182,5 0,040 13,29
187,5 0,006 18,29
192,5 0,001 23,29
--- 1,000 ---
Scarti
assoluti da
Me ordinati
Freq. rel.
Sardegna
Freq. rel.
cumulate
( a )
( b )
( c )
1,71 0,302 0,302
3,29 0,269 0,571
6,71 0,182 0,753
8,29 0,136 0,889
11,71 0,064 0,953
13,29 0,040 0,993
18,29 0,006 0,999
23,29 0,001 1,000
--- 1,000 ---
SSM=3,29
97
Valori centrali Freq. rel. Friuli Freq. rel.
cumulate
( a )
( b )
( c )
( a ) x ( b )
(a) x (a) x (b)
157,5 0,007 0,007 1,10 173,6
162,5 0,035 0,042 5,69 924,2
167,5 0,117 0,159 19,60 3282,6
172,5 0,274 0,433 47,27 8153,2
177,5 0,287 0,720 50,94 9042,3
182,5 0,188 0,908 34,31 6261,6
187,5 0,071 0,979 13,31 2496,1
192,5 0,021 1,000 4,04 778,2
--- 1,000 --- 176,26 31111,8
M=176,26;
Me=175+(0,500-0,433)(180-175)/(0,720-0,433)=176,17;
Q1=170+(0,250-0,159)(175-170)/(0,433-0,159)=171,66;
Q3=180+(0,750-0,720)(185-180)/(0,908-0,720)=180,80;
E2-E1=195-155=40; Q3-Q1=180,80-171,66=9,14; V=31111,8-M2=44,21;
SQM=√44,21=6,65; CV=6,65/176,26=0,038;
98
Valori
centrali
Freq. rel.
Friuli
Scarti assoluti da
Me
( a )
( b )
( c )
157,5 0,007 18,67
162,5 0,035 13,67
167,5 0,117 8,67
172,5 0,274 3,67
177,5 0,287 1,33
182,5 0,188 6,33
187,5 0,071 11,33
192,5 0,021 16,33
--- 1,000 ---
Scarti
assoluti da
Me ordinati
Freq. rel.
Sardegna
Freq. rel.
cumulate
( a )
( b )
( c )
1,33 0,287 0,287
3,67 0,274 0,561
6,33 0,188 0,749
8,67 0,117 0,866
11,33 0,071 0,937
13,67 0,035 0,972
16,33 0,021 0,993
18,67 0,007 1,000
--- 1,000 ---
SSM=3,67
99
Sommario
Sardegna Friuli
Media 169.41 176.26
Mediana 169.21 176.17
(E2-E1) 40 40
(Q3-Q1) 8.68 9.14
V 36.36 44.21
SQM 6.03 6.65
CV 0.036 0.038
SSM 3.29 3.67 100
Trasformazioni lineari
Siano le xi le modalità diverse del carattere X con frequenze
ni per (i=1,…,k) ; se:
zi =xi +c
avremo:
cioè, in generale: M(z) = M(x ± c) = M(x) ± c 101
Avremo inoltre:
cioè, in generale: V(z) = V(x ± c) = V(x)
Se invece: zi =xi c
avremo:
cioè: M(z) = c M(x) 102
ancora:
cioè: V(z) = c2 V(x) 103
104
In generale se:
zi = a + b xi ,
dove le xi sono le modalità diverse del carattere X (ciascuna
avente frequenza pari a ni, con i=1,..,k,) diremo che il carattere
Z con modalità diverse zi (ciascuna avente frequenza pari a ni,
con i=1,..,k,) è una Trasformazione Lineare di X.
Applicando le formule precedenti avremo:
M(z)=M(a+bx)=M(a)+M(bx)=a+bM(x)
V(z)= V(a+bx)=V(bx)=b2V(x)
105
Un caso particolare di Trasformazione Lineare si ha quando
tra X ed Z intercorre la relazione:
in tal caso si dice che Z è stata ottenuta dalla
Standardizzazione di X . Si dice, inoltre, che Z è la variabile
standardizzata di X. La standardizzazione è un caso
particolare di Trasformazione Lineare, infatti:
106
Pertanto la Standardizzazione può essere vista come caso
particolare della Trasformazione Lineare quando:
e ;
avremo quindi:
In conclusione, se Z è la standardizzata di X, cioè se:
allora: M(z)=0 e V(z)=1.
Simmetria ed asimmetria di una distribuzione.
y y y
y= centro di simmetria e asse di simmetria
Siano le xi le modalità diverse equispaziate (o se la
distribuzione è divisa in classi, esse siano di uguale ampiezza)
del carattere X con frequenze ni per (i=1,…,k), allora:
Condizione di Simmetria ni = nk-i+1 per i=1,…,k 107
Proprietà distribuzioniUnimodale simmetriche:
M = Me = Md
dove Md è la Moda della distribuzione.
Nota:
se M=Me=Md non è detto che la distribuzione sia
simmetrica
Esempio: le xi siano: 4 5 3 5 5 3 5 8 5 5 4 8 M=Me=Md=5
ma la
distribuzione
non è simmetrica
X ni xi ni
3 2 6
4 2 8
5 6 30
8 2 16
Totali 12 60 108
Distribuzione unimodale asimmetrica positiva:
Md<Me<M
+ Md Me M
109
Distribuzione unimodale asimmetrica negativa:
Md >Me >M
M Me Md
110
Misure di asimmetria.
Indice di Pearson:
Se:
δ > 0 asimmetria positiva.
δ < 0 asimmetria negativa.
δ è un indice “relativo”.
Difatti: a) δ=0 / simmetria,
b) Md di difficile determinazione
111
Indice di Pearson modificato.
Verifica empirica: in distribuzioni non molto asimmetriche si
ha che
M – Md ≅ 3 (M - Me)
112
Trasformazioni dei dati finalizzate all’ottenimento della
simmetria
Trasformazioni di Potenza finalizzate all’ottenimento della
simmetria:
con xi>0 e lg in base 10.
Si noti, innanzitutto, che le trasformazioni di potenza lasciano
inalterato l’ordinamento dei dati. Inoltre, l’effetto sui dati è
seguente:
se p>1 zi >>xi , cioè aumentano tutti i valori ma i più
grandi aumentano più che proporzionalmente dei piccoli;
se p<1 zi<<xi , cioè diminuiscono tutti i valori ma i
piccoli diminuiscono meno che proporzionalmente dei grandi. 113
ESEMPIO:
Pertanto per ricondurci ad una situazione di simmetria
useremo :
a) in caso di asimmetria negativa valori di p>1 (ad esempio:
p=2, 2.5, 3, 3.5 etc.);
b) in caso di asimmetria positiva valori di p<1 (ad esempio:
p=1/2, 0, -1, -2 etc.).
Perché trasformare i dati per ottenere distribuzioni
simmetriche? Risposta: per facilitare i confronti
Xi Xi2 Xi
1/2
2 4 1,41
4 16 2,00
6 36 2,45
8 64 2,83
10 100 3,16
12 144 3,46
14 196 3,74
16 256 4,00
114
280 715 370 221 1340 128 456 924 383 411 143 913
250 762 236 607 399 1342 745 974 1856 1226 565 730
1377 148 309 788 288 743 1480 1160 1218 1309 1115 1236
1077 607 593 125 327 897 687 797 920 783 1315 150
992 2061 302 348 664 693 362 368 1525 1998 1117 94
1347 1894 256 645 255 774 198 407 1423 1525 366 2219
1504 1372 766 518 655 652 601 867 1062 766 780 820
121 1165 1433 811 1428 84 637 436 1626 930 125 758
505 560 1011 1085 1330 1423 809 622 640 1106 787 890
950 962 690 1532 713 1013 1788 1034 1037 1010 934 761
701 589 736 1081 1059 2257 662 1066 1026 35 2380 2489
In un collettivo di 132 unità vengono rilevate le seguenti
modalità xi del carattere X :
avremo: M=867.03, Me=781.50, SQM=513.97,
Min=35, Max=2489;
volendo costruire una distribuzione di frequenze stabiliamo le
seguenti classi di modalità: 0-250; 250-500; 500-750; 750-
1000; 1000-1250; 1250-1500; 1500-1750; 1750-2000; 2000-
2250; 2250-2500. 115
Avremo la seguente distribuzione di frequenze, cui
corrisponde l’annesso istogramma:
da entrambe le rappresentazioni (tabellare e grafica) si evince
che la distribuzione di X è asimmetrica positiva, con δ’=0.499.
Classi di
X
f(x)
0 - 250 14
250 - 500 18
500 - 750 27
750 - 1000 26
1000 - 1250 20
1250 - 1500 13
1500 - 1750 5
1750 - 2000 4
2000 - 2250 2
2250 - 2500 3
Totali 132 0
5
10
15
20
25
30
0 - 250 250 - 500 500 - 750 750 - 1000 1000 - 1250 1250 - 1500 1500 - 1750 1750 - 2000 2000 - 2250 2250 - 2500
116
Per rendere simmetrica la distribuzione dobbiamo trasformare
le modalità di X mediante la “Trasformazione di Potenza” con
p<1. Si procederà per tentativi, si scelga p=1/2=0.5; avremo:
avremo: M=54,04; Me=53,91; SQM=18,12 ,
Min=9,83, Max=97,78;
volendo costruire una distribuzione di frequenze stabiliamo le
seguenti classi di modalità: 0 -10; 10 - 20; 20 - 30; 30 - 40;
40 – 50; 50 – 60; 60 – 70; 70- 80; 80 – 90; 90 – 100.
31,47 51,48 36,47 27,73 71,21 20,63 40,71 58,79 37,14 38,55 21,92 58,43
29,62 53,21 28,72 47,27 37,95 71,27 52,59 60,42 84,16 68,03 45,54 52,04
72,22 22,33 33,16 54,14 31,94 52,52 74,94 66,12 67,80 70,36 64,78 68,31
63,64 47,27 46,70 20,36 34,17 57,90 50,42 54,46 58,66 53,96 70,53 22,49
60,99 88,80 32,76 35,31 49,54 50,65 36,05 36,37 76,10 87,40 64,84 17,39
71,40 85,04 30,00 48,79 29,94 53,64 26,14 38,35 73,45 76,10 36,26 92,21
75,56 72,08 53,35 43,52 49,19 49,07 47,03 56,89 63,18 53,35 53,86 55,27
20,00 66,26 73,71 54,96 73,58 16,33 48,48 39,76 78,65 58,99 20,36 53,06
42,94 45,33 61,59 63,88 70,94 73,45 54,89 47,88 48,60 64,51 54,11 57,67
59,64 60,03 50,54 76,28 51,40 61,66 82,57 62,31 62,40 61,56 59,12 53,17
50,95 46,54 52,26 63,76 63,08 93,02 49,46 63,30 62,06 9,83 95,57 97,78
117
Avremo la seguente distribuzione di frequenze, cui
corrisponde l’annesso istogramma:
La distribuzione trasformata (con p=1/2=0.5) è certamente
meno asimmetrica di quella originaria, infatti: δ’=0.021.
Classi di
Z F(z)
0 - 10 1
10 - 20 3
20 - 30 12
30 - 40 15
40 - 50 18
50 - 60 33
60 - 70 23
70 - 80 18
80 - 90 5
90 - 100 4
Totali 132 0
5
10
15
20
25
30
35
0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100
118
Allo scopo di migliorare ulteriormente la simmetria si possono
provare altre trasfomazioni per valori diversi di p<1. A puro
titolo didattico proveremo con p=0.485, avremo:
avremo: M=50,12; Me=50,10; SQM=16,43;
Min=9,50; Max=89,42;
volendo costruire una distribuzione di frequenze stabiliamo le
seguenti classi di modalità: 0 -10; 10 - 20; 20 - 30; 30 - 40;
40 – 50; 50 – 60; 60 – 70; 70 – 80; 80 – 90;
29,64 47,90 34,23 26,21 65,69 19,63 38,10 54,51 34,85 36,13 20,83 54,18
27,95 49,46 27,12 44,08 35,59 65,74 48,90 55,98 77,28 62,83 42,50 48,40
66,59 21,21 31,20 50,31 30,08 48,83 69,03 61,11 62,62 64,92 59,91 63,08
58,88 44,08 43,56 19,38 32,12 53,70 46,94 50,60 54,39 50,15 65,07 21,36
56,49 81,42 30,83 33,17 46,13 47,14 33,85 34,14 70,07 80,17 59,96 16,61
65,86 78,07 28,29 45,46 28,24 49,85 24,74 35,95 67,69 70,07 34,04 84,46
69,59 66,47 49,59 40,67 45,82 45,71 43,86 52,79 58,46 49,59 50,05 51,33
19,04 61,24 67,93 51,04 67,81 15,62 45,17 37,24 72,35 54,69 19,38 49,33
40,14 42,31 57,03 59,09 65,44 67,69 50,98 44,63 45,28 59,67 50,27 53,49
55,28 55,63 47,04 70,23 47,83 57,09 75,86 57,68 57,77 57,01 54,81 49,43
47,42 43,41 48,60 58,99 58,38 85,18 46,06 58,57 57,46 9,50 87,45 89,42
119
Avremo la seguente distribuzione di frequenze, cui
corrisponde l’annesso istogramma:
la distribuzione trasformata (con p=0.485) è più simmetrica di
quella originaria, infatti δ’=0.005.
0
5
10
15
20
25
30
35
40
0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90
Classi di
Z
f(z)
0 - 10 1
10 - 20 6
20 - 30 10
30 - 40 15
40 - 50 33
50 - 60 35
60 - 70 19
70 - 80 7
80 - 90 6
Totale 132
120
Distribuzioni Bivariate Sulle unità statistiche del collettivo di 50 famiglie sulle quali
abbiamo rilevato il carattere X = “n° Figli per Famiglia”
rileviamo un secondo carattere Y = “Settore di Attività
Economica del Capofamiglia”, le cui modalità sono:
A= agricoltura; I= industria; S= servizi;
elenco modalità rilevate:
dal conteggio delle singole modalità diverse xi e dall’analogo
conteggio delle singole modalità diverse yi si ottengono
distribuzioni univariate di X e di Y: 121
(3,A) (1,I) (3,A) (2,S) (2,I) (0,A) (2,I) (1,S) (5,A) (4,I)
(2,S) (2,A) (3,I) (1,A) (1,I) (2,S) (2,I) (0,I) (2,A) (1,S)
(4,A) (2,S) (1,I) (2,I) (1,S) (4,S) (3,S) (2,I) (1,S) (3,I)
(0,S) (4,A) (3,I) (2,A) (0,S) (3,A) (2,I) (2,I) (1,A) (2,S)
(3,A) (1,S) (0,S) (2,I) (2,S) (1,I) (2,I) (2,S) (1,S) (3,I)
X=N° figli Frequenze
0 5
1 12
2 19
3 9
4 4
5 1
Totale 50
Y=Settore Attità
Economica
Frequenze
Agric. 13
Indus. 19
Serv. 18
Totale 50
122
Distribuzioni Univariate di Frequenze (o anche
Distribuzioni Marginali)
Conteggiando le coppie di modalità diverse (xi , yi) dei due
caratteri (X,Y) avremo:
Distribuzione
Bivariata di Frequenze
I valori nella tabella vengono chiamati: frequenze congiunte;
mentre i totali parziali vengono chiamati: frequenze
marginali.
Simbologia delle Distribuzioni Bivariate
X/Y y1 y2 y3 ... yj ... ys Tot
x1 n11 n12 n13 ... n1j ... n1s n1.
x2 n21 n22 n23 ... n2j ... n2s n2.
... ... ... ... ... ... ... ... ...
xi ni1 ni2 ni3 ... nij ... nis ni.
... ... ... ... ... ... ... ... ...
xr nr1 nr2 nr3 ... nrj ... nrs nr.
Tot n.1 n.2 n.3 ... n.j ... n.s n
123
X e Y sono i caratteri qualitativi e/o quantitativi che
costituiscono la distribuzione doppia.
Frequenze Congiunte: fr(X=xi;Y=yj)=fr(xi;yj)=nij .
Frequenze Marginali
fr(X=xi ) = fr(xi ) =
fr(Y=yi ) = fr(yi ) =
Totale complessivo delle freq.
r
=1i
i.
s
j=1
.j
r
=1i
s
j=1
ij
r
=1i
ij.j
s
j=1
iji.
ij
n =n= n=n
s1,2,...,=j n=n
r1,2,...,=i n=n
sjrin
:
:
),...,1;,...,1(:
124
Frequenze Relative:
Freq. relative congiunte: f(xi,yj)=nij/n=fij (i=1,…,r;j=1,…,s)
Freq. relative marginali: f(xi)=ni./n=fi. (i=1,...,r)
f(yj)=nj./n=f.j (j=1,..,s)
Naturalmente:
1)( ;1)(
1),(
),()(
),()(
11
1 1
1
.
1.
s
j
j
r
i
i
r
i
s
j
ji
r
i
jijj
s
j
jiii
yfxf
yxf
yxfyff
yxfxff
125
126
Nota: alle coppie di modalità (3,A) e (3,I) compete la stessa
frequenza relativa: 0.08 (8% del totale delle 50 famiglie), ma il
peso delle famiglie con 3 figli è molto diverso tra le famiglie
“A” e quelle “I”. Per sapere se la % di famiglie con 3 figli è
maggiore tra quelle “agricole” che tra quelle “operaie”
dobbiamo calcolare le frequenze di X condizionate ad Y.
Dalle 50 coppie di modalità ricaviamo la distribuzione di
frequenze bivariata (X,Y) mediante il conteggio delle
frequenze di ciascuna coppia di modalità diverse (in tutto
6x3=18) (xi , yi ):
Per far risaltare questo diverso peso dovremmo calcolare le
frequenze relative delle famiglie con 3 figli nei sotto–collettivi
delle famiglie “A”, “I” ed “S”. In modo più completo
calcoleremo tutte le frequenze relative nelle tre sotto –
distribuzioni:
X|Y=A 0 1 2 3 4 5 Totali
fr. 1 2 3 4 2 1 13
fr. rel. 0.08 0.15 0.23 0.31 0.15 0.08 1.00
X|Y=I 0 1 2 3 4 5 Totali
fr. 1 4 9 4 1 0 19
fr. rel. 0.05 0.21 0.48 0.21 0.05 0.00 1.00
X|Y=S 0 1 2 3 4 5 Totali
fr. 3 6 7 1 1 0 18
fr. rel. 0.17 0.33 0.38 0.06 0.06 0.00 1.00 127
Le tre distribuzioni univariate (che si aggiungono alle due
distribuzioni marginali) appena illustrate si chiamano:
Distribuzioni di X Condizionate ad Y
che possiamo sintetizzare nella seguente tabella:
X 0 1 2 3 4 5 Totali
fr(X|Y=A) 0.08 0.15 0.23 0.31 0.15 0.08 1.00
fr(X|Y=I) 0.05 0.21 0.48 0.21 0.05 0.00 1.00
fr(X|Y=S) 0.17 0.33 0.38 0.06 0.06 0.00 1.00
Si noti ora che le famiglie con 3 figli sono 31% tra quelle agricole ed
il 21% tra quelle operaie.
In generale, quando su n unità statistiche vengono rilevati due
caratteri, X e Y, si possono determinare le Distribuzioni Univariate
dei caratteri X e Y considerati singolarmente, la Distribuzione
Bivariariata (o Distribuzione Congiunta) dei caratteri X e Y
considerati congiuntamente ed, infine, le Distribuzioni
Condizionate. 128
X ni.
x1 n1.
.. ..
xi ni.
.. ..
xr nr.
Tot. n
X f(X)
x1 f(x1 ) = n1./n
.. ..
xi f(xi ) = ni./n
.. ..
xr f(xr ) = nr./n
Tot. 1
X f( X | yj )
x1 f(x1|yj ) = n1j /n.j
.. ..
xi f(xi|yj ) = nij /n.j
.. ..
xr f(xr|yj ) = nrj /n.j
Totali 1
In simboli le distribuzioni univariate di X, pertanto, sono:
L’ultima delle tre tabelle è la generica distribuzione di X
condizionata a Y=yj , poiché (j=1,...,s) di distribuzioni
condizionate di X ce ne sono proprio s.
129
Calcoliamo ora le distribuzioni di frequenze del carattere Y
nei sotto-collettivi di famiglie che hanno, rispettivamente, “0”,
“1”, “2”, “3”, “4”, “5”:
Y|X=0 fr. fr. rel.
A 1 0.20
I 1 0.20
S 3 0.60
Totali 5 1.00
Y|X=5 fr. fr. rel.
A 1 1.00
I 0 0.00
S 0 0.00
Totali 1 1.00
Y|X= fr. fr. rel.
A 2 0.50
I 1 0.25
S 1 0.25
Totali 4 1.00
Y|X=3 fr. fr. rel.
A 4 0.44
I 4 0.44
S 1 0.12
Totali 9 1.00
Y|X=2 fr. fr. rel.
A 3 0.16
I 9 0.47
S 7 0.37
Totali 19 1.00
Y|X=1 fr. fr. rel.
A 2 0.17
I 4 0.33
S 6 0.50
Totali 12 1.00
130
Distribuzioni di Y Condizionate ad X
che possiamo sintetizzare nella seguente tabella:
Y fr(Y|X=0) fr(Y|X=1) fr(Y|X=2) fr(Y|X=3) fr(Y|X=4) fr(Y|X=5)
A 0.20 0.17 0.16 0.44 0.50 1.00
I 0.20 0.33 0.47 0.44 0.25 0.00
S 0.60 0.50 0.37 0.12 0.25 0.00
Totali 1.00 1.00 1.00 1.00 1.00 1.00
131
In simboli le distribuzioni univariate di Y sono:
Y n.j
y1 n.1
.. ..
yj n.j
.. ..
yr n.s
Tot.
n
Y f(Y)
y1 f(y1 )=n.1 /n
.. ..
yj f(yi )=n.j /n
.. ..
ys f(ys )=n.s /n
Tot. 1
Y f(Y|xi )
y1 f(y1|xi )=ni1 /ni.
.. ..
yj f(yj|xi )=nij /ni.
.. ..
ys f(ys|xi )=nis /ni.
Totali 1
L’ultima delle tre tabelle è la generica distribuzione di Y
condizionata a X=xi , poiché (i=1,...,r) di distribuzioni
condizionate di Y ce ne sono proprio r.
132
Centralità, dispersione e dipendenza per distribuzione
bivariate
Medie Marginali:
Centro della distribuzione bivariata: [M(x), M(y)]
Varianze Marginali:
133
134
Medie Condizionate
per (j=1,…,s)
per (i=1,…,r)
135
Varianze Condizionate:
per (j=1,…,s)
per (i=1,…,r)
136
(1.71, 6.12) (2.77, 6.23) (2.34, 7.32) (1.42, 5.66) (0.48, 3.12)
(2.10, 7.44) (2.18, 7.23) (2.93, 5.92) (1.76, 7.29) (0.95, 4.81)
(0.92, 4.14) (0.96, 4.16) (0.58, 2.82) (2.45, 5.82) (2.96, 8.10)
(1.60, 6.28) (1.07, 4.50) (2.49, 6.30) (0.92, 4.84) (2.33, 6.08)
(1.66, 4.32) (0.45, 3.90) (1.87, 5.94) (0.44, 3.99) (2.54, 5.32)
(1.23, 4.20) (0.51, 3.74) (1.21, 4.63) (1.71, 5.45) (0.64, 4.47)
(1.12, 4.60) (2.53, 7.89) (2.13, 6.02) (0.89, 4.92) (1.20, 5.01)
(2.90, 7.65) (1.97, 6.27) (1.56, 5.09) (1.19, 3.16) (0.06, 4.58)
(2.89, 8.44) (2.07, 6.65) (0.73, 4.66) (1.56, 4.59) (1.37, 6.85)
(1.85, 6.10) (0.23, 3.81) (1.21, 5.48) (2.57, 5.78) (1.33, 3.88)
(1.46, 5.08) (0.17, 3.29) (0.10, 3.20) (0.18, 2.53) (2.95, 7.78)
(2.07, 4.81) (0.49, 2.48) (1.06, 4.83) (2.74, 6.97) (2.76, 6.58)
(2.83, 8.13) (0.26, 3.86) (2.87, 8.50) (0.65, 4.42) (2.63, 7.34)
(2.11, 6.78) (0.75, 4.39) (2.54, 6.68) (0.01, 3.01) (2.13, 6.00)
(2.16, 6.99) (1.89, 7.12) (2.38, 7.78) (1.25, 4.64) (1.65, 4.17)
(1.39, 5.50) (2.98, 6.70) (2.97, 6.86) (0.30, 3.54) (1.95, 7.47)
(2.86, 7.11) (0.40, 4.03) (0.52, 4.68) (1.73, 6.39) (2.78, 6.16)
(1.70, 3.45) (0.76, 3.02) (0.83, 4.25) (2.10, 6.70) (0.50, 3.41)
(0.99, 5.38) (1.80, 3.64) (2.15, 6.42) (0.62, 3.32) (1.81, 4.62)
(2.00, 5.83) (1.73, 4.09) (0.75, 3.45) (2.18, 6.14) (2.54, 5.87)
Quantità di composto additivo (X) e resistenza alla torsione
(Y) rilevate su 100 barre d’acciaio sperimentali:
137
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50
Diagramma SCATTER: X=quantità di composto additivo; Y=resistenza alla trazione
Y
X
138
Quantità di composto additivo (X) e resistenza alla torsione
(Y) rilevate su 100 barre d’acciaio sperimentali:
X/Y 2 - 4 4 - 5 5 - 6 6 - 7 7 - 9 Totali
0,00-0,75 15 6 0 0 0 21
0,75-1,50 4 13 6 1 0 24
1,50-2,25 2 6 5 15 7 35
2,25-3,00 0 0 4 7 9 20
Totali 21 25 15 23 16 100
Distribuzione Bivariata (X,Y)
Domanda: a quali valori di X si associano, in prevalenza, i
valori di Y?
139
140
Distribuzioni di Y condizionate ad X
(val. centr. X=0,375; 1,125; 1,875; 2,625)
(val.centr. Y=3; 4,5; 5,5;6,5; 8)
Y n1j f(Y| x1) yj f(Y| x1)
2 - 4 15 0,7143 2,1429
4 - 5 6 0,2857 1,2857
5 - 6 0 0,0000 0,0000
6 - 7 0 0,0000 0,0000
7 - 9 0 0,0000 0,0000
Totali 21 1,0000 3,4286
Y n2j f(Y| x2) yj f(Y| x2)
2 - 4 4 0,1667 0,5000
4 - 5 13 0,5417 2,4375
5 - 6 6 0,2500 1,3750
6 - 7 1 0,0417 0,2708
7 - 9 0 0,0000 0,0000
Totali 24 1,0000 4,5833
M(Y| X=x1=0,375)=3,43; M(Y| X=x2=1,125)=4,583;
141
Distribuzioni di Y condizionate ad X
(val. centr. X=0,375; 1,125; 1,875; 2,625)
(val.centr. Y=3; 4,5; 5,5;6,5; 8)
Y n3j f(Y| x3) yj f(Y| x3)
2 - 4 2 0,0571 0,1714
4 - 5 6 0,1714 0,7714
5 - 6 5 0,1429 0,7857
6 - 7 15 0,4286 2,7857
7 - 9 7 0,2000 1,6000
Totali 35 1,0000 6,1143
Y n4j f(Y| x4) yj f(Y| x4)
2 - 4 0 0,0000 0,0000
4 - 5 0 0,0000 0,0000
5 - 6 4 0,2000 1,1000
6 - 7 7 0,3500 2,2750
7 - 9 9 0,4500 3,6000
Totali 20 1,0000 6,9750
M(Y| X=x3=1,875)=6,114; M(Y| X=x4=2,625)=6,975;
142
Andamento delle Medie di Y condizionate ad X
3,429
4,583
6,114
6,975
0,000
1,000
2,000
3,000
4,000
5,000
6,000
7,000
8,000
0,000 - 0,750 0,750 - 1,500 1,500 - 2,250 2,250 - 3,000
M(Y|X)
M(Y|X)
143
Distribuzione
Bivariata X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali
( Y , X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …
Y val.c. Y
2 -4 3 11 6 2 2 0 0 21
4 - 5 4,5 2 11 6 5 1 0 25
5 - 6 5,5 0 1 5 3 2 4 15
6 - 7 6,5 0 0 1 5 10 7 23
7 - 9 8 0 0 0 3 4 9 16
Totali … 13 18 14 18 17 20 100
144
Distribuzioni Condizionate
X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali
( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …
Y val.c. Y
2 -4 3 0,8462 0,3333 0,1429 0,1111 0,0000 0,0000 0,2100
4 - 5 4,5 0,1538 0,6111 0,4286 0,2778 0,0588 0,0000 0,2500
5 - 6 5,5 0,0000 0,0556 0,3571 0,1667 0,1176 0,2000 0,1500
6 - 7 6,5 0,0000 0,0000 0,0714 0,2778 0,5882 0,3500 0,2300
7 - 9 8 0,0000 0,0000 0,0000 0,1667 0,2353 0,4500 0,1600
Totali … 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
145
Medie
Condizionate X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali
( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …
Y val.c. Y
2 -4 3 2,5385 1,0000 0,4286 0,3333 0,0000 0,0000 0,6300
4 - 5 4,5 0,6923 2,7500 1,9286 1,2500 0,2647 0,0000 1,1250
5 - 6 5,5 0,0000 0,3056 1,9643 0,9167 0,6471 1,1000 0,8250
6 - 7 6,5 0,0000 0,0000 0,4643 1,8056 3,8235 2,2750 1,4950
7 - 9 8 0,0000 0,0000 0,0000 1,3333 1,8824 3,6000 1,2800
Totali … 3,2308 4,0556 4,7857 5,6389 6,6176 6,9750 5,3550
146
Momenti II° Condizionati
X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali
( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …
Y val.c. Y
2 -4 3 7,6154 3,0000 1,2857 1,0000 0,0000 0,0000 1,8900
4 - 5 4,5 3,1154 12,3750 8,6786 5,6250 1,1912 0,0000 5,0625
5 - 6 5,5 0,0000 1,6806 10,8036 5,0417 3,5588 6,0500 4,5375
6 - 7 6,5 0,0000 0,0000 3,0179 11,7361 24,8529 14,7875 9,7175
7 - 9 8 0,0000 0,0000 0,0000 10,6667 15,0588 28,8000 10,2400
Totali … 10,7308 17,0556 23,7857 34,0694 44,6618 49,6375 31,4475
Varianze
Condizionate ( Y | X )
0,2929 0,6080 0,8827 2,2724 0,8685 0,9869 2,7715
147
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
0,25 0,75 1,25 1,75 2,25 2,75
Medie Condizionate ( Y | X )
148
Indipendenza tra due caratteri
Definizioni:
1) due caratteri sono indipendenti se tra essi non esiste una
relazione di causa ed effetto;
2) due caratteri sono indipendenti se la conoscenza di una
modalità di uno dei due caratteri non migliora la previsione
sulla modalità dell’altro;
149
Esempio di Distribuzione Bivariata:
X/Y y1 y2 y3 y4 Tot.
x1 12 4 16 8 40
x2 15 5 20 10 50
x3 9 3 12 6 30
Tot. 36 12 48 24 120 X f(X|y1) f(X|y2) f(X|y3) f(X|y4) f(X)
x1 12/36=0.33 4/12=0.33 16/48=0.33 8/24=0.33 40/120=0.33
x2 15/36=0.42 5/12=0.42 20/48=0.42 10/24=0.42 50/120=0.42
x3 9/36=0.25 3/12=0.25 12/48=0.25 6/24=0.25 30/120=0.25
Tot. 1.00 1.00 1.00 1.00 1.00
Domanda: se sulla 121^ unità si rileva Y=y3 questa
informazione migliora la nostra previsione su quale potrebbe
essere il valore di X? La risposta è NO! Perché il sapere che
Y=y3 non aggiunge nulla rispetto all’informazione che ci viene
data dalla semplice distribuzione marginale di X.
150
Y f(Y|x1) f(Y|x2) f(Y|x3) f(Y)
y1 12/40=0.30 15/50=0.30 9/30=0.30 36/120=0.30
y2 4/40=0.10 5/50=0.10 3/30=0.10 12/120=0.10
y3 16/40=0.40 20/50=0.40 12/30=0.40 48/120=0.40
y4 8/40=0.20 10/50=0.20 6/30=0.20 24/120=0.20
Tot. 1.00 1.00 1.00 1.00
Nota: se tutte le distribuzioni di X condizionate ad Y sono
uguali tra loro ed uguali alla marginale di X anche tutte le
distribuzioni di Y condizionate ad X sono uguali tra loro ed
uguali alla marginale di Y. Pertanto, anche in questo caso, se
sulla 121^ unità dovesse essere rilevato, ad esempio, X=x1 la
nostra previsione circa la modalità di Y non migliorerebbe
rispetto all’informazione che ci viene data dalla distribuzione
marginale della stessa Y. Quindi Y è indipendente da X.
Domanda: come sono le medie condizionate di X e di Y?
Pertanto possiamo concludere che: X è indipendente da Y
151
Y f( Y| x1 ) f( Y| x2 ) f( Y| x3 ) f( Y| x4 )
2 - 4 0,7143 0,1667 0,0571 0,0000
4 - 5 0,2857 0,5417 0,1714 0,0000
5 - 6 0,0000 0,2500 0,1429 0,2000
6 - 7 0,0000 0,0417 0,4286 0,3500
7 - 9 0,0000 0,0000 0,2000 0,4500
Totali 1,0000 1,0000 1,0000 1,0000
Tornando, invece, alle 100 barrette d’acciaio ed esaminando la
tabelle delle distribuzioni di Y condizionate ad X, sapendo, ad
esempio che: 0<X<0,75 quale previsione potremmo fare su Y?
152
Teorema:
Se
(1) f(xi|y1)=...=f(xi|yj)=… =f(xi|ys)=ki per (i=1,..,r)
allora:
(2) f(xi)=ki per (i=1,..,r)
(3) f(yj|x1)=...=f(yj|xi)=...=f(yj|xr)=kj per (j=1,..,s)
(4) f(yj)=kj per (j=1,..,s)
(5) X è indipendente da Y e Y è indipendente da X.
153
Dimostrazione:
dalla (1) avremo che:
ni1 / n.1 = ... = nij / n.j = ... = nis / n.s = ki
cioè:
ni1 = n.1 ki;….; nij = n.j ki; …. ; nis = n.s ki
sommando membro a membro avremo che:
cioè per (i=1,..,r)
ovvero: ki = ni. / n per (i=1,..,r), che dimostra la (2).
154
Da (1) e (2) deduciamo che:
f(xi|yj) = f(xi) = ki per (i=1,..,r) e (j=1,..,s)
che equivale a:
per (i=1,..,r) e (j=1,..,s)
da cui:
per (i=1,..,r) e (j=1,..,s)
che dimostrano la (3) e la (4).
Se sono tutte vere: (1), (2), (3) e (4) esse implicano anche la
(5) che è dalle stesse è definita. Infine la condizione di
Indipendenza Statistica tra X e Y è data da:
per (i=1,..,r) e (j=1,..,s) c.d.d..
155
In sintesi, abbiamo dimostrato che:
{indipendenza} { f(xi|yj)=f(xi)} { f(yj|xi)=f(yj)}; i,j
ovvero:
{indipendenza} {nij/n.j = ni./n} {nij/ni .= n.j/n}; i,j
Condizione d’Indipendenza:
Verificare la condizione d’indipendenza sulle ultime due
distribuzioni bivariate (pagine 138 e 144).
s1,..,=j
r1,..,=i
n
n n=n
.ji.
ij
156
Regione X Y
Piemonte 174,2 287
Valle d'Aosta 174,95 281
Lombardia 173,79 282
Trentino A.A. 175,43 266
Veneto 174,83 262
Friuli V.G. 176,11 302
Liguria 174,19 318
Emilia R. 174,58 285
Toscana 174,49 280
Umbria 173,71 263
Marche 173,46 259
Lazio 173,98 239
Abruzzi 172,3 243
Molise 171,33 230
Campania 171,2 148
Puglia 171,42 223
Basilicata 169,86 204
Calabria 169,58 173
Sicilia 170,48 175
Sardegna 169,27 209
(X): Numero degli abbonamenti alla RAI (1982) per
1000 abitanti per Regione;
(Y) Statura media in cm. degli iscritti di leva (classe
1962).
Stabiliamo le seguenti Classi di Modalità di X
169-173; 173-175; 175-177;
e di Y:
140-210; 210-250; 250-300; 300-320.
X/Y 169 - 173 173 - 175 175 - 177 Totali
140 - 210 5 0 0 5
210 - 250 3 1 0 4
250 - 300 0 8 1 9
300 - 320 0 1 1 2
Totali 8 10 2 20
Essendo per tutti gli (i,j) i caratteri (X,Y)
sono statisticamente dipendenti, ma non essendo
logicamente dipendenti, diremo che si tratta di
dipendenza spuria. Nel seguito “Dipendenza”
significherà “Dipendenza Statistica”.
nij ≠ni. n.j
n
157
Esempio: collettivo di 50 famiglie classificate per n° figli e per
settore d’attività economica del capofamiglia;
Frequenze congiunte
nij
Frequenze congiunte
d’indipendenza n’ij
Contingenze cij
Y/X 0 1 2 3 4 5 Tot.
A 1.30 3.12 4.94 2.34 1.04 0.26 13
I 1.90 4.56 7.22 3.42 1.52 0.38 19
S 1.80 4.32 6.84 3.24 1.44 0.36 18
Tot. 5 12 19 9 4 1 50
Y/X 0 1 2 3 4 5 Tot.
A -0.30 -1.12 -1.94 1.66 0.96 0.74 0.00
I -0.90 -0.56 1.78 0.58 -0.52 -0.38 0.00
S 1.20 1.68 0.16 -2.24 -0.44 -0.36 0.00
Tot. 0.00 0.00 0.00 0.00 0.00 0.00 0.00
158
Misure sintetiche di Dipendenza Statistica
Indiche Chi-Quadro di Pearson:
dove le cij = (nij – n’ij ) e le n’ij = (ni. n.j / n ).
Proprietà di χ2:
a) se X ed Y sono indipendenti allora χ2 = 0;
b) se X ed Y non sono indipendenti χ2 > 0, ed è tanto più
grande quanto più le nij si differenziano dalle n’ij ;
c) χ2 è una misura di dipendenza per X ed Y caratteri
quantitativi e/o qualitativi ed il suo calcolo non si basa né sulle
modalità di X né su quelle di Y;
d) χ2 è una misura assoluta di dipendenza statistica.
159
Calcolo di χ2:
1)Tabella dati
originari: nij;
2)Tabella di
Indipendenza: n’ij;
3)Tabella delle
contingenze: cij;
4)Tabella dei
rapporti: c2ij / n’ij;
5) χ2=10,49.
Nota: il valore di χ2 ottenuto ci assicura che tra X ed Y c’è
dipendenza statistica ma non dice quanto essa è forte, perché
χ2 è una misura assoluta di dipendenza.
Y/X 0 1 2 3 4 5 Tot.
A 1 2 3 4 2 1 13
I 1 4 9 4 1 0 19
S 3 6 7 1 1 0 18
Tot. 5 12 19 9 4 1 50
Y/X 0 1 2 3 4 5 Tot.
A 1,3 3,12 4,94 2,34 1,04 0,26 13
I 1,9 4,56 7,22 3,42 1,52 0,38 19
S 1,8 4,32 6,84 3,24 1,44 0,36 18
Tot. 5 12 19 9 4 1 50
Y/X 0 1 2 3 4 5 Tot.
A -0,3 -1,12 -1,94 1,66 0,96 0,74 0
I -0,9 -0,56 1,78 0,58 -0,52 -0,38 0
S 1,2 1,68 0,16 -2,24 -0,44 -0,36 0
Tot. 0 0 0 0 0 0 0
Y/X 0 1 2 3 4 5 Tot.
A 0,07 0,40 0,76 1,18 0,89 2,11 5,40
I 0,43 0,07 0,44 0,10 0,18 0,38 1,59
S 0,80 0,65 0,00 1,55 0,13 0,36 3,50
Tot. 1,30 1,12 1,20 2,82 1,20 2,85 10,49
r
=1i
s
j=1
2
ijijij
2
ij
ij
r
=1i
s
j=1 ij
2
ijijr
=1i
s
j=1 ij
ij2
2
=)n+n2n-(nn
1=
=n
)n-(n=
n
c=
r
=1i
s
j=1
ij
r
=1i
s
j=1
r
=1i
s
j=1
ij
ij
2
ij
r
=1i
s
j=1 ij
2
ijr
=1i
s
j=1 ij
ijijr
=1i
s
j=1 ij
2
ij
=n+n2-n
n=
=n
n+
n
nn2-
n
n=
n+2n-n
n=
r
=1i
s
j=1 ij
2
ij
n = n n n
1=)n)(n(
n
1=
n
n n=n
s
j=1
.j
r
=1i
i.
r
=1i
s
j=1
.ji.r
=1i
s
j=1
ij
Calcolo alternativo di χ2:
poiché :
Pertanto avremo anche:
infine, se non si vuole passare per il calcolo delle n’ij=ni. n.j / n,
avremo:
161
n 1-n n
n=
r
=1i
s
j=1 .ji.
2
ij
2
162
Definizione di Massima Dipendenza
La dipendenza è massima se per ogni riga o per ogni colonna
non più di una frequenza congiunta è diversa da zero.
Esempio: X/Y y1 y2 y3 y4 Tot.
x1 n11 0 0 0 n11
x2 0 0 n23 0 n23
x3 0 n32 0 0 n32
Tot. n11 n32 n23 0 n
Per le caselle con nij ≠ 0 avremo: n2ij = ni. n.j e di conseguenza
, dove t = minore ( r , s ) e max χ2 =( t – 1) n
Definiamo, quindi, l’indice relativo di dipendenza di Cràmer:
C2 = χ2/ max χ2 = χ2/ [ ( t – 1 ) n ] con [0 ≤ C2 ≤ 1] .
tn n
nr
=1i
s
j=1 .ji.
2
ij
163
Misure di dipendenza lineare o correlazione
Se due caratteri quantitativi risultano “statisticamente
dipendenti” possiamo ipotizzare che essi siano legati da una
relazione lineare, cioè del tipo Y= a + b X .
Per verificare questa ipotesi misureremo la:
“strettezza della relazione lineare, ovvero, misurando il grado
di correlazione tra X e Y”.
Si considerino le coppie di modalità (xi , yj), riportati nelle
tabelle che seguono, ed i relativi di diagrammi scatter che
mettono in luce una possibile relazione lineare tra X e Y:
164
X Y X Y X Y X Y
1,00 -3,70 6,00 -1,98 11,00 24,07 17,00 13,06
1,00 14,53 6,60 2,42 10,30 -4,60 17,00 6,18
1,30 -3,62 7,00 6,03 11,00 12,81 17,40 12,10
1,00 -4,46 7,00 -7,16 11,40 -1,16 18,00 15,31
1,00 -1,54 7,00 -1,70 12,00 10,76 18,00 7,33
1,60 -7,99 7,00 19,24 12,00 5,14 18,10 12,97
1,70 10,86 7,10 -7,68 12,10 21,17 19,00 13,56
1,50 11,97 7,00 9,32 13,00 7,38 19,00 9,45
2,00 9,11 7,80 9,02 13,00 25,59 20,30 26,55
2,00 -11,32 8,00 15,06 13,00 14,81 21,00 14,07
2,40 -6,60 8,00 19,28 13,40 9,64 22,90 22,42
3,00 2,83 8,70 19,33 13,00 24,97 23,10 26,72
3,00 5,71 8,00 17,56 13,00 0,54 24,00 29,89
3,40 9,73 8,00 7,99 14,00 24,08 24,00 33,89
3,00 -7,08 8,20 19,50 14,50 0,26 25,10 14,39
3,00 7,64 8,00 13,02 14,00 0,33 25,00 15,87
3,60 13,74 9,00 2,40 14,00 23,64 25,00 9,13
4,00 -1,76 9,00 11,69 14,20 2,79 25,00 15,41
4,10 3,66 9,10 17,11 15,00 14,89 26,70 29,08
5,00 -6,50 9,00 -1,30 15,00 -2,37 26,00 17,58
5,40 5,54 9,60 17,32 15,00 14,56 26,20 22,06
5,00 19,50 10,00 16,51 16,00 1,66 27,00 10,48
5,00 -6,96 10,00 4,00 16,00 17,61 27,00 25,73
5,20 3,47 10,30 -5,79 16,00 3,23 28,20 15,30
5,00 14,39 10,00 20,30 16,00 5,68 29,00 18,37
Data Set (a) relativo a 100 coppie di modalità (xi , yi ) dei
caratteri quantitativi X e Y
165
Diagramma Scatter (a) relativo a 100 coppie di modalità
(xi , yi ) dei caratteri quantitativi X e Y
-15
-10
-5
0
5
10
15
20
25
30
35
40
0 5 10 15 20 25 30 35
166 -15
-10
-5
0
5
10
15
20
25
30
35
40
0 5 10 15 20 25 30 35
Diagramma Scatter (a) relativo a 100 coppie di modalità (xi , yi ) dei caratteri
quantitativi X e Y
(in sovrimpressione la retta d’equazione: Y = 1 + 0,75 X )
167
X Y X Y X Y X Y
1,00 2,20 6,00 4,07 11,00 9,03 17,00 10,85
1,00 2,81 6,60 9,34 10,30 8,08 17,00 12,661,30 3,38 7,00 8,92 11,00 9,03 17,40 14,43
1,00 5,20 7,00 8,44 11,40 9,95 18,00 15,46
1,00 1,73 7,00 9,16 12,00 11,18 18,00 16,83
1,60 5,42 7,00 6,01 12,00 13,36 18,10 13,41
1,70 5,67 7,10 5,84 12,10 8,15 19,00 17,98
1,50 -0,24 7,00 7,34 13,00 9,22 19,00 15,84
2,00 5,83 7,80 9,06 13,00 9,81 20,30 19,51
2,00 3,43 8,00 8,14 13,00 11,60 21,00 14,52
2,40 2,87 8,00 6,99 13,40 13,09 22,90 19,53
3,00 4,07 8,70 7,68 13,00 10,76 23,10 15,52
3,00 -0,01 8,00 7,40 13,00 10,05 24,00 21,27
3,40 0,83 8,00 10,34 14,00 12,58 24,00 16,623,00 2,99 8,20 5,35 14,50 12,02 25,10 20,13
3,00 5,88 8,00 6,40 14,00 8,41 25,00 16,99
3,60 3,97 9,00 5,86 14,00 10,32 25,00 22,60
4,00 6,19 9,00 10,57 14,20 12,28 25,00 22,30
4,10 3,24 9,10 9,44 15,00 15,48 26,70 23,49
5,00 6,01 9,00 7,01 15,00 9,40 26,00 19,85
5,40 8,38 9,60 6,41 15,00 11,13 26,20 18,04
5,00 3,64 10,00 11,00 16,00 13,41 27,00 17,89
5,00 3,53 10,00 6,12 16,00 14,06 28,20 22,45
5,20 3,56 10,30 11,54 16,00 11,43 28,00 24,285,00 7,35 10,00 10,26 16,00 15,69 29,00 20,23
Data Set (b) relativo a 100 coppie di modalità (xi , yi ) dei
caratteri quantitativi X e Y
168 -5
0
5
10
15
20
25
30
0 5 10 15 20 25 30 35
Diagramma Scatter (b) relativo a 100 coppie di modalità
(xi , yi ) dei caratteri quantitativi X e Y
169 -5
0
5
10
15
20
25
30
0 5 10 15 20 25 30 35
Diagramma Scatter (b) relativo a 100 coppie di modalità (xi , yi ) dei caratteri
quantitativi X e Y
(in sovrimpressione la retta d’equazione: Y = 1 + 0,75 X )
170
La differenza tra i due diagrammi scatter (a) e (b) consiste nel
fatto che il primo diagramma mostra una nuvola di punti più
dispersa che non nel secondo caso, pur mostrando entrambe
una sottostante relazione lineare tra X e Y. Più precisamente
diremo che nel caso (b) la relazione lineare tra X e Y è più
stretta che non nel caso (a).
Misure di strettezza della relazione lineare o di
Correlazione tra X e Y
La Covarianza
Date le n coppie di modalità (x1, y1)……(xn, yn) chiameremo
Covarianza la media dei prodotti degli scarti dalle rispettive
medie di X e di Y:
n
=1i
ii M(y)-yM(x)-xn
1=y)cov(x,
171
(b)Diagramma Scatter degli scarti [(xi-M(X)] , [yi –M(Y)]
dei caratteri quantitativi X e Y (concordi). Sono prevalenti
i prodotti di scarti positivi, quindi Cov(X,Y)>0.
In particolare: Cov(X,Y) = 41,73.
-15
-10
-5
0
5
10
15
20
-15 -10 -5 0 5 10 15 20
III° Quadrante “+” IV° Quadrante “-”
I° Quadrante “-” II° Quadrante “+”
172
Se X ed Y sono concordi sono prevalenti i punti che cadono
nel II° e nel III° quadrante. A tali punti corrispondono scarti di
X e di Y che hanno, rispettivamente, lo stesso segno e che
producono, pertanto, prodotti di scarti positivi.
La Covarianza, essendo pari alla media dei prodotti degli
scarti, sarà positiva.
Nel caso in cui X ed Y siano discordi i punti del diagramma
scatter saranno prevalenti nel I° e nel IV° quadrante. A tali
punti corrisponderanno scarti di X e di Y che avranno segno
opposto e daranno luogo, pertanto, a prodotti di scarti negativi.
La Covarianza, in questo secondo caso, essendo pari alla
media dei prodotti degli scarti, sarà negativa.
173
X Y X Y X Y X Y
1,00 23,94 6,00 18,37 11,00 19,17 17,00 7,80
1,00 21,20 6,60 22,22 10,30 13,95 17,00 13,15
1,30 24,83 7,00 21,30 11,00 16,49 17,40 11,26
1,00 21,85 7,00 17,87 11,40 13,47 18,00 13,36
1,00 25,48 7,00 15,97 12,00 15,54 18,00 13,01
1,60 23,63 7,00 18,58 12,00 14,54 18,10 13,75
1,70 23,86 7,10 17,18 12,10 12,96 19,00 7,76
1,50 25,80 7,00 19,95 13,00 16,75 19,00 9,38
2,00 21,82 7,80 18,65 13,00 14,36 20,30 7,35
2,00 23,42 8,00 18,12 13,00 16,25 21,00 9,57
2,40 22,87 8,00 19,17 13,40 16,28 22,90 4,96
3,00 20,89 8,70 16,29 13,00 13,49 23,10 3,34
3,00 18,78 8,00 21,12 13,00 17,64 24,00 7,68
3,40 21,24 8,00 16,61 14,00 10,71 24,00 7,25
3,00 18,82 8,20 19,54 14,50 10,20 25,10 5,37
3,00 22,33 8,00 18,44 14,00 13,69 25,00 8,31
3,60 19,50 9,00 18,44 14,00 16,53 25,00 2,94
4,00 19,75 9,00 20,61 14,20 13,60 25,00 4,40
4,10 22,09 9,10 18,68 15,00 9,51 26,70 4,93
5,00 23,13 9,00 15,28 15,00 16,05 26,00 5,94
5,40 18,74 9,60 19,04 15,00 9,86 26,20 4,24
5,00 17,99 10,00 16,42 16,00 14,48 27,00 1,29
5,00 18,87 10,00 16,13 16,00 11,52 28,20 3,87
5,20 23,06 10,30 17,10 16,00 9,51 28,00 5,92
5,00 23,12 10,00 18,63 16,00 15,08 29,00 5,05
Data Set (c) relativo a 100 coppie di modalità (xi , yi ) dei
caratteri quantitativi X e Y
174 0
5
10
15
20
25
30
0 5 10 15 20 25 30 35
Diagramma Scatter (c) relativo a 100 coppie di modalità
(xi , yi ) dei caratteri quantitativi X e Y
175 0
5
10
15
20
25
30
0 5 10 15 20 25 30 35
Diagramma Scatter (c) relativo a 100 coppie di modalità (xi , yi ) dei caratteri
quantitativi X e Y
(in sovrimpressione la retta d’equazione: Y = 24 - 0,75 X )
176
(c)Diagramma Scatter degli scarti [(xi-M(X)] , [yi –M(Y)]
dei caratteri quantitativi X e Y (discordi). Sono prevalenti i
prodotti di scarti negativi, quindi Cov(X,Y)<0.
In particolare: Cov(X,Y)= - 43,72 .
-20
-15
-10
-5
0
5
10
15
-15 -10 -5 0 5 10 15 20
I° Quadrante “-”
III° Quadrante “+” IV° Quadrante “-”
II° Quadrante “+”
177
In caso di bilanciamento tra prodotti degli scarti positivi e
negativi si ha: Cov( X , Y ) = 0.
____...____
Diseguaglianza di Cauchy-Schwarz
Cov( X , Y )2 ≤ V( X ) V( Y ) Dimostrazione:
=)lw+(zM(Y)-y=w
M(X)-x=z n
=1i
2
ii
ii
ii
0 w l+ wz l 2+z=
=) wl+ wz l 2+(z=
n
=1i
2
i
2n
=1i
ii
n
=1i
2
i
n
=1i
2
i
2
ii
2
i
≥
178
Poiché l’espressione precedente non – negativa allora il
polinomio in l:
non ammette radici reali e distinte, cioè il suo discriminante è
minore o uguale a “0”, cioè:
179
ma, sostituendo al posto di zi e wi gli scarti di xi e yi dalle
rispettive medie, avremo:
cioè:
Cov( X , Y )2 ≤ V( X ) V( Y ) c.d.d.
da cui consegue:
V(Y) V(X)Y)Cov(X,V(Y) V(X) - ≤≤
180
Nella diseguaglianza di Cauchy-Schwarz vale il segno “=“
quando X ed Y sono legate da una perfetta relazione lineare,
cioè Y=a+bX.
Infatti, se Y=a+bX allora yi = a + b xi , i , quindi,
ricordando che M(Y) = a + b M(X), avremo:
V(X) b=M(X)-x n
1 b=
=M(X)-x b M(X)-x n
1=
= M(X)b-a-x b+aM(X)-x n
1=
=M(Y)-yM(X)-x n
1=Y)Cov(X,
2n
=1i
i
n
=1i
ii
n
=1i
ii
n
=1i
ii
181
inoltre, essendoci una relazione lineare tra le medie avremo
anche:
M(X)=-(a/b)+M(Y)/b
pertanto:
V(Y) b
1=M(Y)-y
n
1
b
1=
=M(Y)-y M(Y)-y b
1
n
1=
=M(Y)-y b
M(Y)+
b
a+
b
y+
b
a-
n
1=
=M(Y)-yM(X)-x n
1=Y)Cov(X,
2n
=1i
i
n
=1i
ii
i
n
=1i
i
n
=1i
ii
182
quindi, in ultima analisi:
Cov(X,Y)=bV(X)
Cov(X,Y)=V(Y)/b
pertanto se:
Y=a+bX allora Cov(X,Y)2=V(X)V(Y)
c.d.d.
inoltre, se b>0 si ha Cov(X,Y)=bV(X)≥0 , quindi:
se, invece, b<0 si ha Cov(X,Y)=bV(X)≤0 , quindi:
V(Y) V(X)=Y)Cov(X,
V(Y) V(X)- =Y)Cov(X,
183
V(Y) V(X)
Y)(X, Cov=
Y)(X, Cov max
Y)(X, Cov=Y)r(X,
Indice relativo di dipendenza lineare o correlazione:
1 Y)r(X, 1- ≤≤
il significato di r(X,Y), detto coefficiente di correlazione di
Bravais – Pearson, è identico a quello di Cov(X,Y) ma, a
differenza di quest’ultima, r(X,Y) è una misura relativa di
correlazione.
184
Per il Data Set (a) avremo:
M(X)=11,87; M(Y)=9,87; VX)=58,74; V(Y)=102,85;
Cov(X,Y)=41,43; r(X,Y)=0,533.
Per il data set (b) avremo:
M(X)=11,88;M(Y)=10,29;V(X)=59,05;V(Y)=33,20;
Cov(X,Y)=41,73; r(X,Y)=0,943.
Per il data set ( c ) avremo:
M(X)=11,88; M(Y)=15,40; V(X)=59,05; V(Y)=36,19;
Cov(X,Y)=-43,72; r(X,Y)=-0,946.
185
Sino ad ora, nello studio dei delle distribuzioni bivariate
abbiamo supposto che i dati siano forniti sotto forma di n
coppie di modalità rilevate (xi , yi ). Analizzeremo ora il caso
in cui, invece, essi siano forniti sotto forma di:
tabella a doppia entrata o tabella di contingenza.
I dati da prendere in considerazione saranno ora le r x s coppie
(xi , yj ) di modalità diverse ciascuna considerata con la
propria frequenza nij .
186
X/Y y1 y2 y3 ... yj ... ys Tot
x1 n11 n12 n13 ... n1j ... n1s n1.
x2 n21 n22 n23 ... n2j ... n2s n2.
... ... ... ... ... ... ... ... ...
xi ni1 ni2 ni3 ... nij ... nis ni.
... ... ... ... ... ... ... ... ...
xr nr1 nr2 nr3 ... nrj ... nrs nr.
Tot n.1 n.2 n.3 ... n.j ... n.s n
Tabella a Doppia Entrata
La covarianza rimane definita come la media aritmetica, in
questo caso “ponderata”, dei prodotti degli scarti dalla media,
rispettivamente, di X e di Y .
187
Si noti che se le variabili X e Y sono indipendenti allora si
avrà che: nij = ni. n.j / n , (i,j), sostituendo nella formula della
covarianza avremo:
=n
n n M(Y)-yM(X)-x
n
1=Y)Cov(X,
.ji.
j
r
=1i
s
j=1
i
=n M(Y)-y n
1n M(X)-x
n
1=
s
j=1
.jj
r
=1i
i.i
= 0 0 = 0
In conclusione:
se (X, Y) sono Indipendenti Cov(X, Y)=0 , r(X, Y)=0 .
NON E’ VERO IL VICEVERSA
188
Verifichiamo con un contro – esempio che Cov(X, Y)=0 non
implica l’indipendanza:
Infatti nella tabella, di cui sopra, M(X)=0, M(Y)=2, quindi
Cov(X,Y)=r(X,Y)=0 ma, chiaramente, Y dipende da X secondo
una legge quadratica. In questo caso X ed Y si dicono
incorrelati .
X Y XY
-2 4 -8
-1 1 -1
0 0 0
1 1 1
2 4 8
0 10 0
189
Calcolo semplificato della Covarianza
=XMYM+X My-Y Mx-y x n
1=
=YM-yXM-x n
1=Y)Cov(X,
n
=1i
iiii
n
=1i
ii
M(Y)M(X)+M(Y)M(X)-M(Y)M(X)-yxn
1=
=nM(Y)M(X)+yM(X)-xM(Y)-yxn
1=
n
=1i
ii
n
=1i
i
n
=1i
i
n
=1i
ii
da cui:
M(Y)M(X)-y xn
1=Y)Cov(X,
n
=1i
ii
se i dati sono organizzati in una tabella a doppia entrata
avremo analogamente:
il calcolo del coefficiente di correlazione si effettuerà come di
consueto:
190
V(Y) V(X)
Y)(X, Cov=Y)r(X,
M(Y)M(X)-ny xn
1=Y)Cov(X,
r
=1i
s
j=1
ijji
191
La Regressione
Sulla base delle n coppie di modalità osservate (x1,y1),..,(xn,yn),
dopo aver verificato la dipendenza tra i caratteri quantitativi X
ed Y, ci proponiamo di determinare la funzione matematica “f”
che meglio sintetizzi il legame di dipendenza tra X ed Y, cioè:
Y = f ( X )
Le motivazioni che ci spingono alla ricerca di “ f ” sono
essenzialmente due: la Previsione ed il Controllo.
192
Previsione
Nella fase di raccolta dei dati in corrispondenza dei valori
osservati x1, x2,…,xn di X e sono stati anche rilevati i
valori y1, y2,...,yn di Y. Se si osserva un nuovo valore di X,
diciamo xn+1, possiamo prevedere l’ignoto valore di Y con
y’n+1 = f ( xn+1 ).
Controllo
Sulla base degli n valori osservati di X e di Y si è determinata
la funzione che lega le due variabili: Y=f(X). Ci si chiede ora:
quale valore incognito l’operatore deve dare alla X per
ottenere un desiderato valore y0 della Y. Il valore incognito è:
x0 = f-1( y0 ), cioè quel valore di X tale che f(x0 )=y0.
193
I dati del problema della ricerca della funzione “f” più idonea a
rappresentare il legame tra X ed Y sono costituiti dalle n coppie di valori
(xi , yi ) che graficamente si possono così rappresentare n punti:
194
Il modo più semplicistico per determinare “f ” consiste nello scegliere la
polinomiale di equazione Y=a0+a1x+a2x2+…+an-1x
n-1, che passa per tutti
gli n punti dati:
195
Si opera meglio se si procede nel modo seguente:
a) si ipotizza un modello semplice di relazione tra X ed Y;
b) si determinano i valori dei parametri del modello
minimizzando i residui, cioè le differenze tra i valori osservati
di Y ed i valori teorici di Y*, forniti dal modello;
c) si giudica la bontà di adattamento del modello ai dati sulla
base dell’andamento dei residui;
d) se il modello è insoddisfacente, sulla base dei residui, si
sceglie un nuovo modello da prendere in considerazione, e si
riparte da a).
196
Il modello di relazione più semplice è quello lineare:
Y= a+ b X
“a” e “b” sono:
- i parametri del modello,
ovvero:
- il termine noto ed il coefficiente di X,
ovvero:
- l’intercetta ed il coefficiente angolare della retta di
equazione: y=a+bx .
197
Esempio di perfetta relazione lineare tra X ed Y:
Y = a + b X : con Y = a quando X = 0 e Y = a + b per X = 1.
198
Metodo dei Minimi Quadrati
Si dispone di n coppie di valori ( xi , yi ) relative ai caratteri X
ed Y rilevati su n unità statistiche. Avendo verificato la
dipendenza statistica di Y da X si vuole determinare la
funzione “ f “ più idonea per descrivere tale legame.
Ipotizziamo, in prima approssimazione che: Y = a + b X. In tal
caso in corrispondenza dei valori di X: x1, x2,…,xn , dovremmo
ottenere, nel caso di perfetta relazione lineare, i seguenti
valori teorici di Y:
y*1 = a + b x1
y*2 = a + b x2
…………….
y*n = a + b xn
Determineremo ora i parametri incogniti a e b in modo che sia
minimizzata la somma dei quadrati delle differenze (yi – y*i ):
199
Per determinare i valori di a’ e b’ che rendano minima S
dobbiamo derivare la funzione f(a,b) rispetto ad a e b,
uguagliare a zero le derivate parziali e risolvere il sistema di I°
grado che si ottiene, avente incognite a e b. Per verificare che
le soluzioni a’ e b’ che si otterranno minimizzino S basti
considerare che f(a,b) è una funzione di secondo grado tale
f(a,b) ≥ 0.
200
Avremo che:
201
Analogamente avremo:
202
Uguagliando a zero le due derivate parziali avremo il Sistema
Normale:
203
Sistema Normale:
204
Nell’espressione che ci fornisce b’ se dividiamo numeratore e
denominatore per n, otterremo:
inoltre dalla prima equazione del Sistema avremo:
da cui otteniamo:
a’ e b’ sono gli stimatori “minimi quadrati di a e b.