Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse...

Bibliografia: Cicchitelli G. (2008). Statistica. Principi e Metodi”. Pearson Education [Capitoli 1, 3, 4, 5 (fino a § 5.12), 6 (escluso § 6.3), 7, 9, 10-11] Di Ciaccio A, Borra S. (2008). Statistica. Metodologie per le Scienze Economiche e Sociali”. McGraw-Hill, Milano. [Capitolo 1 (fino a § 1.4), 2, 3 (escluso § 3.4), 4 (esclusi § 4.4 e 4.7), 6 (escluso § 6.7), 16 (fino a § 16.5)] Leti G, Cerbara L. (2009). Elementi di Statistica Descrittiva. Il Mulino [Capitoli 1-8, 10, 11 (fino a § 5.5), 13 (fino a § 6.3), 14-15] Zenga M. (2007). Lezioni di Statistica Descrittiva. Giappichelli

2

Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni:

l’enumerazione a scopi fiscali e militari.

Tra le varie civiltà ricordiamo:

Medio Oriente: Egitto ( III° millennio A.C. ) Mesopotamia ( 2800 A.C. ) Ebrei ( 1200 A.C. ) Oriente India ( 313 A.C. ) Cina

3

Roma I° censimento 578 A.C.

Alto Medioevo

Guglielmo il Conquistatore “Domesday Book” 1086 Registri Veneziani 1268 Basso Medioevo Il ruolo della Chiesa e quello degli Stati Nazionali. Lo sviluppo dei traffici.

Dopo la Rivoluzione Francese I° censimento Americano 1790 I° censimento Inglese 1801

4

XVIII° Secolo Aritmetica Politica

Statistica

Sviluppi Moderni Corrado Gini (Scuola Italiana)

R.A. Fisher (Scuola Inglese) Neyman-Pearson (Scuola Americana)

5

La Statistica nel mondo

contemporaneo ( applicazioni )

6

Statistica descrittiva. - Rappresentazione sintetica dei dati rilevati.

- Studio della relazione tra due fenomeni. Concetti elementari: Unità statistica Popolazione statistica Unità di rilevazione Campione Censimento Indagine campionaria Piano degli esperimenti Collettivo statistico

7

Concetti elementari: Carattere

Modalità del carattere Carattere: qualitativo o quantitativo

N.B. alcuni caratteri qualitativi sono ordinabili

Caratteri quantitativi: discreti o continui esempio di carattere discreto con molte modalità è il reddito.

8

Rappresentazione tabellare

Esempio: 50 famiglie classificate per il n° dei figli (carattere discreto):

3 1 3 2 2 0 2 1 5 4 2 2 3 1 1 2 2 0 2 1 4 2 1 2 1 4 3 2 1 3 0 4 3 2 0 3 2 2 1 2 3 1 0 2 2 1 2 2 1 3

9

Distribuzione di frequenze

N° figli Frequenze

0 5

1 12

2 19

3 9

4 4

5 1 Totale 50

10

Esempio: Pezzi di un lotto classificati a seconda della qualità (carattere qualitativo). (legenda: b= buono, r= riutilizzabile, d= difettoso)

b b d r b d b r r b b r b r b b r b b b d b r b d

11

Distribuzione di frequenze del carattere qualitativo dei pezzi del lotto:

Qualità pezzo frequenze

difettoso 4

riutilizzabile 7

buono 14

Totale 25

12

Frequenze relative

N° figli Freq.

ass.

Freq.

relat.

0 5 0.10

1 12 0.24

2 19 0.38

3 9 0.18

4 4 0.08

5 1 0.02 Totale 50 1.00

Qualità pezzo freq. ass. freq. relat.

difettoso 4 0.16

riutilizzabile 7 0.28

buono 14 0.56

Totale 25 1.00 13

5

12

19

9

4

1

0

2

4

6

8

10

12

14

16

18

20

0 1 2 3 4 5

N° di figli per famiglia

14

10%

24%

38%

18%

8%

2%

N° di figli per famiglia

0

1

2

3

4

5

15

4

7

14

0

2

4

6

8

10

12

14

16

difettoso riutilizzabile buono

Qualità pezzo

16

16%

28% 56%

Qualità pezzo

difettoso

riutilizzabile

buono

17

Solo per caratteri quantitativi: Frequenze cumulate e Frequenze cumulate relative

N° figli Freq.

ass.

Freq.

relat.

Freq.

cum.

Freq.

cum. rel.

0 5 0.10 5 0.10

1 12 0.24 17 0.34

2 19 0.38 36 0.72

3 9 0.18 45 0.90

4 4 0.08 49 0.98

5 1 0.02 50 1.00 Totale 50 1.00 -- --

Domanda: Qual è la % di famiglie con più di 3 figli?

18

Carattere quantitativo discreto con numerose modalità.

Esempio: età in anni compiuti rilevati su 60 individui.

5 13 22 30 26 20 11 24 14 29 31 53 0 34 1 17 62 27 37 46

15 65 27 21 34 25 1 51 16 7 6 43 17 66 69 49 10 19 28 55

73 30 75 33 3 70 54 28 8 32 67 80 33 40 64 18 67 26 12 14

19

Possibile divisione in classi: (meno di 6) età prescolare ( 6 - 14 ) età scuola d’obbligo ( 14 - 24 ) età scuola sup. e Univ. ( 24 - 40 ) Ia età produttiva ( 40- 65 ) IIa età produttiva ( oltre 65 ) età del pensionamento (NB:per convenzione l’estremo superiore non appartiene alla classe)

classi freq. ass. freq. rel. freq. cum. freq. cum.

rel.

amp.

classi

h

densità

meno di 6 5 0.08 5 0.08 6 0.013

6-14 7 0.12 12 0.20 8 0.015

14-24 11 0.18 23 0.38 10 0.018

24-40 18 0.30 41 0.68 16 0.019

40-65 10 0.17 51 0.85 25 0.007

oltre 65 9 0.15 60 1.00 35 0.004

totale 60 1.00 -.- -.- -.- -.- 20

h =freq.rel.

amp.cla.= densità di Frequenza

A= amp.cla. X h = amp.cla. X freq.rel.

amp.cla.= freq. rel.

21

Ogiva delle frequenze.

L’ogiva delle frequenze è la spezzata congiungente i punti di ascissa pari

all’estremo superiore della classe e di ordinata pari alla frequenza

cumulata relativa.

Domanda: Quanti hanno meno di 50 anni ?

Domanda: Qual è l’età cui corrisponde una frequenza relativa cumulata

uguale a 0.5 ?

22

Caratteri quantitativi continui. E’ possibile soltanto una distribuzione di frequenza divisa in classi. Il trattamento è analogo a quelle dei caratteri quantitativi discreti con molte modalità.

Esempio: altezza di 60 studenti (in cm.)

158 160 157 154 160 158 151 156 165 161 170 171 148 152 174 145 146 153 162 149

155 173 179 178 146 144 153 157 158 167

154 157 151 163 154 160 155 156 166 154 159 164 149 161 162 156 170 160 148 176

153 160 160 158 166 164 158 163 165 167

classi fr. ass. fr. rel. fr. cum. fr.cum. rel. h

140-148 4 0.07 4 0.07 0.009

148-156 16 0.26 20 0.33 0.034

156-164 25 0.42 45 0.75 0.053

164-172 11 0.18 56 0.93 0.023

172-180 4 0.07 60 1.00 0.009

Totali 60 1.00 -.- -.- -.- 23

Nota: Area Istogramma = Area poligonale = Area curva di frequenza = 1

26

Distribuzioni di quantità (solo per caratteri trasferibili)

Per ogni classe viene fornito l’ammontare del carattere che

compete alla classe.

Esempio: distribuzione del reddito.

Classi di

reddito

Freq. Ass. Ammontare

0 - 10 15 120

10 - 30 45 1170

30 - 80 30 1470

oltre 80 10 950

TOTALI 100 3710

Nota: con riferimento alla frequenza assoluta si ha una distribuzione di frequenza, mentre con l’ammontare si ha una distribuzione di quantità.

27

Esempi di Distribuzioni di Frequenze

e

Distribuzioni di Quantità

28

Carattere quantitativo: Distribuzione Seriazione di frequenze o di quantità. Carattere qualitativo: Distribuzione Serie di frequenze o di quantità. Serie temporale ( o storica ) Serie territoriali

29

0

500

1000

1500

2000

2500

3000

Delitti Totali (in migliaia)

31

Delitti Totali (in migliaia)

0

500

1000

1500

2000

2500

3000

32

Variazioni del prezzo della benzina senza piombo dal 1988 al 2003 negli USA 33

0

100

200

300

400

500

600

Superficie Paesi EU (in Migliaia Km quad.)

38

Cartogramma

39

Sintesi numeriche di una distribuzione:

Misure di centralità

La Mediana

n = numero di unità del collettivo.

Ordiniamo le modalità in senso crescente:

se n è dispari: mediana= unica modalità centrale

se n è pari:

mediana=1/2 (somma delle modalità centrali)

40

Esempi:

I° collettivo:

n=15 (dispari)

7 - 3 - 3 - 11 - 4 - 4 - 2 - 9 - 7 - 10 - 9 - 1 - 1 - 4 - 10

ordiniamo:

Modalità 1 1 2 3 3 4 4 4 7

Rango 1 2 3 4 5 6 7 8 9

7 9 9 10 10 11

10 11 12 13 14 15

mediana= modalità di rango [ ( 15+1

2) = 8 ] = 4

41

II° collettivo:

n=16 ( pari )

13 - 2 - 2 - 12 - 1 - 10 - 7 - 4 - 7 - 8 - 12 - 15 – 68 - 4 - 3 - 55

ordiniamo le modalità:

Modalità 1 2 2 3 4 4 7 7 8

Rango 1 2 3 4 5 6 7 8 9

10 12 12 13 15 55

10 11 12 13 14 15

68

16

mod. di rango[( 16

2

12

3

Mediana = ½ )] + mod. di rango[( 16

2+1)]

12

3

=

= ½ [ 7 + 8 ] = 7,5

mediana= centro ordinale 42

Distribuzione di modalità in simboli:

x1,x2,…,xi,…,xn

dove:

n indica la numerosità del collettivo statistico e

xi indica la modalità assunta dal carattere X nell’i-esima

unità del collettivo.

Distribuzione delle modalità ordinate in simboli:

Se n è dispari: Me = y(n+1)/2

Se n è pari : Me =½ [yn/2+y(n/2)+1]

y1≤y2≤…≤yi≤…≤yn

43

Mediana nelle distribuzioni di frequenze:

N° figli Freq.

ass.

Freq.

relat.

Freq.

cum.

Freq.

cum. rel.

0 5 0.10 5 0.10

1 12 0.24 17 0.34

2 19 0.38 36 0.72

3 9 0.18 45 0.90

4 4 0.08 49 0.98

5 1 0.02 50 1.00 Totale 50 1.00 -- -- n = 50 (pari), le modalità centrali hanno rango:

50/2=25 ; 50/2 + 1=26 Mediana = ½[mod.rango (25)+mod.rang(26)]=½[2+2]=2

(OPERATIVAMENTE: cerchiamo la modalità la cui frequenza cumulata relativa è

immediatamente superiore 0,5) 44

Mediana nelle distribuzioni di frequenze divise in classi:

classi freq. ass. freq. rel. freq. cum. freq. cum.

rel.

meno di 6 5 0.08 5 0.08

6-14 7 0.12 12 0.20

14-24 11 0.18 23 0.38

24-40 18 0.30 41 0.68

40-65 10 0.17 51 0.85

oltre 65 9 0.15 60 1.00

totale 60 1.00 -.- -.-

n=60 (pari); le modalità centrali hanno rango: 60/2=30 e (60/2)+1=31

Quindi la classe mediana è: (24-40)

45

con l’ipotesi di uniforme distribuzione all’interno della classe

possiamo determinare il valore (approssimato) della Mediana

all’interno della Classe Mediana grazie alle proporzioni che

legano i cateti di triangoli simili

46

Me

0,68

0,50

0,38

24 40

(Me-24):(0,50-0,38)=((40-24):(0,68-0,38)

Me=24+(0,50-0,38)x(40-24)/(0,68-0,38)=24+0,12x16/0,30=30,4 49

In generale:

Me=EI+(ES-EI)x(0,5-FI)/(FS-FI)

Dove:

ES,EI= estremi superiore ed inferiore della classe mediana

FI= frequenza cumulata relativa della classe precedente a quella

mediana.

FS= frequenza cumulata relativa della classe mediana.

50

Richiami di matematica:

Il Valore Assoluto di un numero (positivo o negativo

che sia) è uguale alla sua determinazione POSITIVA.

Esempio:

333 aaa ;

Il simbolo indica, sinteticamente, la sommatoria di un

certo numero di addendi:

----.----

n

i

in yyyy1

21 ...

51

Proprietà della sommatoria:

n

i

i

n

i

in ykkykykyky11

21 ...

knkkkkn

i

1

...

n

i

n

i

iin y

aa

y

a

y

a

y

a

y

1 1

21 1...

Se k=1/a :

52

Peculiarità della mediana.

Il valore della mediana dipende soltanto da quello delle

unità centrali

Siano:

(y1,y2,...,yn)

le modalità ordinate e

(y1-Me), (y2-Me),..., (yn-Me)

gli scarti (o scostamenti) dalla mediana, la proprietà è:

Cioè per c qualsiasi si ha sempre:

cyMey i

n

i

i

153

n

i

i Mey1

Dimostrazione:

Consideriamo solo y1 e yn. Affinché c minimizzi:

|y1-c|+|yn-c|

deve essere: y1 < c < yn.

Infatti se:

y1 < c < yn segue che:

|y1-c|+|yn-c|=c-y1+yn-c=yn- y1.

Se c < y1 < yn segue che:

|y1-c|+|yn-c|=y1-c+yn-c>y1-y1+yn-y1=yn-y1.

Se, infine, y1< yn< c segue che:

|y1-c|+|yn-c|=c-yn+c-y1>yn-y1+yn-yn=yn-y1.

54

esemplificazione

5 10

1)c=7 : |5-7|+|10-7|=2+3=5

2)c=3 : |5-3|+|10-3|=2+7=9

3)c=12 : |5-12|+|10-12|=7+2=9

Consideriamo la coppia (y2, yn-1), anche in questo caso,

affinché c minimizzi: |y2-c|+|yn-1-c| , deve essere: y2 < c < yn-1,

ma così deve essere per tutte le coppie (yi, yn-i+1), quindi:

c.d.d.

55

𝐂 ≡ 𝐌𝐞𝐝𝐢𝐚𝐧𝐚

Altri indici di posizione:

Moda (Md)

Classe modale

Distribuzione unimodale

Distribuzione plurimodale

Md M d 56

I percentili I° Quartile = Q1 è il valore tale che il 25% delle unità del

collettivo hanno modalità ≤ Q1;

II° Quartile = Q2=Me è il valore tale che il 50% delle unità

del collettivo hanno modalità ≤ Q2;

III° Quartile = Q3 è il valore tale che il 75% delle unità del

collettivo hanno modalità ≤ Q3;

Q1 Q2 Q3

25% 25% 25% 25%

57

Calcolo dei Quartili

n = pari ed (n/2) = dispari

Q1 non è altro che la mediana delle prime (n/2) modalità

ordinate, con (n/2)=dispari, quindi:

Q1=y[(n/2)+1]/2=y(n+2)/4

Q2 è la mediana quindi:

Q2=Me=[yn/2+y(n/2)+1]/2

Q3 non è altro che la mediana delle ultime (n/2) modalità

ordinate, quindi:

Q3=y(n/2)+[(n/2)+1]/2=y(3n+2)/4

58


n = pari ed (n/2) = pari

Q1 non è altro che la mediana delle prime (n/2) modalità

ordinate, con (n/2)=pari, quindi:

Q1=[y[(n/2)/2]+y[(n/2)/2]+1]/2=[yn/4+yn/4+1]/2


Q2=Me=[yn/2+y(n/2)+1]/2

Q3 non è altro che la mediana delle ultime (n/2) modalità

ordinate, quindi:

Q3=[y(n/2)+[(n/2)]/2+y(n/2)+[(n/2)/2]+1]/2

Cioè: Q3=[y3n/4+y(3n+4)/4]/2

59


n = dispari e (n+1)/2 = pari

Q1 non è altro che la mediana delle prime (n+1)/2-1=(n-1)/2

modalità ordinate, con (n-1)/2 = dispari, quindi:

Q1=y[(n-1)/2+1]/2=y(n+1)/4


Q2=Me=y(n+1)/2

Q3 non è altro che la mediana delle ultime (n-1)/2 modalità

ordinate, quindi:

Q3=y(n+1)/2+[(n-1)/2]+1]/2=y3(n+1)/4

60


n = dispari e (n+1)/2 = dispari

Q1 non è altro che la mediana delle prime (n+1)/2-1=(n-1)/2

modalità ordinate, con (n-1)/2=pari, quindi:

Q1=[y[(n-1)/2]/2+y[(n-1)/2]/2+1]/2=[y(n-1)/4+y(n+3)/4]/2


Q2=Me=y(n+1)/2

Q3 non è altro che la mediana delle ultime (n-1)/2 modalità

ordinate, quindi:

Q3=[y (n+1)/2+[(n-1)/2]/2+y(n+1)/2+[(n-1)/2]/2+1]/2

cioè: Q3=[y(3n+1)/4+y(3n+5)/4]/2

61

Esempi:

I° collettivo: n=15=dispari, (n+1)/2=8=pari

Modalità ordinate:

Ranghi:

, quindi: Q1= y4=3;

, quindi: Q3= y12=9;

, quindi: Q2= Me=y8=4;

62

Esempi:

II° collettivo: n=16=dispari, n/2=8=pari

Modalità ordinate:

Ranghi: Q1 Me Q3

, quindi: Q1=[y4+y5]/2=3,5

, quindi: Q2=Me=[y8+y9]/2=7,5

, quindi: Q3=[y12+y13]/2=12,5

63

Nel caso di distribuzioni divise in classi di modalità, si applica

lo stesso criterio visto per la mediana.

33

33333

11

11111

FI-FS

FI-0.75)EI-(ES+EI =Q

FI-FS

FI-0.25)EI-(ES+EI =Q

EI1,ES1= Estremo inf. e sup. della classe contenente Q1

EI3,ES3= Estremo inf. e sup. della classe contenente Q3

FS1,FI1= Freq. cum. rel. della classe contenente Q1 e di quella

precedente.

FS3,FI3= Freq. cum. rel. della classe contenente Q3 e di quella

precedente.

64

Esempio: Distribuzione di frequenza per classi di modalità

Classi

d’età

freq.

ass.

freq. cum. freq. cum.

relat.

Meno di 6 5 5 0.08

6 - 14 7 12 0.20

14 - 24 11 23 0.38 Q1

24 - 40 18 41 0.68 Q2=Me

40 - 65 10 51 0.85 Q3

oltre 65 9 60 1.00

Totali 60 -- -- 65

29.5068.0-85.0

0.68-0.7540)-(65+40=Q

78.1620.0-38.0

0.20-0.2514)-(24+14=Q

3

1

Dopo aver ricordato che la Mediana è pari

Me=24+(40-24)x(0,50-0,38)/(0,68-0,38)=

=Me= Q2= 30,4

calcoliamo gli altri due quartili:

66

La media aritmetica

Misura di centralità che dipende da tutte le modalità

Esempio:

I° collettivo:

M=1/15(7+3+3+11+4+4+2+9+7+10+9+1+1+4+10)=5.67

II° collettivo:

M=(13+2+2+12+1+10+7+4+7+8+12+15+

+68+4+3+55)/16=13.94

mentre la mediana (media lasca) era Me=4 nel I° collettivo e

Me=7.5 nel II°.

Media : sensibile ai valori estremi

Eliminando i valori 68 e 55 nel II° collettivo:

Me=7.0 , M=7.14

67

Media aritmetica per distribuzione di frequenza

n° figli freq. ass. freq. rel.

0 5 0.10

1 12 0.24

2 19 0.38

3 9 0.18

4 4 0.08

5 1 0.02

Totali 50 1.00 68

M=1/50(0+0+0+0+0+1+1+..........+3+3+4+4+4+4+5)

=1/50[(0*5)+(1*12)+(2*19)+(3*9)+(4*4)+(5*1)]=98/50

M=1,96

Alternativamente, molto più facilmente si può calcolare la

Media pesata o ponderata:

M=(0*0.10)+(1*0.24)+(2*0.38)+(3*0.18)+(4*0.08)+(5*0.02)

che porta allo stesso risultato:

In simboli indicheremo con: (x1, x2,…,xi,…,xn) le modalità

rilevate del carattere X relative alle n unità del collettivo

e con M la Media Aritmetica calcolata da:

n

i

ini xn

xxxn

M1

1

1)......(

1

69

di seguito indicheremo, anche, con:

(x1,x2,…,xi,…,xk)

e con:

(n1,n2,…,ni,…,nk) , con ,

le k modalità diverse del carattere X rilevato sulle n unità

statistiche del collettivo. La formula di calcolo della media

aritmetica è pertanto:

: dove fi sono le frequenze relative.

k

i

i nn1

i

k

i

ii

k

i

i

k

i

iikkii

fxn

nxM

nxn

nxnxnxnxn

M

11

1

2211

1)........(

1

70

X Fr(X)=ni Fr.r(X)=fi

x1 n1 f1

x2 n2 f2

… --- ---

xi ni fi

… … ---

xk nk fk

Totale n 1

Distribuzione di frequenze di modalità

(in simboli)

71

Distribuzione di freq per classi di modalità

distribuzione delle altezze

classi fr. ass. fr. rel. val. cent.

140-148 4 0.07 144

148-156 16 0.26 152

156-164 25 0.42 160

164-172 11 0.18 168

172-180 4 0.07 176

Totali 60 1.00 ---

72

Calcolo della Media, in modo esatto:

M=(158+160+..+165+167)/60=158.98

alternativamente:

M=[(144*4)+(152*16)+(160*25)+

+(168*11)+(176*4)]/60=159.33

Dove 144,152, 160, 168 e 176 sono i valori centrali delle

classi.

73

Simbologia: ci = (xi + xi+1 ) /2 ;

Classi

Modalità:

xi-1 xi

Frequenze

Assolute:

ni

Frequenze

Relative:

fi

Valori centrali

delle Classi: ci

x1 x2 n1 f1 c1

x2 x3 n2 f2 c2

… … … …

xi xi+1 ni fi ci

… … … …

xk-1 xk nk-1 fk-1 ck-1

xk xk+1 nk fk ck

totale n 1 …

74

Proprietà di M:

1)Internalità della Media

Siano (x1, x2,…,xi,…,xn) modalità rilevate del carattere X e

y1 , yn , rispettivamente, la modalità più piccola e quella più

grande, allora: y1 ≤ M ≤ yn .

Dimostrazione

per definizione:

y1 ≤ x1 ≤ yn;..….…..; y1 ≤ xi ≤ yn;……… ; y1 ≤ xn ≤ yn .

Sommando membro a membro le diseguaglianze si ha che:

e dividendo per n si ottiene:

, da cui y1 ≤ M ≤ yn , c.d.d.

75

2)Proprietà di Invarianza

La media aritmetica, se sostituita a ciascuna delle singole

modalità osservate, lascia invariata la somma delle modalità.

Dimostrazione

Si indichi la funzione somma delle modalità rilevate con:

, sostituendo al posto delle xi la media

M si ottiene: , c.d.d.

76

3)Proprietà della Nullità della Somma degli Scarti

La somma degli scarti dalla media è nulla.

Dimostrazione:

c.d.d.

77

4)Proprietà del minimo

La somma degli scarti al quadrato delle modalità da una

costante c assume il valore minimo quando c = M , cioè:

, c per qualsiasi.

Dimostrazione:

78

ma il secondo termine è nullo (per la terza proprietà della

media aritmetica) ed il terzo è certamente positivo, quindi:

cioè:

c.d.d.

0

79

Se anziché considerare le n modalità rilevate (x1, x2,…,xi,..,xn)

del carattere X si considerino le k modalità diverse e le

rispettive frequenze (n1,n2,…,ni,…,nk), le precedenti proprietà

hanno dimostrazioni del tutto analoghe:

1)Internalità: y1 ≤ M ≤ yn ;

Dimostrazione:

per ogni i si ha: y1 ≤ xi ≤ yn , da cui: ni y1 ≤ ni xi ≤ ni yn ,

da cui anche:

cioè:

da cui infine: y1 ≤ M ≤ yn , c.d.d. 80

2)Invarianza:

3)Nullità della somma degli scarti:

81

4)Minimo:

cioè

Dimostrazione:

c.d.d. 82

La media geometrica

Serie temporale:

Indice a base mobile:

Periodo Consumi di

energia elettrica

Num. Indice a

Base Mobile

Incremento

/Decremento %

Gennaio 3657 ---- ----

Febbraio 4534 1.24 24%

Marzo 4262 0.94 -6%

Aprile 5754 1.35 35%

Maggio 6963 1.21 21%

Giugno 6058 0.87 -13%

83

cioè: 1,656=1,24*0,94*1,35*1,21*0,87

Calcolo del valore degli indici a base mobile:

Si noti che:

84

Mg =Indice mensile medio ?

Sarebbe auspicabile che Mg sostituito ai singoli indici mensili

lasciasse invariato il prodotto, cioè:

Mg*Mg*Mg*Mg*Mg=1,656 , ovvero: Mg5 = 1,656 da cui:

che fornisce un aumento medio mensile del 10,6%. Si noti:

Mg non è la media aritmetica (che lascia invariata la somma)

Mg = Media Geometrica

(che lascia invariato il prodotto). 85

Richiami di matematica: i logartmi

Si ricorda che diremo che: lga b = c se ac = b, dove a è la

base che usualmente assume i valori: a=10, dando luogo ai

logaritmi in base 10, ovvero a = e = 2,71828…= costante di

Nepero, dando luogo ai logaritmi naturali.

Proprietà dei logaritmi:

lg(a1*a2)=lg a1+lg a2

lg(a1/a2)=lg a1-lg a2

lg a1a2=a2 lg a1

a lg

n

1alg

1

n

nn aa

86

Proprietà della media geometrica

Usando la simbologia più generale della distribuzione di

frequenze di modalità, nella quale (x1,…,xk) [xi>0] sono le

modalità diverse e (n1,…,nk) sono le corrispondenti frequenze,

(*) avremo:

1)Proprietà dell’invarianza

La media geometrica sostituita alle singole modalità lascia

invariata la funzione prodotto. Dimostrazione: Siano

e

(*)

Il caso particolare della distribuzione di modalità si ottiene per

ni=1 per tutti gli i e per k=n.

n

k

i

innn

xk

1

nk...21

in21 xxx=Mg

87

ma si ha anche:

c.d.d.

2)Il lg della Mg è la Media Aritmetica dei lg xi

Dimostrazione:

c.d.d.

3)La Mg di (z1,…,zi,…,zn) con zi=xi/yi , per i=1,…,n , è:

Mg(z)=Mg(x)/Mg(Y).

Dimostrazione:

c.d.d.

88

Dispersione o Variabilità

Definizione:

Le Misure di Dispersione:

• sono pari a zero in caso di dispersione nulla

• si utilizzano per confrontare le distribuzioni

• permettono di valutare la rappresentatività delle misure di

centralità.

89

Esempio:

Classificazione del collettivo A e del collettivo B per classi di

reddito.

classi di

reddito

val. cent.

ci

A

ni

B

ni’

A

ni ci

B

ni’ ci

0 - 10 5 10 4 50 20

10 - 20 15 25 7 375 105

20 - 30 25 40 85 1000 2125

30 - 40 35 15 2 525 70

40 - 50 45 8 1 360 45

50 - 60 55 2 1 110 55

Totali --- 100 100 2420 2420

90

Misure di Dispersione:

1)Campo di variazione: (E2-E1)

2)Distanza interquartilica: (Q3-Q1)

Collettivo A:

E1=0 , E2=60; (E2-E1)=60;

Q1=10 + 10 x (0.25-0.10) / (0.35-0.10)=16

Q3=20 + 10 x (0.75-0.35) / (0.75-0.35)=30

(Q3-Q1)=14

Collettivo B:

E1=0 , E2=60; (E2-E1)=60;

Q1=20+10 x (0.25-0.11) / (0.96-0.11)=21.65

Q3=20+10 x (0.75-0.11) / (0.96-0.11)=27.53

(Q3-Q1)=5.88

91

3)La Varianza: media degli scarti al quadrato dalla media

della distribuzione

Dipende da tutte le modalità quindi è molto sensibile ai valori

abnormi.

Calcolo semplificato:

k

=1i

ii nM-xn

1=xV

2

)(

22

i

i

2

i

i

i

2

i

ii

i

i

2

i

i

i

2

i

2

i

i

i

2

i

M+2M-nxn

1=

=nn

1M+nx

n

12M-nx

n

1=

=nM+2Mx-xn

1=

=nM-xn

1=xV )(

2

i

k

=1i

2

i M-nxn

1=V

92

Nell’esempio precedente, il campo di variazione è =60 sia nel

collettivo “A” che in quello “B”, la distanza interquartilica,

invece, varia da un collettivo all’altro mettendo in luce la

maggiore variabilità del collettivo “A” rispetto al collettivo

“B”. La varianza è una misura di variabilità più precisa. In

riferimento ai due collettivi “A” e “B”, avremo:

val. cent. Xi2 A

Xi2ni

B

Xi2ni

’

5 25 250 100

15 225 5.625 1.575

25 625 25.000 53.125

35 1.225 18.375 2.450

45 2.025 16.200 2.025

55 3.025 6.050 3.025

--- ---- 71.500 62.300

VA=71500/100-24.202=129.36; VB=62300/100-24.202=37.36

Variabilità di A > Variabilità di B 93

Difetti della varianza.

a)Dipende, eventualmente, dai valori abnormi. b)È espressa

con dimensionalità al quadrato. c)E’ una misura assoluta di

variabilità.

Alternative

Scarto Quadratico Medio: [b) è ok]

Coefficiente di Variazione: [c) è ok]

SQM e CV non sono esenti dal difetto a).

Scarto Semplice Mediano: SSM=Medianai=1,..,n [ ]

V =SQM

M

SQM CV

|xi-Me|

94

Classi d'altezza (cm)

Valori centrali

Frequenze relative

Sardegna Friuli meno di 160 157,5 0,064 0,007

160 - 165 162,5 0,182 0,035 165 - 170 167,5 0,302 0,117 170 - 175 172,5 0,269 0,274 175 - 180 177,5 0,136 0,287 180 - 185 182,5 0,040 0,188 185 - 190 187,5 0,006 0,071 più di 190 192,5 0,001 0,021

Totali --- 1,000 1,000

Distribuzione della statura degli iscritti alla leva militare

della Sardegna e del Friuli nati nel 1962 (dati ISTAT, 1985)

95

Valori centrali Freq. rel.

Sardegna

Freq. rel.

cumulate

( a )

( b )

( c )

( a ) x ( b )

(a) x (a) x (b)

157,5 0,064 0,064 10,08 1587,6

162,5 0,182 0,246 29,58 4805,9

167,5 0,302 0,548 50,59 8473,0

172,5 0,269 0,817 46,40 8004,4

177,5 0,136 0,953 24,14 4284,9

182,5 0,040 0,993 7,30 1332,3

187,5 0,006 0,999 1,13 210,9

192,5 0,001 1,000 0,19 37,1

--- 1,000 --- 169,41 28736,1

M=169,41;

Me=165+(0,500-0,246)(170-165)/(0,548-0,246)=169,21;

Q1=165+(0,250-0,246)(170-165)/(0,548-0,246)=165,07;

Q3=170+(0,750-0,548)(175-170)/(0,817-0,548)=173,75;

E2-E1=195-155=40; Q3-Q1=173,75-165,07=8,69; V=28736,1-M2=36,36;

SQM=√36,36=6,03; CV=6,03/169,41=0,036; 96

Valori

centrali

Freq. rel.

Sardegna

Scarti

assoluti da

Me

( a )

( b )

( c )

157,5 0,064 11,71

162,5 0,182 6,71

167,5 0,302 1,71

172,5 0,269 3,29

177,5 0,136 8,29

182,5 0,040 13,29

187,5 0,006 18,29

192,5 0,001 23,29

--- 1,000 ---

Scarti

assoluti da

Me ordinati

Freq. rel.

Sardegna

Freq. rel.

cumulate

( a )

( b )

( c )

1,71 0,302 0,302

3,29 0,269 0,571

6,71 0,182 0,753

8,29 0,136 0,889

11,71 0,064 0,953

13,29 0,040 0,993

18,29 0,006 0,999

23,29 0,001 1,000

--- 1,000 ---

SSM=3,29

97

Valori centrali Freq. rel. Friuli Freq. rel.

cumulate

( a )

( b )

( c )

( a ) x ( b )

(a) x (a) x (b)

157,5 0,007 0,007 1,10 173,6

162,5 0,035 0,042 5,69 924,2

167,5 0,117 0,159 19,60 3282,6

172,5 0,274 0,433 47,27 8153,2

177,5 0,287 0,720 50,94 9042,3

182,5 0,188 0,908 34,31 6261,6

187,5 0,071 0,979 13,31 2496,1

192,5 0,021 1,000 4,04 778,2

--- 1,000 --- 176,26 31111,8

M=176,26;

Me=175+(0,500-0,433)(180-175)/(0,720-0,433)=176,17;

Q1=170+(0,250-0,159)(175-170)/(0,433-0,159)=171,66;

Q3=180+(0,750-0,720)(185-180)/(0,908-0,720)=180,80;

E2-E1=195-155=40; Q3-Q1=180,80-171,66=9,14; V=31111,8-M2=44,21;

SQM=√44,21=6,65; CV=6,65/176,26=0,038;

98

Valori

centrali

Freq. rel.

Friuli

Scarti assoluti da

Me

( a )

( b )

( c )

157,5 0,007 18,67

162,5 0,035 13,67

167,5 0,117 8,67

172,5 0,274 3,67

177,5 0,287 1,33

182,5 0,188 6,33

187,5 0,071 11,33

192,5 0,021 16,33

--- 1,000 ---

Scarti

assoluti da

Me ordinati

Freq. rel.

Sardegna

Freq. rel.

cumulate

( a )

( b )

( c )

1,33 0,287 0,287

3,67 0,274 0,561

6,33 0,188 0,749

8,67 0,117 0,866

11,33 0,071 0,937

13,67 0,035 0,972

16,33 0,021 0,993

18,67 0,007 1,000

--- 1,000 ---

SSM=3,67

99

Sommario

Sardegna Friuli

Media 169.41 176.26

Mediana 169.21 176.17

(E2-E1) 40 40

(Q3-Q1) 8.68 9.14

V 36.36 44.21

SQM 6.03 6.65

CV 0.036 0.038

SSM 3.29 3.67 100

Trasformazioni lineari

Siano le xi le modalità diverse del carattere X con frequenze

ni per (i=1,…,k) ; se:

zi =xi +c

avremo:

cioè, in generale: M(z) = M(x ± c) = M(x) ± c 101

Avremo inoltre:

cioè, in generale: V(z) = V(x ± c) = V(x)

Se invece: zi =xi c

avremo:

cioè: M(z) = c M(x) 102

ancora:

cioè: V(z) = c2 V(x) 103

104

In generale se:

zi = a + b xi ,

dove le xi sono le modalità diverse del carattere X (ciascuna

avente frequenza pari a ni, con i=1,..,k,) diremo che il carattere

Z con modalità diverse zi (ciascuna avente frequenza pari a ni,

con i=1,..,k,) è una Trasformazione Lineare di X.

Applicando le formule precedenti avremo:

M(z)=M(a+bx)=M(a)+M(bx)=a+bM(x)

V(z)= V(a+bx)=V(bx)=b2V(x)

105

Un caso particolare di Trasformazione Lineare si ha quando

tra X ed Z intercorre la relazione:

in tal caso si dice che Z è stata ottenuta dalla

Standardizzazione di X . Si dice, inoltre, che Z è la variabile

standardizzata di X. La standardizzazione è un caso

particolare di Trasformazione Lineare, infatti:

106

Pertanto la Standardizzazione può essere vista come caso

particolare della Trasformazione Lineare quando:

e ;

avremo quindi:

In conclusione, se Z è la standardizzata di X, cioè se:

allora: M(z)=0 e V(z)=1.

Simmetria ed asimmetria di una distribuzione.

y y y

y= centro di simmetria e asse di simmetria

Siano le xi le modalità diverse equispaziate (o se la

distribuzione è divisa in classi, esse siano di uguale ampiezza)

del carattere X con frequenze ni per (i=1,…,k), allora:

Condizione di Simmetria ni = nk-i+1 per i=1,…,k 107

Proprietà distribuzioniUnimodale simmetriche:

M = Me = Md

dove Md è la Moda della distribuzione.

Nota:

se M=Me=Md non è detto che la distribuzione sia

simmetrica

Esempio: le xi siano: 4 5 3 5 5 3 5 8 5 5 4 8 M=Me=Md=5

ma la

distribuzione

non è simmetrica

X ni xi ni

3 2 6

4 2 8

5 6 30

8 2 16

Totali 12 60 108

Distribuzione unimodale asimmetrica positiva:

Md<Me<M

+ Md Me M

109

Distribuzione unimodale asimmetrica negativa:

Md >Me >M

M Me Md

110

Misure di asimmetria.

Indice di Pearson:

Se:

δ > 0 asimmetria positiva.

δ < 0 asimmetria negativa.

δ è un indice “relativo”.

Difatti: a) δ=0 / simmetria,

b) Md di difficile determinazione

111

Indice di Pearson modificato.

Verifica empirica: in distribuzioni non molto asimmetriche si

ha che

M – Md ≅ 3 (M - Me)

112

Trasformazioni dei dati finalizzate all’ottenimento della

simmetria

Trasformazioni di Potenza finalizzate all’ottenimento della

simmetria:

con xi>0 e lg in base 10.

Si noti, innanzitutto, che le trasformazioni di potenza lasciano

inalterato l’ordinamento dei dati. Inoltre, l’effetto sui dati è

seguente:

se p>1 zi >>xi , cioè aumentano tutti i valori ma i più

grandi aumentano più che proporzionalmente dei piccoli;

se p<1 zi<<xi , cioè diminuiscono tutti i valori ma i

piccoli diminuiscono meno che proporzionalmente dei grandi. 113

ESEMPIO:

Pertanto per ricondurci ad una situazione di simmetria

useremo :

a) in caso di asimmetria negativa valori di p>1 (ad esempio:

p=2, 2.5, 3, 3.5 etc.);

b) in caso di asimmetria positiva valori di p<1 (ad esempio:

p=1/2, 0, -1, -2 etc.).

Perché trasformare i dati per ottenere distribuzioni

simmetriche? Risposta: per facilitare i confronti

Xi Xi2 Xi

1/2

2 4 1,41

4 16 2,00

6 36 2,45

8 64 2,83

10 100 3,16

12 144 3,46

14 196 3,74

16 256 4,00

114

280 715 370 221 1340 128 456 924 383 411 143 913

250 762 236 607 399 1342 745 974 1856 1226 565 730

1377 148 309 788 288 743 1480 1160 1218 1309 1115 1236

1077 607 593 125 327 897 687 797 920 783 1315 150

992 2061 302 348 664 693 362 368 1525 1998 1117 94

1347 1894 256 645 255 774 198 407 1423 1525 366 2219

1504 1372 766 518 655 652 601 867 1062 766 780 820

121 1165 1433 811 1428 84 637 436 1626 930 125 758

505 560 1011 1085 1330 1423 809 622 640 1106 787 890

950 962 690 1532 713 1013 1788 1034 1037 1010 934 761

701 589 736 1081 1059 2257 662 1066 1026 35 2380 2489

In un collettivo di 132 unità vengono rilevate le seguenti

modalità xi del carattere X :

avremo: M=867.03, Me=781.50, SQM=513.97,

Min=35, Max=2489;

volendo costruire una distribuzione di frequenze stabiliamo le

seguenti classi di modalità: 0-250; 250-500; 500-750; 750-

1000; 1000-1250; 1250-1500; 1500-1750; 1750-2000; 2000-

2250; 2250-2500. 115

Avremo la seguente distribuzione di frequenze, cui

corrisponde l’annesso istogramma:

da entrambe le rappresentazioni (tabellare e grafica) si evince

che la distribuzione di X è asimmetrica positiva, con δ’=0.499.

Classi di

X

f(x)

0 - 250 14

250 - 500 18

500 - 750 27

750 - 1000 26

1000 - 1250 20

1250 - 1500 13

1500 - 1750 5

1750 - 2000 4

2000 - 2250 2

2250 - 2500 3

Totali 132 0

5

10

15

20

25

30

0 - 250 250 - 500 500 - 750 750 - 1000 1000 - 1250 1250 - 1500 1500 - 1750 1750 - 2000 2000 - 2250 2250 - 2500

116

Per rendere simmetrica la distribuzione dobbiamo trasformare

le modalità di X mediante la “Trasformazione di Potenza” con

p<1. Si procederà per tentativi, si scelga p=1/2=0.5; avremo:

avremo: M=54,04; Me=53,91; SQM=18,12 ,

Min=9,83, Max=97,78;


seguenti classi di modalità: 0 -10; 10 - 20; 20 - 30; 30 - 40;

40 – 50; 50 – 60; 60 – 70; 70- 80; 80 – 90; 90 – 100.

31,47 51,48 36,47 27,73 71,21 20,63 40,71 58,79 37,14 38,55 21,92 58,43

29,62 53,21 28,72 47,27 37,95 71,27 52,59 60,42 84,16 68,03 45,54 52,04

72,22 22,33 33,16 54,14 31,94 52,52 74,94 66,12 67,80 70,36 64,78 68,31

63,64 47,27 46,70 20,36 34,17 57,90 50,42 54,46 58,66 53,96 70,53 22,49

60,99 88,80 32,76 35,31 49,54 50,65 36,05 36,37 76,10 87,40 64,84 17,39

71,40 85,04 30,00 48,79 29,94 53,64 26,14 38,35 73,45 76,10 36,26 92,21

75,56 72,08 53,35 43,52 49,19 49,07 47,03 56,89 63,18 53,35 53,86 55,27

20,00 66,26 73,71 54,96 73,58 16,33 48,48 39,76 78,65 58,99 20,36 53,06

42,94 45,33 61,59 63,88 70,94 73,45 54,89 47,88 48,60 64,51 54,11 57,67

59,64 60,03 50,54 76,28 51,40 61,66 82,57 62,31 62,40 61,56 59,12 53,17

50,95 46,54 52,26 63,76 63,08 93,02 49,46 63,30 62,06 9,83 95,57 97,78

117



La distribuzione trasformata (con p=1/2=0.5) è certamente

meno asimmetrica di quella originaria, infatti: δ’=0.021.

Classi di

Z F(z)

0 - 10 1

10 - 20 3

20 - 30 12

30 - 40 15

40 - 50 18

50 - 60 33

60 - 70 23

70 - 80 18

80 - 90 5

90 - 100 4

Totali 132 0

5

10

15

20

25

30

35

0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100

118

Allo scopo di migliorare ulteriormente la simmetria si possono

provare altre trasfomazioni per valori diversi di p<1. A puro

titolo didattico proveremo con p=0.485, avremo:

avremo: M=50,12; Me=50,10; SQM=16,43;

Min=9,50; Max=89,42;


seguenti classi di modalità: 0 -10; 10 - 20; 20 - 30; 30 - 40;

40 – 50; 50 – 60; 60 – 70; 70 – 80; 80 – 90;

29,64 47,90 34,23 26,21 65,69 19,63 38,10 54,51 34,85 36,13 20,83 54,18

27,95 49,46 27,12 44,08 35,59 65,74 48,90 55,98 77,28 62,83 42,50 48,40

66,59 21,21 31,20 50,31 30,08 48,83 69,03 61,11 62,62 64,92 59,91 63,08

58,88 44,08 43,56 19,38 32,12 53,70 46,94 50,60 54,39 50,15 65,07 21,36

56,49 81,42 30,83 33,17 46,13 47,14 33,85 34,14 70,07 80,17 59,96 16,61

65,86 78,07 28,29 45,46 28,24 49,85 24,74 35,95 67,69 70,07 34,04 84,46

69,59 66,47 49,59 40,67 45,82 45,71 43,86 52,79 58,46 49,59 50,05 51,33

19,04 61,24 67,93 51,04 67,81 15,62 45,17 37,24 72,35 54,69 19,38 49,33

40,14 42,31 57,03 59,09 65,44 67,69 50,98 44,63 45,28 59,67 50,27 53,49

55,28 55,63 47,04 70,23 47,83 57,09 75,86 57,68 57,77 57,01 54,81 49,43

47,42 43,41 48,60 58,99 58,38 85,18 46,06 58,57 57,46 9,50 87,45 89,42

119



la distribuzione trasformata (con p=0.485) è più simmetrica di

quella originaria, infatti δ’=0.005.

0

5

10

15

20

25

30

35

40

0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90

Classi di

Z

f(z)

0 - 10 1

10 - 20 6

20 - 30 10

30 - 40 15

40 - 50 33

50 - 60 35

60 - 70 19

70 - 80 7

80 - 90 6

Totale 132

120

Distribuzioni Bivariate Sulle unità statistiche del collettivo di 50 famiglie sulle quali

abbiamo rilevato il carattere X = “n° Figli per Famiglia”

rileviamo un secondo carattere Y = “Settore di Attività

Economica del Capofamiglia”, le cui modalità sono:

A= agricoltura; I= industria; S= servizi;

elenco modalità rilevate:

dal conteggio delle singole modalità diverse xi e dall’analogo

conteggio delle singole modalità diverse yi si ottengono

distribuzioni univariate di X e di Y: 121

(3,A) (1,I) (3,A) (2,S) (2,I) (0,A) (2,I) (1,S) (5,A) (4,I)

(2,S) (2,A) (3,I) (1,A) (1,I) (2,S) (2,I) (0,I) (2,A) (1,S)

(4,A) (2,S) (1,I) (2,I) (1,S) (4,S) (3,S) (2,I) (1,S) (3,I)

(0,S) (4,A) (3,I) (2,A) (0,S) (3,A) (2,I) (2,I) (1,A) (2,S)

(3,A) (1,S) (0,S) (2,I) (2,S) (1,I) (2,I) (2,S) (1,S) (3,I)

X=N° figli Frequenze

0 5

1 12

2 19

3 9

4 4

5 1

Totale 50

Y=Settore Attità

Economica

Frequenze

Agric. 13

Indus. 19

Serv. 18

Totale 50

122

Distribuzioni Univariate di Frequenze (o anche

Distribuzioni Marginali)

Conteggiando le coppie di modalità diverse (xi , yi) dei due

caratteri (X,Y) avremo:

Distribuzione

Bivariata di Frequenze

I valori nella tabella vengono chiamati: frequenze congiunte;

mentre i totali parziali vengono chiamati: frequenze

marginali.

Simbologia delle Distribuzioni Bivariate

X/Y y1 y2 y3 ... yj ... ys Tot

x1 n11 n12 n13 ... n1j ... n1s n1.

x2 n21 n22 n23 ... n2j ... n2s n2.

... ... ... ... ... ... ... ... ...

xi ni1 ni2 ni3 ... nij ... nis ni.

... ... ... ... ... ... ... ... ...

xr nr1 nr2 nr3 ... nrj ... nrs nr.

Tot n.1 n.2 n.3 ... n.j ... n.s n

123

X e Y sono i caratteri qualitativi e/o quantitativi che

costituiscono la distribuzione doppia.

Frequenze Congiunte: fr(X=xi;Y=yj)=fr(xi;yj)=nij .

Frequenze Marginali

fr(X=xi ) = fr(xi ) =

fr(Y=yi ) = fr(yi ) =

Totale complessivo delle freq.

r

=1i

i.

s

j=1

.j

r

=1i

s

j=1

ij

r

=1i

ij.j

s

j=1

iji.

ij

n =n= n=n

s1,2,...,=j n=n

r1,2,...,=i n=n

sjrin

:

:

),...,1;,...,1(:

124

Frequenze Relative:

Freq. relative congiunte: f(xi,yj)=nij/n=fij (i=1,…,r;j=1,…,s)

Freq. relative marginali: f(xi)=ni./n=fi. (i=1,...,r)

f(yj)=nj./n=f.j (j=1,..,s)

Naturalmente:

1)( ;1)(

1),(

),()(

),()(

11

1 1

1

.

1.

s

j

j

r

i

i

r

i

s

j

ji

r

i

jijj

s

j

jiii

yfxf

yxf

yxfyff

yxfxff

125

126

Nota: alle coppie di modalità (3,A) e (3,I) compete la stessa

frequenza relativa: 0.08 (8% del totale delle 50 famiglie), ma il

peso delle famiglie con 3 figli è molto diverso tra le famiglie

“A” e quelle “I”. Per sapere se la % di famiglie con 3 figli è

maggiore tra quelle “agricole” che tra quelle “operaie”

dobbiamo calcolare le frequenze di X condizionate ad Y.

Dalle 50 coppie di modalità ricaviamo la distribuzione di

frequenze bivariata (X,Y) mediante il conteggio delle

frequenze di ciascuna coppia di modalità diverse (in tutto

6x3=18) (xi , yi ):

Per far risaltare questo diverso peso dovremmo calcolare le

frequenze relative delle famiglie con 3 figli nei sotto–collettivi

delle famiglie “A”, “I” ed “S”. In modo più completo

calcoleremo tutte le frequenze relative nelle tre sotto –

distribuzioni:

X|Y=A 0 1 2 3 4 5 Totali

fr. 1 2 3 4 2 1 13

fr. rel. 0.08 0.15 0.23 0.31 0.15 0.08 1.00

X|Y=I 0 1 2 3 4 5 Totali

fr. 1 4 9 4 1 0 19

fr. rel. 0.05 0.21 0.48 0.21 0.05 0.00 1.00

X|Y=S 0 1 2 3 4 5 Totali

fr. 3 6 7 1 1 0 18

fr. rel. 0.17 0.33 0.38 0.06 0.06 0.00 1.00 127

Le tre distribuzioni univariate (che si aggiungono alle due

distribuzioni marginali) appena illustrate si chiamano:

Distribuzioni di X Condizionate ad Y

che possiamo sintetizzare nella seguente tabella:

X 0 1 2 3 4 5 Totali

fr(X|Y=A) 0.08 0.15 0.23 0.31 0.15 0.08 1.00

fr(X|Y=I) 0.05 0.21 0.48 0.21 0.05 0.00 1.00

fr(X|Y=S) 0.17 0.33 0.38 0.06 0.06 0.00 1.00

Si noti ora che le famiglie con 3 figli sono 31% tra quelle agricole ed

il 21% tra quelle operaie.

In generale, quando su n unità statistiche vengono rilevati due

caratteri, X e Y, si possono determinare le Distribuzioni Univariate

dei caratteri X e Y considerati singolarmente, la Distribuzione

Bivariariata (o Distribuzione Congiunta) dei caratteri X e Y

considerati congiuntamente ed, infine, le Distribuzioni

Condizionate. 128

X ni.

x1 n1.

.. ..

xi ni.

.. ..

xr nr.

Tot. n

X f(X)

x1 f(x1 ) = n1./n

.. ..

xi f(xi ) = ni./n

.. ..

xr f(xr ) = nr./n

Tot. 1

X f( X | yj )

x1 f(x1|yj ) = n1j /n.j

.. ..

xi f(xi|yj ) = nij /n.j

.. ..

xr f(xr|yj ) = nrj /n.j

Totali 1

In simboli le distribuzioni univariate di X, pertanto, sono:

L’ultima delle tre tabelle è la generica distribuzione di X

condizionata a Y=yj , poiché (j=1,...,s) di distribuzioni

condizionate di X ce ne sono proprio s.

129

Calcoliamo ora le distribuzioni di frequenze del carattere Y

nei sotto-collettivi di famiglie che hanno, rispettivamente, “0”,

“1”, “2”, “3”, “4”, “5”:

Y|X=0 fr. fr. rel.

A 1 0.20

I 1 0.20

S 3 0.60

Totali 5 1.00

Y|X=5 fr. fr. rel.

A 1 1.00

I 0 0.00

S 0 0.00

Totali 1 1.00

Y|X= fr. fr. rel.

A 2 0.50

I 1 0.25

S 1 0.25

Totali 4 1.00

Y|X=3 fr. fr. rel.

A 4 0.44

I 4 0.44

S 1 0.12

Totali 9 1.00

Y|X=2 fr. fr. rel.

A 3 0.16

I 9 0.47

S 7 0.37

Totali 19 1.00

Y|X=1 fr. fr. rel.

A 2 0.17

I 4 0.33

S 6 0.50

Totali 12 1.00

130

In simboli le distribuzioni univariate di Y sono:

Y n.j

y1 n.1

.. ..

yj n.j

.. ..

yr n.s

Tot.

n

Y f(Y)

y1 f(y1 )=n.1 /n

.. ..

yj f(yi )=n.j /n

.. ..

ys f(ys )=n.s /n

Tot. 1

Y f(Y|xi )

y1 f(y1|xi )=ni1 /ni.

.. ..

yj f(yj|xi )=nij /ni.

.. ..

ys f(ys|xi )=nis /ni.

Totali 1

L’ultima delle tre tabelle è la generica distribuzione di Y

condizionata a X=xi , poiché (i=1,...,r) di distribuzioni

condizionate di Y ce ne sono proprio r.

132

Centralità, dispersione e dipendenza per distribuzione

bivariate

Medie Marginali:

Centro della distribuzione bivariata: [M(x), M(y)]

Varianze Marginali:

133

134

Medie Condizionate

per (j=1,…,s)

per (i=1,…,r)

135

Varianze Condizionate:

per (j=1,…,s)

per (i=1,…,r)

136

(1.71, 6.12) (2.77, 6.23) (2.34, 7.32) (1.42, 5.66) (0.48, 3.12)

(2.10, 7.44) (2.18, 7.23) (2.93, 5.92) (1.76, 7.29) (0.95, 4.81)

(0.92, 4.14) (0.96, 4.16) (0.58, 2.82) (2.45, 5.82) (2.96, 8.10)

(1.60, 6.28) (1.07, 4.50) (2.49, 6.30) (0.92, 4.84) (2.33, 6.08)

(1.66, 4.32) (0.45, 3.90) (1.87, 5.94) (0.44, 3.99) (2.54, 5.32)

(1.23, 4.20) (0.51, 3.74) (1.21, 4.63) (1.71, 5.45) (0.64, 4.47)

(1.12, 4.60) (2.53, 7.89) (2.13, 6.02) (0.89, 4.92) (1.20, 5.01)

(2.90, 7.65) (1.97, 6.27) (1.56, 5.09) (1.19, 3.16) (0.06, 4.58)

(2.89, 8.44) (2.07, 6.65) (0.73, 4.66) (1.56, 4.59) (1.37, 6.85)

(1.85, 6.10) (0.23, 3.81) (1.21, 5.48) (2.57, 5.78) (1.33, 3.88)

(1.46, 5.08) (0.17, 3.29) (0.10, 3.20) (0.18, 2.53) (2.95, 7.78)

(2.07, 4.81) (0.49, 2.48) (1.06, 4.83) (2.74, 6.97) (2.76, 6.58)

(2.83, 8.13) (0.26, 3.86) (2.87, 8.50) (0.65, 4.42) (2.63, 7.34)

(2.11, 6.78) (0.75, 4.39) (2.54, 6.68) (0.01, 3.01) (2.13, 6.00)

(2.16, 6.99) (1.89, 7.12) (2.38, 7.78) (1.25, 4.64) (1.65, 4.17)

(1.39, 5.50) (2.98, 6.70) (2.97, 6.86) (0.30, 3.54) (1.95, 7.47)

(2.86, 7.11) (0.40, 4.03) (0.52, 4.68) (1.73, 6.39) (2.78, 6.16)

(1.70, 3.45) (0.76, 3.02) (0.83, 4.25) (2.10, 6.70) (0.50, 3.41)

(0.99, 5.38) (1.80, 3.64) (2.15, 6.42) (0.62, 3.32) (1.81, 4.62)

(2.00, 5.83) (1.73, 4.09) (0.75, 3.45) (2.18, 6.14) (2.54, 5.87)

Quantità di composto additivo (X) e resistenza alla torsione

(Y) rilevate su 100 barre d’acciaio sperimentali:

137

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

8,00

9,00

0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50

Diagramma SCATTER: X=quantità di composto additivo; Y=resistenza alla trazione

Y

X

138

Quantità di composto additivo (X) e resistenza alla torsione

(Y) rilevate su 100 barre d’acciaio sperimentali:

X/Y 2 - 4 4 - 5 5 - 6 6 - 7 7 - 9 Totali

0,00-0,75 15 6 0 0 0 21

0,75-1,50 4 13 6 1 0 24

1,50-2,25 2 6 5 15 7 35

2,25-3,00 0 0 4 7 9 20

Totali 21 25 15 23 16 100

Distribuzione Bivariata (X,Y)

Domanda: a quali valori di X si associano, in prevalenza, i

valori di Y?

140

Distribuzioni di Y condizionate ad X

(val. centr. X=0,375; 1,125; 1,875; 2,625)

(val.centr. Y=3; 4,5; 5,5;6,5; 8)

Y n1j f(Y| x1) yj f(Y| x1)

2 - 4 15 0,7143 2,1429

4 - 5 6 0,2857 1,2857

5 - 6 0 0,0000 0,0000

6 - 7 0 0,0000 0,0000

7 - 9 0 0,0000 0,0000

Totali 21 1,0000 3,4286


2 - 4 4 0,1667 0,5000

4 - 5 13 0,5417 2,4375

5 - 6 6 0,2500 1,3750

6 - 7 1 0,0417 0,2708

7 - 9 0 0,0000 0,0000

Totali 24 1,0000 4,5833

M(Y| X=x1=0,375)=3,43; M(Y| X=x2=1,125)=4,583;

141

Distribuzioni di Y condizionate ad X

(val. centr. X=0,375; 1,125; 1,875; 2,625)

(val.centr. Y=3; 4,5; 5,5;6,5; 8)


2 - 4 2 0,0571 0,1714

4 - 5 6 0,1714 0,7714

5 - 6 5 0,1429 0,7857

6 - 7 15 0,4286 2,7857

7 - 9 7 0,2000 1,6000

Totali 35 1,0000 6,1143


2 - 4 0 0,0000 0,0000

4 - 5 0 0,0000 0,0000

5 - 6 4 0,2000 1,1000

6 - 7 7 0,3500 2,2750

7 - 9 9 0,4500 3,6000

Totali 20 1,0000 6,9750

M(Y| X=x3=1,875)=6,114; M(Y| X=x4=2,625)=6,975;

142

Andamento delle Medie di Y condizionate ad X

3,429

4,583

6,114

6,975

0,000

1,000

2,000

3,000

4,000

5,000

6,000

7,000

8,000

0,000 - 0,750 0,750 - 1,500 1,500 - 2,250 2,250 - 3,000

M(Y|X)

M(Y|X)

143

Distribuzione

Bivariata X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y , X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 11 6 2 2 0 0 21

4 - 5 4,5 2 11 6 5 1 0 25

5 - 6 5,5 0 1 5 3 2 4 15

6 - 7 6,5 0 0 1 5 10 7 23

7 - 9 8 0 0 0 3 4 9 16

Totali … 13 18 14 18 17 20 100

144

Distribuzioni Condizionate

X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 0,8462 0,3333 0,1429 0,1111 0,0000 0,0000 0,2100

4 - 5 4,5 0,1538 0,6111 0,4286 0,2778 0,0588 0,0000 0,2500

5 - 6 5,5 0,0000 0,0556 0,3571 0,1667 0,1176 0,2000 0,1500

6 - 7 6,5 0,0000 0,0000 0,0714 0,2778 0,5882 0,3500 0,2300

7 - 9 8 0,0000 0,0000 0,0000 0,1667 0,2353 0,4500 0,1600

Totali … 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

145

Medie

Condizionate X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 2,5385 1,0000 0,4286 0,3333 0,0000 0,0000 0,6300

4 - 5 4,5 0,6923 2,7500 1,9286 1,2500 0,2647 0,0000 1,1250

5 - 6 5,5 0,0000 0,3056 1,9643 0,9167 0,6471 1,1000 0,8250

6 - 7 6,5 0,0000 0,0000 0,4643 1,8056 3,8235 2,2750 1,4950

7 - 9 8 0,0000 0,0000 0,0000 1,3333 1,8824 3,6000 1,2800

Totali … 3,2308 4,0556 4,7857 5,6389 6,6176 6,9750 5,3550

146

Momenti II° Condizionati

X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 7,6154 3,0000 1,2857 1,0000 0,0000 0,0000 1,8900

4 - 5 4,5 3,1154 12,3750 8,6786 5,6250 1,1912 0,0000 5,0625

5 - 6 5,5 0,0000 1,6806 10,8036 5,0417 3,5588 6,0500 4,5375

6 - 7 6,5 0,0000 0,0000 3,0179 11,7361 24,8529 14,7875 9,7175

7 - 9 8 0,0000 0,0000 0,0000 10,6667 15,0588 28,8000 10,2400

Totali … 10,7308 17,0556 23,7857 34,0694 44,6618 49,6375 31,4475

Varianze

Condizionate ( Y | X )

0,2929 0,6080 0,8827 2,2724 0,8685 0,9869 2,7715

147

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

8,00

0,25 0,75 1,25 1,75 2,25 2,75

Medie Condizionate ( Y | X )

148

Indipendenza tra due caratteri

Definizioni:

1) due caratteri sono indipendenti se tra essi non esiste una

relazione di causa ed effetto;

2) due caratteri sono indipendenti se la conoscenza di una

modalità di uno dei due caratteri non migliora la previsione

sulla modalità dell’altro;

149

Esempio di Distribuzione Bivariata:

X/Y y1 y2 y3 y4 Tot.

x1 12 4 16 8 40

x2 15 5 20 10 50

x3 9 3 12 6 30

Tot. 36 12 48 24 120 X f(X|y1) f(X|y2) f(X|y3) f(X|y4) f(X)

x1 12/36=0.33 4/12=0.33 16/48=0.33 8/24=0.33 40/120=0.33

x2 15/36=0.42 5/12=0.42 20/48=0.42 10/24=0.42 50/120=0.42

x3 9/36=0.25 3/12=0.25 12/48=0.25 6/24=0.25 30/120=0.25

Tot. 1.00 1.00 1.00 1.00 1.00

Domanda: se sulla 121^ unità si rileva Y=y3 questa

informazione migliora la nostra previsione su quale potrebbe

essere il valore di X? La risposta è NO! Perché il sapere che

Y=y3 non aggiunge nulla rispetto all’informazione che ci viene

data dalla semplice distribuzione marginale di X.

150

Y f(Y|x1) f(Y|x2) f(Y|x3) f(Y)

y1 12/40=0.30 15/50=0.30 9/30=0.30 36/120=0.30

y2 4/40=0.10 5/50=0.10 3/30=0.10 12/120=0.10

y3 16/40=0.40 20/50=0.40 12/30=0.40 48/120=0.40

y4 8/40=0.20 10/50=0.20 6/30=0.20 24/120=0.20

Tot. 1.00 1.00 1.00 1.00

Nota: se tutte le distribuzioni di X condizionate ad Y sono

uguali tra loro ed uguali alla marginale di X anche tutte le

distribuzioni di Y condizionate ad X sono uguali tra loro ed

uguali alla marginale di Y. Pertanto, anche in questo caso, se

sulla 121^ unità dovesse essere rilevato, ad esempio, X=x1 la

nostra previsione circa la modalità di Y non migliorerebbe

rispetto all’informazione che ci viene data dalla distribuzione

marginale della stessa Y. Quindi Y è indipendente da X.

Domanda: come sono le medie condizionate di X e di Y?

Pertanto possiamo concludere che: X è indipendente da Y

151

Y f( Y| x1 ) f( Y| x2 ) f( Y| x3 ) f( Y| x4 )

2 - 4 0,7143 0,1667 0,0571 0,0000

4 - 5 0,2857 0,5417 0,1714 0,0000

5 - 6 0,0000 0,2500 0,1429 0,2000

6 - 7 0,0000 0,0417 0,4286 0,3500

7 - 9 0,0000 0,0000 0,2000 0,4500

Totali 1,0000 1,0000 1,0000 1,0000

Tornando, invece, alle 100 barrette d’acciaio ed esaminando la

tabelle delle distribuzioni di Y condizionate ad X, sapendo, ad

esempio che: 0<X<0,75 quale previsione potremmo fare su Y?

153

Dimostrazione:

dalla (1) avremo che:

ni1 / n.1 = ... = nij / n.j = ... = nis / n.s = ki

cioè:

ni1 = n.1 ki;….; nij = n.j ki; …. ; nis = n.s ki

sommando membro a membro avremo che:

cioè per (i=1,..,r)

ovvero: ki = ni. / n per (i=1,..,r), che dimostra la (2).

154

Da (1) e (2) deduciamo che:

f(xi|yj) = f(xi) = ki per (i=1,..,r) e (j=1,..,s)

che equivale a:

per (i=1,..,r) e (j=1,..,s)

da cui:

per (i=1,..,r) e (j=1,..,s)

che dimostrano la (3) e la (4).

Se sono tutte vere: (1), (2), (3) e (4) esse implicano anche la

(5) che è dalle stesse è definita. Infine la condizione di

Indipendenza Statistica tra X e Y è data da:

per (i=1,..,r) e (j=1,..,s) c.d.d..

155

In sintesi, abbiamo dimostrato che:

{indipendenza} { f(xi|yj)=f(xi)} { f(yj|xi)=f(yj)}; i,j

ovvero:

{indipendenza} {nij/n.j = ni./n} {nij/ni .= n.j/n}; i,j

Condizione d’Indipendenza:

Verificare la condizione d’indipendenza sulle ultime due

distribuzioni bivariate (pagine 138 e 144).

s1,..,=j

r1,..,=i

n

n n=n

.ji.

ij

156

Regione X Y

Piemonte 174,2 287

Valle d'Aosta 174,95 281

Lombardia 173,79 282

Trentino A.A. 175,43 266

Veneto 174,83 262

Friuli V.G. 176,11 302

Liguria 174,19 318

Emilia R. 174,58 285

Toscana 174,49 280

Umbria 173,71 263

Marche 173,46 259

Lazio 173,98 239

Abruzzi 172,3 243

Molise 171,33 230

Campania 171,2 148

Puglia 171,42 223

Basilicata 169,86 204

Calabria 169,58 173

Sicilia 170,48 175

Sardegna 169,27 209

(X): Numero degli abbonamenti alla RAI (1982) per

1000 abitanti per Regione;

(Y) Statura media in cm. degli iscritti di leva (classe

1962).

Stabiliamo le seguenti Classi di Modalità di X

169-173; 173-175; 175-177;

e di Y:

140-210; 210-250; 250-300; 300-320.

X/Y 169 - 173 173 - 175 175 - 177 Totali

140 - 210 5 0 0 5

210 - 250 3 1 0 4

250 - 300 0 8 1 9

300 - 320 0 1 1 2

Totali 8 10 2 20

Essendo per tutti gli (i,j) i caratteri (X,Y)

sono statisticamente dipendenti, ma non essendo

logicamente dipendenti, diremo che si tratta di

dipendenza spuria. Nel seguito “Dipendenza”

significherà “Dipendenza Statistica”.

nij ≠ni. n.j

n

157

Esempio: collettivo di 50 famiglie classificate per n° figli e per

settore d’attività economica del capofamiglia;

Frequenze congiunte

nij

Frequenze congiunte

d’indipendenza n’ij

Contingenze cij

Y/X 0 1 2 3 4 5 Tot.

A 1.30 3.12 4.94 2.34 1.04 0.26 13

I 1.90 4.56 7.22 3.42 1.52 0.38 19

S 1.80 4.32 6.84 3.24 1.44 0.36 18

Tot. 5 12 19 9 4 1 50

Y/X 0 1 2 3 4 5 Tot.

A -0.30 -1.12 -1.94 1.66 0.96 0.74 0.00

I -0.90 -0.56 1.78 0.58 -0.52 -0.38 0.00

S 1.20 1.68 0.16 -2.24 -0.44 -0.36 0.00

Tot. 0.00 0.00 0.00 0.00 0.00 0.00 0.00

158

Misure sintetiche di Dipendenza Statistica

Indiche Chi-Quadro di Pearson:

dove le cij = (nij – n’ij ) e le n’ij = (ni. n.j / n ).

Proprietà di χ2:

a) se X ed Y sono indipendenti allora χ2 = 0;

b) se X ed Y non sono indipendenti χ2 > 0, ed è tanto più

grande quanto più le nij si differenziano dalle n’ij ;

c) χ2 è una misura di dipendenza per X ed Y caratteri

quantitativi e/o qualitativi ed il suo calcolo non si basa né sulle

modalità di X né su quelle di Y;

d) χ2 è una misura assoluta di dipendenza statistica.

159

Calcolo di χ2:

1)Tabella dati

originari: nij;

2)Tabella di

Indipendenza: n’ij;

3)Tabella delle

contingenze: cij;

4)Tabella dei

rapporti: c2ij / n’ij;

5) χ2=10,49.

Nota: il valore di χ2 ottenuto ci assicura che tra X ed Y c’è

dipendenza statistica ma non dice quanto essa è forte, perché

χ2 è una misura assoluta di dipendenza.

Y/X 0 1 2 3 4 5 Tot.

A 1 2 3 4 2 1 13

I 1 4 9 4 1 0 19

S 3 6 7 1 1 0 18

Tot. 5 12 19 9 4 1 50

Y/X 0 1 2 3 4 5 Tot.

A 1,3 3,12 4,94 2,34 1,04 0,26 13

I 1,9 4,56 7,22 3,42 1,52 0,38 19

S 1,8 4,32 6,84 3,24 1,44 0,36 18

Tot. 5 12 19 9 4 1 50

Y/X 0 1 2 3 4 5 Tot.

A -0,3 -1,12 -1,94 1,66 0,96 0,74 0

I -0,9 -0,56 1,78 0,58 -0,52 -0,38 0

S 1,2 1,68 0,16 -2,24 -0,44 -0,36 0

Tot. 0 0 0 0 0 0 0

Y/X 0 1 2 3 4 5 Tot.

A 0,07 0,40 0,76 1,18 0,89 2,11 5,40

I 0,43 0,07 0,44 0,10 0,18 0,38 1,59

S 0,80 0,65 0,00 1,55 0,13 0,36 3,50

Tot. 1,30 1,12 1,20 2,82 1,20 2,85 10,49

r

=1i

s

j=1

2

ijijij

2

ij

ij

r

=1i

s

j=1 ij

2

ijijr

=1i

s

j=1 ij

ij2

2

=)n+n2n-(nn

1=

=n

)n-(n=

n

c=

r

=1i

s

j=1

ij

r

=1i

s

j=1

r

=1i

s

j=1

ij

ij

2

ij

r

=1i

s

j=1 ij

2

ijr

=1i

s

j=1 ij

ijijr

=1i

s

j=1 ij

2

ij

=n+n2-n

n=

=n

n+

n

nn2-

n

n=

n+2n-n

n=

r

=1i

s

j=1 ij

2

ij

n = n n n

1=)n)(n(

n

1=

n

n n=n

s

j=1

.j

r

=1i

i.

r

=1i

s

j=1

.ji.r

=1i

s

j=1

ij

Calcolo alternativo di χ2:

poiché :

Pertanto avremo anche:

infine, se non si vuole passare per il calcolo delle n’ij=ni. n.j / n,

avremo:

161

n 1-n n

n=

r

=1i

s

j=1 .ji.

2

ij

2

162

Definizione di Massima Dipendenza

La dipendenza è massima se per ogni riga o per ogni colonna

non più di una frequenza congiunta è diversa da zero.

Esempio: X/Y y1 y2 y3 y4 Tot.

x1 n11 0 0 0 n11

x2 0 0 n23 0 n23

x3 0 n32 0 0 n32

Tot. n11 n32 n23 0 n

Per le caselle con nij ≠ 0 avremo: n2ij = ni. n.j e di conseguenza

, dove t = minore ( r , s ) e max χ2 =( t – 1) n

Definiamo, quindi, l’indice relativo di dipendenza di Cràmer:

C2 = χ2/ max χ2 = χ2/ [ ( t – 1 ) n ] con [0 ≤ C2 ≤ 1] .

tn n

nr

=1i

s

j=1 .ji.

2

ij

163

Misure di dipendenza lineare o correlazione

Se due caratteri quantitativi risultano “statisticamente

dipendenti” possiamo ipotizzare che essi siano legati da una

relazione lineare, cioè del tipo Y= a + b X .

Per verificare questa ipotesi misureremo la:

“strettezza della relazione lineare, ovvero, misurando il grado

di correlazione tra X e Y”.

Si considerino le coppie di modalità (xi , yj), riportati nelle

tabelle che seguono, ed i relativi di diagrammi scatter che

mettono in luce una possibile relazione lineare tra X e Y:

164

X Y X Y X Y X Y

1,00 -3,70 6,00 -1,98 11,00 24,07 17,00 13,06

1,00 14,53 6,60 2,42 10,30 -4,60 17,00 6,18

1,30 -3,62 7,00 6,03 11,00 12,81 17,40 12,10

1,00 -4,46 7,00 -7,16 11,40 -1,16 18,00 15,31

1,00 -1,54 7,00 -1,70 12,00 10,76 18,00 7,33

1,60 -7,99 7,00 19,24 12,00 5,14 18,10 12,97

1,70 10,86 7,10 -7,68 12,10 21,17 19,00 13,56

1,50 11,97 7,00 9,32 13,00 7,38 19,00 9,45

2,00 9,11 7,80 9,02 13,00 25,59 20,30 26,55

2,00 -11,32 8,00 15,06 13,00 14,81 21,00 14,07

2,40 -6,60 8,00 19,28 13,40 9,64 22,90 22,42

3,00 2,83 8,70 19,33 13,00 24,97 23,10 26,72

3,00 5,71 8,00 17,56 13,00 0,54 24,00 29,89

3,40 9,73 8,00 7,99 14,00 24,08 24,00 33,89

3,00 -7,08 8,20 19,50 14,50 0,26 25,10 14,39

3,00 7,64 8,00 13,02 14,00 0,33 25,00 15,87

3,60 13,74 9,00 2,40 14,00 23,64 25,00 9,13

4,00 -1,76 9,00 11,69 14,20 2,79 25,00 15,41

4,10 3,66 9,10 17,11 15,00 14,89 26,70 29,08

5,00 -6,50 9,00 -1,30 15,00 -2,37 26,00 17,58

5,40 5,54 9,60 17,32 15,00 14,56 26,20 22,06

5,00 19,50 10,00 16,51 16,00 1,66 27,00 10,48

5,00 -6,96 10,00 4,00 16,00 17,61 27,00 25,73

5,20 3,47 10,30 -5,79 16,00 3,23 28,20 15,30

5,00 14,39 10,00 20,30 16,00 5,68 29,00 18,37

Data Set (a) relativo a 100 coppie di modalità (xi , yi ) dei

caratteri quantitativi X e Y

165

Diagramma Scatter (a) relativo a 100 coppie di modalità

(xi , yi ) dei caratteri quantitativi X e Y

-15

-10

-5

0

5

10

15

20

25

30

35

40

0 5 10 15 20 25 30 35

166 -15

-10

-5

0

5

10

15

20

25

30

35

40

0 5 10 15 20 25 30 35

Diagramma Scatter (a) relativo a 100 coppie di modalità (xi , yi ) dei caratteri

quantitativi X e Y

(in sovrimpressione la retta d’equazione: Y = 1 + 0,75 X )

167

X Y X Y X Y X Y

1,00 2,20 6,00 4,07 11,00 9,03 17,00 10,85

1,00 2,81 6,60 9,34 10,30 8,08 17,00 12,661,30 3,38 7,00 8,92 11,00 9,03 17,40 14,43

1,00 5,20 7,00 8,44 11,40 9,95 18,00 15,46

1,00 1,73 7,00 9,16 12,00 11,18 18,00 16,83

1,60 5,42 7,00 6,01 12,00 13,36 18,10 13,41

1,70 5,67 7,10 5,84 12,10 8,15 19,00 17,98

1,50 -0,24 7,00 7,34 13,00 9,22 19,00 15,84

2,00 5,83 7,80 9,06 13,00 9,81 20,30 19,51

2,00 3,43 8,00 8,14 13,00 11,60 21,00 14,52

2,40 2,87 8,00 6,99 13,40 13,09 22,90 19,53

3,00 4,07 8,70 7,68 13,00 10,76 23,10 15,52

3,00 -0,01 8,00 7,40 13,00 10,05 24,00 21,27

3,40 0,83 8,00 10,34 14,00 12,58 24,00 16,623,00 2,99 8,20 5,35 14,50 12,02 25,10 20,13

3,00 5,88 8,00 6,40 14,00 8,41 25,00 16,99

3,60 3,97 9,00 5,86 14,00 10,32 25,00 22,60

4,00 6,19 9,00 10,57 14,20 12,28 25,00 22,30

4,10 3,24 9,10 9,44 15,00 15,48 26,70 23,49

5,00 6,01 9,00 7,01 15,00 9,40 26,00 19,85

5,40 8,38 9,60 6,41 15,00 11,13 26,20 18,04

5,00 3,64 10,00 11,00 16,00 13,41 27,00 17,89

5,00 3,53 10,00 6,12 16,00 14,06 28,20 22,45

5,20 3,56 10,30 11,54 16,00 11,43 28,00 24,285,00 7,35 10,00 10,26 16,00 15,69 29,00 20,23

Data Set (b) relativo a 100 coppie di modalità (xi , yi ) dei


168 -5

0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (b) relativo a 100 coppie di modalità


169 -5

0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (b) relativo a 100 coppie di modalità (xi , yi ) dei caratteri

quantitativi X e Y

(in sovrimpressione la retta d’equazione: Y = 1 + 0,75 X )

170

La differenza tra i due diagrammi scatter (a) e (b) consiste nel

fatto che il primo diagramma mostra una nuvola di punti più

dispersa che non nel secondo caso, pur mostrando entrambe

una sottostante relazione lineare tra X e Y. Più precisamente

diremo che nel caso (b) la relazione lineare tra X e Y è più

stretta che non nel caso (a).

Misure di strettezza della relazione lineare o di

Correlazione tra X e Y

La Covarianza

Date le n coppie di modalità (x1, y1)……(xn, yn) chiameremo

Covarianza la media dei prodotti degli scarti dalle rispettive

medie di X e di Y:

n

=1i

ii M(y)-yM(x)-xn

1=y)cov(x,

171

(b)Diagramma Scatter degli scarti [(xi-M(X)] , [yi –M(Y)]

dei caratteri quantitativi X e Y (concordi). Sono prevalenti

i prodotti di scarti positivi, quindi Cov(X,Y)>0.

In particolare: Cov(X,Y) = 41,73.

-15

-10

-5

0

5

10

15

20

-15 -10 -5 0 5 10 15 20

III° Quadrante “+” IV° Quadrante “-”

I° Quadrante “-” II° Quadrante “+”

172

Se X ed Y sono concordi sono prevalenti i punti che cadono

nel II° e nel III° quadrante. A tali punti corrispondono scarti di

X e di Y che hanno, rispettivamente, lo stesso segno e che

producono, pertanto, prodotti di scarti positivi.

La Covarianza, essendo pari alla media dei prodotti degli

scarti, sarà positiva.

Nel caso in cui X ed Y siano discordi i punti del diagramma

scatter saranno prevalenti nel I° e nel IV° quadrante. A tali

punti corrisponderanno scarti di X e di Y che avranno segno

opposto e daranno luogo, pertanto, a prodotti di scarti negativi.

La Covarianza, in questo secondo caso, essendo pari alla

media dei prodotti degli scarti, sarà negativa.

173

X Y X Y X Y X Y

1,00 23,94 6,00 18,37 11,00 19,17 17,00 7,80

1,00 21,20 6,60 22,22 10,30 13,95 17,00 13,15

1,30 24,83 7,00 21,30 11,00 16,49 17,40 11,26

1,00 21,85 7,00 17,87 11,40 13,47 18,00 13,36

1,00 25,48 7,00 15,97 12,00 15,54 18,00 13,01

1,60 23,63 7,00 18,58 12,00 14,54 18,10 13,75

1,70 23,86 7,10 17,18 12,10 12,96 19,00 7,76

1,50 25,80 7,00 19,95 13,00 16,75 19,00 9,38

2,00 21,82 7,80 18,65 13,00 14,36 20,30 7,35

2,00 23,42 8,00 18,12 13,00 16,25 21,00 9,57

2,40 22,87 8,00 19,17 13,40 16,28 22,90 4,96

3,00 20,89 8,70 16,29 13,00 13,49 23,10 3,34

3,00 18,78 8,00 21,12 13,00 17,64 24,00 7,68

3,40 21,24 8,00 16,61 14,00 10,71 24,00 7,25

3,00 18,82 8,20 19,54 14,50 10,20 25,10 5,37

3,00 22,33 8,00 18,44 14,00 13,69 25,00 8,31

3,60 19,50 9,00 18,44 14,00 16,53 25,00 2,94

4,00 19,75 9,00 20,61 14,20 13,60 25,00 4,40

4,10 22,09 9,10 18,68 15,00 9,51 26,70 4,93

5,00 23,13 9,00 15,28 15,00 16,05 26,00 5,94

5,40 18,74 9,60 19,04 15,00 9,86 26,20 4,24

5,00 17,99 10,00 16,42 16,00 14,48 27,00 1,29

5,00 18,87 10,00 16,13 16,00 11,52 28,20 3,87

5,20 23,06 10,30 17,10 16,00 9,51 28,00 5,92

5,00 23,12 10,00 18,63 16,00 15,08 29,00 5,05

Data Set (c) relativo a 100 coppie di modalità (xi , yi ) dei


174 0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (c) relativo a 100 coppie di modalità


175 0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (c) relativo a 100 coppie di modalità (xi , yi ) dei caratteri

quantitativi X e Y

(in sovrimpressione la retta d’equazione: Y = 24 - 0,75 X )

176

(c)Diagramma Scatter degli scarti [(xi-M(X)] , [yi –M(Y)]

dei caratteri quantitativi X e Y (discordi). Sono prevalenti i

prodotti di scarti negativi, quindi Cov(X,Y)<0.

In particolare: Cov(X,Y)= - 43,72 .

-20

-15

-10

-5

0

5

10

15

-15 -10 -5 0 5 10 15 20

I° Quadrante “-”

III° Quadrante “+” IV° Quadrante “-”

II° Quadrante “+”

177

In caso di bilanciamento tra prodotti degli scarti positivi e

negativi si ha: Cov( X , Y ) = 0.

____...____

Diseguaglianza di Cauchy-Schwarz

Cov( X , Y )2 ≤ V( X ) V( Y ) Dimostrazione:

=)lw+(zM(Y)-y=w

M(X)-x=z n

=1i

2

ii

ii

ii

0 w l+ wz l 2+z=

=) wl+ wz l 2+(z=

n

=1i

2

i

2n

=1i

ii

n

=1i

2

i

n

=1i

2

i

2

ii

2

i

≥

178

Poiché l’espressione precedente non – negativa allora il

polinomio in l:

non ammette radici reali e distinte, cioè il suo discriminante è

minore o uguale a “0”, cioè:

179

ma, sostituendo al posto di zi e wi gli scarti di xi e yi dalle

rispettive medie, avremo:

cioè:

Cov( X , Y )2 ≤ V( X ) V( Y ) c.d.d.

da cui consegue:

V(Y) V(X)Y)Cov(X,V(Y) V(X) - ≤≤

180

Nella diseguaglianza di Cauchy-Schwarz vale il segno “=“

quando X ed Y sono legate da una perfetta relazione lineare,

cioè Y=a+bX.

Infatti, se Y=a+bX allora yi = a + b xi , i , quindi,

ricordando che M(Y) = a + b M(X), avremo:

V(X) b=M(X)-x n

1 b=

=M(X)-x b M(X)-x n

1=

= M(X)b-a-x b+aM(X)-x n

1=

=M(Y)-yM(X)-x n

1=Y)Cov(X,

2n

=1i

i

n

=1i

ii

n

=1i

ii

n

=1i

ii

181

inoltre, essendoci una relazione lineare tra le medie avremo

anche:

M(X)=-(a/b)+M(Y)/b

pertanto:

V(Y) b

1=M(Y)-y

n

1

b

1=

=M(Y)-y M(Y)-y b

1

n

1=

=M(Y)-y b

M(Y)+

b

a+

b

y+

b

a-

n

1=

=M(Y)-yM(X)-x n

1=Y)Cov(X,

2n

=1i

i

n

=1i

ii

i

n

=1i

i

n

=1i

ii

182

quindi, in ultima analisi:

Cov(X,Y)=bV(X)

Cov(X,Y)=V(Y)/b

pertanto se:

Y=a+bX allora Cov(X,Y)2=V(X)V(Y)

c.d.d.

inoltre, se b>0 si ha Cov(X,Y)=bV(X)≥0 , quindi:

se, invece, b<0 si ha Cov(X,Y)=bV(X)≤0 , quindi:

V(Y) V(X)=Y)Cov(X,

V(Y) V(X)- =Y)Cov(X,

183

V(Y) V(X)

Y)(X, Cov=

Y)(X, Cov max

Y)(X, Cov=Y)r(X,

Indice relativo di dipendenza lineare o correlazione:

1 Y)r(X, 1- ≤≤

il significato di r(X,Y), detto coefficiente di correlazione di

Bravais – Pearson, è identico a quello di Cov(X,Y) ma, a

differenza di quest’ultima, r(X,Y) è una misura relativa di

correlazione.

184

Per il Data Set (a) avremo:

M(X)=11,87; M(Y)=9,87; VX)=58,74; V(Y)=102,85;

Cov(X,Y)=41,43; r(X,Y)=0,533.

Per il data set (b) avremo:

M(X)=11,88;M(Y)=10,29;V(X)=59,05;V(Y)=33,20;

Cov(X,Y)=41,73; r(X,Y)=0,943.

Per il data set ( c ) avremo:

M(X)=11,88; M(Y)=15,40; V(X)=59,05; V(Y)=36,19;

Cov(X,Y)=-43,72; r(X,Y)=-0,946.

185

Sino ad ora, nello studio dei delle distribuzioni bivariate

abbiamo supposto che i dati siano forniti sotto forma di n

coppie di modalità rilevate (xi , yi ). Analizzeremo ora il caso

in cui, invece, essi siano forniti sotto forma di:

tabella a doppia entrata o tabella di contingenza.

I dati da prendere in considerazione saranno ora le r x s coppie

(xi , yj ) di modalità diverse ciascuna considerata con la

propria frequenza nij .

186

X/Y y1 y2 y3 ... yj ... ys Tot

x1 n11 n12 n13 ... n1j ... n1s n1.

x2 n21 n22 n23 ... n2j ... n2s n2.

... ... ... ... ... ... ... ... ...

xi ni1 ni2 ni3 ... nij ... nis ni.

... ... ... ... ... ... ... ... ...

xr nr1 nr2 nr3 ... nrj ... nrs nr.

Tot n.1 n.2 n.3 ... n.j ... n.s n

Tabella a Doppia Entrata

La covarianza rimane definita come la media aritmetica, in

questo caso “ponderata”, dei prodotti degli scarti dalla media,

rispettivamente, di X e di Y .

187

Si noti che se le variabili X e Y sono indipendenti allora si

avrà che: nij = ni. n.j / n , (i,j), sostituendo nella formula della

covarianza avremo:

=n

n n M(Y)-yM(X)-x

n

1=Y)Cov(X,

.ji.

j

r

=1i

s

j=1

i

=n M(Y)-y n

1n M(X)-x

n

1=

s

j=1

.jj

r

=1i

i.i

= 0 0 = 0

In conclusione:

se (X, Y) sono Indipendenti Cov(X, Y)=0 , r(X, Y)=0 .

NON E’ VERO IL VICEVERSA

188

Verifichiamo con un contro – esempio che Cov(X, Y)=0 non

implica l’indipendanza:

Infatti nella tabella, di cui sopra, M(X)=0, M(Y)=2, quindi

Cov(X,Y)=r(X,Y)=0 ma, chiaramente, Y dipende da X secondo

una legge quadratica. In questo caso X ed Y si dicono

incorrelati .

X Y XY

-2 4 -8

-1 1 -1

0 0 0

1 1 1

2 4 8

0 10 0

189

Calcolo semplificato della Covarianza

=XMYM+X My-Y Mx-y x n

1=

=YM-yXM-x n

1=Y)Cov(X,

n

=1i

iiii

n

=1i

ii

M(Y)M(X)+M(Y)M(X)-M(Y)M(X)-yxn

1=

=nM(Y)M(X)+yM(X)-xM(Y)-yxn

1=

n

=1i

ii

n

=1i

i

n

=1i

i

n

=1i

ii

da cui:

M(Y)M(X)-y xn

1=Y)Cov(X,

n

=1i

ii

se i dati sono organizzati in una tabella a doppia entrata

avremo analogamente:

il calcolo del coefficiente di correlazione si effettuerà come di

consueto:

190

V(Y) V(X)

Y)(X, Cov=Y)r(X,

M(Y)M(X)-ny xn

1=Y)Cov(X,

r

=1i

s

j=1

ijji

191

La Regressione

Sulla base delle n coppie di modalità osservate (x1,y1),..,(xn,yn),

dopo aver verificato la dipendenza tra i caratteri quantitativi X

ed Y, ci proponiamo di determinare la funzione matematica “f”

che meglio sintetizzi il legame di dipendenza tra X ed Y, cioè:

Y = f ( X )

Le motivazioni che ci spingono alla ricerca di “ f ” sono

essenzialmente due: la Previsione ed il Controllo.

192

Previsione

Nella fase di raccolta dei dati in corrispondenza dei valori

osservati x1, x2,…,xn di X e sono stati anche rilevati i

valori y1, y2,...,yn di Y. Se si osserva un nuovo valore di X,

diciamo xn+1, possiamo prevedere l’ignoto valore di Y con

y’n+1 = f ( xn+1 ).

Controllo

Sulla base degli n valori osservati di X e di Y si è determinata

la funzione che lega le due variabili: Y=f(X). Ci si chiede ora:

quale valore incognito l’operatore deve dare alla X per

ottenere un desiderato valore y0 della Y. Il valore incognito è:

x0 = f-1( y0 ), cioè quel valore di X tale che f(x0 )=y0.

193

I dati del problema della ricerca della funzione “f” più idonea a

rappresentare il legame tra X ed Y sono costituiti dalle n coppie di valori

(xi , yi ) che graficamente si possono così rappresentare n punti:

194

Il modo più semplicistico per determinare “f ” consiste nello scegliere la

polinomiale di equazione Y=a0+a1x+a2x2+…+an-1x

n-1, che passa per tutti

gli n punti dati:

195

Si opera meglio se si procede nel modo seguente:

a) si ipotizza un modello semplice di relazione tra X ed Y;

b) si determinano i valori dei parametri del modello

minimizzando i residui, cioè le differenze tra i valori osservati

di Y ed i valori teorici di Y*, forniti dal modello;

c) si giudica la bontà di adattamento del modello ai dati sulla

base dell’andamento dei residui;

d) se il modello è insoddisfacente, sulla base dei residui, si

sceglie un nuovo modello da prendere in considerazione, e si

riparte da a).

196

Il modello di relazione più semplice è quello lineare:

Y= a+ b X

“a” e “b” sono:

- i parametri del modello,

ovvero:

- il termine noto ed il coefficiente di X,

ovvero:

- l’intercetta ed il coefficiente angolare della retta di

equazione: y=a+bx .

197

Esempio di perfetta relazione lineare tra X ed Y:

Y = a + b X : con Y = a quando X = 0 e Y = a + b per X = 1.

198

Metodo dei Minimi Quadrati

Si dispone di n coppie di valori ( xi , yi ) relative ai caratteri X

ed Y rilevati su n unità statistiche. Avendo verificato la

dipendenza statistica di Y da X si vuole determinare la

funzione “ f “ più idonea per descrivere tale legame.

Ipotizziamo, in prima approssimazione che: Y = a + b X. In tal

caso in corrispondenza dei valori di X: x1, x2,…,xn , dovremmo

ottenere, nel caso di perfetta relazione lineare, i seguenti

valori teorici di Y:

y*1 = a + b x1

y*2 = a + b x2

…………….

y*n = a + b xn

Determineremo ora i parametri incogniti a e b in modo che sia

minimizzata la somma dei quadrati delle differenze (yi – y*i ):

199

Per determinare i valori di a’ e b’ che rendano minima S

dobbiamo derivare la funzione f(a,b) rispetto ad a e b,

uguagliare a zero le derivate parziali e risolvere il sistema di I°

grado che si ottiene, avente incognite a e b. Per verificare che

le soluzioni a’ e b’ che si otterranno minimizzino S basti

considerare che f(a,b) è una funzione di secondo grado tale

f(a,b) ≥ 0.

200

Avremo che:

201

Analogamente avremo:

202

Uguagliando a zero le due derivate parziali avremo il Sistema

Normale:

203

Sistema Normale:

204

Nell’espressione che ci fornisce b’ se dividiamo numeratore e

denominatore per n, otterremo:

inoltre dalla prima equazione del Sistema avremo:

da cui otteniamo:

a’ e b’ sono gli stimatori “minimi quadrati di a e b.

Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse...

Documents

Transcript of Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse...