Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse...

204
1

Transcript of Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse...

Page 1: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

1

Page 2: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Bibliografia: Cicchitelli G. (2008). Statistica. Principi e Metodi”. Pearson Education [Capitoli 1, 3, 4, 5 (fino a § 5.12), 6 (escluso § 6.3), 7, 9, 10-11] Di Ciaccio A, Borra S. (2008). Statistica. Metodologie per le Scienze Economiche e Sociali”. McGraw-Hill, Milano. [Capitolo 1 (fino a § 1.4), 2, 3 (escluso § 3.4), 4 (esclusi § 4.4 e 4.7), 6 (escluso § 6.7), 16 (fino a § 16.5)] Leti G, Cerbara L. (2009). Elementi di Statistica Descrittiva. Il Mulino [Capitoli 1-8, 10, 11 (fino a § 5.5), 13 (fino a § 6.3), 14-15] Zenga M. (2007). Lezioni di Statistica Descrittiva. Giappichelli

2

Page 3: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni:

l’enumerazione a scopi fiscali e militari.

Tra le varie civiltà ricordiamo:

Medio Oriente: Egitto ( III° millennio A.C. ) Mesopotamia ( 2800 A.C. ) Ebrei ( 1200 A.C. ) Oriente India ( 313 A.C. ) Cina

3

Page 4: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Roma I° censimento 578 A.C.

Alto Medioevo

Guglielmo il Conquistatore “Domesday Book” 1086 Registri Veneziani 1268 Basso Medioevo Il ruolo della Chiesa e quello degli Stati Nazionali. Lo sviluppo dei traffici.

Dopo la Rivoluzione Francese I° censimento Americano 1790 I° censimento Inglese 1801

4

Page 5: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

XVIII° Secolo Aritmetica Politica

Statistica

Sviluppi Moderni Corrado Gini (Scuola Italiana)

R.A. Fisher (Scuola Inglese) Neyman-Pearson (Scuola Americana)

5

Page 6: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

La Statistica nel mondo

contemporaneo ( applicazioni )

6

Page 7: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Statistica descrittiva. - Rappresentazione sintetica dei dati rilevati.

- Studio della relazione tra due fenomeni. Concetti elementari: Unità statistica Popolazione statistica Unità di rilevazione Campione Censimento Indagine campionaria Piano degli esperimenti Collettivo statistico

7

Page 8: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Concetti elementari: Carattere

Modalità del carattere Carattere: qualitativo o quantitativo

N.B. alcuni caratteri qualitativi sono ordinabili

Caratteri quantitativi: discreti o continui esempio di carattere discreto con molte modalità è il reddito.

8

Page 9: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Rappresentazione tabellare

Esempio: 50 famiglie classificate per il n° dei figli (carattere discreto):

3 1 3 2 2 0 2 1 5 4 2 2 3 1 1 2 2 0 2 1 4 2 1 2 1 4 3 2 1 3 0 4 3 2 0 3 2 2 1 2 3 1 0 2 2 1 2 2 1 3

9

Page 10: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzione di frequenze

N° figli Frequenze

0 5

1 12

2 19

3 9

4 4

5 1 Totale 50

10

Page 11: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Esempio: Pezzi di un lotto classificati a seconda della qualità (carattere qualitativo). (legenda: b= buono, r= riutilizzabile, d= difettoso)

b b d r b d b r r b b r b r b b r b b b d b r b d

11

Page 12: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzione di frequenze del carattere qualitativo dei pezzi del lotto:

Qualità pezzo frequenze

difettoso 4

riutilizzabile 7

buono 14

Totale 25

12

Page 13: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Frequenze relative

N° figli Freq.

ass.

Freq.

relat.

0 5 0.10

1 12 0.24

2 19 0.38

3 9 0.18

4 4 0.08

5 1 0.02 Totale 50 1.00

Qualità pezzo freq. ass. freq. relat.

difettoso 4 0.16

riutilizzabile 7 0.28

buono 14 0.56

Totale 25 1.00 13

Page 14: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

5

12

19

9

4

1

0

2

4

6

8

10

12

14

16

18

20

0 1 2 3 4 5

N° di figli per famiglia

14

Page 15: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

10%

24%

38%

18%

8%

2%

N° di figli per famiglia

0

1

2

3

4

5

15

Page 16: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

4

7

14

0

2

4

6

8

10

12

14

16

difettoso riutilizzabile buono

Qualità pezzo

16

Page 17: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

16%

28% 56%

Qualità pezzo

difettoso

riutilizzabile

buono

17

Page 18: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Solo per caratteri quantitativi: Frequenze cumulate e Frequenze cumulate relative

N° figli Freq.

ass.

Freq.

relat.

Freq.

cum.

Freq.

cum. rel.

0 5 0.10 5 0.10

1 12 0.24 17 0.34

2 19 0.38 36 0.72

3 9 0.18 45 0.90

4 4 0.08 49 0.98

5 1 0.02 50 1.00 Totale 50 1.00 -- --

Domanda: Qual è la % di famiglie con più di 3 figli?

18

Page 19: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Carattere quantitativo discreto con numerose modalità.

Esempio: età in anni compiuti rilevati su 60 individui.

5 13 22 30 26 20 11 24 14 29 31 53 0 34 1 17 62 27 37 46

15 65 27 21 34 25 1 51 16 7 6 43 17 66 69 49 10 19 28 55

73 30 75 33 3 70 54 28 8 32 67 80 33 40 64 18 67 26 12 14

19

Page 20: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Possibile divisione in classi: (meno di 6) età prescolare ( 6 - 14 ) età scuola d’obbligo ( 14 - 24 ) età scuola sup. e Univ. ( 24 - 40 ) Ia età produttiva ( 40- 65 ) IIa età produttiva ( oltre 65 ) età del pensionamento (NB:per convenzione l’estremo superiore non appartiene alla classe)

classi freq. ass. freq. rel. freq. cum. freq. cum.

rel.

amp.

classi

h

densità

meno di 6 5 0.08 5 0.08 6 0.013

6-14 7 0.12 12 0.20 8 0.015

14-24 11 0.18 23 0.38 10 0.018

24-40 18 0.30 41 0.68 16 0.019

40-65 10 0.17 51 0.85 25 0.007

oltre 65 9 0.15 60 1.00 35 0.004

totale 60 1.00 -.- -.- -.- -.- 20

Page 21: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

h =freq.rel.

amp.cla.= densità di Frequenza

A= amp.cla. X h = amp.cla. X freq.rel.

amp.cla.= freq. rel.

21

Page 22: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Ogiva delle frequenze.

L’ogiva delle frequenze è la spezzata congiungente i punti di ascissa pari

all’estremo superiore della classe e di ordinata pari alla frequenza

cumulata relativa.

Domanda: Quanti hanno meno di 50 anni ?

Domanda: Qual è l’età cui corrisponde una frequenza relativa cumulata

uguale a 0.5 ?

22

Page 23: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Caratteri quantitativi continui. E’ possibile soltanto una distribuzione di frequenza divisa in classi. Il trattamento è analogo a quelle dei caratteri quantitativi discreti con molte modalità.

Esempio: altezza di 60 studenti (in cm.)

158 160 157 154 160 158 151 156 165 161 170 171 148 152 174 145 146 153 162 149

155 173 179 178 146 144 153 157 158 167

154 157 151 163 154 160 155 156 166 154 159 164 149 161 162 156 170 160 148 176

153 160 160 158 166 164 158 163 165 167

classi fr. ass. fr. rel. fr. cum. fr.cum. rel. h

140-148 4 0.07 4 0.07 0.009

148-156 16 0.26 20 0.33 0.034

156-164 25 0.42 45 0.75 0.053

164-172 11 0.18 56 0.93 0.023

172-180 4 0.07 60 1.00 0.009

Totali 60 1.00 -.- -.- -.- 23

Page 24: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

24

Page 25: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

25

Page 26: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Nota: Area Istogramma = Area poligonale = Area curva di frequenza = 1

26

Page 27: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzioni di quantità (solo per caratteri trasferibili)

Per ogni classe viene fornito l’ammontare del carattere che

compete alla classe.

Esempio: distribuzione del reddito.

Classi di

reddito

Freq. Ass. Ammontare

0 - 10 15 120

10 - 30 45 1170

30 - 80 30 1470

oltre 80 10 950

TOTALI 100 3710

Nota: con riferimento alla frequenza assoluta si ha una distribuzione di frequenza, mentre con l’ammontare si ha una distribuzione di quantità.

27

Page 28: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Esempi di Distribuzioni di Frequenze

e

Distribuzioni di Quantità

28

Page 29: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Carattere quantitativo: Distribuzione Seriazione di frequenze o di quantità. Carattere qualitativo: Distribuzione Serie di frequenze o di quantità. Serie temporale ( o storica ) Serie territoriali

29

Page 30: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

30

Page 31: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

0

500

1000

1500

2000

2500

3000

Delitti Totali (in migliaia)

31

Page 32: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Delitti Totali (in migliaia)

0

500

1000

1500

2000

2500

3000

32

Page 33: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Variazioni del prezzo della benzina senza piombo dal 1988 al 2003 negli USA 33

Page 34: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

34

Page 35: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

35

Page 36: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

36

Page 37: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

37

Page 38: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

0

100

200

300

400

500

600

Superficie Paesi EU (in Migliaia Km quad.)

38

Page 39: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Cartogramma

39

Page 40: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Sintesi numeriche di una distribuzione:

Misure di centralità

La Mediana

n = numero di unità del collettivo.

Ordiniamo le modalità in senso crescente:

se n è dispari: mediana= unica modalità centrale

se n è pari:

mediana=1/2 (somma delle modalità centrali)

40

Page 41: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Esempi:

I° collettivo:

n=15 (dispari)

7 - 3 - 3 - 11 - 4 - 4 - 2 - 9 - 7 - 10 - 9 - 1 - 1 - 4 - 10

ordiniamo:

Modalità 1 1 2 3 3 4 4 4 7

Rango 1 2 3 4 5 6 7 8 9

7 9 9 10 10 11

10 11 12 13 14 15

mediana= modalità di rango [ ( 15+1

2) = 8 ] = 4

41

Page 42: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

II° collettivo:

n=16 ( pari )

13 - 2 - 2 - 12 - 1 - 10 - 7 - 4 - 7 - 8 - 12 - 15 – 68 - 4 - 3 - 55

ordiniamo le modalità:

Modalità 1 2 2 3 4 4 7 7 8

Rango 1 2 3 4 5 6 7 8 9

10 12 12 13 15 55

10 11 12 13 14 15

68

16

mod. di rango[( 16

2

12

3

Mediana = ½ )] + mod. di rango[( 16

2+1)]

12

3

=

= ½ [ 7 + 8 ] = 7,5

mediana= centro ordinale 42

Page 43: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzione di modalità in simboli:

x1,x2,…,xi,…,xn

dove:

n indica la numerosità del collettivo statistico e

xi indica la modalità assunta dal carattere X nell’i-esima

unità del collettivo.

Distribuzione delle modalità ordinate in simboli:

Se n è dispari: Me = y(n+1)/2

Se n è pari : Me =½ [yn/2+y(n/2)+1]

y1≤y2≤…≤yi≤…≤yn

43

Page 44: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Mediana nelle distribuzioni di frequenze:

N° figli Freq.

ass.

Freq.

relat.

Freq.

cum.

Freq.

cum. rel.

0 5 0.10 5 0.10

1 12 0.24 17 0.34

2 19 0.38 36 0.72

3 9 0.18 45 0.90

4 4 0.08 49 0.98

5 1 0.02 50 1.00 Totale 50 1.00 -- -- n = 50 (pari), le modalità centrali hanno rango:

50/2=25 ; 50/2 + 1=26 Mediana = ½[mod.rango (25)+mod.rang(26)]=½[2+2]=2

(OPERATIVAMENTE: cerchiamo la modalità la cui frequenza cumulata relativa è

immediatamente superiore 0,5) 44

Page 45: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Mediana nelle distribuzioni di frequenze divise in classi:

classi freq. ass. freq. rel. freq. cum. freq. cum.

rel.

meno di 6 5 0.08 5 0.08

6-14 7 0.12 12 0.20

14-24 11 0.18 23 0.38

24-40 18 0.30 41 0.68

40-65 10 0.17 51 0.85

oltre 65 9 0.15 60 1.00

totale 60 1.00 -.- -.-

n=60 (pari); le modalità centrali hanno rango: 60/2=30 e (60/2)+1=31

Quindi la classe mediana è: (24-40)

45

Page 46: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

con l’ipotesi di uniforme distribuzione all’interno della classe

possiamo determinare il valore (approssimato) della Mediana

all’interno della Classe Mediana grazie alle proporzioni che

legano i cateti di triangoli simili

46

Page 47: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

47

Page 48: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

48

Page 49: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Me

0,68

0,50

0,38

24 40

(Me-24):(0,50-0,38)=((40-24):(0,68-0,38)

Me=24+(0,50-0,38)x(40-24)/(0,68-0,38)=24+0,12x16/0,30=30,4 49

Page 50: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

In generale:

Me=EI+(ES-EI)x(0,5-FI)/(FS-FI)

Dove:

ES,EI= estremi superiore ed inferiore della classe mediana

FI= frequenza cumulata relativa della classe precedente a quella

mediana.

FS= frequenza cumulata relativa della classe mediana.

50

Page 51: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Richiami di matematica:

Il Valore Assoluto di un numero (positivo o negativo

che sia) è uguale alla sua determinazione POSITIVA.

Esempio:

333 aaa ;

Il simbolo indica, sinteticamente, la sommatoria di un

certo numero di addendi:

----.----

n

i

in yyyy1

21 ...

51

Page 52: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Proprietà della sommatoria:

n

i

i

n

i

in ykkykykyky11

21 ...

knkkkkn

i

1

...

n

i

n

i

iin y

aa

y

a

y

a

y

a

y

1 1

21 1...

Se k=1/a :

52

Page 53: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Peculiarità della mediana.

Il valore della mediana dipende soltanto da quello delle

unità centrali

Siano:

(y1,y2,...,yn)

le modalità ordinate e

(y1-Me), (y2-Me),..., (yn-Me)

gli scarti (o scostamenti) dalla mediana, la proprietà è:

Cioè per c qualsiasi si ha sempre:

cyMey i

n

i

i

153

n

i

i Mey1

Page 54: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Dimostrazione:

Consideriamo solo y1 e yn. Affinché c minimizzi:

|y1-c|+|yn-c|

deve essere: y1 < c < yn.

Infatti se:

y1 < c < yn segue che:

|y1-c|+|yn-c|=c-y1+yn-c=yn- y1.

Se c < y1 < yn segue che:

|y1-c|+|yn-c|=y1-c+yn-c>y1-y1+yn-y1=yn-y1.

Se, infine, y1< yn< c segue che:

|y1-c|+|yn-c|=c-yn+c-y1>yn-y1+yn-yn=yn-y1.

54

Page 55: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

esemplificazione

5 10

1)c=7 : |5-7|+|10-7|=2+3=5

2)c=3 : |5-3|+|10-3|=2+7=9

3)c=12 : |5-12|+|10-12|=7+2=9

Consideriamo la coppia (y2, yn-1), anche in questo caso,

affinché c minimizzi: |y2-c|+|yn-1-c| , deve essere: y2 < c < yn-1,

ma così deve essere per tutte le coppie (yi, yn-i+1), quindi:

c.d.d.

55

𝐂 ≡ 𝐌𝐞𝐝𝐢𝐚𝐧𝐚

Page 56: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Altri indici di posizione:

Moda (Md)

Classe modale

Distribuzione unimodale

Distribuzione plurimodale

Md M d 56

Page 57: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

I percentili I° Quartile = Q1 è il valore tale che il 25% delle unità del

collettivo hanno modalità ≤ Q1;

II° Quartile = Q2=Me è il valore tale che il 50% delle unità

del collettivo hanno modalità ≤ Q2;

III° Quartile = Q3 è il valore tale che il 75% delle unità del

collettivo hanno modalità ≤ Q3;

Q1 Q2 Q3

25% 25% 25% 25%

57

Page 58: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Calcolo dei Quartili

n = pari ed (n/2) = dispari

Q1 non è altro che la mediana delle prime (n/2) modalità

ordinate, con (n/2)=dispari, quindi:

Q1=y[(n/2)+1]/2=y(n+2)/4

Q2 è la mediana quindi:

Q2=Me=[yn/2+y(n/2)+1]/2

Q3 non è altro che la mediana delle ultime (n/2) modalità

ordinate, quindi:

Q3=y(n/2)+[(n/2)+1]/2=y(3n+2)/4

58

Page 59: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Calcolo dei Quartili

n = pari ed (n/2) = pari

Q1 non è altro che la mediana delle prime (n/2) modalità

ordinate, con (n/2)=pari, quindi:

Q1=[y[(n/2)/2]+y[(n/2)/2]+1]/2=[yn/4+yn/4+1]/2

Q2 è la mediana quindi:

Q2=Me=[yn/2+y(n/2)+1]/2

Q3 non è altro che la mediana delle ultime (n/2) modalità

ordinate, quindi:

Q3=[y(n/2)+[(n/2)]/2+y(n/2)+[(n/2)/2]+1]/2

Cioè: Q3=[y3n/4+y(3n+4)/4]/2

59

Page 60: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Calcolo dei Quartili

n = dispari e (n+1)/2 = pari

Q1 non è altro che la mediana delle prime (n+1)/2-1=(n-1)/2

modalità ordinate, con (n-1)/2 = dispari, quindi:

Q1=y[(n-1)/2+1]/2=y(n+1)/4

Q2 è la mediana quindi:

Q2=Me=y(n+1)/2

Q3 non è altro che la mediana delle ultime (n-1)/2 modalità

ordinate, quindi:

Q3=y(n+1)/2+[(n-1)/2]+1]/2=y3(n+1)/4

60

Page 61: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Calcolo dei Quartili

n = dispari e (n+1)/2 = dispari

Q1 non è altro che la mediana delle prime (n+1)/2-1=(n-1)/2

modalità ordinate, con (n-1)/2=pari, quindi:

Q1=[y[(n-1)/2]/2+y[(n-1)/2]/2+1]/2=[y(n-1)/4+y(n+3)/4]/2

Q2 è la mediana quindi:

Q2=Me=y(n+1)/2

Q3 non è altro che la mediana delle ultime (n-1)/2 modalità

ordinate, quindi:

Q3=[y (n+1)/2+[(n-1)/2]/2+y(n+1)/2+[(n-1)/2]/2+1]/2

cioè: Q3=[y(3n+1)/4+y(3n+5)/4]/2

61

Page 62: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Esempi:

I° collettivo: n=15=dispari, (n+1)/2=8=pari

Modalità ordinate:

Ranghi:

, quindi: Q1= y4=3;

, quindi: Q3= y12=9;

, quindi: Q2= Me=y8=4;

62

Page 63: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Esempi:

II° collettivo: n=16=dispari, n/2=8=pari

Modalità ordinate:

Ranghi: Q1 Me Q3

, quindi: Q1=[y4+y5]/2=3,5

, quindi: Q2=Me=[y8+y9]/2=7,5

, quindi: Q3=[y12+y13]/2=12,5

63

Page 64: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Nel caso di distribuzioni divise in classi di modalità, si applica

lo stesso criterio visto per la mediana.

33

33333

11

11111

FI-FS

FI-0.75)EI-(ES+EI =Q

FI-FS

FI-0.25)EI-(ES+EI =Q

EI1,ES1= Estremo inf. e sup. della classe contenente Q1

EI3,ES3= Estremo inf. e sup. della classe contenente Q3

FS1,FI1= Freq. cum. rel. della classe contenente Q1 e di quella

precedente.

FS3,FI3= Freq. cum. rel. della classe contenente Q3 e di quella

precedente.

64

Page 65: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Esempio: Distribuzione di frequenza per classi di modalità

Classi

d’età

freq.

ass.

freq. cum. freq. cum.

relat.

Meno di 6 5 5 0.08

6 - 14 7 12 0.20

14 - 24 11 23 0.38 Q1

24 - 40 18 41 0.68 Q2=Me

40 - 65 10 51 0.85 Q3

oltre 65 9 60 1.00

Totali 60 -- -- 65

Page 66: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

29.5068.0-85.0

0.68-0.7540)-(65+40=Q

78.1620.0-38.0

0.20-0.2514)-(24+14=Q

3

1

Dopo aver ricordato che la Mediana è pari

Me=24+(40-24)x(0,50-0,38)/(0,68-0,38)=

=Me= Q2= 30,4

calcoliamo gli altri due quartili:

66

Page 67: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

La media aritmetica

Misura di centralità che dipende da tutte le modalità

Esempio:

I° collettivo:

M=1/15(7+3+3+11+4+4+2+9+7+10+9+1+1+4+10)=5.67

II° collettivo:

M=(13+2+2+12+1+10+7+4+7+8+12+15+

+68+4+3+55)/16=13.94

mentre la mediana (media lasca) era Me=4 nel I° collettivo e

Me=7.5 nel II°.

Media : sensibile ai valori estremi

Eliminando i valori 68 e 55 nel II° collettivo:

Me=7.0 , M=7.14

67

Page 68: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Media aritmetica per distribuzione di frequenza

n° figli freq. ass. freq. rel.

0 5 0.10

1 12 0.24

2 19 0.38

3 9 0.18

4 4 0.08

5 1 0.02

Totali 50 1.00 68

Page 69: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

M=1/50(0+0+0+0+0+1+1+..........+3+3+4+4+4+4+5)

=1/50[(0*5)+(1*12)+(2*19)+(3*9)+(4*4)+(5*1)]=98/50

M=1,96

Alternativamente, molto più facilmente si può calcolare la

Media pesata o ponderata:

M=(0*0.10)+(1*0.24)+(2*0.38)+(3*0.18)+(4*0.08)+(5*0.02)

che porta allo stesso risultato:

In simboli indicheremo con: (x1, x2,…,xi,…,xn) le modalità

rilevate del carattere X relative alle n unità del collettivo

e con M la Media Aritmetica calcolata da:

n

i

ini xn

xxxn

M1

1

1)......(

1

69

Page 70: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

di seguito indicheremo, anche, con:

(x1,x2,…,xi,…,xk)

e con:

(n1,n2,…,ni,…,nk) , con ,

le k modalità diverse del carattere X rilevato sulle n unità

statistiche del collettivo. La formula di calcolo della media

aritmetica è pertanto:

: dove fi sono le frequenze relative.

k

i

i nn1

i

k

i

ii

k

i

i

k

i

iikkii

fxn

nxM

nxn

nxnxnxnxn

M

11

1

2211

1)........(

1

70

Page 71: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

X Fr(X)=ni Fr.r(X)=fi

x1 n1 f1

x2 n2 f2

… --- ---

xi ni fi

… … ---

xk nk fk

Totale n 1

Distribuzione di frequenze di modalità

(in simboli)

71

Page 72: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzione di freq per classi di modalità

distribuzione delle altezze

classi fr. ass. fr. rel. val. cent.

140-148 4 0.07 144

148-156 16 0.26 152

156-164 25 0.42 160

164-172 11 0.18 168

172-180 4 0.07 176

Totali 60 1.00 ---

72

Page 73: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Calcolo della Media, in modo esatto:

M=(158+160+..+165+167)/60=158.98

alternativamente:

M=[(144*4)+(152*16)+(160*25)+

+(168*11)+(176*4)]/60=159.33

Dove 144,152, 160, 168 e 176 sono i valori centrali delle

classi.

73

Page 74: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Simbologia: ci = (xi + xi+1 ) /2 ;

Classi

Modalità:

xi-1 xi

Frequenze

Assolute:

ni

Frequenze

Relative:

fi

Valori centrali

delle Classi: ci

x1 x2 n1 f1 c1

x2 x3 n2 f2 c2

… … … …

xi xi+1 ni fi ci

… … … …

xk-1 xk nk-1 fk-1 ck-1

xk xk+1 nk fk ck

totale n 1 …

74

Page 75: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Proprietà di M:

1)Internalità della Media

Siano (x1, x2,…,xi,…,xn) modalità rilevate del carattere X e

y1 , yn , rispettivamente, la modalità più piccola e quella più

grande, allora: y1 ≤ M ≤ yn .

Dimostrazione

per definizione:

y1 ≤ x1 ≤ yn;..….…..; y1 ≤ xi ≤ yn;……… ; y1 ≤ xn ≤ yn .

Sommando membro a membro le diseguaglianze si ha che:

e dividendo per n si ottiene:

, da cui y1 ≤ M ≤ yn , c.d.d.

75

Page 76: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

2)Proprietà di Invarianza

La media aritmetica, se sostituita a ciascuna delle singole

modalità osservate, lascia invariata la somma delle modalità.

Dimostrazione

Si indichi la funzione somma delle modalità rilevate con:

, sostituendo al posto delle xi la media

M si ottiene: , c.d.d.

76

Page 77: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

3)Proprietà della Nullità della Somma degli Scarti

La somma degli scarti dalla media è nulla.

Dimostrazione:

c.d.d.

77

Page 78: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

4)Proprietà del minimo

La somma degli scarti al quadrato delle modalità da una

costante c assume il valore minimo quando c = M , cioè:

, c per qualsiasi.

Dimostrazione:

78

Page 79: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

ma il secondo termine è nullo (per la terza proprietà della

media aritmetica) ed il terzo è certamente positivo, quindi:

cioè:

c.d.d.

0

79

Page 80: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Se anziché considerare le n modalità rilevate (x1, x2,…,xi,..,xn)

del carattere X si considerino le k modalità diverse e le

rispettive frequenze (n1,n2,…,ni,…,nk), le precedenti proprietà

hanno dimostrazioni del tutto analoghe:

1)Internalità: y1 ≤ M ≤ yn ;

Dimostrazione:

per ogni i si ha: y1 ≤ xi ≤ yn , da cui: ni y1 ≤ ni xi ≤ ni yn ,

da cui anche:

cioè:

da cui infine: y1 ≤ M ≤ yn , c.d.d. 80

Page 81: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

2)Invarianza:

3)Nullità della somma degli scarti:

81

Page 82: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

4)Minimo:

cioè

Dimostrazione:

c.d.d. 82

Page 83: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

La media geometrica

Serie temporale:

Indice a base mobile:

Periodo Consumi di

energia elettrica

Num. Indice a

Base Mobile

Incremento

/Decremento %

Gennaio 3657 ---- ----

Febbraio 4534 1.24 24%

Marzo 4262 0.94 -6%

Aprile 5754 1.35 35%

Maggio 6963 1.21 21%

Giugno 6058 0.87 -13%

83

Page 84: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

cioè: 1,656=1,24*0,94*1,35*1,21*0,87

Calcolo del valore degli indici a base mobile:

Si noti che:

84

Page 85: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Mg =Indice mensile medio ?

Sarebbe auspicabile che Mg sostituito ai singoli indici mensili

lasciasse invariato il prodotto, cioè:

Mg*Mg*Mg*Mg*Mg=1,656 , ovvero: Mg5 = 1,656 da cui:

che fornisce un aumento medio mensile del 10,6%. Si noti:

Mg non è la media aritmetica (che lascia invariata la somma)

Mg = Media Geometrica

(che lascia invariato il prodotto). 85

Page 86: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Richiami di matematica: i logartmi

Si ricorda che diremo che: lga b = c se ac = b, dove a è la

base che usualmente assume i valori: a=10, dando luogo ai

logaritmi in base 10, ovvero a = e = 2,71828…= costante di

Nepero, dando luogo ai logaritmi naturali.

Proprietà dei logaritmi:

lg(a1*a2)=lg a1+lg a2

lg(a1/a2)=lg a1-lg a2

lg a1a2=a2 lg a1

a lg

n

1alg

1

n

nn aa

86

Page 87: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Proprietà della media geometrica

Usando la simbologia più generale della distribuzione di

frequenze di modalità, nella quale (x1,…,xk) [xi>0] sono le

modalità diverse e (n1,…,nk) sono le corrispondenti frequenze,

(*) avremo:

1)Proprietà dell’invarianza

La media geometrica sostituita alle singole modalità lascia

invariata la funzione prodotto. Dimostrazione: Siano

e

(*)

Il caso particolare della distribuzione di modalità si ottiene per

ni=1 per tutti gli i e per k=n.

n

k

i

innn

xk

1

nk...21

in21 xxx=Mg

87

Page 88: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

ma si ha anche:

c.d.d.

2)Il lg della Mg è la Media Aritmetica dei lg xi

Dimostrazione:

c.d.d.

3)La Mg di (z1,…,zi,…,zn) con zi=xi/yi , per i=1,…,n , è:

Mg(z)=Mg(x)/Mg(Y).

Dimostrazione:

c.d.d.

88

Page 89: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Dispersione o Variabilità

Definizione:

Le Misure di Dispersione:

• sono pari a zero in caso di dispersione nulla

• si utilizzano per confrontare le distribuzioni

• permettono di valutare la rappresentatività delle misure di

centralità.

89

Page 90: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Esempio:

Classificazione del collettivo A e del collettivo B per classi di

reddito.

classi di

reddito

val. cent.

ci

A

ni

B

ni’

A

ni ci

B

ni’ ci

0 - 10 5 10 4 50 20

10 - 20 15 25 7 375 105

20 - 30 25 40 85 1000 2125

30 - 40 35 15 2 525 70

40 - 50 45 8 1 360 45

50 - 60 55 2 1 110 55

Totali --- 100 100 2420 2420

90

Page 91: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Misure di Dispersione:

1)Campo di variazione: (E2-E1)

2)Distanza interquartilica: (Q3-Q1)

Collettivo A:

E1=0 , E2=60; (E2-E1)=60;

Q1=10 + 10 x (0.25-0.10) / (0.35-0.10)=16

Q3=20 + 10 x (0.75-0.35) / (0.75-0.35)=30

(Q3-Q1)=14

Collettivo B:

E1=0 , E2=60; (E2-E1)=60;

Q1=20+10 x (0.25-0.11) / (0.96-0.11)=21.65

Q3=20+10 x (0.75-0.11) / (0.96-0.11)=27.53

(Q3-Q1)=5.88

91

Page 92: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

3)La Varianza: media degli scarti al quadrato dalla media

della distribuzione

Dipende da tutte le modalità quindi è molto sensibile ai valori

abnormi.

Calcolo semplificato:

k

=1i

ii nM-xn

1=xV

2

)(

22

i

i

2

i

i

i

2

i

ii

i

i

2

i

i

i

2

i

2

i

i

i

2

i

M+2M-nxn

1=

=nn

1M+nx

n

12M-nx

n

1=

=nM+2Mx-xn

1=

=nM-xn

1=xV )(

2

i

k

=1i

2

i M-nxn

1=V

92

Page 93: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Nell’esempio precedente, il campo di variazione è =60 sia nel

collettivo “A” che in quello “B”, la distanza interquartilica,

invece, varia da un collettivo all’altro mettendo in luce la

maggiore variabilità del collettivo “A” rispetto al collettivo

“B”. La varianza è una misura di variabilità più precisa. In

riferimento ai due collettivi “A” e “B”, avremo:

val. cent. Xi2 A

Xi2ni

B

Xi2ni

5 25 250 100

15 225 5.625 1.575

25 625 25.000 53.125

35 1.225 18.375 2.450

45 2.025 16.200 2.025

55 3.025 6.050 3.025

--- ---- 71.500 62.300

VA=71500/100-24.202=129.36; VB=62300/100-24.202=37.36

Variabilità di A > Variabilità di B 93

Page 94: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Difetti della varianza.

a)Dipende, eventualmente, dai valori abnormi. b)È espressa

con dimensionalità al quadrato. c)E’ una misura assoluta di

variabilità.

Alternative

Scarto Quadratico Medio: [b) è ok]

Coefficiente di Variazione: [c) è ok]

SQM e CV non sono esenti dal difetto a).

Scarto Semplice Mediano: SSM=Medianai=1,..,n [ ]

V =SQM

M

SQM CV

|xi-Me|

94

Page 95: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Classi d'altezza (cm)

Valori centrali

Frequenze relative

Sardegna Friuli meno di 160 157,5 0,064 0,007

160 - 165 162,5 0,182 0,035 165 - 170 167,5 0,302 0,117 170 - 175 172,5 0,269 0,274 175 - 180 177,5 0,136 0,287 180 - 185 182,5 0,040 0,188 185 - 190 187,5 0,006 0,071 più di 190 192,5 0,001 0,021

Totali --- 1,000 1,000

Distribuzione della statura degli iscritti alla leva militare

della Sardegna e del Friuli nati nel 1962 (dati ISTAT, 1985)

95

Page 96: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Valori centrali Freq. rel.

Sardegna

Freq. rel.

cumulate

( a )

( b )

( c )

( a ) x ( b )

(a) x (a) x (b)

157,5 0,064 0,064 10,08 1587,6

162,5 0,182 0,246 29,58 4805,9

167,5 0,302 0,548 50,59 8473,0

172,5 0,269 0,817 46,40 8004,4

177,5 0,136 0,953 24,14 4284,9

182,5 0,040 0,993 7,30 1332,3

187,5 0,006 0,999 1,13 210,9

192,5 0,001 1,000 0,19 37,1

--- 1,000 --- 169,41 28736,1

M=169,41;

Me=165+(0,500-0,246)(170-165)/(0,548-0,246)=169,21;

Q1=165+(0,250-0,246)(170-165)/(0,548-0,246)=165,07;

Q3=170+(0,750-0,548)(175-170)/(0,817-0,548)=173,75;

E2-E1=195-155=40; Q3-Q1=173,75-165,07=8,69; V=28736,1-M2=36,36;

SQM=√36,36=6,03; CV=6,03/169,41=0,036; 96

Page 97: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Valori

centrali

Freq. rel.

Sardegna

Scarti

assoluti da

Me

( a )

( b )

( c )

157,5 0,064 11,71

162,5 0,182 6,71

167,5 0,302 1,71

172,5 0,269 3,29

177,5 0,136 8,29

182,5 0,040 13,29

187,5 0,006 18,29

192,5 0,001 23,29

--- 1,000 ---

Scarti

assoluti da

Me ordinati

Freq. rel.

Sardegna

Freq. rel.

cumulate

( a )

( b )

( c )

1,71 0,302 0,302

3,29 0,269 0,571

6,71 0,182 0,753

8,29 0,136 0,889

11,71 0,064 0,953

13,29 0,040 0,993

18,29 0,006 0,999

23,29 0,001 1,000

--- 1,000 ---

SSM=3,29

97

Page 98: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Valori centrali Freq. rel. Friuli Freq. rel.

cumulate

( a )

( b )

( c )

( a ) x ( b )

(a) x (a) x (b)

157,5 0,007 0,007 1,10 173,6

162,5 0,035 0,042 5,69 924,2

167,5 0,117 0,159 19,60 3282,6

172,5 0,274 0,433 47,27 8153,2

177,5 0,287 0,720 50,94 9042,3

182,5 0,188 0,908 34,31 6261,6

187,5 0,071 0,979 13,31 2496,1

192,5 0,021 1,000 4,04 778,2

--- 1,000 --- 176,26 31111,8

M=176,26;

Me=175+(0,500-0,433)(180-175)/(0,720-0,433)=176,17;

Q1=170+(0,250-0,159)(175-170)/(0,433-0,159)=171,66;

Q3=180+(0,750-0,720)(185-180)/(0,908-0,720)=180,80;

E2-E1=195-155=40; Q3-Q1=180,80-171,66=9,14; V=31111,8-M2=44,21;

SQM=√44,21=6,65; CV=6,65/176,26=0,038;

98

Page 99: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Valori

centrali

Freq. rel.

Friuli

Scarti assoluti da

Me

( a )

( b )

( c )

157,5 0,007 18,67

162,5 0,035 13,67

167,5 0,117 8,67

172,5 0,274 3,67

177,5 0,287 1,33

182,5 0,188 6,33

187,5 0,071 11,33

192,5 0,021 16,33

--- 1,000 ---

Scarti

assoluti da

Me ordinati

Freq. rel.

Sardegna

Freq. rel.

cumulate

( a )

( b )

( c )

1,33 0,287 0,287

3,67 0,274 0,561

6,33 0,188 0,749

8,67 0,117 0,866

11,33 0,071 0,937

13,67 0,035 0,972

16,33 0,021 0,993

18,67 0,007 1,000

--- 1,000 ---

SSM=3,67

99

Page 100: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Sommario

Sardegna Friuli

Media 169.41 176.26

Mediana 169.21 176.17

(E2-E1) 40 40

(Q3-Q1) 8.68 9.14

V 36.36 44.21

SQM 6.03 6.65

CV 0.036 0.038

SSM 3.29 3.67 100

Page 101: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Trasformazioni lineari

Siano le xi le modalità diverse del carattere X con frequenze

ni per (i=1,…,k) ; se:

zi =xi +c

avremo:

cioè, in generale: M(z) = M(x ± c) = M(x) ± c 101

Page 102: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Avremo inoltre:

cioè, in generale: V(z) = V(x ± c) = V(x)

Se invece: zi =xi c

avremo:

cioè: M(z) = c M(x) 102

Page 103: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

ancora:

cioè: V(z) = c2 V(x) 103

Page 104: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

104

In generale se:

zi = a + b xi ,

dove le xi sono le modalità diverse del carattere X (ciascuna

avente frequenza pari a ni, con i=1,..,k,) diremo che il carattere

Z con modalità diverse zi (ciascuna avente frequenza pari a ni,

con i=1,..,k,) è una Trasformazione Lineare di X.

Applicando le formule precedenti avremo:

M(z)=M(a+bx)=M(a)+M(bx)=a+bM(x)

V(z)= V(a+bx)=V(bx)=b2V(x)

Page 105: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

105

Un caso particolare di Trasformazione Lineare si ha quando

tra X ed Z intercorre la relazione:

in tal caso si dice che Z è stata ottenuta dalla

Standardizzazione di X . Si dice, inoltre, che Z è la variabile

standardizzata di X. La standardizzazione è un caso

particolare di Trasformazione Lineare, infatti:

Page 106: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

106

Pertanto la Standardizzazione può essere vista come caso

particolare della Trasformazione Lineare quando:

e ;

avremo quindi:

In conclusione, se Z è la standardizzata di X, cioè se:

allora: M(z)=0 e V(z)=1.

Page 107: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Simmetria ed asimmetria di una distribuzione.

y y y

y= centro di simmetria e asse di simmetria

Siano le xi le modalità diverse equispaziate (o se la

distribuzione è divisa in classi, esse siano di uguale ampiezza)

del carattere X con frequenze ni per (i=1,…,k), allora:

Condizione di Simmetria ni = nk-i+1 per i=1,…,k 107

Page 108: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Proprietà distribuzioniUnimodale simmetriche:

M = Me = Md

dove Md è la Moda della distribuzione.

Nota:

se M=Me=Md non è detto che la distribuzione sia

simmetrica

Esempio: le xi siano: 4 5 3 5 5 3 5 8 5 5 4 8 M=Me=Md=5

ma la

distribuzione

non è simmetrica

X ni xi ni

3 2 6

4 2 8

5 6 30

8 2 16

Totali 12 60 108

Page 109: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzione unimodale asimmetrica positiva:

Md<Me<M

+ Md Me M

109

Page 110: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzione unimodale asimmetrica negativa:

Md >Me >M

M Me Md

110

Page 111: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Misure di asimmetria.

Indice di Pearson:

Se:

δ > 0 asimmetria positiva.

δ < 0 asimmetria negativa.

δ è un indice “relativo”.

Difatti: a) δ=0 / simmetria,

b) Md di difficile determinazione

111

Page 112: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Indice di Pearson modificato.

Verifica empirica: in distribuzioni non molto asimmetriche si

ha che

M – Md ≅ 3 (M - Me)

112

Page 113: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Trasformazioni dei dati finalizzate all’ottenimento della

simmetria

Trasformazioni di Potenza finalizzate all’ottenimento della

simmetria:

con xi>0 e lg in base 10.

Si noti, innanzitutto, che le trasformazioni di potenza lasciano

inalterato l’ordinamento dei dati. Inoltre, l’effetto sui dati è

seguente:

se p>1 zi >>xi , cioè aumentano tutti i valori ma i più

grandi aumentano più che proporzionalmente dei piccoli;

se p<1 zi<<xi , cioè diminuiscono tutti i valori ma i

piccoli diminuiscono meno che proporzionalmente dei grandi. 113

Page 114: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

ESEMPIO:

Pertanto per ricondurci ad una situazione di simmetria

useremo :

a) in caso di asimmetria negativa valori di p>1 (ad esempio:

p=2, 2.5, 3, 3.5 etc.);

b) in caso di asimmetria positiva valori di p<1 (ad esempio:

p=1/2, 0, -1, -2 etc.).

Perché trasformare i dati per ottenere distribuzioni

simmetriche? Risposta: per facilitare i confronti

Xi Xi2 Xi

1/2

2 4 1,41

4 16 2,00

6 36 2,45

8 64 2,83

10 100 3,16

12 144 3,46

14 196 3,74

16 256 4,00

114

Page 115: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

280 715 370 221 1340 128 456 924 383 411 143 913

250 762 236 607 399 1342 745 974 1856 1226 565 730

1377 148 309 788 288 743 1480 1160 1218 1309 1115 1236

1077 607 593 125 327 897 687 797 920 783 1315 150

992 2061 302 348 664 693 362 368 1525 1998 1117 94

1347 1894 256 645 255 774 198 407 1423 1525 366 2219

1504 1372 766 518 655 652 601 867 1062 766 780 820

121 1165 1433 811 1428 84 637 436 1626 930 125 758

505 560 1011 1085 1330 1423 809 622 640 1106 787 890

950 962 690 1532 713 1013 1788 1034 1037 1010 934 761

701 589 736 1081 1059 2257 662 1066 1026 35 2380 2489

In un collettivo di 132 unità vengono rilevate le seguenti

modalità xi del carattere X :

avremo: M=867.03, Me=781.50, SQM=513.97,

Min=35, Max=2489;

volendo costruire una distribuzione di frequenze stabiliamo le

seguenti classi di modalità: 0-250; 250-500; 500-750; 750-

1000; 1000-1250; 1250-1500; 1500-1750; 1750-2000; 2000-

2250; 2250-2500. 115

Page 116: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Avremo la seguente distribuzione di frequenze, cui

corrisponde l’annesso istogramma:

da entrambe le rappresentazioni (tabellare e grafica) si evince

che la distribuzione di X è asimmetrica positiva, con δ’=0.499.

Classi di

X

f(x)

0 - 250 14

250 - 500 18

500 - 750 27

750 - 1000 26

1000 - 1250 20

1250 - 1500 13

1500 - 1750 5

1750 - 2000 4

2000 - 2250 2

2250 - 2500 3

Totali 132 0

5

10

15

20

25

30

0 - 250 250 - 500 500 - 750 750 - 1000 1000 - 1250 1250 - 1500 1500 - 1750 1750 - 2000 2000 - 2250 2250 - 2500

116

Page 117: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Per rendere simmetrica la distribuzione dobbiamo trasformare

le modalità di X mediante la “Trasformazione di Potenza” con

p<1. Si procederà per tentativi, si scelga p=1/2=0.5; avremo:

avremo: M=54,04; Me=53,91; SQM=18,12 ,

Min=9,83, Max=97,78;

volendo costruire una distribuzione di frequenze stabiliamo le

seguenti classi di modalità: 0 -10; 10 - 20; 20 - 30; 30 - 40;

40 – 50; 50 – 60; 60 – 70; 70- 80; 80 – 90; 90 – 100.

31,47 51,48 36,47 27,73 71,21 20,63 40,71 58,79 37,14 38,55 21,92 58,43

29,62 53,21 28,72 47,27 37,95 71,27 52,59 60,42 84,16 68,03 45,54 52,04

72,22 22,33 33,16 54,14 31,94 52,52 74,94 66,12 67,80 70,36 64,78 68,31

63,64 47,27 46,70 20,36 34,17 57,90 50,42 54,46 58,66 53,96 70,53 22,49

60,99 88,80 32,76 35,31 49,54 50,65 36,05 36,37 76,10 87,40 64,84 17,39

71,40 85,04 30,00 48,79 29,94 53,64 26,14 38,35 73,45 76,10 36,26 92,21

75,56 72,08 53,35 43,52 49,19 49,07 47,03 56,89 63,18 53,35 53,86 55,27

20,00 66,26 73,71 54,96 73,58 16,33 48,48 39,76 78,65 58,99 20,36 53,06

42,94 45,33 61,59 63,88 70,94 73,45 54,89 47,88 48,60 64,51 54,11 57,67

59,64 60,03 50,54 76,28 51,40 61,66 82,57 62,31 62,40 61,56 59,12 53,17

50,95 46,54 52,26 63,76 63,08 93,02 49,46 63,30 62,06 9,83 95,57 97,78

117

Page 118: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Avremo la seguente distribuzione di frequenze, cui

corrisponde l’annesso istogramma:

La distribuzione trasformata (con p=1/2=0.5) è certamente

meno asimmetrica di quella originaria, infatti: δ’=0.021.

Classi di

Z F(z)

0 - 10 1

10 - 20 3

20 - 30 12

30 - 40 15

40 - 50 18

50 - 60 33

60 - 70 23

70 - 80 18

80 - 90 5

90 - 100 4

Totali 132 0

5

10

15

20

25

30

35

0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100

118

Page 119: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Allo scopo di migliorare ulteriormente la simmetria si possono

provare altre trasfomazioni per valori diversi di p<1. A puro

titolo didattico proveremo con p=0.485, avremo:

avremo: M=50,12; Me=50,10; SQM=16,43;

Min=9,50; Max=89,42;

volendo costruire una distribuzione di frequenze stabiliamo le

seguenti classi di modalità: 0 -10; 10 - 20; 20 - 30; 30 - 40;

40 – 50; 50 – 60; 60 – 70; 70 – 80; 80 – 90;

29,64 47,90 34,23 26,21 65,69 19,63 38,10 54,51 34,85 36,13 20,83 54,18

27,95 49,46 27,12 44,08 35,59 65,74 48,90 55,98 77,28 62,83 42,50 48,40

66,59 21,21 31,20 50,31 30,08 48,83 69,03 61,11 62,62 64,92 59,91 63,08

58,88 44,08 43,56 19,38 32,12 53,70 46,94 50,60 54,39 50,15 65,07 21,36

56,49 81,42 30,83 33,17 46,13 47,14 33,85 34,14 70,07 80,17 59,96 16,61

65,86 78,07 28,29 45,46 28,24 49,85 24,74 35,95 67,69 70,07 34,04 84,46

69,59 66,47 49,59 40,67 45,82 45,71 43,86 52,79 58,46 49,59 50,05 51,33

19,04 61,24 67,93 51,04 67,81 15,62 45,17 37,24 72,35 54,69 19,38 49,33

40,14 42,31 57,03 59,09 65,44 67,69 50,98 44,63 45,28 59,67 50,27 53,49

55,28 55,63 47,04 70,23 47,83 57,09 75,86 57,68 57,77 57,01 54,81 49,43

47,42 43,41 48,60 58,99 58,38 85,18 46,06 58,57 57,46 9,50 87,45 89,42

119

Page 120: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Avremo la seguente distribuzione di frequenze, cui

corrisponde l’annesso istogramma:

la distribuzione trasformata (con p=0.485) è più simmetrica di

quella originaria, infatti δ’=0.005.

0

5

10

15

20

25

30

35

40

0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90

Classi di

Z

f(z)

0 - 10 1

10 - 20 6

20 - 30 10

30 - 40 15

40 - 50 33

50 - 60 35

60 - 70 19

70 - 80 7

80 - 90 6

Totale 132

120

Page 121: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzioni Bivariate Sulle unità statistiche del collettivo di 50 famiglie sulle quali

abbiamo rilevato il carattere X = “n° Figli per Famiglia”

rileviamo un secondo carattere Y = “Settore di Attività

Economica del Capofamiglia”, le cui modalità sono:

A= agricoltura; I= industria; S= servizi;

elenco modalità rilevate:

dal conteggio delle singole modalità diverse xi e dall’analogo

conteggio delle singole modalità diverse yi si ottengono

distribuzioni univariate di X e di Y: 121

(3,A) (1,I) (3,A) (2,S) (2,I) (0,A) (2,I) (1,S) (5,A) (4,I)

(2,S) (2,A) (3,I) (1,A) (1,I) (2,S) (2,I) (0,I) (2,A) (1,S)

(4,A) (2,S) (1,I) (2,I) (1,S) (4,S) (3,S) (2,I) (1,S) (3,I)

(0,S) (4,A) (3,I) (2,A) (0,S) (3,A) (2,I) (2,I) (1,A) (2,S)

(3,A) (1,S) (0,S) (2,I) (2,S) (1,I) (2,I) (2,S) (1,S) (3,I)

Page 122: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

X=N° figli Frequenze

0 5

1 12

2 19

3 9

4 4

5 1

Totale 50

Y=Settore Attità

Economica

Frequenze

Agric. 13

Indus. 19

Serv. 18

Totale 50

122

Distribuzioni Univariate di Frequenze (o anche

Distribuzioni Marginali)

Conteggiando le coppie di modalità diverse (xi , yi) dei due

caratteri (X,Y) avremo:

Distribuzione

Bivariata di Frequenze

Page 123: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

I valori nella tabella vengono chiamati: frequenze congiunte;

mentre i totali parziali vengono chiamati: frequenze

marginali.

Simbologia delle Distribuzioni Bivariate

X/Y y1 y2 y3 ... yj ... ys Tot

x1 n11 n12 n13 ... n1j ... n1s n1.

x2 n21 n22 n23 ... n2j ... n2s n2.

... ... ... ... ... ... ... ... ...

xi ni1 ni2 ni3 ... nij ... nis ni.

... ... ... ... ... ... ... ... ...

xr nr1 nr2 nr3 ... nrj ... nrs nr.

Tot n.1 n.2 n.3 ... n.j ... n.s n

123

Page 124: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

X e Y sono i caratteri qualitativi e/o quantitativi che

costituiscono la distribuzione doppia.

Frequenze Congiunte: fr(X=xi;Y=yj)=fr(xi;yj)=nij .

Frequenze Marginali

fr(X=xi ) = fr(xi ) =

fr(Y=yi ) = fr(yi ) =

Totale complessivo delle freq.

r

=1i

i.

s

j=1

.j

r

=1i

s

j=1

ij

r

=1i

ij.j

s

j=1

iji.

ij

n =n= n=n

s1,2,...,=j n=n

r1,2,...,=i n=n

sjrin

:

:

),...,1;,...,1(:

124

Page 125: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Frequenze Relative:

Freq. relative congiunte: f(xi,yj)=nij/n=fij (i=1,…,r;j=1,…,s)

Freq. relative marginali: f(xi)=ni./n=fi. (i=1,...,r)

f(yj)=nj./n=f.j (j=1,..,s)

Naturalmente:

1)( ;1)(

1),(

),()(

),()(

11

1 1

1

.

1.

s

j

j

r

i

i

r

i

s

j

ji

r

i

jijj

s

j

jiii

yfxf

yxf

yxfyff

yxfxff

125

Page 126: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

126

Nota: alle coppie di modalità (3,A) e (3,I) compete la stessa

frequenza relativa: 0.08 (8% del totale delle 50 famiglie), ma il

peso delle famiglie con 3 figli è molto diverso tra le famiglie

“A” e quelle “I”. Per sapere se la % di famiglie con 3 figli è

maggiore tra quelle “agricole” che tra quelle “operaie”

dobbiamo calcolare le frequenze di X condizionate ad Y.

Dalle 50 coppie di modalità ricaviamo la distribuzione di

frequenze bivariata (X,Y) mediante il conteggio delle

frequenze di ciascuna coppia di modalità diverse (in tutto

6x3=18) (xi , yi ):

Page 127: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Per far risaltare questo diverso peso dovremmo calcolare le

frequenze relative delle famiglie con 3 figli nei sotto–collettivi

delle famiglie “A”, “I” ed “S”. In modo più completo

calcoleremo tutte le frequenze relative nelle tre sotto –

distribuzioni:

X|Y=A 0 1 2 3 4 5 Totali

fr. 1 2 3 4 2 1 13

fr. rel. 0.08 0.15 0.23 0.31 0.15 0.08 1.00

X|Y=I 0 1 2 3 4 5 Totali

fr. 1 4 9 4 1 0 19

fr. rel. 0.05 0.21 0.48 0.21 0.05 0.00 1.00

X|Y=S 0 1 2 3 4 5 Totali

fr. 3 6 7 1 1 0 18

fr. rel. 0.17 0.33 0.38 0.06 0.06 0.00 1.00 127

Page 128: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Le tre distribuzioni univariate (che si aggiungono alle due

distribuzioni marginali) appena illustrate si chiamano:

Distribuzioni di X Condizionate ad Y

che possiamo sintetizzare nella seguente tabella:

X 0 1 2 3 4 5 Totali

fr(X|Y=A) 0.08 0.15 0.23 0.31 0.15 0.08 1.00

fr(X|Y=I) 0.05 0.21 0.48 0.21 0.05 0.00 1.00

fr(X|Y=S) 0.17 0.33 0.38 0.06 0.06 0.00 1.00

Si noti ora che le famiglie con 3 figli sono 31% tra quelle agricole ed

il 21% tra quelle operaie.

In generale, quando su n unità statistiche vengono rilevati due

caratteri, X e Y, si possono determinare le Distribuzioni Univariate

dei caratteri X e Y considerati singolarmente, la Distribuzione

Bivariariata (o Distribuzione Congiunta) dei caratteri X e Y

considerati congiuntamente ed, infine, le Distribuzioni

Condizionate. 128

Page 129: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

X ni.

x1 n1.

.. ..

xi ni.

.. ..

xr nr.

Tot. n

X f(X)

x1 f(x1 ) = n1./n

.. ..

xi f(xi ) = ni./n

.. ..

xr f(xr ) = nr./n

Tot. 1

X f( X | yj )

x1 f(x1|yj ) = n1j /n.j

.. ..

xi f(xi|yj ) = nij /n.j

.. ..

xr f(xr|yj ) = nrj /n.j

Totali 1

In simboli le distribuzioni univariate di X, pertanto, sono:

L’ultima delle tre tabelle è la generica distribuzione di X

condizionata a Y=yj , poiché (j=1,...,s) di distribuzioni

condizionate di X ce ne sono proprio s.

129

Page 130: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Calcoliamo ora le distribuzioni di frequenze del carattere Y

nei sotto-collettivi di famiglie che hanno, rispettivamente, “0”,

“1”, “2”, “3”, “4”, “5”:

Y|X=0 fr. fr. rel.

A 1 0.20

I 1 0.20

S 3 0.60

Totali 5 1.00

Y|X=5 fr. fr. rel.

A 1 1.00

I 0 0.00

S 0 0.00

Totali 1 1.00

Y|X= fr. fr. rel.

A 2 0.50

I 1 0.25

S 1 0.25

Totali 4 1.00

Y|X=3 fr. fr. rel.

A 4 0.44

I 4 0.44

S 1 0.12

Totali 9 1.00

Y|X=2 fr. fr. rel.

A 3 0.16

I 9 0.47

S 7 0.37

Totali 19 1.00

Y|X=1 fr. fr. rel.

A 2 0.17

I 4 0.33

S 6 0.50

Totali 12 1.00

130

Page 131: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Distribuzioni di Y Condizionate ad X

che possiamo sintetizzare nella seguente tabella:

Y fr(Y|X=0) fr(Y|X=1) fr(Y|X=2) fr(Y|X=3) fr(Y|X=4) fr(Y|X=5)

A 0.20 0.17 0.16 0.44 0.50 1.00

I 0.20 0.33 0.47 0.44 0.25 0.00

S 0.60 0.50 0.37 0.12 0.25 0.00

Totali 1.00 1.00 1.00 1.00 1.00 1.00

131

Page 132: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

In simboli le distribuzioni univariate di Y sono:

Y n.j

y1 n.1

.. ..

yj n.j

.. ..

yr n.s

Tot.

n

Y f(Y)

y1 f(y1 )=n.1 /n

.. ..

yj f(yi )=n.j /n

.. ..

ys f(ys )=n.s /n

Tot. 1

Y f(Y|xi )

y1 f(y1|xi )=ni1 /ni.

.. ..

yj f(yj|xi )=nij /ni.

.. ..

ys f(ys|xi )=nis /ni.

Totali 1

L’ultima delle tre tabelle è la generica distribuzione di Y

condizionata a X=xi , poiché (i=1,...,r) di distribuzioni

condizionate di Y ce ne sono proprio r.

132

Page 133: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Centralità, dispersione e dipendenza per distribuzione

bivariate

Medie Marginali:

Centro della distribuzione bivariata: [M(x), M(y)]

Varianze Marginali:

133

Page 134: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

134

Medie Condizionate

per (j=1,…,s)

per (i=1,…,r)

Page 135: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

135

Varianze Condizionate:

per (j=1,…,s)

per (i=1,…,r)

Page 136: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

136

(1.71, 6.12) (2.77, 6.23) (2.34, 7.32) (1.42, 5.66) (0.48, 3.12)

(2.10, 7.44) (2.18, 7.23) (2.93, 5.92) (1.76, 7.29) (0.95, 4.81)

(0.92, 4.14) (0.96, 4.16) (0.58, 2.82) (2.45, 5.82) (2.96, 8.10)

(1.60, 6.28) (1.07, 4.50) (2.49, 6.30) (0.92, 4.84) (2.33, 6.08)

(1.66, 4.32) (0.45, 3.90) (1.87, 5.94) (0.44, 3.99) (2.54, 5.32)

(1.23, 4.20) (0.51, 3.74) (1.21, 4.63) (1.71, 5.45) (0.64, 4.47)

(1.12, 4.60) (2.53, 7.89) (2.13, 6.02) (0.89, 4.92) (1.20, 5.01)

(2.90, 7.65) (1.97, 6.27) (1.56, 5.09) (1.19, 3.16) (0.06, 4.58)

(2.89, 8.44) (2.07, 6.65) (0.73, 4.66) (1.56, 4.59) (1.37, 6.85)

(1.85, 6.10) (0.23, 3.81) (1.21, 5.48) (2.57, 5.78) (1.33, 3.88)

(1.46, 5.08) (0.17, 3.29) (0.10, 3.20) (0.18, 2.53) (2.95, 7.78)

(2.07, 4.81) (0.49, 2.48) (1.06, 4.83) (2.74, 6.97) (2.76, 6.58)

(2.83, 8.13) (0.26, 3.86) (2.87, 8.50) (0.65, 4.42) (2.63, 7.34)

(2.11, 6.78) (0.75, 4.39) (2.54, 6.68) (0.01, 3.01) (2.13, 6.00)

(2.16, 6.99) (1.89, 7.12) (2.38, 7.78) (1.25, 4.64) (1.65, 4.17)

(1.39, 5.50) (2.98, 6.70) (2.97, 6.86) (0.30, 3.54) (1.95, 7.47)

(2.86, 7.11) (0.40, 4.03) (0.52, 4.68) (1.73, 6.39) (2.78, 6.16)

(1.70, 3.45) (0.76, 3.02) (0.83, 4.25) (2.10, 6.70) (0.50, 3.41)

(0.99, 5.38) (1.80, 3.64) (2.15, 6.42) (0.62, 3.32) (1.81, 4.62)

(2.00, 5.83) (1.73, 4.09) (0.75, 3.45) (2.18, 6.14) (2.54, 5.87)

Quantità di composto additivo (X) e resistenza alla torsione

(Y) rilevate su 100 barre d’acciaio sperimentali:

Page 137: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

137

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

8,00

9,00

0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50

Diagramma SCATTER: X=quantità di composto additivo; Y=resistenza alla trazione

Y

X

Page 138: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

138

Quantità di composto additivo (X) e resistenza alla torsione

(Y) rilevate su 100 barre d’acciaio sperimentali:

X/Y 2 - 4 4 - 5 5 - 6 6 - 7 7 - 9 Totali

0,00-0,75 15 6 0 0 0 21

0,75-1,50 4 13 6 1 0 24

1,50-2,25 2 6 5 15 7 35

2,25-3,00 0 0 4 7 9 20

Totali 21 25 15 23 16 100

Distribuzione Bivariata (X,Y)

Domanda: a quali valori di X si associano, in prevalenza, i

valori di Y?

Page 139: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

139

Page 140: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

140

Distribuzioni di Y condizionate ad X

(val. centr. X=0,375; 1,125; 1,875; 2,625)

(val.centr. Y=3; 4,5; 5,5;6,5; 8)

Y n1j f(Y| x1) yj f(Y| x1)

2 - 4 15 0,7143 2,1429

4 - 5 6 0,2857 1,2857

5 - 6 0 0,0000 0,0000

6 - 7 0 0,0000 0,0000

7 - 9 0 0,0000 0,0000

Totali 21 1,0000 3,4286

Y n2j f(Y| x2) yj f(Y| x2)

2 - 4 4 0,1667 0,5000

4 - 5 13 0,5417 2,4375

5 - 6 6 0,2500 1,3750

6 - 7 1 0,0417 0,2708

7 - 9 0 0,0000 0,0000

Totali 24 1,0000 4,5833

M(Y| X=x1=0,375)=3,43; M(Y| X=x2=1,125)=4,583;

Page 141: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

141

Distribuzioni di Y condizionate ad X

(val. centr. X=0,375; 1,125; 1,875; 2,625)

(val.centr. Y=3; 4,5; 5,5;6,5; 8)

Y n3j f(Y| x3) yj f(Y| x3)

2 - 4 2 0,0571 0,1714

4 - 5 6 0,1714 0,7714

5 - 6 5 0,1429 0,7857

6 - 7 15 0,4286 2,7857

7 - 9 7 0,2000 1,6000

Totali 35 1,0000 6,1143

Y n4j f(Y| x4) yj f(Y| x4)

2 - 4 0 0,0000 0,0000

4 - 5 0 0,0000 0,0000

5 - 6 4 0,2000 1,1000

6 - 7 7 0,3500 2,2750

7 - 9 9 0,4500 3,6000

Totali 20 1,0000 6,9750

M(Y| X=x3=1,875)=6,114; M(Y| X=x4=2,625)=6,975;

Page 142: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

142

Andamento delle Medie di Y condizionate ad X

3,429

4,583

6,114

6,975

0,000

1,000

2,000

3,000

4,000

5,000

6,000

7,000

8,000

0,000 - 0,750 0,750 - 1,500 1,500 - 2,250 2,250 - 3,000

M(Y|X)

M(Y|X)

Page 143: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

143

Distribuzione

Bivariata X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y , X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 11 6 2 2 0 0 21

4 - 5 4,5 2 11 6 5 1 0 25

5 - 6 5,5 0 1 5 3 2 4 15

6 - 7 6,5 0 0 1 5 10 7 23

7 - 9 8 0 0 0 3 4 9 16

Totali … 13 18 14 18 17 20 100

Page 144: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

144

Distribuzioni Condizionate

X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 0,8462 0,3333 0,1429 0,1111 0,0000 0,0000 0,2100

4 - 5 4,5 0,1538 0,6111 0,4286 0,2778 0,0588 0,0000 0,2500

5 - 6 5,5 0,0000 0,0556 0,3571 0,1667 0,1176 0,2000 0,1500

6 - 7 6,5 0,0000 0,0000 0,0714 0,2778 0,5882 0,3500 0,2300

7 - 9 8 0,0000 0,0000 0,0000 0,1667 0,2353 0,4500 0,1600

Totali … 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Page 145: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

145

Medie

Condizionate X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 2,5385 1,0000 0,4286 0,3333 0,0000 0,0000 0,6300

4 - 5 4,5 0,6923 2,7500 1,9286 1,2500 0,2647 0,0000 1,1250

5 - 6 5,5 0,0000 0,3056 1,9643 0,9167 0,6471 1,1000 0,8250

6 - 7 6,5 0,0000 0,0000 0,4643 1,8056 3,8235 2,2750 1,4950

7 - 9 8 0,0000 0,0000 0,0000 1,3333 1,8824 3,6000 1,2800

Totali … 3,2308 4,0556 4,7857 5,6389 6,6176 6,9750 5,3550

Page 146: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

146

Momenti II° Condizionati

X 0 - 0,5 0,5 - 1 1 - 1,5 1,5 - 2 2 - 2,5 2,5 - 3 Totali

( Y | X ) val. c. X 0,25 0,75 1,25 1,75 2,25 2,75 …

Y val.c. Y

2 -4 3 7,6154 3,0000 1,2857 1,0000 0,0000 0,0000 1,8900

4 - 5 4,5 3,1154 12,3750 8,6786 5,6250 1,1912 0,0000 5,0625

5 - 6 5,5 0,0000 1,6806 10,8036 5,0417 3,5588 6,0500 4,5375

6 - 7 6,5 0,0000 0,0000 3,0179 11,7361 24,8529 14,7875 9,7175

7 - 9 8 0,0000 0,0000 0,0000 10,6667 15,0588 28,8000 10,2400

Totali … 10,7308 17,0556 23,7857 34,0694 44,6618 49,6375 31,4475

Varianze

Condizionate ( Y | X )

0,2929 0,6080 0,8827 2,2724 0,8685 0,9869 2,7715

Page 147: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

147

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

8,00

0,25 0,75 1,25 1,75 2,25 2,75

Medie Condizionate ( Y | X )

Page 148: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

148

Indipendenza tra due caratteri

Definizioni:

1) due caratteri sono indipendenti se tra essi non esiste una

relazione di causa ed effetto;

2) due caratteri sono indipendenti se la conoscenza di una

modalità di uno dei due caratteri non migliora la previsione

sulla modalità dell’altro;

Page 149: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

149

Esempio di Distribuzione Bivariata:

X/Y y1 y2 y3 y4 Tot.

x1 12 4 16 8 40

x2 15 5 20 10 50

x3 9 3 12 6 30

Tot. 36 12 48 24 120 X f(X|y1) f(X|y2) f(X|y3) f(X|y4) f(X)

x1 12/36=0.33 4/12=0.33 16/48=0.33 8/24=0.33 40/120=0.33

x2 15/36=0.42 5/12=0.42 20/48=0.42 10/24=0.42 50/120=0.42

x3 9/36=0.25 3/12=0.25 12/48=0.25 6/24=0.25 30/120=0.25

Tot. 1.00 1.00 1.00 1.00 1.00

Domanda: se sulla 121^ unità si rileva Y=y3 questa

informazione migliora la nostra previsione su quale potrebbe

essere il valore di X? La risposta è NO! Perché il sapere che

Y=y3 non aggiunge nulla rispetto all’informazione che ci viene

data dalla semplice distribuzione marginale di X.

Page 150: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

150

Y f(Y|x1) f(Y|x2) f(Y|x3) f(Y)

y1 12/40=0.30 15/50=0.30 9/30=0.30 36/120=0.30

y2 4/40=0.10 5/50=0.10 3/30=0.10 12/120=0.10

y3 16/40=0.40 20/50=0.40 12/30=0.40 48/120=0.40

y4 8/40=0.20 10/50=0.20 6/30=0.20 24/120=0.20

Tot. 1.00 1.00 1.00 1.00

Nota: se tutte le distribuzioni di X condizionate ad Y sono

uguali tra loro ed uguali alla marginale di X anche tutte le

distribuzioni di Y condizionate ad X sono uguali tra loro ed

uguali alla marginale di Y. Pertanto, anche in questo caso, se

sulla 121^ unità dovesse essere rilevato, ad esempio, X=x1 la

nostra previsione circa la modalità di Y non migliorerebbe

rispetto all’informazione che ci viene data dalla distribuzione

marginale della stessa Y. Quindi Y è indipendente da X.

Domanda: come sono le medie condizionate di X e di Y?

Pertanto possiamo concludere che: X è indipendente da Y

Page 151: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

151

Y f( Y| x1 ) f( Y| x2 ) f( Y| x3 ) f( Y| x4 )

2 - 4 0,7143 0,1667 0,0571 0,0000

4 - 5 0,2857 0,5417 0,1714 0,0000

5 - 6 0,0000 0,2500 0,1429 0,2000

6 - 7 0,0000 0,0417 0,4286 0,3500

7 - 9 0,0000 0,0000 0,2000 0,4500

Totali 1,0000 1,0000 1,0000 1,0000

Tornando, invece, alle 100 barrette d’acciaio ed esaminando la

tabelle delle distribuzioni di Y condizionate ad X, sapendo, ad

esempio che: 0<X<0,75 quale previsione potremmo fare su Y?

Page 152: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

152

Teorema:

Se

(1) f(xi|y1)=...=f(xi|yj)=… =f(xi|ys)=ki per (i=1,..,r)

allora:

(2) f(xi)=ki per (i=1,..,r)

(3) f(yj|x1)=...=f(yj|xi)=...=f(yj|xr)=kj per (j=1,..,s)

(4) f(yj)=kj per (j=1,..,s)

(5) X è indipendente da Y e Y è indipendente da X.

Page 153: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

153

Dimostrazione:

dalla (1) avremo che:

ni1 / n.1 = ... = nij / n.j = ... = nis / n.s = ki

cioè:

ni1 = n.1 ki;….; nij = n.j ki; …. ; nis = n.s ki

sommando membro a membro avremo che:

cioè per (i=1,..,r)

ovvero: ki = ni. / n per (i=1,..,r), che dimostra la (2).

Page 154: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

154

Da (1) e (2) deduciamo che:

f(xi|yj) = f(xi) = ki per (i=1,..,r) e (j=1,..,s)

che equivale a:

per (i=1,..,r) e (j=1,..,s)

da cui:

per (i=1,..,r) e (j=1,..,s)

che dimostrano la (3) e la (4).

Se sono tutte vere: (1), (2), (3) e (4) esse implicano anche la

(5) che è dalle stesse è definita. Infine la condizione di

Indipendenza Statistica tra X e Y è data da:

per (i=1,..,r) e (j=1,..,s) c.d.d..

Page 155: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

155

In sintesi, abbiamo dimostrato che:

{indipendenza} { f(xi|yj)=f(xi)} { f(yj|xi)=f(yj)}; i,j

ovvero:

{indipendenza} {nij/n.j = ni./n} {nij/ni .= n.j/n}; i,j

Condizione d’Indipendenza:

Verificare la condizione d’indipendenza sulle ultime due

distribuzioni bivariate (pagine 138 e 144).

s1,..,=j

r1,..,=i

n

n n=n

.ji.

ij

Page 156: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

156

Regione X Y

Piemonte 174,2 287

Valle d'Aosta 174,95 281

Lombardia 173,79 282

Trentino A.A. 175,43 266

Veneto 174,83 262

Friuli V.G. 176,11 302

Liguria 174,19 318

Emilia R. 174,58 285

Toscana 174,49 280

Umbria 173,71 263

Marche 173,46 259

Lazio 173,98 239

Abruzzi 172,3 243

Molise 171,33 230

Campania 171,2 148

Puglia 171,42 223

Basilicata 169,86 204

Calabria 169,58 173

Sicilia 170,48 175

Sardegna 169,27 209

(X): Numero degli abbonamenti alla RAI (1982) per

1000 abitanti per Regione;

(Y) Statura media in cm. degli iscritti di leva (classe

1962).

Stabiliamo le seguenti Classi di Modalità di X

169-173; 173-175; 175-177;

e di Y:

140-210; 210-250; 250-300; 300-320.

X/Y 169 - 173 173 - 175 175 - 177 Totali

140 - 210 5 0 0 5

210 - 250 3 1 0 4

250 - 300 0 8 1 9

300 - 320 0 1 1 2

Totali 8 10 2 20

Essendo per tutti gli (i,j) i caratteri (X,Y)

sono statisticamente dipendenti, ma non essendo

logicamente dipendenti, diremo che si tratta di

dipendenza spuria. Nel seguito “Dipendenza”

significherà “Dipendenza Statistica”.

nij ≠ni. n.j

n

Page 157: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

157

Esempio: collettivo di 50 famiglie classificate per n° figli e per

settore d’attività economica del capofamiglia;

Frequenze congiunte

nij

Frequenze congiunte

d’indipendenza n’ij

Contingenze cij

Y/X 0 1 2 3 4 5 Tot.

A 1.30 3.12 4.94 2.34 1.04 0.26 13

I 1.90 4.56 7.22 3.42 1.52 0.38 19

S 1.80 4.32 6.84 3.24 1.44 0.36 18

Tot. 5 12 19 9 4 1 50

Y/X 0 1 2 3 4 5 Tot.

A -0.30 -1.12 -1.94 1.66 0.96 0.74 0.00

I -0.90 -0.56 1.78 0.58 -0.52 -0.38 0.00

S 1.20 1.68 0.16 -2.24 -0.44 -0.36 0.00

Tot. 0.00 0.00 0.00 0.00 0.00 0.00 0.00

Page 158: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

158

Misure sintetiche di Dipendenza Statistica

Indiche Chi-Quadro di Pearson:

dove le cij = (nij – n’ij ) e le n’ij = (ni. n.j / n ).

Proprietà di χ2:

a) se X ed Y sono indipendenti allora χ2 = 0;

b) se X ed Y non sono indipendenti χ2 > 0, ed è tanto più

grande quanto più le nij si differenziano dalle n’ij ;

c) χ2 è una misura di dipendenza per X ed Y caratteri

quantitativi e/o qualitativi ed il suo calcolo non si basa né sulle

modalità di X né su quelle di Y;

d) χ2 è una misura assoluta di dipendenza statistica.

Page 159: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

159

Calcolo di χ2:

1)Tabella dati

originari: nij;

2)Tabella di

Indipendenza: n’ij;

3)Tabella delle

contingenze: cij;

4)Tabella dei

rapporti: c2ij / n’ij;

5) χ2=10,49.

Nota: il valore di χ2 ottenuto ci assicura che tra X ed Y c’è

dipendenza statistica ma non dice quanto essa è forte, perché

χ2 è una misura assoluta di dipendenza.

Y/X 0 1 2 3 4 5 Tot.

A 1 2 3 4 2 1 13

I 1 4 9 4 1 0 19

S 3 6 7 1 1 0 18

Tot. 5 12 19 9 4 1 50

Y/X 0 1 2 3 4 5 Tot.

A 1,3 3,12 4,94 2,34 1,04 0,26 13

I 1,9 4,56 7,22 3,42 1,52 0,38 19

S 1,8 4,32 6,84 3,24 1,44 0,36 18

Tot. 5 12 19 9 4 1 50

Y/X 0 1 2 3 4 5 Tot.

A -0,3 -1,12 -1,94 1,66 0,96 0,74 0

I -0,9 -0,56 1,78 0,58 -0,52 -0,38 0

S 1,2 1,68 0,16 -2,24 -0,44 -0,36 0

Tot. 0 0 0 0 0 0 0

Y/X 0 1 2 3 4 5 Tot.

A 0,07 0,40 0,76 1,18 0,89 2,11 5,40

I 0,43 0,07 0,44 0,10 0,18 0,38 1,59

S 0,80 0,65 0,00 1,55 0,13 0,36 3,50

Tot. 1,30 1,12 1,20 2,82 1,20 2,85 10,49

Page 160: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

r

=1i

s

j=1

2

ijijij

2

ij

ij

r

=1i

s

j=1 ij

2

ijijr

=1i

s

j=1 ij

ij2

2

=)n+n2n-(nn

1=

=n

)n-(n=

n

c=

r

=1i

s

j=1

ij

r

=1i

s

j=1

r

=1i

s

j=1

ij

ij

2

ij

r

=1i

s

j=1 ij

2

ijr

=1i

s

j=1 ij

ijijr

=1i

s

j=1 ij

2

ij

=n+n2-n

n=

=n

n+

n

nn2-

n

n=

n+2n-n

n=

r

=1i

s

j=1 ij

2

ij

n = n n n

1=)n)(n(

n

1=

n

n n=n

s

j=1

.j

r

=1i

i.

r

=1i

s

j=1

.ji.r

=1i

s

j=1

ij

Calcolo alternativo di χ2:

poiché :

Page 161: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

Pertanto avremo anche:

infine, se non si vuole passare per il calcolo delle n’ij=ni. n.j / n,

avremo:

161

n 1-n n

n=

r

=1i

s

j=1 .ji.

2

ij

2

Page 162: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

162

Definizione di Massima Dipendenza

La dipendenza è massima se per ogni riga o per ogni colonna

non più di una frequenza congiunta è diversa da zero.

Esempio: X/Y y1 y2 y3 y4 Tot.

x1 n11 0 0 0 n11

x2 0 0 n23 0 n23

x3 0 n32 0 0 n32

Tot. n11 n32 n23 0 n

Per le caselle con nij ≠ 0 avremo: n2ij = ni. n.j e di conseguenza

, dove t = minore ( r , s ) e max χ2 =( t – 1) n

Definiamo, quindi, l’indice relativo di dipendenza di Cràmer:

C2 = χ2/ max χ2 = χ2/ [ ( t – 1 ) n ] con [0 ≤ C2 ≤ 1] .

tn n

nr

=1i

s

j=1 .ji.

2

ij

Page 163: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

163

Misure di dipendenza lineare o correlazione

Se due caratteri quantitativi risultano “statisticamente

dipendenti” possiamo ipotizzare che essi siano legati da una

relazione lineare, cioè del tipo Y= a + b X .

Per verificare questa ipotesi misureremo la:

“strettezza della relazione lineare, ovvero, misurando il grado

di correlazione tra X e Y”.

Si considerino le coppie di modalità (xi , yj), riportati nelle

tabelle che seguono, ed i relativi di diagrammi scatter che

mettono in luce una possibile relazione lineare tra X e Y:

Page 164: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

164

X Y X Y X Y X Y

1,00 -3,70 6,00 -1,98 11,00 24,07 17,00 13,06

1,00 14,53 6,60 2,42 10,30 -4,60 17,00 6,18

1,30 -3,62 7,00 6,03 11,00 12,81 17,40 12,10

1,00 -4,46 7,00 -7,16 11,40 -1,16 18,00 15,31

1,00 -1,54 7,00 -1,70 12,00 10,76 18,00 7,33

1,60 -7,99 7,00 19,24 12,00 5,14 18,10 12,97

1,70 10,86 7,10 -7,68 12,10 21,17 19,00 13,56

1,50 11,97 7,00 9,32 13,00 7,38 19,00 9,45

2,00 9,11 7,80 9,02 13,00 25,59 20,30 26,55

2,00 -11,32 8,00 15,06 13,00 14,81 21,00 14,07

2,40 -6,60 8,00 19,28 13,40 9,64 22,90 22,42

3,00 2,83 8,70 19,33 13,00 24,97 23,10 26,72

3,00 5,71 8,00 17,56 13,00 0,54 24,00 29,89

3,40 9,73 8,00 7,99 14,00 24,08 24,00 33,89

3,00 -7,08 8,20 19,50 14,50 0,26 25,10 14,39

3,00 7,64 8,00 13,02 14,00 0,33 25,00 15,87

3,60 13,74 9,00 2,40 14,00 23,64 25,00 9,13

4,00 -1,76 9,00 11,69 14,20 2,79 25,00 15,41

4,10 3,66 9,10 17,11 15,00 14,89 26,70 29,08

5,00 -6,50 9,00 -1,30 15,00 -2,37 26,00 17,58

5,40 5,54 9,60 17,32 15,00 14,56 26,20 22,06

5,00 19,50 10,00 16,51 16,00 1,66 27,00 10,48

5,00 -6,96 10,00 4,00 16,00 17,61 27,00 25,73

5,20 3,47 10,30 -5,79 16,00 3,23 28,20 15,30

5,00 14,39 10,00 20,30 16,00 5,68 29,00 18,37

Data Set (a) relativo a 100 coppie di modalità (xi , yi ) dei

caratteri quantitativi X e Y

Page 165: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

165

Diagramma Scatter (a) relativo a 100 coppie di modalità

(xi , yi ) dei caratteri quantitativi X e Y

-15

-10

-5

0

5

10

15

20

25

30

35

40

0 5 10 15 20 25 30 35

Page 166: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

166 -15

-10

-5

0

5

10

15

20

25

30

35

40

0 5 10 15 20 25 30 35

Diagramma Scatter (a) relativo a 100 coppie di modalità (xi , yi ) dei caratteri

quantitativi X e Y

(in sovrimpressione la retta d’equazione: Y = 1 + 0,75 X )

Page 167: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

167

X Y X Y X Y X Y

1,00 2,20 6,00 4,07 11,00 9,03 17,00 10,85

1,00 2,81 6,60 9,34 10,30 8,08 17,00 12,661,30 3,38 7,00 8,92 11,00 9,03 17,40 14,43

1,00 5,20 7,00 8,44 11,40 9,95 18,00 15,46

1,00 1,73 7,00 9,16 12,00 11,18 18,00 16,83

1,60 5,42 7,00 6,01 12,00 13,36 18,10 13,41

1,70 5,67 7,10 5,84 12,10 8,15 19,00 17,98

1,50 -0,24 7,00 7,34 13,00 9,22 19,00 15,84

2,00 5,83 7,80 9,06 13,00 9,81 20,30 19,51

2,00 3,43 8,00 8,14 13,00 11,60 21,00 14,52

2,40 2,87 8,00 6,99 13,40 13,09 22,90 19,53

3,00 4,07 8,70 7,68 13,00 10,76 23,10 15,52

3,00 -0,01 8,00 7,40 13,00 10,05 24,00 21,27

3,40 0,83 8,00 10,34 14,00 12,58 24,00 16,623,00 2,99 8,20 5,35 14,50 12,02 25,10 20,13

3,00 5,88 8,00 6,40 14,00 8,41 25,00 16,99

3,60 3,97 9,00 5,86 14,00 10,32 25,00 22,60

4,00 6,19 9,00 10,57 14,20 12,28 25,00 22,30

4,10 3,24 9,10 9,44 15,00 15,48 26,70 23,49

5,00 6,01 9,00 7,01 15,00 9,40 26,00 19,85

5,40 8,38 9,60 6,41 15,00 11,13 26,20 18,04

5,00 3,64 10,00 11,00 16,00 13,41 27,00 17,89

5,00 3,53 10,00 6,12 16,00 14,06 28,20 22,45

5,20 3,56 10,30 11,54 16,00 11,43 28,00 24,285,00 7,35 10,00 10,26 16,00 15,69 29,00 20,23

Data Set (b) relativo a 100 coppie di modalità (xi , yi ) dei

caratteri quantitativi X e Y

Page 168: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

168 -5

0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (b) relativo a 100 coppie di modalità

(xi , yi ) dei caratteri quantitativi X e Y

Page 169: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

169 -5

0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (b) relativo a 100 coppie di modalità (xi , yi ) dei caratteri

quantitativi X e Y

(in sovrimpressione la retta d’equazione: Y = 1 + 0,75 X )

Page 170: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

170

La differenza tra i due diagrammi scatter (a) e (b) consiste nel

fatto che il primo diagramma mostra una nuvola di punti più

dispersa che non nel secondo caso, pur mostrando entrambe

una sottostante relazione lineare tra X e Y. Più precisamente

diremo che nel caso (b) la relazione lineare tra X e Y è più

stretta che non nel caso (a).

Misure di strettezza della relazione lineare o di

Correlazione tra X e Y

La Covarianza

Date le n coppie di modalità (x1, y1)……(xn, yn) chiameremo

Covarianza la media dei prodotti degli scarti dalle rispettive

medie di X e di Y:

n

=1i

ii M(y)-yM(x)-xn

1=y)cov(x,

Page 171: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

171

(b)Diagramma Scatter degli scarti [(xi-M(X)] , [yi –M(Y)]

dei caratteri quantitativi X e Y (concordi). Sono prevalenti

i prodotti di scarti positivi, quindi Cov(X,Y)>0.

In particolare: Cov(X,Y) = 41,73.

-15

-10

-5

0

5

10

15

20

-15 -10 -5 0 5 10 15 20

III° Quadrante “+” IV° Quadrante “-”

I° Quadrante “-” II° Quadrante “+”

Page 172: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

172

Se X ed Y sono concordi sono prevalenti i punti che cadono

nel II° e nel III° quadrante. A tali punti corrispondono scarti di

X e di Y che hanno, rispettivamente, lo stesso segno e che

producono, pertanto, prodotti di scarti positivi.

La Covarianza, essendo pari alla media dei prodotti degli

scarti, sarà positiva.

Nel caso in cui X ed Y siano discordi i punti del diagramma

scatter saranno prevalenti nel I° e nel IV° quadrante. A tali

punti corrisponderanno scarti di X e di Y che avranno segno

opposto e daranno luogo, pertanto, a prodotti di scarti negativi.

La Covarianza, in questo secondo caso, essendo pari alla

media dei prodotti degli scarti, sarà negativa.

Page 173: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

173

X Y X Y X Y X Y

1,00 23,94 6,00 18,37 11,00 19,17 17,00 7,80

1,00 21,20 6,60 22,22 10,30 13,95 17,00 13,15

1,30 24,83 7,00 21,30 11,00 16,49 17,40 11,26

1,00 21,85 7,00 17,87 11,40 13,47 18,00 13,36

1,00 25,48 7,00 15,97 12,00 15,54 18,00 13,01

1,60 23,63 7,00 18,58 12,00 14,54 18,10 13,75

1,70 23,86 7,10 17,18 12,10 12,96 19,00 7,76

1,50 25,80 7,00 19,95 13,00 16,75 19,00 9,38

2,00 21,82 7,80 18,65 13,00 14,36 20,30 7,35

2,00 23,42 8,00 18,12 13,00 16,25 21,00 9,57

2,40 22,87 8,00 19,17 13,40 16,28 22,90 4,96

3,00 20,89 8,70 16,29 13,00 13,49 23,10 3,34

3,00 18,78 8,00 21,12 13,00 17,64 24,00 7,68

3,40 21,24 8,00 16,61 14,00 10,71 24,00 7,25

3,00 18,82 8,20 19,54 14,50 10,20 25,10 5,37

3,00 22,33 8,00 18,44 14,00 13,69 25,00 8,31

3,60 19,50 9,00 18,44 14,00 16,53 25,00 2,94

4,00 19,75 9,00 20,61 14,20 13,60 25,00 4,40

4,10 22,09 9,10 18,68 15,00 9,51 26,70 4,93

5,00 23,13 9,00 15,28 15,00 16,05 26,00 5,94

5,40 18,74 9,60 19,04 15,00 9,86 26,20 4,24

5,00 17,99 10,00 16,42 16,00 14,48 27,00 1,29

5,00 18,87 10,00 16,13 16,00 11,52 28,20 3,87

5,20 23,06 10,30 17,10 16,00 9,51 28,00 5,92

5,00 23,12 10,00 18,63 16,00 15,08 29,00 5,05

Data Set (c) relativo a 100 coppie di modalità (xi , yi ) dei

caratteri quantitativi X e Y

Page 174: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

174 0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (c) relativo a 100 coppie di modalità

(xi , yi ) dei caratteri quantitativi X e Y

Page 175: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

175 0

5

10

15

20

25

30

0 5 10 15 20 25 30 35

Diagramma Scatter (c) relativo a 100 coppie di modalità (xi , yi ) dei caratteri

quantitativi X e Y

(in sovrimpressione la retta d’equazione: Y = 24 - 0,75 X )

Page 176: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

176

(c)Diagramma Scatter degli scarti [(xi-M(X)] , [yi –M(Y)]

dei caratteri quantitativi X e Y (discordi). Sono prevalenti i

prodotti di scarti negativi, quindi Cov(X,Y)<0.

In particolare: Cov(X,Y)= - 43,72 .

-20

-15

-10

-5

0

5

10

15

-15 -10 -5 0 5 10 15 20

I° Quadrante “-”

III° Quadrante “+” IV° Quadrante “-”

II° Quadrante “+”

Page 177: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

177

In caso di bilanciamento tra prodotti degli scarti positivi e

negativi si ha: Cov( X , Y ) = 0.

____...____

Diseguaglianza di Cauchy-Schwarz

Cov( X , Y )2 ≤ V( X ) V( Y ) Dimostrazione:

=)lw+(zM(Y)-y=w

M(X)-x=z n

=1i

2

ii

ii

ii

0 w l+ wz l 2+z=

=) wl+ wz l 2+(z=

n

=1i

2

i

2n

=1i

ii

n

=1i

2

i

n

=1i

2

i

2

ii

2

i

Page 178: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

178

Poiché l’espressione precedente non – negativa allora il

polinomio in l:

non ammette radici reali e distinte, cioè il suo discriminante è

minore o uguale a “0”, cioè:

Page 179: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

179

ma, sostituendo al posto di zi e wi gli scarti di xi e yi dalle

rispettive medie, avremo:

cioè:

Cov( X , Y )2 ≤ V( X ) V( Y ) c.d.d.

da cui consegue:

V(Y) V(X)Y)Cov(X,V(Y) V(X) - ≤≤

Page 180: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

180

Nella diseguaglianza di Cauchy-Schwarz vale il segno “=“

quando X ed Y sono legate da una perfetta relazione lineare,

cioè Y=a+bX.

Infatti, se Y=a+bX allora yi = a + b xi , i , quindi,

ricordando che M(Y) = a + b M(X), avremo:

V(X) b=M(X)-x n

1 b=

=M(X)-x b M(X)-x n

1=

= M(X)b-a-x b+aM(X)-x n

1=

=M(Y)-yM(X)-x n

1=Y)Cov(X,

2n

=1i

i

n

=1i

ii

n

=1i

ii

n

=1i

ii

Page 181: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

181

inoltre, essendoci una relazione lineare tra le medie avremo

anche:

M(X)=-(a/b)+M(Y)/b

pertanto:

V(Y) b

1=M(Y)-y

n

1

b

1=

=M(Y)-y M(Y)-y b

1

n

1=

=M(Y)-y b

M(Y)+

b

a+

b

y+

b

a-

n

1=

=M(Y)-yM(X)-x n

1=Y)Cov(X,

2n

=1i

i

n

=1i

ii

i

n

=1i

i

n

=1i

ii

Page 182: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

182

quindi, in ultima analisi:

Cov(X,Y)=bV(X)

Cov(X,Y)=V(Y)/b

pertanto se:

Y=a+bX allora Cov(X,Y)2=V(X)V(Y)

c.d.d.

inoltre, se b>0 si ha Cov(X,Y)=bV(X)≥0 , quindi:

se, invece, b<0 si ha Cov(X,Y)=bV(X)≤0 , quindi:

V(Y) V(X)=Y)Cov(X,

V(Y) V(X)- =Y)Cov(X,

Page 183: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

183

V(Y) V(X)

Y)(X, Cov=

Y)(X, Cov max

Y)(X, Cov=Y)r(X,

Indice relativo di dipendenza lineare o correlazione:

1 Y)r(X, 1- ≤≤

il significato di r(X,Y), detto coefficiente di correlazione di

Bravais – Pearson, è identico a quello di Cov(X,Y) ma, a

differenza di quest’ultima, r(X,Y) è una misura relativa di

correlazione.

Page 184: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

184

Per il Data Set (a) avremo:

M(X)=11,87; M(Y)=9,87; VX)=58,74; V(Y)=102,85;

Cov(X,Y)=41,43; r(X,Y)=0,533.

Per il data set (b) avremo:

M(X)=11,88;M(Y)=10,29;V(X)=59,05;V(Y)=33,20;

Cov(X,Y)=41,73; r(X,Y)=0,943.

Per il data set ( c ) avremo:

M(X)=11,88; M(Y)=15,40; V(X)=59,05; V(Y)=36,19;

Cov(X,Y)=-43,72; r(X,Y)=-0,946.

Page 185: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

185

Sino ad ora, nello studio dei delle distribuzioni bivariate

abbiamo supposto che i dati siano forniti sotto forma di n

coppie di modalità rilevate (xi , yi ). Analizzeremo ora il caso

in cui, invece, essi siano forniti sotto forma di:

tabella a doppia entrata o tabella di contingenza.

I dati da prendere in considerazione saranno ora le r x s coppie

(xi , yj ) di modalità diverse ciascuna considerata con la

propria frequenza nij .

Page 186: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

186

X/Y y1 y2 y3 ... yj ... ys Tot

x1 n11 n12 n13 ... n1j ... n1s n1.

x2 n21 n22 n23 ... n2j ... n2s n2.

... ... ... ... ... ... ... ... ...

xi ni1 ni2 ni3 ... nij ... nis ni.

... ... ... ... ... ... ... ... ...

xr nr1 nr2 nr3 ... nrj ... nrs nr.

Tot n.1 n.2 n.3 ... n.j ... n.s n

Tabella a Doppia Entrata

La covarianza rimane definita come la media aritmetica, in

questo caso “ponderata”, dei prodotti degli scarti dalla media,

rispettivamente, di X e di Y .

Page 187: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

187

Si noti che se le variabili X e Y sono indipendenti allora si

avrà che: nij = ni. n.j / n , (i,j), sostituendo nella formula della

covarianza avremo:

=n

n n M(Y)-yM(X)-x

n

1=Y)Cov(X,

.ji.

j

r

=1i

s

j=1

i

=n M(Y)-y n

1n M(X)-x

n

1=

s

j=1

.jj

r

=1i

i.i

= 0 0 = 0

In conclusione:

se (X, Y) sono Indipendenti Cov(X, Y)=0 , r(X, Y)=0 .

NON E’ VERO IL VICEVERSA

Page 188: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

188

Verifichiamo con un contro – esempio che Cov(X, Y)=0 non

implica l’indipendanza:

Infatti nella tabella, di cui sopra, M(X)=0, M(Y)=2, quindi

Cov(X,Y)=r(X,Y)=0 ma, chiaramente, Y dipende da X secondo

una legge quadratica. In questo caso X ed Y si dicono

incorrelati .

X Y XY

-2 4 -8

-1 1 -1

0 0 0

1 1 1

2 4 8

0 10 0

Page 189: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

189

Calcolo semplificato della Covarianza

=XMYM+X My-Y Mx-y x n

1=

=YM-yXM-x n

1=Y)Cov(X,

n

=1i

iiii

n

=1i

ii

M(Y)M(X)+M(Y)M(X)-M(Y)M(X)-yxn

1=

=nM(Y)M(X)+yM(X)-xM(Y)-yxn

1=

n

=1i

ii

n

=1i

i

n

=1i

i

n

=1i

ii

da cui:

M(Y)M(X)-y xn

1=Y)Cov(X,

n

=1i

ii

Page 190: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

se i dati sono organizzati in una tabella a doppia entrata

avremo analogamente:

il calcolo del coefficiente di correlazione si effettuerà come di

consueto:

190

V(Y) V(X)

Y)(X, Cov=Y)r(X,

M(Y)M(X)-ny xn

1=Y)Cov(X,

r

=1i

s

j=1

ijji

Page 191: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

191

La Regressione

Sulla base delle n coppie di modalità osservate (x1,y1),..,(xn,yn),

dopo aver verificato la dipendenza tra i caratteri quantitativi X

ed Y, ci proponiamo di determinare la funzione matematica “f”

che meglio sintetizzi il legame di dipendenza tra X ed Y, cioè:

Y = f ( X )

Le motivazioni che ci spingono alla ricerca di “ f ” sono

essenzialmente due: la Previsione ed il Controllo.

Page 192: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

192

Previsione

Nella fase di raccolta dei dati in corrispondenza dei valori

osservati x1, x2,…,xn di X e sono stati anche rilevati i

valori y1, y2,...,yn di Y. Se si osserva un nuovo valore di X,

diciamo xn+1, possiamo prevedere l’ignoto valore di Y con

y’n+1 = f ( xn+1 ).

Controllo

Sulla base degli n valori osservati di X e di Y si è determinata

la funzione che lega le due variabili: Y=f(X). Ci si chiede ora:

quale valore incognito l’operatore deve dare alla X per

ottenere un desiderato valore y0 della Y. Il valore incognito è:

x0 = f-1( y0 ), cioè quel valore di X tale che f(x0 )=y0.

Page 193: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

193

I dati del problema della ricerca della funzione “f” più idonea a

rappresentare il legame tra X ed Y sono costituiti dalle n coppie di valori

(xi , yi ) che graficamente si possono così rappresentare n punti:

Page 194: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

194

Il modo più semplicistico per determinare “f ” consiste nello scegliere la

polinomiale di equazione Y=a0+a1x+a2x2+…+an-1x

n-1, che passa per tutti

gli n punti dati:

Page 195: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

195

Si opera meglio se si procede nel modo seguente:

a) si ipotizza un modello semplice di relazione tra X ed Y;

b) si determinano i valori dei parametri del modello

minimizzando i residui, cioè le differenze tra i valori osservati

di Y ed i valori teorici di Y*, forniti dal modello;

c) si giudica la bontà di adattamento del modello ai dati sulla

base dell’andamento dei residui;

d) se il modello è insoddisfacente, sulla base dei residui, si

sceglie un nuovo modello da prendere in considerazione, e si

riparte da a).

Page 196: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

196

Il modello di relazione più semplice è quello lineare:

Y= a+ b X

“a” e “b” sono:

- i parametri del modello,

ovvero:

- il termine noto ed il coefficiente di X,

ovvero:

- l’intercetta ed il coefficiente angolare della retta di

equazione: y=a+bx .

Page 197: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

197

Esempio di perfetta relazione lineare tra X ed Y:

Y = a + b X : con Y = a quando X = 0 e Y = a + b per X = 1.

Page 198: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

198

Metodo dei Minimi Quadrati

Si dispone di n coppie di valori ( xi , yi ) relative ai caratteri X

ed Y rilevati su n unità statistiche. Avendo verificato la

dipendenza statistica di Y da X si vuole determinare la

funzione “ f “ più idonea per descrivere tale legame.

Ipotizziamo, in prima approssimazione che: Y = a + b X. In tal

caso in corrispondenza dei valori di X: x1, x2,…,xn , dovremmo

ottenere, nel caso di perfetta relazione lineare, i seguenti

valori teorici di Y:

y*1 = a + b x1

y*2 = a + b x2

…………….

y*n = a + b xn

Determineremo ora i parametri incogniti a e b in modo che sia

minimizzata la somma dei quadrati delle differenze (yi – y*i ):

Page 199: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

199

Per determinare i valori di a’ e b’ che rendano minima S

dobbiamo derivare la funzione f(a,b) rispetto ad a e b,

uguagliare a zero le derivate parziali e risolvere il sistema di I°

grado che si ottiene, avente incognite a e b. Per verificare che

le soluzioni a’ e b’ che si otterranno minimizzino S basti

considerare che f(a,b) è una funzione di secondo grado tale

f(a,b) ≥ 0.

Page 200: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

200

Avremo che:

Page 201: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

201

Analogamente avremo:

Page 202: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

202

Uguagliando a zero le due derivate parziali avremo il Sistema

Normale:

Page 203: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

203

Sistema Normale:

Page 204: Presentazione di PowerPoint...Cenni di Storia della Statistica Tratto comune alle diverse civilizzazioni: l’enumerazione a scopi fiscali e militari. Tra le varie civiltà ricordiamo:

204

Nell’espressione che ci fornisce b’ se dividiamo numeratore e

denominatore per n, otterremo:

inoltre dalla prima equazione del Sistema avremo:

da cui otteniamo:

a’ e b’ sono gli stimatori “minimi quadrati di a e b.