Distribuzioni Bivariate di due Variabili - mozzanica.net Dispense STB/2014-2015... · rapporto di...

32
Distribuzioni Distribuzioni Bivariate Bivariate di due Variabili di due Variabili Consideriamo una distribuzione bivariata costituita da due variabili statistiche . Possiamo definire, rispetto al solito schema, le seguenti medie parziali (essendo X e Y variabili statistiche, tutte le modalità ad esse relative sono qualitative). n n n n n x n n n n n x n n n n n x Tot y y y y c j c j c j 20 2 2 22 21 2 10 1 1 12 11 1 2 1 .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... 1 n n n n n Tot n n n n n x n n n n n x c j r rc rj r r r i ic ij i i i 0 0 02 01 0 2 1 0 2 1 .... .... .... .... .... .... .... .... .... .... .... .... .... .... Le distribuzioni semplici che possono essere ricavate da una distribuzione doppia come la precedente sono r (una per ogni riga) + c (una per ogni colonna) + 2 ( la distribuzione marginale delle X e la distribuzione marginale delle Y). Per ognuna di esse di può ottenere una media semplice secondo il seguente schema:

Transcript of Distribuzioni Bivariate di due Variabili - mozzanica.net Dispense STB/2014-2015... · rapporto di...

Distribuzioni Distribuzioni BivariateBivariate di due Variabilidi due VariabiliConsideriamo una distribuzione bivariata costituita da due variabili statistiche .Possiamo definire, rispetto al solito schema, le seguenti medie parziali (essendo X e Y variabili statistiche, tutte le modalità ad esse relative sono qualitative).

nnnnnx

nnnnnx

nnnnnx

Totyyyy

cj

cj

cj

202222212

101112111

21

........

................................

........

........

........

1

nnnnnTot

nnnnnx

nnnnnx

cj

rrcrjrrr

iicijiii

000201

021

021

........

........

................................

........

Le distribuzioni semplici che possono essere ricavate da una distribuzione doppia come la precedente sono r (una per ogni riga) + c (una per ogni colonna) + 2 ( la distribuzione marginale delle X e la distribuzione marginale delle Y). Per ognuna di esse di può ottenere una media semplice secondo il seguente schema:

Medie Condizionate e MarginaliMedie Condizionate e MarginaliMedia Condizionata (o parziale) xj

cjn

nxMx

j

r

iiji

yXjj

,...,1 0

1 =⋅

==∑

=

Media Condizionata (o parziale) yi

rin

ny

Myi

c

jijj

xYi i,...,1

0

1 =⋅

==∑

=

Media Marginale X Media Marginale Y

2

10

n

nxX

r

iii∑

=

⋅=

n

ny

Y

c

jjj∑

=

⋅= 1

0

Medie Condizionate e MarginaliMedie Condizionate e MarginaliEs. Excel

y_1 y_2 y_3 y_4Medie parziali

Y|x_i Media Y modalità2 4 6 8 n_i0 frequenze

x_1 3 12 7 2 3 24 3,67 mediex_2 5 2 3 6 4 15 5,60 4,42

x_3 7 23 16 8 14 61 4,43n_0j 37 26 16 21 100

Medie

3

Medie Parziali

X|y_j5,59 5,69 5,75 6,05

Media X 5,74

3

5

7

0

5

10

15

20

25

24

68

12

7

2 3

2 36

4

23

16

8

14

Frequenze

Medie Condizionate e MarginaliMedie Condizionate e MarginaliGrafici Excel

3

5

7

n_0j

0

20

40

60

80

100

24

68

Frequenze (Marginali)

100

Frequenze e medie

4

8n_i0

3

5

7

n…

M…M…

0

10

20

30

40

50

60

70

80

90

100

24

68

n_i0Medie

parziali

Y|x_i

Medie Parziali.Medie Parziali.Grafici Excel

40

50

60

70

80

90

100

Frequenze e medie

5

2

4

6

8

n…

M…

0

10

20

30

35

7n_0j

Medie

Parziali

X|y_j

Media X

Connessione e DipendenzaConnessione e DipendenzaLa dipendenza tra le due variabili aleatorie X ed Y viene studiata, in prima istanza, attraverso l’indice η di Pearson:

( )

( )∑

=

=

⋅−

⋅−= c

jjYj

r

iiYxY

XY

nMy

nMMi

10

2

10

2|

|η Indica la dipendenza di Y da X

6

A cui va aggiunto

( )( )∑

=

=

⋅−

⋅−= r

iiXi

c

jjXyX

YX

nMx

nMMj

10

2

10

2|

|ηIndica la dipendenza di X da Y

Se η_Y|X ≠ η_X|Y significa che la rilevazione non è simmetrica

Connessione e DipendenzaConnessione e DipendenzaEs. Excel

y_1 y_2 y_3 y_4

2 4 6 8 n_i0Medie parziali

Y|x_i Media Y

x_1 3 12 7 2 3 24 3,67

x_2 5 2 3 6 4 15 5,60 4,42

x_3 7 23 16 8 14 61 4,43

n_0j 37 26 16 21 100

Medie

Parziali

X|y_j

5,59 5,69 5,75 6,05

Media X 5,74

Media Y 4,42

7

Media Y 4,42

Media X 5,74

x_i y_j n_i0 n_0j M_Y|x_i M_X|y_j ΔM_Y^2*n_i0 ΔM_X^2*n_0j (Y-M_Y)^2*n_0j (X-M_X)^2*n_i0

3 2 24 37 3,67 5,59 13,620 0,782 216,687 180,182

5 4 15 26 5,60 5,69 20,886 0,059 4,586 8,214

7 6 61 16 4,43 5,75 0,002 0,002 39,942 96,844

8 21 6,05 1,987 269,144

Totali 100,00 100,00 13,69 23,08 34,509 2,830 530,360 285,240

Indice η_Y|X 0,255

Indice η_X|Y 0,100

Connessione PerfettaConnessione PerfettaEs. Excel

y_1 y_2 y_3 y_4

2 4 6 8 n_i0Medie parziali

Y|x_i Media Yx_1 3 2 0 0 0 2 2,00x_2 5 0 3 0 0 3 4,00 5,71x_3 7 0 0 4 5 9 7,11

n_0j 2 3 4 5 14

Medie Parziali

X|y_j3,00 5,00 7,00 7,00 CONNESSIONE PERFETTA

Media X 6,00

Media Y 5,71

8

Media Y 5,71Media X 6,00

x_i y_j n_i0 n_0j M_Y|x_i M_X|y_j ∆M_Y^2*n_i0 ∆M_X^2*n_0j (Y-M_Y)^2*n_0j (X-M_X)^2*n_i03 2 2 2 2,00 3,00 27,592 18,000 27,592 18,0005 4 3 3 4,00 5,00 8,816 3,000 8,816 3,0007 6 9 4 7,11 7,00 17,560 4,000 0,327 9,000

8 5 7,00 5,000 26,122

Totali 14,00 14,00 13,11 22,00 53,968 30,000 62,857 30,000

Indice η_Y|X 0,927

Indice η_X|Y 1,000

Indipendenza PerfettaIndipendenza PerfettaEs. Excel

y_1 y_2 y_3 y_4

2 4 6 8 n_i0Medie parziali

Y|x_i Media Yx_1 3 1 2 3 4 10 6,00x_2 5 2 4 6 8 20 6,00 6,00x_3 7 3 6 9 12 30 6,00

n_0j 6 12 18 24 60

Medie Parziali

X|y_j5,67 5,67 5,67 5,67 INDIPENDENZA

Media X 5,67

Media Y 6,00Media X 5,67

9

x_i y_j n_i0 n_0j M_Y|x_i M_X|y_j ∆M_Y^2*n_i0 ∆M_X^2*n_0j (Y-M_Y)^2*n_0j (X-M_X)^2*n_i03 2 10 6 6,00 5,67 0,000 0,000 96,000 71,1115 4 20 12 6,00 5,67 0,000 0,000 48,000 8,8897 6 30 18 6,00 5,67 0,000 0,000 0,000 53,333

8 24 5,67 0,000 96,000

Totali 60,00 60,00 18,00 22,67 0,000 0,000 240,000 133,333

Indice η_Y|X 0,000

Indice η_X|Y 0,000

SimmetriaSimmetriaEs. Excel

y_1 y_2 y_3

2 4 6 n_i0

Medie

parziali

Y|x_i Media Y

x_1 3 1 3 4 8 4,75

x_2 5 3 1 4 8 4,25 4,08

x_3 7 4 4 1 9 3,33

n_0j 8 8 9 25

Medie

Parziali

X|y_j

5,75 5,25 4,33 CONNESSIONE SIMMETRICA

Media X 5,08

Media Y 4,08

10

Media X 5,08

x_i y_j n_i0 n_0j M_Y|x_i M_X|y_j ΔM_Y^2*n_i0 ΔM_X^2*n_0j (Y-M_Y)^2*n_0j (X-M_X)^2*n_i0

3 2 8 8 4,75 5,75 3,591 3,591 34,611 34,611

5 4 8 8 4,25 5,25 0,231 0,231 0,051 0,051

7 6 9 9 3,33 4,33 5,018 5,018 33,178 33,178

8

Totali 25,00 25,00 12,33 15,33 8,840 8,840 67,840 67,840

Indice η_Y|X 0,361

Indice η_X|Y 0,361

Regressione e CorrelazioneRegressione e CorrelazioneDue o più variabili hanno una relazione (od un legame) se le variazioni dell’una sono legate in qualche modo alle variazioni dell’altra.Le tecniche statistiche che consentono di valutare il tipo e l’intensità della relazione che lega due o più caratteri qualitativi si dicono “analisi della regressione” ed “analisi della correlazione”.

“Analisi della Regressione” : consiste nello sviluppare un modello matematico per “prevedere” i valori (o le modalità) di una variabile, detta dipendente (o Y), noti i valori (o le modalità) dell’altra variabile, detta indipendente (o X).Si prefigge l’obiettivo di ricavare, in base ai dati, una funzione matematica, detta “funzione di regressione”, in grado di descrivere la natura funzionale che esiste tra le

11

“funzione di regressione”, in grado di descrivere la natura funzionale che esiste tra le due variabili X ed Y.Il “Modello di Regressione Lineare Semplice” che adotteremo fa riferimento ad una legge funzionale y=f(x,a,b,c,..) [legge questa non necessariamente lineare o polinomiale nella variabile x, ma lineare nei parametri (detti “parametri di regressione” ) a,b,c,…]

“Analisi della correlazione”: consiste nella ricerca di alcuni indici che valutino la concordanza o la discordanza tra le variabili X e Y, ossia se esiste una interdipendenza tra esse.Non si tratta di una relazione funzionale a cui ad ogni valore delal X corrisponde un ben definito valore della Y.

Regressione e CorrelazioneRegressione e Correlazione“Analisi della correlazione”: se tra le due variabili esiste una rapporto causa-effetto allora esse sono correlate. Tuttavia se sono correlate non è detto che fra di esse vi sia un rapporto di causa-effetto.

L’analisi della correlazione consente di individuare l’intensità della relazione che lega le due variabili, mentre l’analisi della regressione consente di individuarne il tipo di relazione esistente.Le due tecniche possono essere utilizzate in situazioni diverse ed, a volte, anche congiuntamente.

Per lo studio di correlazione e regressione faremo riferimento ai dati statistici rilevati per

12

Per lo studio di correlazione e regressione faremo riferimento ai dati statistici rilevati per le variabili statistiche X ed Y secondo il seguente schema :Coppie di dati :

( ) ( ) ( )nn yxyxyx ; ..... ; ; 2211 ( ) n ,.....iyx ii ,1 ; =

O come tabella :

nn yx

yx

yx

YX

......22

11

Analisi della CorrelazioneAnalisi della CorrelazioneDef. Due variabili sono perfettamente correlate se esiste un’equazione che lega una variabile all’altra.

Def. Due variabili sono NON correlate se non esiste alcuna relazione tra i loro valori.

Def. Due variabili sono dette positivamente correlate (o che esiste concordanza tra di esse) se al crescere dell’una cresce anche l’altra, se al decrescere dell’una decresce anche l’altra, se la valori piccolo (grandi) dell’una corrispondono valori piccoli (grandi) dell’altra.

Def. Due variabili sono dette negativamente correlate (o che esiste discordanza tra di

13

Conv.

Def. Due variabili sono dette negativamente correlate (o che esiste discordanza tra di esse) se la crescere dell’una l’altra decresce e viceversa, se a valori piccoli (grandi dell’una) corrispondono valori grandi (piccoli) dell’altra.

n

xx

n

ii∑

== 1Valore medio di x

n

yy

n

ii∑

== 1Valore medio di y

xxs ixi−= Scarto x_i yys iyi

−= Scarto y_i

Analisi della Correlazione: CovarianzaAnalisi della Correlazione: Covarianza

( )( )22

1

21

2

2 1xxs

nn

xx n

ix

n

ii

X i−==

−= ∑∑

=

=σ Varianza di x

( )( )22

1

21

2

2 1yys

nn

yy n

iy

n

ii

Y i−==

−= ∑∑

=

=σVarianza di y

14

( )n

s

n

yyn

iy

n

ii

Y

i∑∑== =

−= 1

2

1

2

σ Deviazione Standard di y

( )n

s

n

xxn

ix

n

ii

X

i∑∑== =

−= 1

2

1

2

σ Deviazione Standard di x

Analisi della Correlazione: CovarianzaAnalisi della Correlazione: Covarianza

Def. Codevianza ( ) ( )ii y

n

ixi

n

ii ssyyxxYXCodev ⋅=−⋅−= ∑∑

== 11

),(

Def. Covarianza ( ) ( )XY

i

n

ii

n

yyxxYX σ=

−⋅−=∑

=1),Cov(

Proprietà della Covarianza

⋅−=σProprietà 1

15

yxxyXY ⋅−=σProprietà 1

Dim. ( ) ( )( )=+−−=

−⋅−= ∑∑

=

=n

iiiii

i

n

ii

XY yxyxyxyxnn

yyxx

1

1 1σ

( )yxxyyxyxxyxy

n

yx

n

yx

n

xy

n

yxn

i

n

ii

n

ii

n

iii

⋅−=+⋅−⋅−=+

−=∑∑∑∑

==== 1111

Analisi della Correlazione: CovarianzaAnalisi della Correlazione: Covarianza

11 ≤⋅

≤−YX

XY

σσσProprietà 2

Dim.

yxyx ⋅≤⋅

Dalla diseguaglianza di Cauchy-Schwartz (prodotto scalare) per due generici x e yvettori di Rn abbiamo:

16

Identificando il vettore x con il vettore degli scarti della distribuzione x_i e con y con il vettore degli scarti della distribuzione y_i, abbiamo

( ) ( ) ( ) ( )∑∑∑===

−⋅−≤−⋅−n

ii

n

iii

n

ii yyxxyyxx

1

2

1

2

1

Dividendo per n:

( ) ( ) ( ) ( )n

yy

n

xx

n

yyxxn

ii

n

iii

n

ii ∑∑∑

===

−⋅

−≤

−⋅−1

2

1

2

1

Analisi della Correlazione: CovarianzaAnalisi della Correlazione: Covarianza

1≤⋅ YX

XY

σσσ

Da cui

( ) ( ) ( ) ( )n

yy

n

xx

n

yyxxn

ii

n

iii

n

ii ∑∑∑

===

−⋅

−≤

−⋅−1

2

1

2

1YXXY σσσ ⋅≤

E quindi 11 ≤⋅

≤−YX

XY

σσσ

Covarianza e variabili standardizzate (o normalizzate)

17

Covarianza e variabili standardizzate (o normalizzate)

Sia

XST

XXX

σ−= e sia

YST

YYY

σ−= allora

( )( )=

−=−−

⋅=

⋅= ∑

=

=n

i Y

i

X

i

n

iii

YXYX

XY yyxx

nn

yyxxr

1

1 11:

σσσσσσσ

( ) ( )STST

n

iiSTiST

yxn

yx==

∑=1 STST yxr ⋅=

Analisi della Correlazione: CovarianzaAnalisi della Correlazione: Covarianza

),(),( YXCovcadcYbaXCov ⋅⋅=++Proprietà 3

Dim.( ) ( )( ) ( )( )

=+−+⋅+−+

=∑

=

n

dcymdcybaxmbax ii

n

iii

XY

)(1σ

( ) ( )( ) ( )( ) ( ) ( )−⋅−+−+⋅+−+ ∑∑ yccyxaaxdycdcybxabaxnn

)(

18

( ) ( )( ) ( )( ) ( ) ( )=

−⋅−=

+−+⋅+−+=

∑∑==

n

yccyxaax

n

dycdcybxabax ii

iii

i11

)(

( ) ( ) ( ) ( )),(11 YXCovca

n

yyxxca

n

yycxxa i

n

iii

n

ii

⋅⋅=−⋅−

⋅⋅=−⋅−

=∑∑

==

Analisi della Correlazione: Indice di Analisi della Correlazione: Indice di CorrelazioneCorrelazione

Def. Indice o Coefficiente di Correlazione ( di Bra vais-Pearson)

YX

XYYXrrσσ

σ⋅

== :),(

Def.Se r=0 le due variabili si dicono non correlate

19

Se |r|=1 (r=+1 o r=-1) allora le variabili sono massimamente correlater=+1 correlazione perfetta (e diretta o con concorda nza)r=-1 correlazione perfetta (e inversa o con discorda nza)

Se r>0 le variabili sono positivamente correlate

Se r<0 le variabili sono negativamente correlate

Analisi della Correlazione: Indice di Analisi della Correlazione: Indice di CorrelazioneCorrelazione

Proprietà

1) E’ compreso (o uguale) tra -1 e 1

),(),( XYrYXr =2)E’ simmetrico rispetto alle variabili aleatorie X e Y

3)E’ standardizzato. Se una o entrambe le variabili subiscono una trasformazione lineare il valore dell’indice di correlazione non cambia (vedi proprietà della covarianza)

),(),( XYrdcYbaXr =++

20

),(),( XYrdcYbaXr =++

4)Assume valore 0 solo in caso di indipendenza (LINEARE) delle variabili aleatorie. In tal caso la covarianza è nulla e m(X*Y)=m(X)*m(Y)

5)Assume valore estremi +1 o -1 solo in caso di dipendenza lineare perfetta delle variabili aleatorie

6)L’indice di correlazione misura quindi l’intensità del legame lineare che sussiste fra le due variabili aleatorie

Analisi della Correlazione: Indice di Analisi della Correlazione: Indice di CorrelazioneCorrelazione

Teo. Se 1:=r allora ( ) ( )xxkyy ii −⋅=−

Dim.

YXYX SSSS ⋅=⋅⇔=1:r

Ma ciò accade solo se i vettori S_X ed S_Y sono allineati cioè quanto affermato nella tesi. c.v.d.

21

Nota:Nel caso in cui il coseno dell’angolo tra due vettori sia uguale a 1 significa che i due vettori formano un angolo nullo (0°) cioè sono allineati ed equiversi allora vale la tesi con k>0.Nel caso invece in cui il il coseno dell’angolo tra due vettori sia uguale a -1 significa che i due vettori formano un angolo piatto (180°) cioè sono allineati ed con versi opposti allora vale la tesi con k<0.

Per quanto sopra descritto l’indice di Bravais-Pea rson è anche noto come coefficiente di Correlazione LINEARE

Analisi della Correlazione: Analisi della Correlazione: ScatterScatter Plot o Plot o Diagramma a dispersioneDiagramma a dispersione

22

Analisi della Correlazione: Analisi della Correlazione: ScatterScatter Plot o Plot o Diagramma a dispersioneDiagramma a dispersione

x_i y_i

34 56

92 73

27 41

42 92

89 24

21 49

24 71

92 98

98 45

4 48

3 21

0

20

40

60

80

100

120

0 20 40 60 80 100 1200

20

40

60

80

100

120

0 20 40 60 80 100 120

23

3 21

12 27

13 90

88 21

16 80

70 94

91 7

52 100

n= 18

0

20

40

60

80

100

120

0 50 100 150

0

20

40

60

80

100

120

0 20 40 60 80 100 120

Analisi della Correlazione: Analisi DatiAnalisi della Correlazione: Analisi DatiEs. Excel

x_i y_i

1 8

2 12

3 22

4 28

5 30

n= 5

n= 515

20

25

30

35

24

n= 5

x_i y_i S_x_i S_y_i S_x_i*S_y_i S_x_i^2 S_y_i^2

1 8 -2,00 -12,00 24,00 4,00 144,00

2 12 -1,00 -8,00 8,00 1,00 64,00

3 22 0,00 2,00 0,00 0,00 4,00

4 28 1,00 8,00 8,00 1,00 64,00

5 30 2,00 10,00 20,00 4,00 100,00

Totali 15 100 0 0 60 10 376

Medie 3,00 20,00

σ_XY 12,00

σ_X 1,41

σ_Y 8,67

r 0,98

0

5

10

0 2 4 6

Analisi della Correlazione: Analisi DatiAnalisi della Correlazione: Analisi DatiEs. Excel

x_i y_i

1 22

2 20

3 10

4 5

5 3

n= 5

n= 5

x_i y_i S_x_i S_y_i S_x_i*S_y_i S_x_i^2 S_y_i^2 10

15

20

25

25

1 22 -2,00 10,00 -20,00 4,00 100,00

2 20 -1,00 8,00 -8,00 1,00 64,00

3 10 0,00 -2,00 0,00 0,00 4,00

4 5 1,00 -7,00 -7,00 1,00 49,00

5 3 2,00 -9,00 -18,00 4,00 81,00

Totali 15 60 0 0 -53 10 298

Medie 3,00 12,00

σ_XY -10,60

σ_X 1,41

σ_Y 7,72

r -0,97

0

5

0 2 4 6

Analisi della Correlazione: Analisi DatiAnalisi della Correlazione: Analisi DatiEs. Excel

x_i y_i

1 2

2 0

3 2

4 0

5 2

n= 5

n= 5

x_i y_i S_x_i S_y_i S_x_i*S_y_i S_x_i^2 S_y_i^21

1,5

2

2,5

26

x_i y_i S_x_i S_y_i S_x_i*S_y_i S_x_i^2 S_y_i^2

1 2 -2,00 0,80 -1,60 4,00 0,64

2 0 -1,00 -1,20 1,20 1,00 1,44

3 2 0,00 0,80 0,00 0,00 0,64

4 0 1,00 -1,20 -1,20 1,00 1,44

5 2 2,00 0,80 1,60 4,00 0,64

Totali 15 6 0 0 0 10 4,8

Medie 3,00 1,20

σ_XY 0,00

σ_X 1,41

σ_Y 0,98

r 0,00

0

0,5

1

0 2 4 6

Analisi della Correlazione: Analisi DatiAnalisi della Correlazione: Analisi DatiEs. Excel : altro metodo di calcolo

0

5

10

15

20

25

30

35

0 2 4 6

x_i y_i1 82 123 224 285 30

n= 5

27

n= 5

x_i y_i S_x_i S_y_i S_x_i*S_y_i S_x_i^2 S_y_i^2 x_i^2 y_i^2 x_i*y_i x_ST_i y_ST_i x_ST_i*y_ST_i

1 8 -2,00 -12,00 24,00 4,00 144,00 1,00 64,00 8,00 -1,41 -1,38 1,962 12 -1,00 -8,00 8,00 1,00 64,00 4,00 144,00 24,00 -0,71 -0,92 0,653 22 0,00 2,00 0,00 0,00 4,00 9,00 484,00 66,00 0,00 0,23 0,004 28 1,00 8,00 8,00 1,00 64,00 16,00 784,00 112,00 0,71 0,92 0,655 30 2,00 10,00 20,00 4,00 100,00 25,00 900,00 150,00 1,41 1,15 1,63

Totali 15 100 0 0 60 10 376 55 2376 360 0 0 4,89Medie 3,00 20,00 11,00 475,20 72,00 0,00 0,00 0,98σ_XY 12,00 σ_XY 12,00σ_X^2 2,00 σ_X 1,41 σ_X^2 2,00 σ_X 1,41σ_Y^2 75,20 σ_Y 8,67 σ_Y^2 75,20 σ_Y 8,67

r 0,98 r 0,98

Correlazione e Tabelle delle frequenzeCorrelazione e Tabelle delle frequenzeNel caso in cui si voglia considerare una tabella delle frequenze per le variabili X ed Y, si dovrà allora procedere come segue:

nnnnnTot

nnnnnx

nnnnnx

nnnnnx

nnnnnx

Totyyyy

cj

rrcrjrrr

iicijiii

cj

cj

cj

000201

021

021

202222212

101112111

21

........

........

................................

........

................................

........

........

........

n

nxx

r

iii∑

=

⋅= 1

0

n

ny

y

c

jjj∑

=

⋅= 1

0

28

( )n

ns

n

nyyc

jojy

c

jojj

Y

j∑∑==

⋅=

⋅−= 1

2

1

2

σ( )

n

ns

n

nxxr

iix

r

iii

X

i∑∑==

⋅=

⋅−= 1

02

10

2

σ

( ) ( )XY

r

i

c

jijji

n

nyyxx

YX σ=⋅−⋅−

=∑∑

= =1 1),Cov(

Correlazione e Tabelle delle frequenzeCorrelazione e Tabelle delle frequenzeL’indice di Bravais - Pearson è allora definito come al solito:

YX

XYrσσ

σ⋅

=

( ) ( )

⋅−⋅−=

∑∑= =

cr

r

i

c

jijji nyyxx

r 1 1

Per il calcolo pratico è possibile utilizzare anche la seguenti formule:

29

⋅−⋅

⋅− ∑∑==

c

jjj

r

iii nyynxx

10

2

10

2 )()(

( ) ( )

⋅−⋅⋅

⋅−⋅

⋅⋅−⋅⋅=

∑∑

∑∑

==

= =

2

10

22

10

2

1 1

ynnyxnnx

yxnnyx

rc

jjj

r

iii

r

i

c

jijji

Correlazione e Tabelle delle frequenzeCorrelazione e Tabelle delle frequenzeEsempio Excel:

y_j

x_i 8 12 22 28 30

1 2 3 2 1 1 9 n_i0

2 3 4 5 4 2 18 i=1,..,5

3 1 2 2 3 1 9

4 2 2 3 4 1 12

5 3 2 3 2 4 14

11 13 15 14 9 62

n_0j j=1,..,5

30

n_0j j=1,..,5

metodo 1 metodo 2m(X) 3,064516129 σ_X 1,401277847 1,401277847

metodo 1 metodo 2m(Y) 19,93548387 σ_Y 8,300545975 8,300545975

metodo 1 metodo 2σ_XY 1,391259105 1,391259105

r 0,1196126

Correlazione e Tabelle delle frequenzeCorrelazione e Tabelle delle frequenzeEsempio Excel:

x_i n_i0 x_i*n_i0 s_x_i s_x_i*n_i0 s_x_i^2 s_x_i^2*n_i0 x_i^2*n_i0

1 9 9 -2,064516129 -18,58064516 4,262226847 38,36004162 9

2 18 36 -1,064516129 -19,16129032 1,133194589 20,3975026 72

3 9 27 -0,064516129 -0,580645161 0,004162331 0,037460978 81

4 12 48 0,935483871 11,22580645 0,875130073 10,50156087 192

5 14 70 1,935483871 27,09677419 3,746097815 52,44536941 350

totali 190 -0,322580645 0 10,02081165 121,7419355 704

metodo 1 metodo 2

m(X) 3,064516129 σ_X 1,401277847 1,401277847

31

m(X) 3,064516129 σ_X 1,401277847 1,401277847

y_j n_0j y_j*n_0j s_y_i s_y_i*n_i0 s_y_i^2 s_y_i^2*n_i0 y_i^2*n_i0

8 11 88 -11,93548387 -131,2903226 142,4557752 1567,013528 704

12 13 156 -7,935483871 -103,1612903 62,97190427 818,6347555 1872

22 15 330 2,064516129 30,96774194 4,262226847 63,93340271 7260

28 14 392 8,064516129 112,9032258 65,0364204 910,5098855 10976

30 9 270 10,06451613 90,58064516 101,2944849 911,6503642 8100

totali 1236 0,322580645 0 376,0208117 4271,741935 28912

metodo 1 metodo 2

m(Y) 19,93548387 σ_Y 8,300545975 8,300545975

Correlazione e Tabelle delle frequenzeCorrelazione e Tabelle delle frequenzeEsempio Excel:

s_y_j METODO 1 covarianza

s_x_i -11,93548387 -7,935483871 2,064516129 8,064516129 10,06451613

-2,064516129 49,28199792 49,14880333 -8,524453694 -16,64932362 -20,77835588 52,47866805

-1,064516129 38,11654527 33,78980229 -10,98855359 -34,33922997 -21,4276795 5,150884495

-0,064516129 0,770031217 1,023933403 -0,266389178 -1,560874089 -0,649323621 -0,682622268

0,935483871 -22,33090531 -14,84703434 5,79396462 30,17689906 9,415192508 8,208116545

1,935483871 -69,30280957 -30,71800208 11,98751301 31,21748179 77,91883455 21,10301769

s_x_i*s_y_j*n_ij 86,25806452

s_y_j METODO 2 covarianza

x_i 8 12 22 28 30

32

x_i 8 12 22 28 30

1 16 36 44 28 30 154

2 48 96 220 224 120 708

3 24 72 132 252 90 570

4 64 96 264 448 120 992

5 120 120 330 280 600 1450

x_i*y_j*n_ij 3874

metodo 1 metodo 2

σ_XY 1,391259105 1,391259105

r 0,1196126