LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la...

34
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l’insoddisfazione della madre e l’aggressività del bambino, nel senso che all’aumentare dell’una aumenta anche l’altra. Quando si parla di correlazione bisogna prendere in considerazione due aspetti: il tipo di relazione esistente tra due variabili e la forma della relazione.

Transcript of LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la...

Page 1: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

LA CORRELAZIONE LINEARE

La correlazione indica la tendenza che hanno due variabili (Xe Y) a variare insieme, ovvero, a covariare. Ad esempio, sipuò supporre che vi sia una relazione tra l’insoddisfazionedella madre e l’aggressività del bambino, nel senso cheall’aumentare dell’una aumenta anche l’altra.

Quando si parla di correlazione bisogna prendere inconsiderazione due aspetti: il tipo di relazione esistente tradue variabili e la forma della relazione.

Page 2: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Per quanto riguarda il tipo di relazione, essa può esserelineare o non lineare

• La relazione è di tipo lineare se, rappresentata su assicartesiane, si avvicina alla forma di una retta.

In questo caso,all’aumentare (o aldiminuire) di X aumenta(diminuisce) Y.

Ad esempio, all’aumentaredell’altezza di una personaaumenta anche il suo peso.

Page 3: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

• La relazione è di tipo non lineare, se rappresentata suassi cartesiane, ha un andamento curvilineo (parabola oiperbole).

In questo caso a livelli bassi ealti di X corrispondono livellibassi di Y; mentre a livelliintermedi di X corrispondonolivelli alti di Y.

Ad esempio, il tempoimpiegato per risolvere unproblema è alto quando l’ansiaè bassa o alta, è elevatoquando l’ansia ha livelli medi.

Page 4: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Per quanto riguarda la forma della relazione, si distinguonol’entità e la direzione.

La direzione può essere: positiva, se all’aumentare di unavariabile aumenta anche l’altra.

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Ad esempio, all’aumentaredell’identificazione conl’ingroup aumenta anche ilpregiudizio.

Page 5: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

La direzione è negativa se all’aumentare di una variabilediminuisce l’atra.

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Ad esempio, all’aumentaredella qualità del contatto,diminuisce il pregiudizio neiconfronti dell’outgroup.

Page 6: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

L’entità si riferisce alla forza della relazione esistente tra duevariabili.

Quanto più i punteggi sono raggruppati attorno ad una retta,tanto più forte è la relazione tra due variabili.

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Ad esempio, quanto piùelevata è la temperatura, tantopiù si suda.

Page 7: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Se i punteggi sono dispersi in maniera uniforme, invece, trale due variabili non esiste alcuna relazione.

Ad esempio, non esiste alcunarelazione tra la temperatura e illivello di identificazione conl’ingroup.

Page 8: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Per esprimere la relazione esistente tra due variabili, intermini entità e direzione, si utilizza il coefficiente dicorrelazione.

Tale coefficiente è standardizzato e può assumere valori chevanno da –1.00 (correlazione perfetta negativa) e +1.00(correlazione perfetta positiva). Una correlazione uguale a 0indica che tra le due variabili non vi è alcuna relazione.

Nota. La correlazione non include il concetto di causa-effetto,ma solo quello di rapporto tra variabili. La correlazioneci permette di affermare che tra due variabili c’è unarelazione sistematica, ma non che una causa l’altra.

Page 9: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Esistono vari tipi di coefficienti di correlazione a seconda deltipo di scala della variabile.

• Per le scale a intervalli o rapporti equivalenti si usa ilcoefficiente r di Pearson.

• Per le scale ordinali si usano il coefficiente rs diSpearman o il coefficiente tau di Kendall.

• Per le scale categoriali (dicotomiche) si usano ilcoefficiente rphi o il coefficiente rpbis.

Page 10: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Il coefficiente di correlazione r di Pearson

Tale coefficiente serve a misurare la correlazione tra variabili aintervalli o a rapporti equivalenti. È dato dalla somma deiprodotti dei punteggi standardizzati delle due variabili (zxzy)diviso il numero dei soggetti (o delle osservazioni).

r =Σ zxzy

NTale coefficiente può assumere valori che vanno da –1.00 (trale due variabili vi è una correlazione perfetta negativa) e + 1.00(tra le due variabili vi è una correlazione perfetta positiva). Unacorrelazione uguale a 0 indica che tra le due variabili non vi èalcuna relazione.

Page 11: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Per effettuare i calcoli si utilizza la seguente formula, derivatadalla risoluzione della precedente.

Per stabilire se una correlazione è significativa, si fa riferimentoalla distribuzione campionaria di r, tabulata in apposite tavole,in corrispondenza dei gradi di libertà (N – 2) del coefficiente.

2 2 2 2[ ( ) ][ ( ) ]

N XY X Yr

N X X N Y Y

!=

! !

" " "" " " "

Tale coefficiente può assumere valori che vanno da –1.00 (trale due variabili vi è una correlazione perfetta negativa) e + 1.00(tra le due variabili vi è una correlazione perfetta positiva). Unacorrelazione uguale a 0 indica che tra le due variabili non vi èalcuna relazione.

Page 12: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Esempio.Verificare l’esistenza di una relazione tra l’identificazionecon l’ingroup e il pregiudizio, nei seguenti 5 soggetti.

6134

4125

8153

5122

7101

PregiudizioIdentificazioneSoggetto

Page 13: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

782

144

169

225

144

100

X2

376

48

78

120

60

70

XY

190

16

36

64

25

49

Y2

4125

6134

3062Σ

8153

5122

7101

YXSs

Page 14: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

In questo modo otteniamo:ΣX = 62ΣY = 30ΣX2 = 782ΣY2 = 190ΣXY = 376Applichiamo la formula:

2 2

5*376 62*30

(5*782 62 )(5*190 30 )r

!=

! !

Page 15: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

1880 1860

66*50r

!=

200.35

57.44r = =

Per stabilire se la correlazione è significativa, calcoliamo il t,utilizzando la seguente formula.

21

2

rt

r

n

=!

!

2

0.35

1 0.35

5 2

t =!

!

0.35

0.88

3

t =

0.350.65

0.54t = =

Page 16: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Confrontiamo il valore di t ottenuto con il valore critico relativo an – 2 g.d.l., ovvero a 3 g.d.l.Nota. Bisogna tenere in considerazione l’ipotesi bidirezionale.

Il valore ottenuto (0.65) non supera il valore critico (3.184),quindi, la relazione tra identificazione e pregiudizio non èsignificativa (r = 0.35, ns).

Page 17: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Il coefficiente di determinazione r2

Il coefficiente di determinazione misura l’ammontare divariabilità di una variabile spiegato dalla sua relazione conun’altra variabile. Nel caso specifico della correlazione ilcoefficiente r2 indica la percentuale di varianza che hanno incomune due variabili.

Nell’esempio precedente, abbiamo trovato un r pari a 0.37, dacui ricaviamo r2 = 0.352 = 0.12. Ovvero, abbiamo chel’identificazione e il pregiudizio condividono il 12% divariabilita.

12%

88%

varianzaspiegata

varianza nonspiegata

Page 18: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Esercizio.Verificare se esiste una relazione tra l’altezza e il peso equale è l’ammontare della variabilità comune delle duevariabili.

641704

571575

601626

631697

531643

681762

471551

PesoAltezzaSoggetto

Page 19: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

R = 0.87, p < .05 [t (5) = 3.92, p < .05]R2 = 0.76, 76% di varianza comune

Page 20: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Il coefficiente rs di Spearman

Tale coefficiente serve per misurare la correlazione tra duevariabili di tipo ordinale.

Ad esempio, un ricercatore potrebbe chiedere ad uninsegnante di mettere in ordine di rango gli studenti perprofitto (dal più bravo al meno bravo) e per socievolezza (dalpiù socievole al meno socievole) e vedere, quindi, se tra ledue variabili esiste una relazione.

Page 21: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Il coefficiente rs di Spearman è un’approssimazione delcoefficiente di Pearson e la formula è la seguente:

rs = 1 – 6Σ di

2

N * (N2 – 1)

In cui di è la differenza tra i ranghi delle due variabili per ilsoggetto i-esimo.La relazione tra X e Y è espressa tenendo conto delleconcordanti o differenti posizioni di ciascun soggetto nelle duegraduatorie.

Page 22: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Esempio.I seguenti dati si riferiscono a due graduatorie, relative alprofitto e alla socievolezza.

546

767

415

674

2.533

2.552

121

Rango VotiRango ProfittoSs

Page 23: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

1

1

9

1

0.25

6.25

1

d2

-1

-1

-4

1

0.5

2.5

1

d

546

767

415

674

2.533

2.552

121

Rango YRango XSs

Da dati calcoli, otteniamo Σd2 = 19.5

Page 24: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Applicando la formula otteniamo:

6*19.5 1171 1 1 0.35 0.657*(49 1) 336

sr = ! = ! = ! =

!

Per la significatività di rs si fa riferimento alle apposite tavoledi rs con N-2 gdl.In questo caso, rs = 0.65, è inferiore al valore critico (0.714),quindi, non vi è alcuna relazione tra le due variabili.

Page 25: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Anche rs può assumere valori compresi tra –1.00 e +1.00, congli stessi significati visti per r.

È evidente che, se i soggetti occupassero esattamente lestesse posizioni nelle due graduatorie, per X e per Y, ledifferenze d sarebbero tutte uguali a 0 e rs sarebbe uguale a+1.00, massima correlazione positiva.

Se, invece, si verificasse una corrispondenza perfetta traposizioni opposte in X e Y, rs risulterebbe uguale a –1.00.

Il coefficiente rs ha il difetto di dare una stima per eccessodella correlazione tra X e Y se, per almeno una variabile, siriscontrano molti ranghi uguali.

Page 26: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Esercizio.Verificare l’esistenza di una relazione tra l’ordine di arrivo inuna gara su 100m e l’ordine di arrivo in una gara su 1000m.

9109

4371078

316

8810

745624263592151

Rango 1000Rango 100Ss

rs = 0.47, ns

Page 27: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Il coefficiente tau di Kendall

Anche questo coefficiente serve per misurare la correlazionetra due variabili di tipo ordinale, ma è esente dal difetto delcoefficiente rs. La formula è la seguente:

tau = S

0.5 * N * (N – 1)

Page 28: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

In cui S si ottiene come somma nel modo seguente.Dati i seguenti ranghi relativi a 7 soggetti, su due variabili.

2.55B

76G54F41E67D

2.53C

12ARango YRango XSoggetto

Page 29: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Prima si mettono in graduatoria i valori di X e si considerano icorrispondenti valori di Y.

2.55B

76G54F41E67D

2.53C

12ARango YRango XSoggetto

Page 30: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Quindi, si confronta ciascun valore di Y con tutti quelli cheseguono e si segna +1 ogni volta che i due ranghi confrontatisi trovano in ordine corretto rispetto alla graduatoria delle Y, sisegna, invece, -1 ogni volta che si trovano in ordine errato.

76G

67D

2.55B

54F

2.53C

12A

41E

YXSs

-1G

/

E

/H

+1+1B

+1+1-1F

+1+10+1C

+1+1+1+1+1A

+1+1-1+1-1-1E

DGBFCA

Page 31: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

S è la somma algebrica dei valori +1 e –1 assegnati. Ildenominatore è il valore massimo di S che si otterrebbe setutti gli Y si trovassero nell’ordine corretto.

/H

/E

-1G

+1+1B

+1+1-1F

+1+10+1C

+1+1+1+1+1A

+1+1-1+1-1-1EDGBFCA

S = 15 x (+1) + 5 x (-1) = 15 – 5 = 10

Page 32: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Applicando la formula per il calcolo di tau si ottiene:

10

0.5*7*(7 1)tau =

!

100.48

21tau = =

Confrontando il valore ottenuto, con il valore critico disignificatività, ottenuto dall’ incrocio tra il valore di S e lanumerosità (in questo caso 10 e 7), si trova che tau = 0.48,non è significativo.

Page 33: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Anche tau può assumere valori compresi tra –1.00 e +1.00,con gli stessi significati visti per r.

Nota. È possibile utilizzare i coefficienti di correlazione per ranghisu scale a intervalli o rapporti equivalenti nei casi in cui non èpossibile applicare r di Pearson. Per fare questo bisognatrasformare il livello di misura della variabile, calcolando gliordini di rango sui punteggi originali.L’ordine di rango è, comunque, meno sensibile della misuravera e propria.Inoltre, le statistiche basate sui ranghi sono meno potenti diquelle basate su misure continue.

Page 34: LA CORRELAZIONE LINEARE - amedeolucente.it · LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad

Esercizio.Verificare se esiste una relazione tra la prestazioneottenuta ad un compito di matematica e quella ottenuta adun compito di fisica, entrambe espresse su scala ordinale.

56I65H910G

77B

89L

44F32E

108D11C

23AFisicaMatematicaSoggetto

Tau = 0.82, p < .05