La correlazione

Post on 19-Jun-2015

1.670 views 2 download

description

Lavoro a cura di un gruppo di alunni della 3BT dell'anno scolastico 2011/2012 ITS Luigi Casale - Vigevano (Pavia)

Transcript of La correlazione

LA CORRELAZIONE

La correlazione è una relazione tra due o più variabili.

Una correlazione si dice perfetta se tutti i valori delle variabili soddisfano esattamente un'equazione, ad esempio, fra il lato di un quadrato e la sua area.

La correlazione tra il lato di un quadrato e la sua area è una correlazione perfetta.

Area = l²l

Una correlazione si dice parziale quando i valori delle variabili non soddisfano esattamente un’equazione, ad esempio, fra altezza e peso di una persona.

La correlazione fra altezza e peso è appunto una correlazione parziale.

IL GRADO DI CORRELAZIONE

In statistica, si usa definire il grado di correlazione fra due variabili attraverso un indice di correlazione che può andare da –1 a 1.

Un valore di –1 indica una correlazione perfetta negativa mentre un valore di 1 indica una correlazione perfetta positiva.

LE RETTE DI REGRESSIONE AVRANNO UN ANDAMENTO SEGUENTE:

Se r=-1, la correlazione è perfetta inversa e le due rette sono coincidenti e decrescenti.

y

0 x

Se –1<r<0, la correlazione è negativa o inversa e le due rette sono incidenti e decrescenti.

y

0 x

Se 0<r<1, la correlazione è positiva o diretta e le due rette sono incidenti e crescenti.

y

0 x

Se r=0 non c’è correlazione e le due rette sono perpendicolari fra loro e parallele agli assi cartesiani.

y

0 x

Se r=1, la correlazione è perfetta diretta e le due rette sono coincidenti e crescenti.

y

0 x

LO STUDIO DELLA REGRESSIONE

Lo studio della regressione consiste nella determinazione di una funzione matematica che esprime la relazione fra le variabili.

Applicando il metodo dei minimi quadrati si ottiene la retta y = a + b∙x che è detta retta di regressione di Y rispetto ad X.

La retta di regressione di Y su X la possiamo chiamare

Mentre la retta di regressione di X su Y la chiamiamo

I coefficienti b1 e b2, che devono avere sempre i segni concordi, vengono calcolati così:

Utilizzando i coefficienti b1 e b2 possiamo calcolare r con la seguente formula:

Dove b1 è il coefficiente angolare della retta di regressione di y su x eb2 è l’inverso del coefficiente angolare della retta di regressione di y su x.

Il segno + va messo quando i due coefficienti sono positivi.Il segno – va messo quando i due coefficienti sono negativi.

Per misurare l’intensità, fra le due variabili, si introduce una misura della loro correlazione data dal coefficiente di correlazione lineare di Bravais – Pearson, con questa formula:

Dove ed rappresentano gli scarti dalle rispettive medie di x e di y.

Il rapporto tra la covarianza delle due variabili ed il prodotto delle loro deviazioni standard.

IL COEFFICIENTE DI DETERMINAZIONE

Il coefficiente di determinazione, cioè il quadrato di r, utile per valutare la bontà di un modello di regressione, indica la percentuale di variabilità totale dovuta alla dipendenza lineare della y dalla x, più r² si avvicina a 1 più il modello rappresentato è aderente al fenomeno in studio.

Presentazione a cura di: