Caso pratico sui minimi quadrati

Post on 19-Jun-2015

670 views 0 download

description

Gruppo coordinato da Giorgia Bodei e Veronica Mirra della 3A Turismo dell'ITS Luigi Casale di Vigevano

Transcript of Caso pratico sui minimi quadrati

Caso pratico di regressione lineare

CORRELAZIONE DELLE SPESE MEDIE MENSILI FAMILIARI

TRA NORD-OVEST E SUD NEL 2011

Dati di partenzaIl diagramma a dispersioneLa retta di regressioneLa bontà del modello di regressione lineare

La correlazione esistente fra le due variabili

Conclusioni

INDICE

Abbiamo rilevato le spese medie mensili familiari tra Nord-Ovest (X) e Sud (Y) e abbiamo ottenuto i seguenti dati:

DATI DI PARTENZA

PANE E CEREALI CARNE PESCE

LATTE, FORMAGGI E UOVA

OLI E GRASSI

PATATE, FRUTTA E ORTAGGI

ZUCCHERO, CAFFE’ E DROGHERIA

BEVANDE

X( NORD-OVEST) 79,86 118,54 34,82 68,26 16,07 84,45 34,26 48,95

Y ( SUD) 81,02 116,05 51,43 68,92 17,87 90,11 36,31 39,45

PANE E CEREALI CARNE PESCE

LATTE, FORMAGGI E UOVA

OLI E GRASSI

PATATE, FRUTTA E ORTAGGI

ZUCCHERO, CAFFE’ E DROGHERIA

BEVANDE

X( NORD-OVEST) 79,86 118,54 34,82 68,26 16,07 84,45 34,26 48,95

Y ( SUD) 81,02116,0

551,43 68,92 17,87 90,11 36,31 39,45

Il diagramma di dispersione serve per rappresentare la relazione tra due variabili statistiche.

E‛ il diagramma cartesiano sul quale ciascuna unità statistica è rappresentata mediante coordinante che rappresentano i valori di due variabili statistiche oggetto di studio osservati su quella unità.

CHE COS’È IL DIAGRAMMA A DISPERSIONE?

IL DIAGRAMMA A DISPERSIONE

Lo studio della regressione consiste nella determinazione di una funzione matematica che esprime la relazione fra le variabili.

Applicando il metodo dei minimi quadrati si ottiene la retta y = a + b∙x che è detta retta di regressione di y rispetto ad x.

CHE COS’È LA RETTA DI REGRESSIONE?

La retta di regressione trovata è:

y=0,9445+5,3574xTrattasi quindi di una retta crescente. Al aumentare delle spese familiari del Nord-Ovest crescono in modo lineare le spese familiari del Sud.

LA RETTA DI REGRESSIONE

Utilizzo il coeffi ciente di determinazione r al quadrato dal rapporto fra la covarianza al quadrato di xy e il prodotto fra la varianza di x e la varianza di y. Tale coeffi ciente è compreso tra 0 e 1 ed esprime la percentuale di variabilità totale dovuta alla dipendenza lineare della y dalla x. Più il coeffi ciente si avvicina a 1 più il modello di regressione utilizzato risulta effi cace.

COME CALCOLO LA BONTÀ DEL MODELLO DI REGRESSIONE

LINEARE?

Il modello di regressione lineare è valido perché il 95,13% della variabilità totale è dovuto alla dipendenza lineare della y dalla x.

LA BONTÀ DEL MODELLO DI REGRESSIONE LINEARE

Per misurare l’intensità, o forza del legame, fra le due variabili, nel caso sempre di regressione lineare, si introduce una misura della loro correlazione data dal coeffi ciente di correlazione lineare di Bravais – Pearson che può variare da -1 a 1.

COME SI CALCOLA CORRELAZIONE?

In questo caso, esiste una correlazione positiva o diretta fra le due variabili in quanto il coeffi ciente di correlazione lineare è compreso fra 0 e 1.

LA CORRELAZIONE ESISTENTE FRA LE DUE VARIABILI

r=

Abbiamo constatato lo studio statistico molto effi cace per raggiungere gli obiettivi che ci eravamo posti. Quindi, possiamo dire che al Sud vi è una spesa media mensile familiare che cresce in modo lineare rispetto alla spesa familiare del Nord- Ovest.

CONCLUSIONI