Caso pratico sui minimi quadrati
-
Upload
luigi-pasini -
Category
Education
-
view
670 -
download
0
description
Transcript of Caso pratico sui minimi quadrati
Caso pratico di regressione lineare
CORRELAZIONE DELLE SPESE MEDIE MENSILI FAMILIARI
TRA NORD-OVEST E SUD NEL 2011
Dati di partenzaIl diagramma a dispersioneLa retta di regressioneLa bontà del modello di regressione lineare
La correlazione esistente fra le due variabili
Conclusioni
INDICE
Abbiamo rilevato le spese medie mensili familiari tra Nord-Ovest (X) e Sud (Y) e abbiamo ottenuto i seguenti dati:
DATI DI PARTENZA
PANE E CEREALI CARNE PESCE
LATTE, FORMAGGI E UOVA
OLI E GRASSI
PATATE, FRUTTA E ORTAGGI
ZUCCHERO, CAFFE’ E DROGHERIA
BEVANDE
X( NORD-OVEST) 79,86 118,54 34,82 68,26 16,07 84,45 34,26 48,95
Y ( SUD) 81,02 116,05 51,43 68,92 17,87 90,11 36,31 39,45
PANE E CEREALI CARNE PESCE
LATTE, FORMAGGI E UOVA
OLI E GRASSI
PATATE, FRUTTA E ORTAGGI
ZUCCHERO, CAFFE’ E DROGHERIA
BEVANDE
X( NORD-OVEST) 79,86 118,54 34,82 68,26 16,07 84,45 34,26 48,95
Y ( SUD) 81,02116,0
551,43 68,92 17,87 90,11 36,31 39,45
Il diagramma di dispersione serve per rappresentare la relazione tra due variabili statistiche.
E‛ il diagramma cartesiano sul quale ciascuna unità statistica è rappresentata mediante coordinante che rappresentano i valori di due variabili statistiche oggetto di studio osservati su quella unità.
CHE COS’È IL DIAGRAMMA A DISPERSIONE?
IL DIAGRAMMA A DISPERSIONE
Lo studio della regressione consiste nella determinazione di una funzione matematica che esprime la relazione fra le variabili.
Applicando il metodo dei minimi quadrati si ottiene la retta y = a + b∙x che è detta retta di regressione di y rispetto ad x.
CHE COS’È LA RETTA DI REGRESSIONE?
La retta di regressione trovata è:
y=0,9445+5,3574xTrattasi quindi di una retta crescente. Al aumentare delle spese familiari del Nord-Ovest crescono in modo lineare le spese familiari del Sud.
LA RETTA DI REGRESSIONE
Utilizzo il coeffi ciente di determinazione r al quadrato dal rapporto fra la covarianza al quadrato di xy e il prodotto fra la varianza di x e la varianza di y. Tale coeffi ciente è compreso tra 0 e 1 ed esprime la percentuale di variabilità totale dovuta alla dipendenza lineare della y dalla x. Più il coeffi ciente si avvicina a 1 più il modello di regressione utilizzato risulta effi cace.
COME CALCOLO LA BONTÀ DEL MODELLO DI REGRESSIONE
LINEARE?
Il modello di regressione lineare è valido perché il 95,13% della variabilità totale è dovuto alla dipendenza lineare della y dalla x.
LA BONTÀ DEL MODELLO DI REGRESSIONE LINEARE
Per misurare l’intensità, o forza del legame, fra le due variabili, nel caso sempre di regressione lineare, si introduce una misura della loro correlazione data dal coeffi ciente di correlazione lineare di Bravais – Pearson che può variare da -1 a 1.
COME SI CALCOLA CORRELAZIONE?
In questo caso, esiste una correlazione positiva o diretta fra le due variabili in quanto il coeffi ciente di correlazione lineare è compreso fra 0 e 1.
LA CORRELAZIONE ESISTENTE FRA LE DUE VARIABILI
r=
Abbiamo constatato lo studio statistico molto effi cace per raggiungere gli obiettivi che ci eravamo posti. Quindi, possiamo dire che al Sud vi è una spesa media mensile familiare che cresce in modo lineare rispetto alla spesa familiare del Nord- Ovest.
CONCLUSIONI