Metodo dei minimi quadrati
-
Upload
luigi-pasini -
Category
Education
-
view
27.362 -
download
2
description
Transcript of Metodo dei minimi quadrati
DEFINIZIONE E SUDDIVISIONE
FREQUENZE: DEFINIZIONI ED ESEMPI
IL METODO DEI MINIMI QUADRATI: SPIEGAZIONE E
APPLICAZIONE
RETTA DI REGRESSIONE E COEFFICIENTE DI
CORRELAZIONE LINEARE
La statisticaLa statistica
La statistica è l’applicazione dei metodi scientifici alla programmazione della raccolta dei dati, alla loro classificazione, elaborazione, analisi e presentazione e alla inferenza di conclusioni attendibili da essi.
Si può dividere inSi può dividere in
Statistica descrittiva Statistica induttivaStatistica descrittiva Statistica induttiva
La statistica descrittiva si occupa della raccolta e dell’elaborazione dei dati e della descrizione dei fenomeni collettivi o di massa.Esempio: indagine sull’intera popolazione europea.
La statistica induttiva o inferenziale studia i metodi che permettono di stimare le caratteristiche di un fenomeno collettivo partendo dall’analisi delle caratteristiche di un campione.Esempio: indagine sulla popolazione italiana.
L’unità statistica è la più piccola unità su cui viene effettuata un’ osservazione.
Il dato statistico è il risultato di una operazione compiuta sulle unità statistiche.
FrequenzeFrequenzeLe frequenze assolute: rappresentano il numero di volte in cui viene osservato un carattere quantitativo o il numero di volte in cui viene osservata la modalità di un carattere qualitativo.
Le frequenze relative si ottengono dividendo ogni frequenza assoluta per la somma delle frequenze assolute.
Le frequenze assolute cumulate si ottengono attraverso la progressiva somma delle frequenze assolute.
Le frequenze relative cumulate si ottengono attraverso la progressiva somma delle frequenze relative.
Nella tabella di seguito riportata sono esposti i risultati di un compito di Matematica di una classe di 17 alunni con nell’ordine: le frequenze assolute (FA),cioè il numero di volte con cui si presenta la x, le frequenze relative (FR), cioè ogni FA/la somma delle FA, le frequenze assolute cumulate (FAC), cioè la progressiva somma delle FA, e le frequenze relative cumulate (FRC), la progressiva somma delle FR.
X (voti) FA FR FAC FRC2 2 2/17 2 2/17
2,5 1 1/17 3 3/173 3 3/17 6 6/17
3,5 1 1/17 7 7/174 2 2/17 9 9/17
4,5 1 1/17 10 10/176 2 2/17 12 12/17
6,5 2 2/17 14 14/177,5 1 1/17 15 15/179 1 1/17 16 16/17
11 1 1/17 17 117 1
IL METODO DEI MINIMI QUADRATIIL METODO DEI MINIMI QUADRATIIl metodo dei minimi quadrati risulta spesso utile negli studi statistici per mettere a confronto due variabili statistiche (per esempio Reddito e Risparmio, voti dell’esame di Matematica e voti dell’esame di Statistica di alcuni studenti universitari ecc.) affinché attraverso un’opportuna analisi dei dati rilevati sia possibile effettuare previsioni sull’andamento futuro di una variabile (y) in relazione alle variazioni dell’altra variabile (x).
Partiamo, per esempio, da un campione di studenti dei quali è stato rilevato il voto di cinque esami di Matematica e di Economia Aziendale.
E’ necessario riportare i dati in un grafico che chiameremo diagramma a dispersione.
X Matematica 6 8 5 10 9
Y Ec. Aziendale 5 9 3 10 7
Lo scopo è quello di interpolare, ossia determinare, a partire dai dati rilevati, una funzione che sintetizzi opportunamente l’andamento del fenomeno studiato, mediante una legge matematica o mediante una tabella di valori più regolari.
Diagramma a dispersione
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Matematica
Ec
. A
zie
nd
ale
Ci poniamo ora un problema: il rendimento di Matematica è collegato a quello di Economia Aziendale?Incrementando il primo, si incrementa anche il secondo?Per rispondere occorre trovare una retta, la retta di regressione.
Lo studio della regressione consiste nella determinazione di una funzione matematica che esprime la relazione fra le variabili. Applicando il metodo dei minimi quadrati si ottiene la retta di equazione y = a + bx, che è detta retta di regressione di Y rispetto ad X e passa per i punti :
b =
Creiamo ora una tabella a doppia entrata che sintetizzi le rilevazioni:
X/Y 3 5 7 9 10 TOT
5
6
8
9
10
TOT 1
e determiniamo tutti gli elementi per il calcolo della covarianza:
E(xy)= 5*3* + 6*5* + ………+ 10*10* = 56
E(x)= 5* + 6* +….....+ 10* = 7,6
E(y)= 3* + 5* +……...+ 10* = 6,8
E(x)² = 25* + 36* +…….+ 100* = 61,2
b =
a = 6,8 – 1,2558 * 7,6 = -2,744
La retta di regressione sarà quindi la seguente:
y = -2,7442 + 1,2558 x
otterremo il seguente grafico:
Diagramma a dispersione
y = 1,2558x - 2,7442
R2 = 0,827
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Matematica
Ec.
azi
end
ale
Deduciamo che al crescere del rendimento di Matematica cresce anche quello di Ec. Aziendale, ma entro certi limiti.
Per misurare l’intensità, o forza del legame, fra le due variabili, sempre nel caso di regressione lineare, si introduce una misura della loro correlazione data dal coefficiente di correlazione lineare di Bravais – Pearson.
Questo coefficiente può variare da 0 a 1 e ci indica la % di variabilità totale dovuta alla dipendenza della y dalla x, e quanto più si avvicina a 1, tanto più il modello di regressione lineare è efficace per sintetizzare il fenomeno studiato.
Risolvendo la formula nel modo seguente
e sostituendo i valori, otteniamo:
Ma il vero coefficiente che serve a noi non è r², bensì r ; lo otterremo facendo la radice quadrata di r² ovvero:
√0,8269 = 0,9093
Ora possiamo dire che c’è una correlazione positiva o diretta perché 0 < r < 1.