Metodo dei minimi quadrati

Post on 08-Jun-2015

27.362 views 2 download

description

lavoro a cura di Susanna Camporeale

Transcript of Metodo dei minimi quadrati

DEFINIZIONE E SUDDIVISIONE

FREQUENZE: DEFINIZIONI ED ESEMPI

IL METODO DEI MINIMI QUADRATI: SPIEGAZIONE E

APPLICAZIONE

RETTA DI REGRESSIONE E COEFFICIENTE DI

CORRELAZIONE LINEARE

La statisticaLa statistica

La statistica è l’applicazione dei metodi scientifici alla programmazione della raccolta dei dati, alla loro classificazione, elaborazione, analisi e presentazione e alla inferenza di conclusioni attendibili da essi.

Si può dividere inSi può dividere in

Statistica descrittiva Statistica induttivaStatistica descrittiva Statistica induttiva

La statistica descrittiva si occupa della raccolta e dell’elaborazione dei dati e della descrizione dei fenomeni collettivi o di massa.Esempio: indagine sull’intera popolazione europea.

La statistica induttiva o inferenziale studia i metodi che permettono di stimare le caratteristiche di un fenomeno collettivo partendo dall’analisi delle caratteristiche di un campione.Esempio: indagine sulla popolazione italiana.

L’unità statistica è la più piccola unità su cui viene effettuata un’ osservazione.

Il dato statistico è il risultato di una operazione compiuta sulle unità statistiche.

FrequenzeFrequenzeLe frequenze assolute: rappresentano il numero di volte in cui viene osservato un carattere quantitativo o il numero di volte in cui viene osservata la modalità di un carattere qualitativo.

Le frequenze relative si ottengono dividendo ogni frequenza assoluta per la somma delle frequenze assolute.

Le frequenze assolute cumulate si ottengono attraverso la progressiva somma delle frequenze assolute.

Le frequenze relative cumulate si ottengono attraverso la progressiva somma delle frequenze relative.

Nella tabella di seguito riportata sono esposti i risultati di un compito di Matematica di una classe di 17 alunni con nell’ordine: le frequenze assolute (FA),cioè il numero di volte con cui si presenta la x, le frequenze relative (FR), cioè ogni FA/la somma delle FA, le frequenze assolute cumulate (FAC), cioè la progressiva somma delle FA, e le frequenze relative cumulate (FRC), la progressiva somma delle FR.

X (voti) FA FR FAC FRC2 2 2/17 2 2/17

2,5 1 1/17 3 3/173 3 3/17 6 6/17

3,5 1 1/17 7 7/174 2 2/17 9 9/17

4,5 1 1/17 10 10/176 2 2/17 12 12/17

6,5 2 2/17 14 14/177,5 1 1/17 15 15/179 1 1/17 16 16/17

11 1 1/17 17 117 1

IL METODO DEI MINIMI QUADRATIIL METODO DEI MINIMI QUADRATIIl metodo dei minimi quadrati risulta spesso utile negli studi statistici per mettere a confronto due variabili statistiche (per esempio Reddito e Risparmio, voti dell’esame di Matematica e voti dell’esame di Statistica di alcuni studenti universitari ecc.) affinché attraverso un’opportuna analisi dei dati rilevati sia possibile effettuare previsioni sull’andamento futuro di una variabile (y) in relazione alle variazioni dell’altra variabile (x).

Partiamo, per esempio, da un campione di studenti dei quali è stato rilevato il voto di cinque esami di Matematica e di Economia Aziendale.

E’ necessario riportare i dati in un grafico che chiameremo diagramma a dispersione.

X Matematica 6 8 5 10 9

Y Ec. Aziendale 5 9 3 10 7

Lo scopo è quello di interpolare, ossia determinare, a partire dai dati rilevati, una funzione che sintetizzi opportunamente l’andamento del fenomeno studiato, mediante una legge matematica o mediante una tabella di valori più regolari.

Diagramma a dispersione

0

2

4

6

8

10

12

0 2 4 6 8 10 12

Matematica

Ec

. A

zie

nd

ale

Ci poniamo ora un problema: il rendimento di Matematica è collegato a quello di Economia Aziendale?Incrementando il primo, si incrementa anche il secondo?Per rispondere occorre trovare una retta, la retta di regressione.

Lo studio della regressione consiste nella determinazione di una funzione matematica che esprime la relazione fra le variabili. Applicando il metodo dei minimi quadrati si ottiene la retta di equazione y = a + bx, che è detta retta di regressione di Y rispetto ad X e passa per i punti :

b =

Creiamo ora una tabella a doppia entrata che sintetizzi le rilevazioni:

X/Y 3 5 7 9 10 TOT

5        

6        

8        

9        

10        

TOT 1

utente
Frequenza di quanti studenti hanno preso quel voto, cioè 1 su 5.

e determiniamo tutti gli elementi per il calcolo della covarianza:

E(xy)= 5*3* + 6*5* + ………+ 10*10* = 56

E(x)= 5* + 6* +….....+ 10* = 7,6

E(y)= 3* + 5* +……...+ 10* = 6,8

E(x)² = 25* + 36* +…….+ 100* = 61,2

b =

a = 6,8 – 1,2558 * 7,6 = -2,744

La retta di regressione sarà quindi la seguente:

y = -2,7442 + 1,2558 x

otterremo il seguente grafico:

Diagramma a dispersione

y = 1,2558x - 2,7442

R2 = 0,827

0

2

4

6

8

10

12

0 2 4 6 8 10 12

Matematica

Ec.

azi

end

ale

Deduciamo che al crescere del rendimento di Matematica cresce anche quello di Ec. Aziendale, ma entro certi limiti.

Per misurare l’intensità, o forza del legame, fra le due variabili, sempre nel caso di regressione lineare, si introduce una misura della loro correlazione data dal coefficiente di correlazione lineare di Bravais – Pearson.

Questo coefficiente può variare da 0 a 1 e ci indica la % di variabilità totale dovuta alla dipendenza della y dalla x, e quanto più si avvicina a 1, tanto più il modello di regressione lineare è efficace per sintetizzare il fenomeno studiato.

Risolvendo la formula nel modo seguente

e sostituendo i valori, otteniamo:

Ma il vero coefficiente che serve a noi non è r², bensì r ; lo otterremo facendo la radice quadrata di r² ovvero:

√0,8269 = 0,9093

Ora possiamo dire che c’è una correlazione positiva o diretta perché 0 < r < 1.