Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

16
Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi

Transcript of Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

Page 1: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

Regressione Lineareparte 1

Corso di

Misure Meccaniche e Termiche

David Vetturi

Page 2: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

2

Misure Meccaniche e Termiche Regressione Lineare

Spesso, considerando congiuntamente due caratteristica (X,Y) di una medesima realtà statistica, risulta interessante ricercare un legame funzionale fra le due quantità del tipo Y=f(X)

Regressione lineare

Page 3: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

3

Misure Meccaniche e Termiche Regressione Lineare

Il metodo della Regressione Lineare (o metodo di stima ai Minimi Quadrati) si occupa di individuare, all’interno di un certo ambito di funzioni, una relazione fra le due quantità.

Regressione lineare

Page 4: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

4

Misure Meccaniche e Termiche Regressione Lineare

Siano noti m punti di coordinate

Ipotesi:

mkyx kk ..1con ,

Sia data una base di funzioni che generi uno spazio vettoriale di dimensione n

xxx n , ... ,, 21

La relazione funzionale fra x e y sia una combinazione lineare delle n funzioni di base

n

iii xxy

1

)(

Page 5: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

5

Misure Meccaniche e Termiche Regressione Lineare

Il criterio è dunque quello di scegliere la funzione che minimizza la somma delle distanze di tutti i punti dal modello

criterio:

mkxyy kkk..1con 22

Fra tutte le funzione generate dalla base viene scelta quella che “meglio” descrive la relazione funzionale fra le due grandezze

m

kkk

m

kk xyy

1

2

1

22

2

k

2

k

Page 6: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

6

Misure Meccaniche e Termiche Regressione Lineare

e dunque i punti candidati a risultare minimi di tale funzione sono quello di stazionarietà, ovvero che soddisfano le seguenti n condizioni:

soluzione:

nii

..1con 02

Si può immaginare che la funzione =errore sia una funzione degli n parametri da minimizzare

min,..,, 212 ng

Page 7: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

7

Misure Meccaniche e Termiche Regressione Lineare

BA

La scelta di operare la selezione della funzione che lega X a Y all’interno delle funzioni generate come combinazione lineare delle n funzioni di base conduce il problema appena descritto a prevedere una ed una sola soluzione che può essere determinata risolvendo il seguente sistema:

con:

n

...

2

1

m

kkjkj xybB

1

m

kkjkiij xxaA

1

Si può dimostrare che la matrice del sistema ha determinante non nullo quindi il sistema ammette una sola soluzione

Page 8: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

8

Misure Meccaniche e Termiche Regressione Lineare

e quindi gli elementi della matrice A e del vettore B possono essere visti nel seguente modo:

Prodotto scalare:

Nello spazio vettoriale generato dalla base di vettori (funzioni) (x) è possibile considerare un prodotto scalare con la seguente definizione:

m

kkk xgxfxgxfxgxf

1

)()()()()()(

xxyxyb j

m

kkjkj ~

1

xxxxa ji

m

kkjkiij

1

Page 9: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

9

Misure Meccaniche e Termiche Regressione Lineare

Ne consegue che se le funzioni di base (x) fossero scelte in modo opportuno la matrice A sarebbe una matrice “vuota” (sparsa) e la soluzione del sistema più semplice dal punto di vista computazionale.

In particolare se A fosse diagonale il sistema lineare si ridurrebbe ad una sequenza di n equazioni disaccoppiate, ciascuna con una sola variabile.

E quindi sarebbe opportuno scegliere le funzioni di base (x) fra loro ortogonali, cioè:

jixx ji 0

Page 10: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

10

Misure Meccaniche e Termiche Regressione Lineare

Ortogonalizzazione:Come è noto è possibile ortogonalizzare la base di uno spazio vettoriale utilizzando l’algoritmo di Gram-Schmidt.

Quindi a partire dalla base di funzioni (x) si ottiene una nuova base per il medesimo spazio vettoriale di funzioni ’(x) fra loro ortogonali

xxx

xxxx p

i

p pp

pi

ii

1

1

1v2v

11 vv 2v

11 vv 2v

2v

Page 11: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

11

Misure Meccaniche e Termiche Regressione Lineare

E’ bene osservare che il cambio di base in cui esprimere la funzione da ricercare, quest’ultima non cambia.

Dunque la funzione che minimizza la somma delle distanze al quadrato punto osservato-modello diventa:

n

iii

n

iii xxxy

11

)(

m

kki

m

kkik

i

x

xy

1

2

1

Mentre la soluzione del sistema porta al seguente risultato:

Page 12: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

12

Misure Meccaniche e Termiche Regressione Lineare

Esempio: retta di regressione

Un caso molto comune e diffuso è quello di ricercare un legame fra le quantità X e Y di tipo lineare, ovvero si vuole ricercare la retta del piano che meglio descrive il legame fra le due grandezze.

Le funzioni di base da utilizzare sono dunque:

m

xxxxx

x

kk

con

1

2

1

xxxy 21)(

e dunque:

Page 13: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

13

Misure Meccaniche e Termiche Regressione Lineare

E dunque i parametri del modello diventano:

m

kk

m

kkk

xx

xxy

1

2

12

)(

m

ym

kk

11

Page 14: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

14

Misure Meccaniche e Termiche Regressione Lineare

Retta ai minimi quadrati: esempio numerico

Si considerano i seguenti 10 punti di coordinate X,Yx y

0.8 212.5 363.8 535.3 486.8 618.2 7810.3 7712.6 7514.7 9918.3 104

Si Ipotizza una relazione lineare fra Y ed X, ovvero Y=m X + q

Page 15: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

15

Misure Meccaniche e Termiche Regressione Lineare

E dunque i parametri del modello ortogonalizzato diventano:

50.4

841.284

44.1282

)(

)(

1

2

12

m

kk

m

kkk

xx

xxxy2.65

10

652)(

11

m

xym

kk

e quindi 33.850.42.65)( xxy

70.2750.4)( xxyovvero

33.8con

1

2

1

m

xxxxx

x

kk

Page 16: Regressione Lineare parte 1 Corso di Misure Meccaniche e Termiche David Vetturi.

16

Misure Meccaniche e Termiche Regressione Lineare

Il modello calcolato in corrispondenza dei punti assegnati fornisce i seguenti valori

x y y(x)

0.8 21 31.30

2.5 36 38.95

3.8 53 44.80

5.3 48 51.56

6.8 61 58.31

8.2 78 64.61

10.3 77 74.07

12.6 75 84.42

14.7 99 93.88

18.3 104 110.09