01 interpolazione e-minimi_quadrati

L’Interpolazione Nell’esame di fenomeni di qualsiasi natura si cerca di esprimere, sia mediante

relazioni matematiche, sia mediante specifici indici, i legami rilevati, o ipotizzati, fra

le grandezze che interagiscono nei fenomeni stessi. Nello studio dei legami fra due

variabili statistiche, partendo da un insieme di coppie ,i ix y di dati rilevati, si

determina, se possibile, una funzione y f x che rappresenti il fenomeno.

Vari sono gli scopi della ricerca di tale funzione; fra essi ricordiamo:

- descrivere sinteticamente la relazione fra due variabili osservate;

- determinare la legge di distribuzione dei dati statistici;

- ricavare eventuali dati intermedi mancanti;

- correggere valori affetti da errori accidentali o perturbati da cause secondarie. Per

trovare una funzione che rappresenti il fenomeno si può procedere in due modi:

- determinare una funzione che assuma esattamente i valori ,i ix y rilevati; questo

procedimento viene detto interpolazione per punti noti, o interpolazione

matematica;

- determinare una funzione il cui grafico “si accosti” il più possibile ai punti del

diagramma a dispersione; questo procedimento viene detto interpolazione (o

perequazione) fra punti noti, o interpolazione statistica.

In Statistica, al contrario di quanto accade in Matematica, scegliendo una funzione

polinomiale che sia soddisfatta da tutte le coppie assegnate di valori, essendo il

numero delle coppie di valori piuttosto elevato, risulterebbe tanto complessa da

determinare, quanto di scarsa utilità.

Per tale motivo nelle applicazioni statistiche si preferisce cercare una funzione il

cui grafico “si avvicini” al grafico rappresentativo delle coppie di valori rilevati. Il

procedimento che trattiamo utilizza il metodo dei minimi quadrati che illustriamo.

INTERPOLAZIONE INTERPOLAZIONE

MATEMATICA STATISTICA

1

Nell’interpolazione matematica la funzione interpolante cercata passa per i valori

,i i x y mentre nell’interpolazione statistica la funzione interpolante cercata

passa tra i valori ,i ix y .

Per ora dedichiamoci all’interpolazione statistica e cerchiamo un metodo con cui

ricavare la funzione che passa tra i valori ,i ix y noti.

Metodo dei minimi quadrati

Si considerino due variabili X ed Y sulle quali sono effettuate rilevazioni

espresse dalle coppie:

n

11,x y , 22 ,x y , …, ,n nx y .

Si presentano due problemi:

- scegliere il tipo di funzione che si ritiene esprima meglio la relazione tra X ed Y ;

- determinare i parametri della funzione scelta.

Tale funzione è detta funzione interpolante.

Per quanto riguarda la scelta della funzione interpolante, non esistono criteri

generali validi per ogni caso e si possono solo dare delle indicazioni. La scelta

della funzione dipende da un’eventuale relazione tra le variabili riscontrata

dall’osservazione dei valori assunti dalle stesse. Ad esempio, se gli incrementi dei

valori di Y , per incrementi costanti di X , sono quasi costanti, la curva che meglio

rappresenta il fenomeno è la retta. Se invece il confronto tra i valori osservati

presenta caratteristiche diverse, allora la curva che meglio rappresenta il

fenomeno deve in generale avere le stesse caratteristiche. La scelta della funzione

dipende anche dallo scopo per cui si fa la ricerca. Ad esempio, se lo scopo è

puramente descrittivo del fenomeno, allora si cercherà una funzione semplice. Se

invece lo scopo è investigativo, ossia se si vuole ricavare la legge, o un modello

matematico del fenomeno, allora la funzione sarà più complessa.

Indichiamo con i valori teorici sulla curva corrispondenti ai valori îy ix rilevati.

Sostituendo ai valori rilevati i valori teorici, si commettono errori dati dalla

differenza:

iy

iy

îy

î id y che possono essere positivi, negativi o nulli.

Occorre minimizzare questi errori, ma non è corretto minimizzare la somma delle

, in quanto gli errori positivi potrebbero compensare quelli negativi. id

Il criterio corretto per ottenere un buon accostamento è quello di minimizzare la

somma dei quadrati delle , precisamente: la condizione di accostamento data

dal metodo dei minimi quadrati è: determinare la funzione interpolante in modo

id

2

che sia minima la somma dei quadrati delle differenze fra i valori osservati ed i

valori teorici , cioè .

iy

îy

îy 21

ˆn

i ii

y y

Ricavata la funzione che si ritiene più rappresentativa della distribuzione, bisogna

verificare che i valori teorici approssimino i valori empirici, ossia che il grado di

accostamento sia accettabile.

A questo scopo si calcolano, per prima cosa, le differenze d y che

dovranno essere, il più possibile, di segni alternati; quindi si calcolano gli indici di

accostamento.

i i

Gli indici di accostamento più usati sono l’indice lineare relativo 1I e l’indice

quadratico relativo 2I aventi le seguenti espressioni:

1 î i

i

Iy

ˆy y

2

2

ˆ

ˆ

i i

i

y y

nIy

n

.

Fra i due indici è preferibile il secondo poiché il metodo dei minimi quadrati opera

sui quadrati delle differenze. I valori ottenuti vanno considerati in relazione al

fenomeno; comunque, in linea di massima, per avere un buon accostamento

non devono superare il valore 0,1 (in certi casi non devono superare 0,01);

ovviamente, tanto più piccoli sono i valori di 1I e di 2I , tanto migliore è

l’accostamento. Se lo scopo della ricerca della funzione è quello di avere un

modello matematico del fenomeno, attualmente è stato introdotto un indice detto

coefficiente di determinazione che tiene conto dello scarto quadratico medio dei

valori e indicata con iy

iyy

n

la media aritmetica dei valori , il coefficiente di determinazione ha la seguente

espressione:

iy

2

2

ˆ1 i i

i

y y

y y

.

Quanto più è “vicino” ad 1, tanto più il modello rappresenta bene il fenomeno.

3

Funzione interpolante: la retta

Applichiamo il metodo dei minimi quadrati nel caso in cui come funzione

interpolante venga scelta la retta.

La funzione scelta è una funzione di primo grado in x ed , avente quindi

un’espressione del tipo:

y

y ax b ,

con e b parametri reali. a

Imponendo che sia minima la funzione 21

,n

i ii

f a b y a bx

.

Sfruttando il calcolo delle derivate parziali per ottenere la condizione di minimo si

ottiene:

2 2

i i i

i i

ix y n x ya

x n x

2

2 2

i i i i i

i i

x x y y xb

x n x

da cui la funzione interpolante è

2

2 22 2

i i i i i i i i i

i i i i

x y n x y x x y y xy x

x n x x n x

.

Osservazione: si può dimostrare che la retta interpolante passa per il baricentro

della distribuzione ossia per il punto ,x y , dove x e y sono le medie aritmetiche

di ix e . iy

Un esempio guida:

Il consumo pro capite di pesce in chilogrammi è stato

Anni kg

1971 10,34

1972 10,56 1973 9,9 1974 9,68

1975 10,01 1976 10,56 1977 10,12

1978 10,78

1979 11 1980 12,1

4

Compilo la tabella

n x y xy x^2 f(x) y-f(x) (y-f(x)^2

1 1971 10,34 20380,14 3884841 9,82 0,52 0,27

2 1972 10,56 20824,32 3888784 9,97 0,59 0,35

3 1973 9,9 19532,7 3892729 10,12 -0,22 0,05

4 1974 9,68 19108,32 3896676 10,28 -0,60 0,36

5 1975 10,01 19769,75 3900625 10,43 -0,42 0,18

6 1976 10,56 20866,56 3904576 10,58 -0,02 0,00

7 1977 10,12 20007,24 3908529 10,73 -0,61 0,38

8 1978 10,78 21322,84 3912484 10,89 -0,11 0,01

9 1979 11 21769 3916441 11,04 -0,04 0,00

10 1980 12,1 23958 3920400 11,19 0,91 0,82

ottengo

n 10 Σx 19755 Σy 105,05 Σxy 207538,87

(Σx)^2 390260025 Σx^2 39026085

Σ(y-f(x)) 0,00 Σ(y-f(x))^2 2,42

Σf(x) 105,05

da cui la retta di regressione è 0,153 291,088y x .

L’indice quadratico relativo è 0,047I minore di 0,1 quindi la retta trovata fornisce

una buona interpolazione.

Rappresentando graficamente si ottiene:

8

8,5

9

9,5

10

10,5

11

11,5

12

12,5

1971 1972 1973 1974 1975 1976 1977 1978 1979 1980

anni

kg p

esce

pro

cap

ite

NOTA: in molti casi è possibile sostituire i valori della X con 1,2,3,4,….ottenendo

una semplificazione.

5

L’interpolazione per punti noti Lo scopo è quello di determinare una funzione che passa esattamente per tutti i

punti del diagramma a dispersione. In questo caso si parla di interpolazione

matematica.

6

Si può dimostrare che per determinare la funzione che passa per le coppie n

,i ix y si può usare il polinomio di interpolazione di Lagrange:

2 3 2 3 1 2 11 2

1 2 1 3 1 2 1 2 3 2 1 2 1

....... ....... ..........

....... ....... .......n n

nn n n n

x x x x x x x x x x x x x x x x x xy y y

x x x x x x x x x x x x x x x x x x

n

n n

y

01 interpolazione e-minimi_quadrati

Investor Relations

Transcript of 01 interpolazione e-minimi_quadrati