01 interpolazione e-minimi_quadrati
Click here to load reader
-
Upload
agostino-perna -
Category
Investor Relations
-
view
2.098 -
download
0
Transcript of 01 interpolazione e-minimi_quadrati
L’Interpolazione Nell’esame di fenomeni di qualsiasi natura si cerca di esprimere, sia mediante
relazioni matematiche, sia mediante specifici indici, i legami rilevati, o ipotizzati, fra
le grandezze che interagiscono nei fenomeni stessi. Nello studio dei legami fra due
variabili statistiche, partendo da un insieme di coppie ,i ix y di dati rilevati, si
determina, se possibile, una funzione y f x che rappresenti il fenomeno.
Vari sono gli scopi della ricerca di tale funzione; fra essi ricordiamo:
- descrivere sinteticamente la relazione fra due variabili osservate;
- determinare la legge di distribuzione dei dati statistici;
- ricavare eventuali dati intermedi mancanti;
- correggere valori affetti da errori accidentali o perturbati da cause secondarie. Per
trovare una funzione che rappresenti il fenomeno si può procedere in due modi:
- determinare una funzione che assuma esattamente i valori ,i ix y rilevati; questo
procedimento viene detto interpolazione per punti noti, o interpolazione
matematica;
- determinare una funzione il cui grafico “si accosti” il più possibile ai punti del
diagramma a dispersione; questo procedimento viene detto interpolazione (o
perequazione) fra punti noti, o interpolazione statistica.
In Statistica, al contrario di quanto accade in Matematica, scegliendo una funzione
polinomiale che sia soddisfatta da tutte le coppie assegnate di valori, essendo il
numero delle coppie di valori piuttosto elevato, risulterebbe tanto complessa da
determinare, quanto di scarsa utilità.
Per tale motivo nelle applicazioni statistiche si preferisce cercare una funzione il
cui grafico “si avvicini” al grafico rappresentativo delle coppie di valori rilevati. Il
procedimento che trattiamo utilizza il metodo dei minimi quadrati che illustriamo.
INTERPOLAZIONE INTERPOLAZIONE
MATEMATICA STATISTICA
1
Nell’interpolazione matematica la funzione interpolante cercata passa per i valori
,i i x y mentre nell’interpolazione statistica la funzione interpolante cercata
passa tra i valori ,i ix y .
Per ora dedichiamoci all’interpolazione statistica e cerchiamo un metodo con cui
ricavare la funzione che passa tra i valori ,i ix y noti.
Metodo dei minimi quadrati
Si considerino due variabili X ed Y sulle quali sono effettuate rilevazioni
espresse dalle coppie:
n
11,x y , 22 ,x y , …, ,n nx y .
Si presentano due problemi:
- scegliere il tipo di funzione che si ritiene esprima meglio la relazione tra X ed Y ;
- determinare i parametri della funzione scelta.
Tale funzione è detta funzione interpolante.
Per quanto riguarda la scelta della funzione interpolante, non esistono criteri
generali validi per ogni caso e si possono solo dare delle indicazioni. La scelta
della funzione dipende da un’eventuale relazione tra le variabili riscontrata
dall’osservazione dei valori assunti dalle stesse. Ad esempio, se gli incrementi dei
valori di Y , per incrementi costanti di X , sono quasi costanti, la curva che meglio
rappresenta il fenomeno è la retta. Se invece il confronto tra i valori osservati
presenta caratteristiche diverse, allora la curva che meglio rappresenta il
fenomeno deve in generale avere le stesse caratteristiche. La scelta della funzione
dipende anche dallo scopo per cui si fa la ricerca. Ad esempio, se lo scopo è
puramente descrittivo del fenomeno, allora si cercherà una funzione semplice. Se
invece lo scopo è investigativo, ossia se si vuole ricavare la legge, o un modello
matematico del fenomeno, allora la funzione sarà più complessa.
Indichiamo con i valori teorici sulla curva corrispondenti ai valori ˆiy ix rilevati.
Sostituendo ai valori rilevati i valori teorici, si commettono errori dati dalla
differenza:
iy
iy
ˆiy
ˆi id y che possono essere positivi, negativi o nulli.
Occorre minimizzare questi errori, ma non è corretto minimizzare la somma delle
, in quanto gli errori positivi potrebbero compensare quelli negativi. id
Il criterio corretto per ottenere un buon accostamento è quello di minimizzare la
somma dei quadrati delle , precisamente: la condizione di accostamento data
dal metodo dei minimi quadrati è: determinare la funzione interpolante in modo
id
2
che sia minima la somma dei quadrati delle differenze fra i valori osservati ed i
valori teorici , cioè .
iy
ˆiy
ˆiy 21
ˆn
i ii
y y
Ricavata la funzione che si ritiene più rappresentativa della distribuzione, bisogna
verificare che i valori teorici approssimino i valori empirici, ossia che il grado di
accostamento sia accettabile.
A questo scopo si calcolano, per prima cosa, le differenze d y che
dovranno essere, il più possibile, di segni alternati; quindi si calcolano gli indici di
accostamento.
i i
Gli indici di accostamento più usati sono l’indice lineare relativo 1I e l’indice
quadratico relativo 2I aventi le seguenti espressioni:
1 ˆi i
i
Iy
ˆy y
2
2
ˆ
ˆ
i i
i
y y
nIy
n
.
Fra i due indici è preferibile il secondo poiché il metodo dei minimi quadrati opera
sui quadrati delle differenze. I valori ottenuti vanno considerati in relazione al
fenomeno; comunque, in linea di massima, per avere un buon accostamento
non devono superare il valore 0,1 (in certi casi non devono superare 0,01);
ovviamente, tanto più piccoli sono i valori di 1I e di 2I , tanto migliore è
l’accostamento. Se lo scopo della ricerca della funzione è quello di avere un
modello matematico del fenomeno, attualmente è stato introdotto un indice detto
coefficiente di determinazione che tiene conto dello scarto quadratico medio dei
valori e indicata con iy
iyy
n
la media aritmetica dei valori , il coefficiente di determinazione ha la seguente
espressione:
iy
2
2
ˆ1 i i
i
y y
y y
.
Quanto più è “vicino” ad 1, tanto più il modello rappresenta bene il fenomeno.
3
Funzione interpolante: la retta
Applichiamo il metodo dei minimi quadrati nel caso in cui come funzione
interpolante venga scelta la retta.
La funzione scelta è una funzione di primo grado in x ed , avente quindi
un’espressione del tipo:
y
y ax b ,
con e b parametri reali. a
Imponendo che sia minima la funzione 21
,n
i ii
f a b y a bx
.
Sfruttando il calcolo delle derivate parziali per ottenere la condizione di minimo si
ottiene:
2 2
i i i
i i
ix y n x ya
x n x
2
2 2
i i i i i
i i
x x y y xb
x n x
da cui la funzione interpolante è
2
2 22 2
i i i i i i i i i
i i i i
x y n x y x x y y xy x
x n x x n x
.
Osservazione: si può dimostrare che la retta interpolante passa per il baricentro
della distribuzione ossia per il punto ,x y , dove x e y sono le medie aritmetiche
di ix e . iy
Un esempio guida:
Il consumo pro capite di pesce in chilogrammi è stato
Anni kg
1971 10,34
1972 10,56 1973 9,9 1974 9,68
1975 10,01 1976 10,56 1977 10,12
1978 10,78
1979 11 1980 12,1
4
Compilo la tabella
n x y xy x^2 f(x) y-f(x) (y-f(x)^2
1 1971 10,34 20380,14 3884841 9,82 0,52 0,27
2 1972 10,56 20824,32 3888784 9,97 0,59 0,35
3 1973 9,9 19532,7 3892729 10,12 -0,22 0,05
4 1974 9,68 19108,32 3896676 10,28 -0,60 0,36
5 1975 10,01 19769,75 3900625 10,43 -0,42 0,18
6 1976 10,56 20866,56 3904576 10,58 -0,02 0,00
7 1977 10,12 20007,24 3908529 10,73 -0,61 0,38
8 1978 10,78 21322,84 3912484 10,89 -0,11 0,01
9 1979 11 21769 3916441 11,04 -0,04 0,00
10 1980 12,1 23958 3920400 11,19 0,91 0,82
ottengo
n 10 Σx 19755 Σy 105,05 Σxy 207538,87
(Σx)^2 390260025 Σx^2 39026085
Σ(y-f(x)) 0,00 Σ(y-f(x))^2 2,42
Σf(x) 105,05
da cui la retta di regressione è 0,153 291,088y x .
L’indice quadratico relativo è 0,047I minore di 0,1 quindi la retta trovata fornisce
una buona interpolazione.
Rappresentando graficamente si ottiene:
8
8,5
9
9,5
10
10,5
11
11,5
12
12,5
1971 1972 1973 1974 1975 1976 1977 1978 1979 1980
anni
kg p
esce
pro
cap
ite
NOTA: in molti casi è possibile sostituire i valori della X con 1,2,3,4,….ottenendo
una semplificazione.
5
L’interpolazione per punti noti Lo scopo è quello di determinare una funzione che passa esattamente per tutti i
punti del diagramma a dispersione. In questo caso si parla di interpolazione
matematica.
6
Si può dimostrare che per determinare la funzione che passa per le coppie n
,i ix y si può usare il polinomio di interpolazione di Lagrange:
2 3 2 3 1 2 11 2
1 2 1 3 1 2 1 2 3 2 1 2 1
....... ....... ..........
....... ....... .......n n
nn n n n
x x x x x x x x x x x x x x x x x xy y y
x x x x x x x x x x x x x x x x x x
n
n n
y