Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo...

27
Capitolo 1 Procedure di fit Si supponga di aver effettuato una serie di coppie di misure di due grandezze ed che si pensano legate tramite una funzione , dove con si intende un insieme di parametri ignoti, corrispondenti ad altrettante grandezze fisiche che si vogliono determinare: effettuare un fit significa dare una stima del loro valore ”vero” , cercando quei valori per i quali la “distanza” (dove la “distanza” è un concetto che va ancora definito) tra i valori misurati e quelli calcolati tramite a partire dai corrispondenti valori di risulta minore. La stima delle grandezze fisiche non è altro che una misura indiretta, che porterà dunque ad un errore , e quindi ad una incertezza associata alla misura. Solitamente, si adoperano due tipi di fit: nel caso in cui le incertezze su siano tutte uguali, o peggio siano sconosciute, si adopera il metodo dei minimi quadrati. Se invece le incertezze su risultano sensibilmente diverse tra di loro, si preferisce adoperare il metodo del minimo . Perché il fit possa avere un senso, in numero di parametri indipendenti da cui dipende la curva deve risultare strettamente minore del numero di misure a di- sposizione: questo dipende solamente da considerazioni di natura algebrica: se le variabili indipendenti fossero maggiori, il minimo risulterebbe indeterminato. La differenza tra il numero di misure ed il numero di parametri è detta numero di gradi di libertà del fit: . 1 1 Una operazione di fit non è altro dunque che una condensazione dell’informazione: ad esem- pio, possiamo immaginare di effettuare un fit mediante una retta ad un insieme N di dati. In questo caso, gli N numeri iniziali si riducono a solamente due, con in più l’ipotesi che le variabili ed siano legate da una relazione lineare. Oviamente, parte dell’informazione va persa: ad esempio, se il legame tra le variabili contenesse un piccolo termine non lineare, di questo non rimarrebbe traccia dopo il fit, mentre probabilemente una analisi accurata dei dati originari sarebbe in grado 1

Transcript of Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo...

Page 1: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

Capitolo 1

Procedure di fit

Si supponga di aver effettuato una serie diN coppie di misure di due grandezzex ed y che si pensano legate tramite una funzioney = f(x; a), dove cona siintende un insieme diM parametri ignoti, corrispondenti ad altrettante grandezzefisiche che si vogliono determinare: effettuare un fit significa dare una stima delloro valore ”vero”a0, cercando quei valoriba per i quali la “distanza” (dove la“distanza” è un concetto che va ancora definito) tra i valoriy misurati e quellicalcolati tramitef a partire dai corrispondenti valori dix risulta minore.

La stima delle grandezze fisiche non è altro che una misura indiretta, che porteràdunque ad un errore�a = ba � a0, e quindi ad una incertezza�aassociata allamisura.

Solitamente, si adoperano due tipi di fit: nel caso in cui le incertezze suy sianotutte uguali, o peggio siano sconosciute, si adopera il metodo dei minimi quadrati.Se invece le incertezze suy risultano sensibilmente diverse tra di loro, si preferisceadoperare il metodo del minimo�2.Perché il fit possa avere un senso, in numero di parametri indipendenti da cuidipende la curva deve risultare strettamente minore del numero di misure a di-sposizione: questo dipende solamente da considerazioni dinatura algebrica: sele variabili indipendenti fossero maggiori, il minimo risulterebbe indeterminato.La differenza tra il numero di misure ed il numero di parametri è detta numero digradi di libertà del fit:ngl = N �M . 1

1Una operazione di fit non è altro dunque che una condensazionedell’informazione: ad esem-pio, possiamo immaginare di effettuare un fit mediante una retta ad un insieme N di dati. In questocaso, gli N numeri iniziali si riducono a solamente due, con in più l’ipotesi che le variabilix edysiano legate da una relazione lineare. Oviamente, parte dell’informazione va persa: ad esempio,se il legame tra le variabili contenesse un piccolo termine non lineare, di questo non rimarrebbetraccia dopo il fit, mentre probabilemente una analisi accurata dei dati originari sarebbe in grado

1

Page 2: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

2 CAPITOLO 1. PROCEDURE DI FIT

1.1 Fit col metodo dei minimi quadrati

Vediamo in dettaglio il caso in cui la “distanza” corrisponde allo scarto quadraticotra la funzione ed i valori misurati, caso che costituisce appunto il metodo deiminimi quadrati.

Si supponga che leN misurexi siano effettuate con errore nullo, o comunque tra-scurabile, e che le misureyi siano affette da una stessa indeterminazione�y, notao ignota non importa; si parta per comodità da un valore arbitrario dei parametria,e si calcoli la differenza tra i valori misuratiy e quelli calcolati tramite la funzionef : di = yi � f(xi; a)Le quantitàdisono dette scarti o residui: in generale potranno essere positivi onegativi, quindi non vanno bene per definire una distanza, che è sempre positiva.Possiamo però, a partire dai residui, definire una “distanza” tra la funzionef ed ivalori osservati diy, prendendone il quadrato e costruendone la somma:D2 = NXi=1 d2i = NXi=1 [yi � f(xi; a)℄2Questa distanza, così definita, dipende solamente dai parametri a. È evidente che,se la funzione rispecchia il reale legame tra le variabili, allora in corrispondenzadei parametri ”veri” i residui saranno uguali agli errori sperimentali, e quindi amedia zero e deviazione standard�y. Assumeremo quindi che i valoriba in cor-rispondenza dei quali la sommatoria raggiunge il minimo siano la migliore stimapossibile dei parametri ”veri”a0.

1.1.1 Stima delle incertezze

Nel caso in cui l’incertezza sulla misura diy sia ignota, o mal determinata, èpossibile effettuarne una stima a partire dal risultato delfit. Il metodo è il seguente:dapprima si calcolano i parametriba minimizzando la distanza definita sopra; poia partire da questa si calcolano i residui. La deviazione standard dei residui dàla stima dell’incertezza cercata. Ma attenzione: se abbiamo N misure, e il fitcontieneM parametri, allora il numero di gradi di libertà indipendenti saràngl =N �M . Quindi la deviazione standard andrà calcolata utilizzando la formula :

di metterla in evidenza.

Page 3: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.1. FIT COL METODO DEI MINIMI QUADRATI 3�dati =sPNi=1 d2iN �M =r D2N �M (1.1)

Questo metodo è molto utile, ma può dare risultati sbagliatise la funzionef(x; a)nonriproduce accuratamente la relazione vera trax ey.

Nel caso in cui esista una stima indipendente dell’incertezza�y , è possibile con-frontarne il valore con quello ottenuto dai dati: se i due valori non concidono,perlomeno entro un fattore 2, è bene indagare le cause della discrepanza. Infattiquesto effetto potrebbe dipendere da svariati motivi, ad esempio:� La stima indipendente dell’incertezza suy potrebbe essere sbagliata: questo

è il caso più frequente, che non porta a gravi conseguenze sulpiano pratico.� Le coppie di misure potrebbero non essere indipendenti: ad esempio, po-trebbe esistere un errore sistematico comune a tutti i valori di y.� L’errore sux potrebbe non essere trascurabile.� I dati potrebbero essere legati da una relazione diversa da quella ipotizzata.

Il semplice confronto degli errori è però un test piuttosto rozzo della qualità dei da-ti, in quanto non tiene conto del numero di misure a disposizione. Si preferisconoquindi adoperare test più raffinati, come quello del�2.1.1.2 Test del�2Nel caso in cui l’errore nella misura delle ordinate sia conosciuto, è possibileeffettuare sulle misure il test del�2: viene definita la quantità�2 = NXi=1 �yi � f(x;ba)�y �2 = NXi=1 �di� �2 = D2�2 = (N �M)�2dati�2Si tratta, come si vede, essenzialmente della stessa quantità definita nell’equazione??, calcolata per ogni misura, e sommata su tutte le misure: nonè altro che ilrapporto tra il valore quadratico medio dei residui e la stima delle incertezze. Nelcaso in cui queste coincidano, il�2 vale pressappocoN �M , ovvero il numero digradi di libertà residui dopo il fit. Quindi verificare che la quantità�2=(N �M)(detto chi-quadro ridotto) sia pressappoco uguale ad uno equivale a confrontare lestime degli errori ottenute dai dati e con metodi indipendenti.

Page 4: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

4 CAPITOLO 1. PROCEDURE DI FIT

Figura 1.1: Procedura della stima degli errori: nella figurain alto, i punti corri-spondenti agli errori sperimentali sono graficati senza barre di errore, assieme alrisultato del fit. Nella figura al centro, vengono mostrati i residui: le linee orizzon-tali corrispondo agli errori calcolati seguendo la procedura descritta. La figura inbasso è uguale a quella in alto, ma stavolta sono state aggiunte le barre di errore.

0 2 4 6 8 10 12−5

0

5

10

15

0 2 4 6 8 10 12−4

−2

0

2

4

0 2 4 6 8 10 12−5

0

5

10

15

Page 5: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.1. FIT COL METODO DEI MINIMI QUADRATI 5

Figura 1.2: Calcolo del�2: nella figura in alto viene riportato il grafico dei daticon la curva di fit e le barre di errore. Nella figura in mezzo sono invece mostratii residui. Infine nella figura in basso si vede il grafico di(di=�)2: la somma dellebarre dà il valore di�2. Si vede come il punto corrispondente adx = 5, la cuibarra di errore non interseca il grafico dà alla sommatoria uncontributo maggioredi 1, mentre le altre danno un contributo minore.

0 2 4 6 8 10 12−10

−5

0

5

10

0 2 4 6 8 10 12−4

−2

0

2

4

1 2 3 4 5 6 7 8 9 100

0.5

1

1.5

2

Però con il�2 si può fare molto di più: infatti è possibile calcolare la distribuzionedi probabilità della variabile casuale�2 nel caso in cui si abbiamongl gradi dilibertà. Dalla distribuzione di probabilità è possibile quindi farsi un’idea di quantorisulti probabile il valore di�2 ottenuto nei dati che si stanno analizzando.

1.1.3 Fit polinomiale

In generale, data una funzione qualsiasi, la ricerca del minimo può presentareuna serie di problemi, dovuti a motivi matematici (la presenza di più minimi,ad esempio) o fisici (quando il valore dei parametri corrispondente al minimonon possiede significato fisico, ad esempio). Un caso interessante è però quello

Page 6: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

6 CAPITOLO 1. PROCEDURE DI FIT

Figura 1.3: a) densità di probabilità del�2per diversi gradi di libertà.b) la stessa funzione, integrata fino a+1, mostra la probabilità di osservare unvalore del�2più grande di quello ottenuto. Ad esempio, se otteniamo un�2di7.9 con 5 gradi di libertà (punto evidenziato in nero), dallacurva troviamo che laprobabilità di ottenere un valore più alto del�2 (e quindi dati che si discostanomaggiormente dalla curva osservata) è di circa il 16 %. Valori bassi della pro-balilità indicano che il fit riproduce male i dati sperimentali; d’altro canto valoritroppo alti possono generare il sospetto di una sovrastima delle incertezze.

0 2 4 6 8 10 12 14 16 18 2010

−10

10−5

100

105

0 2 4 6 8 10 12 14 16 18 200

0.2

0.4

0.6

0.8

1

n=1

n=1

n=10

n=10

a)

b)

χ2

χ2

Page 7: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.1. FIT COL METODO DEI MINIMI QUADRATI 7

che si ottiene quando la funzionef è un polinomio:f = PMk=1 akxk. In questocaso, derivando rispetto ai vari valori diak, si ottengono sempre equazioni linearifacilmente risolvibili numericamente. La teoria generaleesula da questo contesto,ci limiteremo a trattare due casi particolari.

Costante

Si supponga una relazione del tipo:y = a0, ovvero che non esista nessuna di-pendenza dalla variabilex (in questa tipologia rientrano quei casi in cui vienemisurata più volte la stessa quantità: in questo caso la variabilex può essere unavariabile qualsiasi, come ad esempio un numero progressivo).

In tal caso: D2 = NXi=1 (yi � a0)2 = NXi=1 y2i � 2a0 NXi=1 yi +Na20Derivando rispetto ada0, si ottiene che il minimo corrisponde al caso in cuia0èuguale alla media diyi.Relazione lineare

Il caso in cui la funzione è una retta,f = a0 + a1x, si risolve con altrettantafacilità:D2 = NXi=1 (yi � a0 � a1xi)2 =NXi=1 y2i +Na20 + a21 NXi=1 x2i � 2a0 NXi=1 yi � 2a1 NXi=1 yixi + 2a0a1 NXi=1 xiDerivando, ed imponendo che la derivata valga zero, si ottengono dopo un po’ diconti le due equazioni accoppiate:Na0 + a1PNi=1 xi =

PNi=1 yia0PNi=1 xi + a1PNi=1 x2i =PNi=1 xiyi (1.2)

che hanno come soluzione:

Page 8: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

8 CAPITOLO 1. PROCEDURE DI FITa0 = (PNi=1 yi)(PNi=1 x2i )�(PNi=1 xiyi)(PNi=1 xi)N(PNi=1 x2i )�(PNi=1 xi)2a1 = N(PNi=1 xiyi)�(PNi=1 yi)(PNi=1 xi)N(PNi=1 x2i )�(PNi=1 xi)22

Il valore di a0rappresenta l’intercetta della retta con l’asse delle ordinate, mentreil valore dia1rappresenta la sua pendenza.

E’ possibile a questo punto ottenere una stima dell’incertezza suy, osservando ladispersione dei valori diy intorno al risultato del fit: basterà calcolare dapprima iresidui, e successivamente la loro deviazione standard.

Nel caso in cui i punti utilizzati siano pochi (diciamo meno di 10), è buona regolacalcolare l’errore suy tramite la formula1.1, che in questo caso si scrive:�y =sPNi=1 d2iN � 2infatti visto che nel calcolo dei residui abbiamo adoperatodue valori ricavati daidati stessi, il numero di gradi di libertà è stato ridotto conseguentemente.

A questo punto, possiamo calcolare anche gli errori sui parametri del fit: perfarlo, basta osservare come siaa0 chea1sono due funzioni delle variabili casualiyi. Quindi bisogna solalmente applicare la formula di popagazione degli erroried effettuare dei conti che qui per brevità ometteremo riportando solamente ilrisultato finale:�2a0 = PNi=1 ��a0�yi �y�2 = �2y (PNi=1 x2i )N(PNi=1 x2i )�(PNi=1 xi)2�2a1 = PNi=1 ��a1�yi �y�2 = �2y NN(PNi=1 x2i )�(PNi=1 xi)2Esiste una correlazione tra i due parametri: è una cosa che siimpara immedia-tamente quando si effettua il fit grafico col righello. Infatti, nel caso semplice incui tutti i dai si trovino nel primo quadrante (valori dix e y positivi) che per farpassare il righello attraverso tutti i dati, se si aumenta l’inclinazione allora il puntodi intersezione con l’asse delle ascisse si abbassa, e viceversa. Quindi se il fit pro-duce come risultato un valore dia1maggiore di quello vero, allora il valore dia0risulterà molto probabilmente minore di quello vero: tra i due parametri esisteràallora una correlazione di tipo negativo.

2Una forma alternativa della soluzione si può scrivere nellaforma:a0 = y � a1xa1 = PNi=1(xi�x)(yi�y)PNi=1(xi�x)2

Page 9: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.1. FIT COL METODO DEI MINIMI QUADRATI 9

Figura 1.4: Correlazione tra pendenza ed intercetta: all’aumentare della pen-denza diminuisce l’intercetta, e viceversa. La correlazione tra i due parametriè quindi negativa (nel caso in cui i dati non giacciano tutti nel primo quadrante lacorrelazione può essere tuttavia negativa o nulla).

0 2 4 6 8 10 120

2

4

6

8

10

12

14

16

18

20

Page 10: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

10 CAPITOLO 1. PROCEDURE DI FIT

Per calcolare la correlazione si può procede nel modo seguente: si parte dall’ideache una variazione�yi in una delle misure produce nei parametri due variazionidate da:�a0 = �a0�yi �yi, �a1 = �a1�yi �yi. Se moltiplichiamo queste due espressioni tra diloro, sommiamo su tutte le misure, e mediamo, otteniamo la covarianza dei dueparametri, che, assumendo che le misureyisiano tra di loro indipendenti, assumela forma: ov(a0; a1) = NXi=1 �a0�yi �a1�yi �2y = �2y �PNi=1 xiNPNi=1 x2i � �PNi=1 xi�2ed infine il coefficente di correlazione risulta uguale a:r = �PNi=1 xiqNPNi=1 x2iIl coefficente di correlazione non dipende in nessun modo day: dipende solodai valori dix. Questo ha come conseguenza interessante che per ottenere duevalori scorrelati della pendenza e dell’intercetta della retta basta fare delle misuresimmetriche intorno all’origine delle coordinate.

1.1.3.1 Esempi

Vediamo adesso alcuni esempi:

Esempio 1 Supponiamo che i valori “veri” delle grandezzex e y siano legatidalla relazione:y = 3x + 1Si effettuano 10 misure, con uno strumento che presenta una risoluzione pari a�y = 1:i 1 2 3 4 5 6 7 8 9 10xi 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0yi 4.1 6.9 11.8 12.0 16.6 19.6 22.4 23.9 27.0 30.5

A partire da questi dati, possiamo calcolare:

Page 11: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.1. FIT COL METODO DEI MINIMI QUADRATI 11PNi=1 xi = 55PNi=1 x2i = 385PNi=1 xiyi = 1198PNi=1 yi = 174:8e quindi, applicando le formule:a0 = 1:71 a1 = 2:87A questo punto è possibile calcolare i residuidi = yi � a0 � a1xi:i 1 2 3 4 5 6 7 8 9 10di -0.48 -0.55 1.48 -1.19 0.54 0.67 0.60 -0.77 -0.54 0.09

Applicando la formula1.1, si ottiene come errore�dati = 0:87, in ottimo accordocol valore atteso.

Le incerte sui parametri si calcolano utilizzando le formule??, ottenendo infine:a0 = 1:71� 0:68 a1 = 2:87� 0:11con un coefficente di correlazione pari a -0.9.

Esempio 2 Supponiamo adesso che anche nelle misure dix si effettui un errorecon dispersione pari a�x = 0:5. I risultati potrebbero apparire come i seguenti:i 1 2 3 4 5 6 7 8 9 10xi 1.0 1.6 2.2 4.9 5.6 6.4 7.6 8.2 8.3 10.7yi 4.1 6.9 11.8 12.0 16.6 19.6 22.4 23.9 27.0 30.5

Stavolta il risultato del fit è notevolmente diverso:a0 = 2:59, a1 = 2:63Calcolando l’errore suy si ottiene�y = 2:0, il doppio di quello vero!

Il motivo sta nel fatto che la dispersione sux viene “trasformata” in una indeter-minazione suy: si ha pressappoco:�2dati = �2y + ( dydx)2�2x

Page 12: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

12 CAPITOLO 1. PROCEDURE DI FIT

Esempio 3 Stavolta i dati siano i seguenti:i 1 2 3 4 5 6 7 8 9 10 11xi 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0yi .001 .012 .015 .024 0.031 0.029 0.033 0.040 0.039 0.042 0.042

Le y sono state misurate con una incertezza pari a2� 10�3.Il fit lineare porta al risultato:a0 = 0:008� 0:001, a1 = 0:039� 0:002.

I residui sono:i 1 2 3 4 5 6 7 8 9 10 11di(�10�3) -8 -6 4 2 4 7 5 3 -1 -2 -9

Il calcolo dell’errore in base ai residui porta al risultato: �dati = 6 � 10�3, ed il�2 vale 42 per 9 gradi di libertà. Anche stavolta l’incertezza calcolata sui dati èpiù grande di quella attesa, ma stavolta la causa è l’inadeguatezza della funzione:infatti, esaminando i residui, si nota come questi, invece di essere positivi o nega-tivi in modo casuale, sembrano seguire un andamento che porta i punti a passareda sotto a sopra e poi di nuovo sotto la retta ottenuta trmite il fit. Questo fa sorge-re il forte sospetto che i dati presentino una leggera concavità rivolta verso l’alto.E’ interessante osservare come questo comportamento non risulta particolarmentevistoso nel grafico che confronta i dati col fit, mentre è evidentissimo nel graficodei residui (fig.1.5).

1.1.4 Metodo matriciale

Un metodo alternativo di risolvere le equazioni 1.2 è quellodi adoperare il metodomatriciale. Data una opportuna trasformazione si possono infatti scrivere nellaforma: A = � a0a1 � ; M = � N P xiP xi Px2i � ; V = � P yiP xiyi �+V = MA+A = M�1VQuindi per trovare i parametri occorre invertire la matriceM : i vantaggi diquesto metodo stanno nel fato che la matrice è invertibile numericamente, ed ilformalismo si può estendere a casi più complicati, come vedremo nel prossimoparagrafo.

Page 13: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.1. FIT COL METODO DEI MINIMI QUADRATI 13

Figura 1.5: Terzo esempio: grafico dei dati (in alto) sovrapposto al risultato delfit, e grafico dei residui. Si vede chiaramente come i dati presentino una leggeracurva che li fa passare da sotto a sopra e poi nuovamente sottola retta del fit.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.01

0.02

0.03

0.04

0.05

0.06

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−0.015

−0.01

−0.005

0

0.005

0.01

0.015

Page 14: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

14 CAPITOLO 1. PROCEDURE DI FIT

La matriceS = �2yM�1 è detta matrice di covarianza: si dimostra come i suoielementi siano:S00 = �2a0 , S11 = �2a1 , S01 = S10 = r �a0�a11.1.5 Polinomio di grado generico

Un fit dei dati mediante un polinomio generico di gradoM è sempre possibile,purché il numero dei punti sperimentali sia almeno uguale algrado del polinomiopiù due: infatti sappiamo che per N punti passa sempre uno ed un solo polinomiodi grado N-1. Quindi, se tentiamo il fit il queste condizioni,il polinomio passeràesattamente per i punti sperimentali: i residui saranno tutti esattamente uguali azero, ed il polinomio trovato sarà il polinomio interpolante. Questo caso risultapoco interessante nel caso di dati affetti da errore: la forza del fit infatti sta nelricavare pochi parametri sperimentali da molte misure, in modo tale che la ridon-danza consenta di ridurre le incertezze sui singoli punti. Qualora il numero didati sperimentali risulti inferiore al grado del polinomioaumentato di 1, allora ilpolinomio rimane indeterminato, ed il fit è impossibile.

Il metodo è simile a quello visto nel caso dell a retta: il polinomio avrà la forma:p(x) = a0 + a1x+ a2x2 + ::::: + aMxM =PMk=0 akxke quindi la funzione da minimizzare sarà:D2 =PNi=1 (yi � p(xi))2 =PNi=1 �yi �PMk=0 akxki �2Derivando, e svolgendo i calcoli, si ottiene un’equazione in forma matriciale,esattamente come nel caso della retta:A = MV con:Ak = ak, Mlk =PNi=1 xk+li , Vl =PNi=1 yixllPer calcolare l’inverso della matriceM esistono metodi numerici molto efficaci,per cui il problema risulta facilmente automatizzabile in tutti i casi di applicazionepratica.

Gli errori sui parametri e i coefficenti di correlazione si calcolano a partire daglielementi della matrice di covarianzaS = �2yM�1:�ak = pSkk, rkl = Skl�ak�al .1.1.6 Problemi con i fit polinomiali

I fit effettuati con un polinomio risultano molto comodi per la facilità con cui ven-gono effettuati: basta calcolare il vetoreV , la matriceM , invertire quest’ultimae moltiplicarla perV , tutte operazioni molto semplici per un calcolatore; inoltre,

Page 15: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.1. FIT COL METODO DEI MINIMI QUADRATI 15

nel caso in cui la legge fisica che lega le quantitàx ey risulti sconosciuta costitui-scono sempre una buona approssimazione ai dati in un piccolointervallo. Però ipolinomi non sono quasi mai in grado di riprodurre alcune caratteristiche comunia molte leggi fisiche, come la presenza di un asintoto o una rapida discesa versolo zero. Si potrebbe pensare che, a causa del teorema di Taylor, un polinomio digrado sufficentemente alto dovrebbe costituire sempre una migliore approssima-zione alla legge sperimentale ignota. Purtroppo non è così:a causa degli errorisperimentali, i polinomi di grado eccessivamente elevato hanno la tendenza a di-ventare instabili, e a presentare caratteristiche, come massimi o punti di flesso,assenti nei dati. Ad esempio, in figura 1.6 viene mostrato come aumentando ilgrado del polinomio la curva risultante tende sempre più a distanziarsi dai dati.Nella pratica, è raro che un polinomio di grado superiore al secondo si riveli utile.Però spesso è possibile riuscire applicare ai dati delle trasformazioni in modo daottenere delle leggi polinomiali.

Un caso molto frequente è quello dell’esponenziale descrescente:y = Ae�kx. In-fatti, adoperando una nuova variabilez = log(y) la legge diventaz = log(A)�kx.Un’altro caso frequente è quello della legge esponenziale del tipo y = �x�: inquesto caso bisogna trasformare entrambe le variabili, prendendo� = log(x),� = log(y). La relazione diviene infatti:� = log(�) + ��.

L’unico problema, nell’adoperare questa tecnica, è che raramente dopo la trasfor-mazione le incertezze sulle variabili rimangono uguali, o almeno comparabili:quindi piuttosto che adoperare il metodo dei minimi quadrati conviene applicarequello del minimo�2, che verrà discusso nel prossimo capitolo.

1.1.7 Relazione di proporzionalità

Un caso interessante si ha quando si ipotizza tra x ed y una relazione di propor-zionalità.

In questo caso, la funzione da minimizzare assume la forma:D2 = NXi=1 (yi � Axi)2Derivando rispetto adA, ed eguagliando a zero il risultato, si ottiene:A = PNi=1 yixiPNi=1 x2icon errore dato da:

Page 16: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

16 CAPITOLO 1. PROCEDURE DI FIT

Figura 1.6: Esempio di problemi nell’uso dei fit polinomiali: la relazione ”vera”tra le variabilix edy è una salita esponenziale verso un valore a regime (linea ne-ra). Come vediamo, nessun polinomio è in grado di riprodurreil comportamentoasintotico, e all’aumento del grado si nota anzi una tendenza verso l’instabilità.

0 0.2 0.4 0.6 0.8 10

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Page 17: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO �2 17�A = �yqPNi=1 x2iè facile verificare come i valori grandi dixi influenzino maggiormente il risultato.

1.2 Fit lineari tramite il metodo del minimo �21.2.1 Richiamo del metodo del minimo�2Si supponga di avere effettuato una serie di misureyi in corrispondenza di N puntixi. Ad ogni misura viene associata una incertezza�i, mentre i valori dixi vengonoconsiderati esatti.

Supponiamo che la quantitày dipenda dax tramite la relazione:y = f(x; a). Ilmetodo del minimo�2 consiste nel determinare i parametri incogniti minimizzan-do la funzione : �2(a) = Xi=1;N (yi � f(x1; a))2�2iDetto in parole povere: il�2 misura, in unità di deviazioni standard, quanto distail valore misuratoyi dal valore previsto dal modello: se il punto coincide conla previsione, il contributo sarà zero. Se invece dista una deviazione standard,allora sarà 1; se dista due deviazioni standard il contributo sarà 4, e così via. Il�2differisce dalla somma degli scarti quadratici in quanto stavolta le misure conerrore maggiore contribuiscono meno alla somma, con una minore influenza sulrisultato finale.

Per trovare il valore dei parametri che minimizzano il�2 èpossibile procedereper via analitica (calcolando cioè le derivate esplicitamente) o per via numerica(calcolando la funzione per vari valori dei parametri e scegliendo quelli per cui siottiene il valore minimo).

In genere, la via analitica è preferibile, ma sono pochissimi i casi in cui risultapraticabile. La via numerica invece funziona in quasi tuttii casi, ma può risultareeccessivamente lenta e macchinosa.

Page 18: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

18 CAPITOLO 1. PROCEDURE DI FIT

1.2.1.1 Primo caso: costante.

Il caso banale corrisponde a quello per cuif è una costante. In questo caso il�2assume la forma: �2 = Xi=1;N (yi � a0)2�2iDerivando rispetto ada0, si ottiene:��2�a0 = 2 Xi=1;N (yi � a0)�2ida cui, infine: a0 = P yi=�2iP 1=�2iPer calcolare l’errore sua0, si utilizza la formula della propagazione degli errori:�2a0 = Xj=1;N ��a0�yj �j�2 =Xj � 1=�2jP 1=�2i �2j�2 = 1P 1=�2iQueste formule sono quelle che definiscono la media pesata diuna serie di misure,che così trova una giustificazione teorica.3

1.2.1.2 Secondo caso: relazione lineare.

Supponiamo stavolta una relazione del tipo:y = a0 + a1x.

Il �2 assume la forma: �2 = Xi=1;N (yi � a0 � a1xi)�2iDerivando, si ha:

3Un modo alternativo di ottenere queste formule quello di supporre che le misure siano distri-buite secondo una distribuzione gaussiana, e di cercare il valore pi\‘u probabile del valore centraledella distribuzione.

Page 19: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO �2 19��2�a0 = 2P yi=�2i � 2a0P 1=�2i � 2a1Pxi=�2i = 0��2�a1 = 2P xiyi=�2i � 2a0P xi=�2i � 2a1P x2i =�2i = 0è possibile esprimere l’equazione precedente in forma matriciale:A = � a0a1 � ; M = � P 1=�2i P xi=�2iP xi=�2i P x2i =�2i � ; V = � P yi=�2iP xiyi=�2i �+V = MA+A = M�1V (1.3)

La matriceM e il vettoreV sono facilmente calcolabili a partire dai dati; allo stes-so modo, l’inversione numerica della matrice M non presentain genere particolaridifficoltà, per cui il problema si può considerare risolto.

La matriceS = M�1 assume un particolare significato: è possibile infatti dimo-strare (tramite un conto che si trova nei testi specializzati e che qui non riprodu-ciamo) che si tratta della matrice di covarianza, i cui elementi diagonali, comeabbiamo visto, sono uguali ai quadrati delle incertezze suialori dei parametri:Skk = �2akL’elemento non diagonale è invece uguale alla covarianza dei parametri, ovveroal loro coefficente di correlazione, moltiplicato per i rispettivi errori:Sjk = �aj�akrjkRicapitolando, il fit di un insieme di parametri tramite una retta col metodo deiminimi quadrati richiede la costruzione di un vettore di dimensione 2, di una ma-trice 2 � 2, la sua inversione, e la moltiplicazione per il vettore precedentemen-te calcolato. Le incertezze sui parametri e i coefficenti di correlazione risultanoautomaticamente dal calcolo dell’inverso della matrice.

1.2.1.3 Terzo caso: relazione di proporzionalità.

Si supponga una relazione del tipo:y = a1x.

Page 20: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

20 CAPITOLO 1. PROCEDURE DI FIT

La funzione�2diventa: �2 = Xi=1;N (yi � a1xi)�2iIn questo caso, la derivata si calcola immediatamente:��2�a1 = 2 Xi=1;N xiyi�2i � 2a1 Xi=1;N x2i�2ie quindi: a1 = P xiyi=�2iPx2i =�2i (1.4)

Infine, gli errori sulla quantitàa1 si possono calcolare utilizzando la formula perla propagazione degli errori:�2a1 = NXj=1 ��a1�yj �j�2 = NXj=i � xj=�jP x2i =�2i �2 = 1Px2i =�2i (1.5)

1.2.2 Applicazioni: La legge di Malus.

Si consideri la serie di dati riportata in tabella 1.1 e mostrata in figura1.7.

Si tratta di un insieme di dati che rappresenta la quantità diluce laser che attraversaun filtro polaroid in funzione dell’angolo di inclinazione.Gli angoli sono calcolatia partire dal minimo dell’intensità; le intensità sono misurate in Volts, in quantolo strumento di misura non era calibrato. Le incertezze sonouguali a 0.1 Volts pertutte le misure.

In queste condizioni, nell’ipotesi di luce laser completamente polarizzata, il gra-fico segue pressappoco la legge di Malus, che con questa scelta dell’origine dellecoordinate assume la forma:I = I0 sin2 �.

Per verificare la validità della legge, è possibile innanzitutto effettuare un cam-biamento di variabile, passando alla variabilex = sin2 �: in questo modo, lalegge di Malus diventa una semplice relazione di proporzionalità: I = I0x, equindi è possibile adoperare la formula 1.4. In questo modo si ottiene : I0 =18:01�0:03V olts. Il �2 del fit risulta di 331 per 36-1=35 gradi di libertà: come sivede, il modello non sembra descrivere i dati in modo sufficentemente accurato.

Page 21: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO �2 21

Tabella 1.1: Dati raccolti nell’esperienza di verifica della legge di Malus� V � V

0Æ 0.2�0.1 180Æ 0.2�0.110Æ 0.7�0.1 190Æ 0.7�0.120Æ 2.1�0.1 200Æ 2.1�0.130Æ 4.4�0.1 210Æ 4.4�0.140Æ 7.3�0.1 220Æ 7.3�0.150Æ 10.4�0.1 230Æ 10.0�0.160Æ 13.4�0.1 240Æ 12.9�0.170Æ 15.3�0.1 250Æ 15.6�0.180Æ 17.4�0.1 260Æ 17.4�0.190Æ 18.0�0.1 270Æ 18.1�0.1100Æ 17.5�0.1 280Æ 17.6�0.1110Æ 15.7�0.1 290Æ 16.2�0.1120Æ 14.0�0.1 300Æ 13.8�0.1130Æ 11.1�0.1 310Æ 10.8�0.1140Æ 8.0�0.1 320Æ 7.9�0.1150Æ 5.0�0.1 330Æ 4.6�0.1160Æ 2.5�0.1 340Æ 2.3�0.1170Æ 0.8�0.1 350Æ 0.8�0.1

Page 22: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

22 CAPITOLO 1. PROCEDURE DI FIT

Figura 1.7: In alto: luce laser che attraversa un polarimetro in funzione dell’ango-lo di inclinazione dell’asse principale. Gli angoli sono misurati in gradi a partiredalla direzione in cui la lettura del sensore presenta un minimo. La scala verticaleè misurata in Volts.Al centro: gli stessi dati, ma riportati in funzione disin2 �: si vede chiaramentecome questi di dispongano intorno ad una retta.In basso: residui ottenuti effettuando un semplice fit di proporzionalità tral’intensità e il quadrato del seno dell’angolo.

0 50 100 150 200 250 300 3500

5

10

15

20

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

5

10

15

20

0 50 100 150 200 250 300 350−1

−0.5

0

0.5

1

Page 23: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO �2 23

Figura 1.8: In alto: risultato del secondo fit sovrapposto aidati. In basso, graficodei residui

0 50 100 150 200 250 300 3500

5

10

15

20

0 50 100 150 200 250 300 350−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

Un primo possibile problema è individuabile già esaminandola tabella dei dati:infatti si nota immediatamente come la luminosità letta dallo strumento non siazzera mai, mentre il modello proposto prevede che nessuna luce attraversi il po-laroid per inclinazioni di0Æ e 180Æ. Una causa di questo comportamento può adesempio essere individuata nella non completa polarizzazione della luce del laser.Un modello più accurato risulta allora:I = I?+I0x, doveI? rappresenta la com-ponente della luce laser polarizzata perpendicolarmente all’asse di polarizzazioneprincipale.

A questo punto è possibile applicare la formula1.3, che dà come risultatoI0 =17:74 � 0:05V; I? = 0:20 � 0:03V . Il �2 di questo fit è uguale a 283, mentreil numero di gradi di libertà è passato da 35 a 34; notiamo inoltre come l’errorestatistico suI0 sia aumentato.

E’ possibile tuttavia migliorare ulteriormente il fit: osserviamo infatti come gliangoli siano stati misurati a partire dal punto di minimo della luminosità, la cuideterminazione porta sempre con sé un errore, che si può ripercuotere negativa-

Page 24: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

24 CAPITOLO 1. PROCEDURE DI FIT

mente sul fit: ingrandendo la figura 1.8 si potrebbe infatti osservare che i datirisultano leggermente spostati verso destra rispetto al risultato del fit.

Conviene allora provare ad introdurre un nuovo parametro, corrispondente ad unpiccolo errore comune a tutti i dati nella determinazione degli angoli.

Stavolta il modello da utilizzare nel fit sarà:I = I? + I0 sin2(� � �)Apparantemente, questa funzione risulta non lineare. Tuttavia è semplicementelinearizzabile con una serie di passaggi: la prima operazione da effettuare è quelladi sfruttare le formule di bisezione degli angoli, in modo daottenere:I = I? + I02 + I02 os(2� � 2�)Si possono inoltre applicare le formule di prostaferesi:I = I? + I02 + I02 os(2�) os(2�)� I02 sin(2�) sin(2�)A questo punto, posto� = I? + I02 , � = I02 os(2�), = � I02 sin(2�), ed inoltres = sin(2�), = os(2�), la funzione assume la forma semplice:I = � + � + sche è lineare, ma dipende da due variabili, e quindi non rientra nei casi esaminatiin precedenza.

Tuttavia, come vedremo, i conti risultano particolarmentesemplici.

Il �2, tenendo conto che gli errori sono uguali per tutte le misure, assume la forma:�2 = Xi (Ii � �� �si � i)2! =�2Ida cui, derivando rispetto ad�, �, , si ottiene:��2�� = 2�2I (Pi Ii � �N � �P si � P i) = 0��2�� = 2�2I (Pi Iisi � �P si � �P s2i � P si i) = 0��2� = 2�2I (Pi Ii i � �P i � �P isi � P 2i ) = 0

Page 25: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO �2 25

Una ulteriore ed importante semplificazione si ha osservando che, avendo effet-tuato le misure ad angoli equispaziati tra di loro nell’intervallo [0; 2�℄, si ha (inquesto caso particolarissimo)

Pi i =Pi si =Pi isi = 0, e quindi:� = Pi Ii=N� = Pi Iisi=P s2i = Pi Ii i=P 2iApplicando la propagazione degli errori si trova inoltre:�2� = �2I=N�2� = �2I=P s2i�2� = �2I=P 2iQueste formule, calcolate sui dati che stiamo analizzando,portano al risultato:� = 9:07 � 0:02; � = �0:33 � 0:02; = �8:8710 � 0:0236Una voltatornati ai parametri fisici, si trova:I0 = 2�p�2 + 2 = 17:75�0:02, I? = �� I02 = 0:20�0:02,� = �12 ar tan � =�0:019� 0:002Il valore del�2 scende bruscamente a 87, per 33 gradi di libertà.

Possiamo adesso porci la domanda: è stata una decisione saggia introdurre unnuovo parametro nel fit? Dobbiamo tenere conto infatti del fatto che l’introdu-zione di nuovi parametri porta sempre, ovviamente, ad un migliore adattamentoai dati, e ad un conseguente abbassamento del valore del�2. Ovviamente c’è unprezzo per questo, ed è l’aumento dell’incertezza sul valore dei parametri. Non haquindi senso continuare indefinitvamente ad introdurre parametri fino ad ottenereuna coincidenza perfetta con i dati.

Tipicamente, l’introduzione di un nuovo parametro è giustificata quando il valo-re del parametro stimato tramite fit risulta significativamente diverso da zero. Inquest’ultimo caso, spesso accade che il valore del�2 del fit diminuisce significa-tivamente, e gli altri parametri subiscono delle variazioni più grandi dell’errorestatistico stimato.

Bisognerebbe evitare però di introdurre un nuovo parametrose questo non pos-siede un chiaro significato fisico. Spesso inoltre conviene verificare tramite uncontrollo indipendente che effettivamente l’introduzione del nuovo parametro ènecessaria: ad esempio, nel caso della quantitàI?, si può verificare come a laserspento la lettura del fotometro è esattamente zero, mentre ruotando il polarimetroa laser acceso la lettura non si azzera mai: quindi evidentemente una piccola parte

Page 26: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

26 CAPITOLO 1. PROCEDURE DI FIT

Figura 1.9: In alto: grafico del terzo fit descritto nel testo sovrapposto ai dati. Inbasso: grafico dei residui

0 50 100 150 200 250 300 3500

5

10

15

20

0 50 100 150 200 250 300 350−1

−0.5

0

0.5

1

Page 27: Capitolo 1 Procedure di fit - INFN Sezione di Padovalunardon/didattica/... · 1.1 Fit col metodo dei minimi quadrati Vediamo in dettaglio il caso in cui la “distanza” corrispond

1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO �2 27

della luce laser riesce ad attraversare comunque il polarimetro, non sappiamo be-ne se per effetto di una non completa polarizzazione del laser o di un difetto delfiltro.

Per quanto riguarda invece l’angolo�, possiamo osservare come l’incertezza nelladeterminazione del minimo nella procedura di allineamentoche ha preceduto lemisure risultava dell’ordine di qualche grado, e pertanto compatibile col valore di� trovato.

A questo punto, l’introduzione di nuovi parametri risulta ingiustificata. Possia-mo però chiederci come mai il valore del�2risulti così alto, e se è ragionevole.Possiamo osservare il grafico dei residui: una cosa in particolare colpisce, ed ènotare come alcuni punti risultano chiaramente sbagliati,e registrano una lumi-nosità chiaramente più bassa degli altri. Questi punti sonomolto probabilmentedovuti a macchie o imperfezioni del polarimetro. Per migliorare la misura, duestrade sono possibile: la prima è quella di pulire accuratamente il filtro e di ripe-tere possibilmente tutte le misure da capo. Se abbiamo nuovamente accesso allostrumento, questa è chiaramente la strada migliore. Se invece non possiamo ripe-tere le misure, allora possiamo decidere di eliminare le misure che presentano unresiduo più alto in valore assoluto, e ripetere il fit. Ad esempio, eliminando le 4misure peggiori4, si ottiene un fit con un�2di 32 per 29 gradi di libertà, che mostracome il modello alla fine sia abbastanza accurato. Ovviamente, diminuendo i datiadoperati, l’errore statistico sul risultato aumenterà.

4Notiamo che molte delle semplificazioni effettuate in precedenza vengono a cadere, ed èquindi necessario rifare alcuni conti.