Laboratorio Nozioni di statistica - Istituto Nazionale di...

20
Laboratorio di Fisica per Scienze Naturali Laboratorio di Fisica per Scienze Naturali 1 1 - - Elementi di Statistica e di teoria degli errori Elementi di Statistica e di teoria degli errori

Transcript of Laboratorio Nozioni di statistica - Istituto Nazionale di...

Page 1: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Laboratorio di Fisica per Scienze NaturaliLaboratorio di Fisica per Scienze Naturali1 1 -- Elementi di Statistica e di teoria degli erroriElementi di Statistica e di teoria degli errori

Page 2: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Misura di una grandezza fisica e suo errore

Tipi di misureLe misure di una grandezza fisica possono venire classificate come:

• misure dirette: la grandezza fisica e’ misurata mediante un confronto con un'altra della stessa specie, assunta come campione.

Esempio: misura dell’ allungamento di una molla con un regolo graduato (Esperienza 1a)

• misure indirette, la grandezza fisica e’ dedotta da una legge fisica nota y = f(x1, x2,...xm) di cui alcune xi sono note ed alcune xj sono misurate. Da queste, sostituendone i valori nella legge data, si ricava la misura di y;

Esempio: misura della costante di elasticità di una molla mediante la misura del periodo di oscillazione (Esperienza 1b)

• misure con apparecchi tarati. La misura della grandezza si ottiene mediante la lettura della posizione di un indice su una scala graduata, o di un numero su un quadrante.

Esempio: misura del coefficiente di viscosità di un fluido mediante viscosimetro tarato (Esperienza 2).

In questo caso la misura e’ diretta ma e’ necessaria una taratura spesso complessa dello strumento

Page 3: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Errori di misuraErrori di misuraQuando si effettua una misura, si commette un errore, di cui è desiderabile valutare l'entità.

Errore assoluto. La misura è sempre pensabile come la somma algebrica di un valore "vero" (non noto) della grandezza e di un errore (errore assoluto) che può modificare il valore della grandezza in più o in meno.

Pertanto il risultato di ogni misura sperimentale y di una grandezza fisica Y si esprime in generale come:

y ± ∆y

• y e’ il valore più probabile della grandezza fisica Y

• ∆y e’ l’ errore assoluto di misura e rappresenta l’ incertezza della misura sul valore vero

Il valore della grandezza fisica non e’ pertanto nota, ma si assume che sia compreso nell’ intervallo di errore.

Errore relativo E’ il rapporto tra il modulo del rapporto tra l’ errore assoluto e il valore di misura

Errore relativo = |∆y/y|

Rappresenta in modo forse più significativo errore la accuratezza della misura, che, per essere significativa deve avere un errore relativo <<1 .

L' accuratezza di una misura indica la vicinanza della misura al valore vero della grandezza in esame. L 'errore assoluto o quello relativo rappresentano pertanto una misura dell'accuratezza

La precisione rappresenta invece l'accordo di una serie di misure fra loro ed è un indice della riproducibilità di una misura. Non è riferibile ad una misura singola, ma a una serie di misure.

Misure molto precise forniscono dunque dati poco "dispersi"; viceversa una grande dispersione dei dati indica scarsa precisione del set di misure e quindi del metodo utilizzato per la misurazione.

.

Page 4: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Accuratezza, precisione e Accuratezza, precisione e sensibilita’sensibilita’

Misure “Vere”

Alta accuratezza e precisione

Scarsa precisione Alta accuratezza

Alta precisione Scarsa accuratezza

La sensibilità di uno strumento o metodo di misura è legata al concetto di minima variazione del valore della grandezza in esame, apprezzabile con lo strumento stesso. Per quantificare questo concetto chiamiamo x il valore della grandezza e S il corrispondente "segnale" dato dallo strumento (p. es: lo spostamento di un indice su una scala).

Sia poi ∆x una piccola variazione di x, a cui corrisponderà un ∆s. La sensibilità può essere definita come S =∆s/ ∆x; ad esempio, un voltmetro può avere una sensibilità di 1 Volt/mm.

Altre volte ci si esprime invece usando l'inverso, ossia S’ =∆x/ ∆s

Page 5: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Errori sistematiciErrori sistematici

Nelle misure con strumenti e metodi di elevata sensibilità, se si effettuano misure ripetute si ottengono valori tutti un po' diversi fra loro: emergono infatti errori casuali o accidentali, eventualmente sovrapposti a errori sistematici.

Entrambi i tipi di errore influenzano ogni misura in modo non noto.

Gli errori sistematici agiscono sempre nello stesso verso e si verificano per :

Ad esempio: un regolo graduato che ha lo zero un spostato (errore sistematico costante); un'asta che dovrebbe essere verticale non lo è perfettamente; un regolo graduato è leggermente incurvato, ecc...

Contro gli errori sistematici non si può fare altro che migliorare metodi, strumenti, teorie ed effettuare misure della stessa grandezza con più metodi diversi, in modo da poterle confrontare criticamente.

Gli errori sistematici in generale influenzano l'ac curatezza di una misura.

Page 6: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Errori sistematiciErrori sistematiciGli errori accidentali o casuali sono dovuti al verificarsi di varie circostanze che, ripetendo le misurazioni in condizioni presupposte identiche, agiscono occasionalmente ora in un verso, ora in un altro, in modo stocastico ossia indefinibile ed imprevedibile.

Generalmente ciò che accade è che fenomeni di vario genere vengono a sovrapporsi in modo irregolare al fenomeno in esame, influenzando i risultati della misura in maniera incontrollabile. Esempi: differenze accidentali di temperatura fra le varie parti di uno strumento producono deformazioni mutevoli...variazioni casuali dell'ambiente esterno, dello stato dell'aria circostante, dell'illuminazione, ecc., errori di valutazione dello sperimentatore

Gli errori casuali hanno la caratteristica di essere irregolari e per lo più risultanti dalla somma algebrica di molti errori elementari agenti simultaneamente, con ugual probabilità, in entrambi i versi, positivo e negativo.

Anche se non c’ è modo di annullarli, e’ possibile minimizzarli con la ripetizione delle misurazionie applicando poi i risultati della teoria degli errori (che è una teoria statistico - probabilistica, adatta appunto agli errori dovuti al caso), in modo da giungere ad affermazioni di questo tipo:

il valore della grandezza (nella unità scelta) si può ritenere compreso nell'intervallo fra x + ∆x e x - ∆x, dove ∆x è una misura di errore.

Ad esempio:

la lunghezza di un ponte e’ l 300 ± 1 m

ovvero:

la lunghezza del ponete e’ 299 < l < 301 m

Page 7: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Errori casualiErrori casuali

Di solito questa affermazione è accompagnata dalla probabilità con cui il valore "vero" si può pensare contenuto nell'intervallo dato (livello di fiducia).

Gli errori accidentali influenzano in generale la p recisione della misura.

Nella discussione che segue non discuteremo di eventuali errori sistematici e ci occuperemo unicamente degli errori casuali.

Con strumenti a sensibilità limitata, come certi strumenti tarati a lettura diretta (in cui si legge sulla graduazione il valore della grandezza), può accadere che ripetendo la misura, si ottenga sempre lo stesso valore, perché gli errori casuali sono di entità inferiore alla minima variazionedella grandezza apprezzabile con lo strumento stesso.

La variazione minima apprezzabile (ossia l'intervallo minimo leggibile sulla graduazione, che il costruttore avrà progettato in maniera opportuna), viene assunta come errore della misura.

Page 8: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Da quanto detto sugli errori casuali, si deduce che ogni misura (sia x) di una grandezza fisica X (ossia il risultato di una operazione di misurazione di X) può essere considerata come una variabile casuale, che ha una probabilità p(x) di assumere, nella data misura, il determinato valore x all’ interno di un insieme di valori possibili.

La quantità p(x) detta distribuzione di probabilità e’ una funzione che rappresenta la probabilità che la misura di X sia compresa tra il valore x e x+dx ed ovviamente

dato che l’ integrale rappresenta la probabilità che la misura assuma un valore qualsiasi.

In generale la funzione p(x) e’ diversa a seconda della misura effettuata ed in generale non e’ nota a priori. E’ tuttavia ragionevole assumere che la probabilità di ottenere una certa misura sia più alta in prossimità del valore vero e ci aspettiamo pertanto che la distribuzione di probabilità abbia andamenti come in figura:

Concetto statistico di misuraConcetto statistico di misura

1)( =∫x dxxp

Valore vero

p(x)

x

Distribuzione asimmetricaDistribuzione simmetrica

Figura 1 Grafico di due funzioni di distribuzione

Page 9: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Distribuzione “normale”Distribuzione “normale”Di particolare importanza la distribuzione “normale” che ha l’ andamento in Figura 2 e e’ rappresentata dalla funzione matematica :

Figura 2 Distribuzione gaussiana

La distribuzione ha un andamento simmetrico, un picco per x = µ una larghezza a semi ampiezza σ e

La “dispersione” della funzione di distribuzione e’ pertanto proporzionale a σ.

Si può dimostrare che questa distribuzione di probabilità rappresenta accuratamente la distribuzione degli errori casuali in insiemi molto grandi di misure.

∫+∞

∞−

=1)( dxxp

Page 10: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Parametri medi di insiemi di datiParametri medi di insiemi di datiLe proprietà insiemi di misura sono descrivibili in termini di parametri medi sull'insieme; i più semplici di queste

• il valor medio della distribuzione

• la varianza della distribuzione pari alla media dei quadrati degli scarti dalla media.

La quantità σx , radice quadrata della varianza è detto scarto quadratico medio o deviazione standard.

∫ ⋅= dxxpx )(

∫ ⋅−= dxxpxx )()( 2_

Per una distribuzione normale,

• il valor medio della distribuzione rappresenta il valore più probabile della variabile misurata

• lo scarto quadratico medio della distribuzione fornisce un’ indicazione sulla probabilità che il valor medio si trovi entro un certo scarto dal valor vero. In particolare questa probabilità e’

• il 68% per σx

• il 95% per 2σx

• il 99% per 3σx

Page 11: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Media e Media e varianzavarianza empiricaempirica

La media empirica è essa stessa una variabile casuale ed è tale che il suo valor medio coincide col valor medio di x:

La varianza della x risulta essere

Per cui la varianza della media empirica risulta essere:

e la deviazione standard della media empirica è

pertanto se N è grande.

Page 12: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Media e Media e varianza varianza empirica di misure ripetuteempirica di misure ripetuteIl calcolo di questo tipo di medie richiede la conoscenza delle leggi della probabilità associate alla variabile casuale che si misura; in particolare per calcolare valor medio e varianza occorre conoscere la funzione p(x) che esprime la probabilità che un dato valore tra x - x+ dx si verifichi.

Nella pratica normalmente queste leggi non sono note; si pone cosi il problema di stimare empiricamente le medie stesse, ossia determinarne dei valori plausibili mediante le informazioni di cui si dispone.

Se dall'insieme dei valori possibili di x si traggono N valori (cosa fattibile effettuando N misure xi) si può, definire la quantità

che è detta media empirica, ed assumere come errore assoluto associato alla singola misura la deviazione standard empirica :

Assumendo che gli errori di misura seguano una distribuzione normale, si può assumere che il 68% delle misure siano all’ interno di una deviazione standard dalla media.

Il parametro utilizzato come stima dell’ errore associato al valor medio di una misura e’ lo scarto quadratico medio rispetto alla media, che si può dimostrare vale:

)1(

)(1

2_

_

−=∑

NN

xxs

N

i

x

sx

Page 13: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Frequenza assoluta e relativa di misure ripetuteFrequenza assoluta e relativa di misure ripetute

∑∑

−=−

−=

N

ii

N

i

x xxfN

xxs

1

2_

1

2_

)(1

)(

Page 14: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Istogramma delle frequenze di misure ripetuteIstogramma delle frequenze di misure ripetuteUn istogramma ad intervalli e’ un grafico che rappresenta la frequenza di ripetizione di misure che cadono nello stesso intervallo.. Ad esempio le età di un gruppo di 346 persone si distribuiscono come mostrato in tabella, l’ istogramma delle frequenze e’ mostrato in figura

0.053

0.106

0.159

0.212

0.265

0.318

0.

Fre

quen

ze r

elat

ive

Page 15: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Istogramma delle densità di frequenzeIstogramma delle densità di frequenze

L’ istogramma delle densità di frequenze e’ pertanto direttamente confrontabile con una funzione di distribuzione di probabilità normalizzata a 1

L’ istogramma della diapositiva precedente e’ un istogramma delle densita’ di frequenze, dato che che si e’ scelto un intervallo δx = 1 (anno)

Page 16: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

3. Calcolare e graficare le densità di frequenza di ciascun intervallo Fi= fi/δx in modo da ottenere una distribuzione sperimentale di frequenze normalizzata a 1

4. Calcolare il valor medio e lo scarto quadratico medio σx della distribuzione ed indicarlo sul grafico

5. Utilizzando i valori e σx calcolare e graficare la funzione di distribuzione normale relativa ai dati. Se i dati sono stati correttamente normalizzati il risultato finale dovrebbe apparire come in figura.

Costruzione di un istogramma Costruzione di un istogramma 1. Ottenuto un insieme di N misure x1, x2, ….. xN, calcolare l’ intervallo massimo di dispersione dei dati

δx = xmax – xmin

2. Scegliere l’ intervallo dell’ istogramma ∆x (bin) dividendo l’ intervallo massimo per un numero intero n. Come regola indicativa:

per N >100

per N < 100

Nn 2≈Nn log10 ⋅≈

_

x

_

x

Page 17: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Costruzione di un istogrammaCostruzione di un istogramma

Si fa notare l’ approssimazione di un istogramma alla funzione di distribuzione e’ tanto migliore quanto e’ maggiore il numero di dati (Figura 1).

Una “statistica povera” e’ in generale motivo di una scarso fit alla funzione di distribuzione (Figura 2).

Effetti come in Figura 2 possono anche suggerire la presenza di un errore sistematico nelle misure, che provocano la dispersione dei dati in due picchi adiacenti.

Figura 1 Figura 2

Page 18: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Ricerca di leggi empiriche (Massima verosimiglianza )Ricerca di leggi empiriche (Massima verosimiglianza )

Si consideri un fenomeno che determina una corrispondenza fra una variabile x ed una variabile y. Se si riportano le misure (xi,yi) su un diagramma cartesiano x-y si ottiene un grafico come in Figura 1. La curva sperimentale non e’ una curva continua ma una sequenza di punti Pi (xi,yi).

Si vuole determinare una espressione analitica y= f(x) che meglio approssima i dati (best fit). Ad esempio, nella 1a esperienza del Laboratorio il risultato della misura può essere rappresentato dal grafico

che suggerisce una dipendenza del tipo y = a0+a1x tra le due variabili. Il problema e’ dunque di determinare le costanti a0 e a1 per il best fit.

0 20 40 60 80 1000

0.2

0.4

0.6

0.8

1

0

y i

10010 xi

xi

1019

28

37

46

55

64

73

82

91

100

= yi

00.1

0.2

0.33

0.41

0.59

0.58

0.7

0.83

0.87

1

=

Page 19: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Ricerca di leggi empiriche (Massima verosimiglianza )Ricerca di leggi empiriche (Massima verosimiglianza )

Si puo’ dimostrare che la curva che meglio approssima i dati sperimentali e quella i cui parametri a0 e a1 rendono minima la quantità :

Perché questo avvenga e’ necessario che

che e’ un sistema di due equazioni in due incognite a0 ed a1 con soluzione:

210

1

)]([ i

N

ii xaayS +−=∑

=

0)]-[21

100∑

=

=+=∂∂ N

ii xa(ay

a

S

0]x-[21

i101∑

=

=+=∂∂ N

iii )xa(ay

a

S 0

0

1 1

210

1 110

=−+

=−+

∑ ∑

∑ ∑

= =

= =

N

i

N

iiii

N

i

N

iii

yxxaa

yxaNa

a00

N

i

yi∑

= 0

N

i

xi( )2

∑=

0

N

i

xi∑

= 0

N

i

xi

yi

⋅( )∑=

N 1+( )

0

N

i

xi( )2

=

0

N

i

xi∑

=

2

:= a1

N 1+( )

0

N

i

xi

yi

⋅( )∑=

0

N

i

xi∑

= 0

N

i

yi( )∑

=

N 1+( )

0

N

i

xi( )2

=

0

N

i

xi∑

=

2

:=

1)

2)

3)

Page 20: Laboratorio Nozioni di statistica - Istituto Nazionale di ...personalpages.to.infn.it/~zaninett/pdf/esperienza_statistica.pdf · Laboratorio di Fisica per Scienze Naturali 1 -Elementi

Utilizzando i dati precedenti e le 3) si ottiene:

e la retta di massima verosimiglianza z = a0+a1x

che e’ confrontata con i dati in figura

Ricerca di leggi empiriche (Massima verosimiglianza )Ricerca di leggi empiriche (Massima verosimiglianza )

a0 0.107−= a1 0.429=

0 20 40 60 80 1000

0.2

0.4

0.6

0.8

1

1.21.005

0

y i

zi

10010 xi