Teorema del Limite Centrale - Istituto Nazionale di Fisica...

37
Teorema del Limite Centrale Una combinazione lineare W = a 1 X + a 2 Y + a 3 Z + ……. , di variabili aleatorie indipendenti X,Y,Z, ciascuna avente una legge di distribuzione qualsiasi ma con valori attesi comparabili e varianze finite dello stesso ordine di grandezza, all’aumentare del numero delle variabili aleatorie tende ad alla distribuzione normale/gaussiana con valore atteso e varianza rispettivamente pari a: Nota: Il caso di più misure della stessa quantità fatte da diversi sperimentatori cade perfettamente nelle ipotesi del teorema. La definizione della deviazione dalla media s m = s/N 1/2 è dimostrabile attraverso il teorema del limite centrale ... ... 2 2 3 2 2 2 2 2 1 2 3 2 1 z y x z y x a a a a a a s s s s

Transcript of Teorema del Limite Centrale - Istituto Nazionale di Fisica...

Page 1: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Teorema del Limite Centrale

Una combinazione lineare W = a1X + a2Y + a3Z + ……. , di variabili aleatorie indipendenti X,Y,Z, … ciascuna avente una legge di distribuzione qualsiasi ma con valori attesi comparabili e varianze finite dello stesso ordine di grandezza, all’aumentare del numero delle variabili aleatorie tende ad alla distribuzione normale/gaussiana con valore atteso e varianza rispettivamente pari a: Nota: Il caso di più misure della stessa quantità fatte da diversi sperimentatori cade perfettamente nelle ipotesi del teorema. La definizione della deviazione dalla media sm = s/N1/2 è dimostrabile attraverso il teorema del limite centrale

...

...

22

3

22

2

22

1

2

321

zyx

zyx

aaa

aaa

ssss

Page 2: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Nella maggioranza dei casi (ma non in tutti) facendo un istogramma delle misure acquisite si ottiene una curva a campana detta ‘normale’ o Gaussiana.

• Si puo dimostrare che l’istogramma ha una forma Gaussiana quando tutte le sorgenti di incertezza hanno un contributo molto piccolo e casuale • Esistono tuttavia altre curve come ad esempio la Binomiale o la Poissoniana • Poiche la Gaussiana è simmetrica attorno al valore medio allora

Media = Mediana = Moda

1,,

2

1,,

2

2

1

dxxG

exG

x

s

ss s

= Valor Medio (vedi prossimo lucido) s = deviazione standard (vedi prossimo lucido)

Distribuzione Gaussiana o Normale

Page 3: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati (indipendenti) si ottiene una curva ‘normale’ o Gaussiana.

• Si puo dimostrare che l’istogramma ha una forma Gaussiana quando tutte le sorgenti di incertezza hanno un contributo molto piccolo e casuale • Esistono tuttavia altre curve come ad esempio la Binomiale o la Poissoniana • Poiche la Gaussiana è simmetrica attorno al valore medio allora

Media = Mediana = Moda

1,,

2

1,,

2

2

1

dxxG

exG

x

s

ss s

= Valor Medio (vedi prossimo lucido) s = deviazione standard (vedi prossimo lucido)

Distribuzione Gaussiana o Normale

Page 4: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Teoremi

Nel caso di un numero N finito di misure, ripetibili ed indipendenti, che possano essere descritte da una distribuzione gaussiana o nel caso di N valori medi della stessa osservabile allora 1- La migliore stima del parametro è la media 2 – La migliore stima del parametro s è la deviazione standard del campione 3 – L’incertezza relativa sul valore di s è data da

2

2

1

2

1,,

s

ss

x

exG

1

)(1

2

N

xxN

i

i

xss

N

i

ixN

x1

1

)1(2

Ndistimacomedivaloresulincertezza x

sss s

Page 5: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Numero Misure

Incertezza sul valore della s

Page 6: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Nell’ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare una definizione più quantitativa della deviazione standard • Il 68% delle misure cadrà sempre all’interno dell’intervallo • Il 95% delle misure cadrà sempre all’interno dell’intervallo • il 99.7% delle misure cadrà sempre all’interno dell’intervallo

Distribuzione Gaussiana o Normale

ss xx ;

ss 96.1;96.1 xx

ss 3;3 xx

Page 7: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Perche il 68% o il 95% ? Data una gaussiana normalizzata Allora

1,,

2

1,,

2

2

1

dxxG

exG

x

s

ss s

s

s

s

s

s

s

s

s

s

3

3

96.1

96.1

997.0,,

95.0,,

68.0,,

x

x

x

x

x

x

dxxxG

dxxxG

dxxxG

Page 8: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Distribuzione Gaussiana o Normale

Questa proprietà è vera solo ed esclusivamente per una distribuzione Gaussiana. Per altre distribuzioni potranno valere, caso per caso, percentuali differenti Per esempio 1 - Poissoniana con valor medio <x> = 8 e s= 2.8 In un intervallo di più o meno una deviazione standard cadono il 62% dei conteggi 2 - Poissoniana con valor medio <x> = 10 e s= 3.2 In un intervallo di più o meno una deviazione standard cadono il 73% dei conteggi 3 - Poissoniana con valor medio <x> = 5 e s= 2.2 In un intervallo di più o meno una deviazione standard cadono il 74% dei conteggi Nota: Valor medio e deviazione standard sono definite per un qualsiasi set di dati, tuttavia solo per il caso della Gaussiana è possibile dimostrare il legame con i parametri della distribuzione stessa.

Page 9: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Probabilità Integrale – ERF – Funzione degli errori

Come ho fatto a calcolare gli integrali di prima ? Come posso fare per calcolare l’integrale di una gaussiana per altri intervalli di integrazione ? Oppure .. più in generale ? Come faccio a trovare la probabilità che una data misura x0 faccia parte della distribuzione statistica ‘Gaussiana’ che ha valor medio xbest e s ? Il punto di partenza è l’integrale parametrizzato e la funzione ERF

xbest

Page 10: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Probabilità Integrale – ERF – Funzione degli errori

Come ho fatto a calcolare gli integrali di prima ? Come posso fare per calcolare l’integrale di una gaussiana per altri intervalli di integrazione ? Oppure .. più in generale ? Come faccio a trovare la probabilità che una data misura x0 faccia parte della distribuzione statistica ‘Gaussiana’ che ha valor medio xbest e s ? Il punto di partenza è l’integrale parametrizzato e la funzione ERF

s

s

sss

s

s

zxx

zxx

xxsedxdxNota

xxzdovedxxGdxxxGP

best

best

best

best

z

z

xx

xx

best

best

best

0

0

'

best

0

0 x'x-x x':

'0,,',,0

0

Non è una uguaglianza matematica ma una equivalenza dopo un cambio di coordinate. Ricordatevi che una traslazione conserva le differenze

Page 11: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

0xxbest 0xxbest

0

0

,,

xx

xx

best

best

best

dxxxGP s

),,( bestxxP s

s

ss

s

00,,

xxzcondxxGP

best

z

z

Page 12: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Bisogna trovare la funzione ERF = Probabilità entro z-sigma Un possibile modo per trovare la funzione ERF è attraverso lo sviluppo in serie, in particolare:

....)336

1

40

1

6

11(

2)(

...3

2

11

1

2

11

2

12!

2

1)1(

2)(

1

12!

2)1(

2

2

1)(

3

0

12

0

12

2

2

s

s

s

s

s

P

kkP

zsia

kk

z

dxezP

k

k

k

k

k

k

z

z

x

Page 13: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

32.0z

Pagina 289 taylor

Sia per esempio

s

s

s32.0

32.0

0,, dxxGP

Dobbiamo usare la tabella

251.00,,

32.0

32.0

s

s

s dxxGP

Quindi

Page 14: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Quindi: • Data una misura x0 • Data una distribuzione gaussiana con valor medio xbest e deviazione standard s • Sia z = |x0 – xbest|/s = 0.32

Allora ho una probabilità pari all’area esterna alla gaussiana, cioè il 74.9% di probabilità, di trovare una misura uguale o ‘peggiore’ (cioè più lontana da xbest) di x0. Quindi ho il 74.9% di probabilità che x0 appartenza alla distribuzione che ha valore medio xbest e deviazione standard s

%9.74251.010,,1

32.0

32.0

s

s

s dxxGP

NOTA IMPORTANTE Cosa succede se z=1.96 ? In questo caso, ho solo il 5% di probabilità di avere una misura uguale o peggiore di x0, quindi x0 è una ‘cattiva’ misura.

Page 15: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

szsz

.0),0,( sxP

La probabilità di avere una misura uguale o peggiore di x0 si calcola integrando su tutto l’intervallo esterno a partire dal punto in questione (x0) su entrambi i lati della gaussiana

Page 16: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Esercizio: Provate a verificare sulle tabelle se è vero che

68.00,,,,0

0

s

s

ss dxxGdxxxGP

xx

xx

best

best

best

95.00,,,,

2

2

0

0

s

s

ss dxxGdxxxGP

xx

xx

best

best

best

99.00,,,,

58.2

58.2

0

0

s

s

ss dxxGdxxxGP

xx

xx

best

best

best

39.00,,,,

5.0

5.0

0

0

s

s

ss dxxGdxxxGP

xx

xx

best

best

best

Page 17: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Nota importante Nei lucidi precedenti abbiamo definito l’osservabile ‘z’ definita come L’osservabile ‘z’ indica, in questo caso, la distanza della misura x0 dal valor medio in unità di deviazione standard Ovviamente il valore dell’osservabile ‘z’ dipende dalla corretta conoscenza di xbest e della deviazione standard In una distribuzione Gaussiana, noto il valore dell’osservabile ‘z’ è possibile, in qualsiasi caso, calcolare la probabilità di avere una misura di valore uguale o maggiore (in modulo) di x0 attraverso l’uso della proprietà integrale e delle tavole.

Nota: La deviazione standard nella formula di ‘z’ è quella ‘VERA’ non quella misurata ! Nella realtà il valore medio e la deviazione standard sono estratti dalle misure e quindi (soprattutto in caso di poche misure) possono essere differenti da quelli VERI

s

0xxz

best

Page 18: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Nell’ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard • La prossima misura ha il 68 % di probabilità di cadere all’interno dell’intervallo • La prossima misura ha il 95 % di probabilità di cadere all’interno dell’intervallo • La prossima misura ha il 99.7 % di probabilità di cadere all’interno dell’intervallo

La deviazione standard quindi: • E’ una quantità associata alla singola misura • E’ una stima quantitativa della incertezza su una singola misura • E’ una stima quantitativa della dispersione delle singole misure • E’ una stima della larghezza della distribuzione di probabilità delle misure • NON è una stima dell’errore del valor medio ottenuto • NON è una stima dell’incertezza statistica presente nel nostro valor medio • NON dipende dal numero di misure effettuate

• Che variabile statistica quantifica l’errore/incertezza presente nel valor medio ?

Distribuzione Gaussiana - Facciamo un riassunto -

ss xx ;

ss 2;2 xx

ss 3;3 xx

Page 19: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Deviazione Standard della Media

Abbiamo visto precedentemente (e si può dimostrare con il teorema del limite centrale) che l’incertezza a cui è soggetto il valore medio è data dal rapporto della deviazione standard con la radice quadrata del numero di misure effettuate. Altri nomi della Deviazione Standard della media (SDOM) sono:

• Errore Standard • Errore Standard della Media

• La Deviazione Standard della media decresce con l’aumentare del numero di misure

Nxm

sss mediadellastandardDeviazione

Nell’ipotesi di: • Aver effettuato N misure della medesima quantità (misure ripetute ed indipendenti). • NON siano presenti errori sistematici. C’e’ il 68% di probabilità che il valore xvero sia all’interno dell’intervallo (xbest – sm; xbest + sm). Il valore xbest è estratto atrraverso il processo di media. Analogamente per il 95% ed il 99.7% di probabilità con 1.96sm e 3sm

Page 20: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

DEFINIZIONI

La deviazione standard è una stima dell’incertezza sulla singola misura, in altre parole è una valutazione quantitativa delle fluttuazioni casuali e quindi di come si disperdono le singole misure attorno al valore medio. In particolare, nella gaussiana, esiste il 68% di probabilità che una singola misura sia all’interno dell’intervallo (xbest – s; xbest + s)

Deviazione Standard s

Deviazione Standard della Media sm

La deviazione standard della media è una stima dell’incertezza sul valor medio, in altre parole è una valutazione quantitativa di quanto (in assenza di errore sistematico) xbest è lontano da xvero . In particolare, esiste il 68% di probabilità che xvero sia all’interno dell’intervallo (xbest – sm; xbest + sm)

Page 21: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Nota Importante Voglio conoscere il valore di una osservabile attraverso una operazione di misura. Ipotizzo che i dati si distribuiscano secondo una gaussiana attorno al valore medio Effettuo N misure (indipendenti e ripetibili) dell’osservabile.

• Estraggo il valore medio (la migliore stima del valore vero) • Estraggo la deviazione standard del campione (la migliore stima di s) • Estraggo la deviazione dalla media (la migliore stima del mio errore) • Estraggo il valore dell’osservabile ‘z’ • Posso quindi affermare che ho il 68% (z=1) di probabilità che il valore vero sia nell’intervallo (xmedio ± sm) o il 99.7% (z=3) che il valore vero sia nell’intervallo (xmedio ± 3sm)

Tuttavia:

• per estrarre la deviazione dalla media devo usare la deviazione standard, che tuttavia non conosco ma di cui ho una stima (la deviazione standard del campione) non necessariamente corretta. • Come posso stimare l’errore della misura se non conosco il valore vero della deviazione standard ? • Se il numero di misure N è ‘piccolo’ posso aspettarmi che il valore della deviazione standard del campione possa essere molto differente dal valore vero della deviazione standard

s

0xxz

best

Page 22: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Il grafico riporta l’andamento della deviazione standard al variare del numero di misure nel caso di un dado equiprobabile. Il valore ‘vero’ è indicato dalla linea gialla. Osservate che dopo 3-5 tiri la deviazione standard del campione può essere molto differente dal valore vero della deviazione standard Per risolvere questo problema bisogna studiare la distribuzione dell’osservabile ‘z’ quando è estratta usando la deviazione standard del campione di N misure. Questa osservabile è in linea di principio differente dalla ‘z’ e molti libri la definiscono come ‘t’

Page 23: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

La distribuzione dell’osservabile ‘t’ è stata calcolata da William Sealy Gosset, nel 1905 con lo pseudonimo di Student e quindi nella storia passata come “Student’s t distribution” ed è data dalla relazione: Dove G indica una funzione matematica speciale (vedi pg. 196 del Bevington). Nella formula l’osservabile ‘n’ indica il numero di gradi di libertà (n = N-1 se dal medesimo set di dati si estrae anche il valor medio) e l’osservabile ‘t’ è data dalla relazione P(t,n) indica quindi la probabilità di ottenere un determinato t avendo fatto un numero di misure pari a N che corrispondono a n gradi di liberta

2/12

12/

2/11),(

G

G

n

nn

n

nn

ttp

dati dai estratta standard deviazione

dati dai estratto mediovalor 0

xx

xxxt

ss

Page 24: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Nota:

• La distribuzione ha code più lunghe rispetto alla Gaussiana standard

• All’aumentare di N la distribuzione "t" di Student tende alla Gaussiana standard.

0

0.1

0.2

0.3

0.4

-8 -6 -4 -2 0 2 4 6 8

f(t)

t di Student (n=2)

t

gaussiana

n

p=0.1

p=0.1

Notate che, nel caso di tre misure (n=2) la probabilità di ottenere |t| 2 con una distribuzione gaussiana è più bassa (4.6%) che con la distribuzione ‘t Student’ 18.3%. Questo andamento è intuitivo poiché non conoscendo il valore vero di s devo ridurre la predittività della misura

Esempio 2, una probabilità inferiore al 5% (su un dataset di tre misure) la ottengo

con dato che dista circa 4.1 s dal valore medio (non 2s)

Page 25: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

La pagina 266 del Bevington (e la tabella che segue) indicano il valore dell’integrale della distribuzione della ‘t’ di Student nell’intervallo da x1 = <x> - tsx a x2 = <x> + tsx fissato il valore dell’osservabile ‘t’ e del numero di gradi di libertà. Facciamo un esempio: • Vengono fatte n (numero piccolo) misure e si ottiene un valor medio di 5,88 ed una deviazione della media di 0,31 (Il valore atteso è pari a 6.50)

• Nel caso di una distribuzione gaussiana il parametro z assume un valore pari a z = (6.50-5,88)/0.31 = 2, in altre parole il valor medio misurato dista due deviazioni standard della media misurate dal valore atteso. • Se la deviazione standard misurate fosse esattamente quella vera (e quindi anche la deviazione dalla media) potremmo dire che esiste il 4.55 % di probabilità che la distanza tra il valore misurato ed il valore atteso sia dovuto alle fluttuazioni statistiche • la misura, tuttavia, ha dato solo una stima, non necessariamente precisa, della deviazione standard. Lo sperimentatore NON conosce il vero valore di s

• Questo è il tipico caso in cui è utile la distribuzione della ‘t’ Student

Page 26: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Quindi: L’osservabile ‘z’ è una variabile statistica definita come Dove la deviazione standard stot indica la deviazione standard ‘vera’ , quindi non nota a meno di fare infinite misure, della differenza (<x> - x0) Come per tutte le variabili statistiche quindi ‘z’ sarà nota con una certa precisione, questa dipende soprattutto dalla precisione con cui si conosce stot Ogni affermazione statistica che fa uso della variabile ‘z’ deve tenere conto del fatto che ‘z’ può avere una sua incertezza, quindi nel caso della stima della probabilità di una gaussiana: Se ho un elevato numero di misure - Posso considerare s misurata praticamente uguale alla s vera e quindi usare la probabilità integrale della gaussiana (osservabile z)

-Se ho poche misure - E’ possibile che la s misurata sia differente dalla s vera, quindi per tenere conto di questa incertezza non devo usare la probabilità integrale gaussiana ma la tabella della ‘t’ di Student

tot

xxz

s

0

Page 27: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

La tabella degli integrali della distribuzione ‘t Student’ (distribuzione a due code) per t = 2 La tabella ERF mi dice che P(z=2) = 4.6% (ma non è necessariamente vero che t=z) Notate che si usa z per la gaussiana e t per ‘Student’ Notate che per un numero infinito di misure t=z (le due distribuzioni sono uguali) Notate che il risultato dipende dal numero di misure Notate che la tabella fornisce la compatibilità o meno tra valori medi o tra una media e un valore atteso. In altre parole indica la probabilità entro il quale ci aspettiamo che il valore atteso sia entro due sigma o sigma-m

Gradi di Liberta Numero Misure Probabilità che la differenza dal valor medio sia una fluttuazione statistica (t=2)

2 3 18.3 %

3 4 13.9 %

4 5 11.6 %

5 6 10.2 %

8 9 8 .0%

10 11 7.3 %

20 21 5.9 %

50 51 5.1 %

infinite Infinite 4.6 %

Page 28: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

La tabella C.8 pg 266 del Bevington Notate che se (con tre misure) ottengo t = 2 allora ho una Probabilità di 1-0.817 = 18.3% che le misure appartengano alla distribuzione statistica attesa

Page 29: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Cosa bisogna fare quando ho poche misure: Esempio: ho 4 Misure che mi hanno dato un valore medio di 5.32 ed una deviazione standard della media 0.17. Voglio verificare la compatibilità di questo risultato con un valore atteso di 4.92. • La funzione ERF della gaussiana (‘z’), poiché costruita con la deviazione standard del campione non

produce le corrette probabilità • Estraggo l’osservabile ‘t’ usando la deviazione standard misurata

• tstud = (5.32 – 4.92)/0.17 = 2.35 • Utilizzando la tabella della ‘t di Student’ trovo la probabilità associata alla ‘t’ ottenuta

• P(esterna,tstud=2.35) = 1 – 0.90 = 0.1

• Ricavo la probabilità equivalente a 0.1 = 10% con la funzione ERF gaussiana • P(gaussiana-esterna)= 10% -> zgauss = 1.64

• Eseguo tutti i ragionamenti di compatibilità come se la ‘t’ ricavata dai miei dati sperimentali fosse 1.64

• Poiché zgauss < 2 allora il dato sperimentale è compatibile con il valore atteso • Ho il 10% di probabilità che la differenza tra la mia misura e il valore atteso sia di origine

statistica e quindi lo accetto

• Se non avessi usato la distribuzione di ‘Student’ avrei concluso che non ci fosse compatibilità tra il dato sperimentale e quello atteso . La bassa statistica invece rende la misure compatibili

Page 30: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

GDL tgauss se tstud = 1 tgauss se tstud = 2 tgauss se tstud = 3

2 ~ 0.80 ~ 1.33 ~ 1.67

3 ~ 0.86 ~ 1.48 ~ 1.90

4 ~ 0.89 ~ 1.57 ~ 2.06

5 ~ 0.91 ~ 1.64 ~ 2.17

6 ~ 0.92 ~ 1.68 ~ 2.26

8 ~ 0.94 ~ 1.75 ~ 2.39

10 ~ 0.95 ~ 1.79 ~ 2.48

12 ~ 0.96 ~ 1.82 ~ 2.54

16 ~ 0.97 ~ 1.86 ~ 2.63

20 ~ 0.98 ~ 1.89 ~ 2.69

50 ~ 0.99 ~ 1.95 ~ 2.87

Morale: Se avete poche misure (i.e. 4 -> 3 GDL) e volete un risultato ad un C.L. 99.7% (a tre sigma gaussiane) allora la vostra tstud deve essere pari a circa 9.2. Quindi l’intervallo diventa enorme e poco utile. Per avere risultati a 3 sigma gaussiane bisogna fare ‘molte’ misure http://www.tutor-homework.com/statistics_tables/statistics_tables.html

Page 31: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Esercizio: Uno studente misura l’accelerazione di gravità, g, cinque volte con i seguenti risultati Trovare il valor medio, la deviazione standard e l’errore sulla misura di g. Calcolare con che probabilità la differenza tra il valore misurato e quello atteso possa essere ricondotta ad una fluttuazione statistica (usate un limite di confidenza del 20%). Fate queto conto usando la proprietà integrale della gaussiana e con le correzioni date dalla distribuzione della ‘t di Student’

9.90 m/s2

9.60 m/s2

9.50 m/s2

9.70 m/s2

9.80 m/s2

Page 32: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

In questo caso l’osservabile t = (9.806 – 9.70)/0.08 = 1.33 Secondo l’integrale Gaussiano ho una probabilità del (1-0.8165) = 18.4 % che la differenza tra la misura ed il valore atteso sia una fluttuazione statistica. Secondo la distribuzione di student la probabilità è di circa 26.7 % Morale: la misura è compatibile entro un intervallo di confidenza del 20%

Page 33: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Esercizio Dopo aver misurato la velocita del suono v molte volte, uno studente conclude che la deviazione standard sv è pari a 10 m/s. Assumendo che tutte le incertezze siano casuali, lo studente puo’ raggiungere una precisione desiderata facendo un numero sufficiente di misure e mediando. Quante misure sono necessarie per avere un errore sulla velocità del suono pari a 3 m/s ? Quante misure sono necessarie per avere un errore sulla velocità del suono pari a 0.5 m/s ?

113

10

/10/3

22

m

m

m

N

smsm

N

s

s

ss

ss

4005.0

10

/10/5.0

22

m

m

m

N

smsm

N

s

s

ss

ss

Page 34: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Attenzione L’errore finale su una qualsiasi quantità non puo essere di molto inferiore alla sensibilità strumentale. Altrimenti sarebbe possibile raggiungere precisioni NON fisiche semplicemente ripetendo le misure più e più volte indipendentemente dallo strumento utilizzato. Esempio: Vogliamo misurare la lunghezza di un tavolo con un metro a nastro con tacche da 1 mm. La sensibilità strumentale è di circa 0.5 mm.

• Eseguendo 9 misure otteniamo un valor medio di 178.2 mm con una deviazione standard di 1.2 mm.

• La deviazione della media è di 0.4 mm dello stesso ordine di grandezza della sensibilità strumentale.

• Non ha il minimo senso fare più misure, tanto l’errore sul valor medio non potrà essere ridotto in maniera significativa.

• questo anche se la matematica ci dice che misurando 9000000 volte

potremmo ottenere una precisione di 0.0004 mm (del decimillesimo di millimetro).

Page 35: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Esempio: Vogliamo misurare la posizione di una massa appesa ad una molla con un sensore ad ultrasuoni con la sensibilità di 0.5 millimetri. A cause di tutte le influenze esterne la massa non è mai ferma ma oscilla leggermente in tutte le direzioni. Queste oscillazioni casuali rendono ovviamente la misura meno precisa.

• Eseguendo 9 misure otteniamo un valor medio di 67.2 mm con una deviazione standard di 3.2 mm.

• La deviazione della media in questo caso è di 1.1 mm, valore superiore (più che doppio) alla sensibilità strumentale.

• In questo caso, potrebbe essere utile arrivare a circa 50 misure. In questo modo la deviazione dalla media sarebbe 0.45 mm. • In questo caso l’effetto delle fluttuazioni casuali è dominante rispetto alla sensibilità strumentale. Effettuare più misure, quindi, giova per aumentare la precisione della misura.

Page 36: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

Livello di confidenza

Abbiamo visto che nel caso di un numero infinito di misure ripetibili ed indipendenti che si distribuiscano secondo una gaussiana il 68 % dei dati sperimentali deve cadere all’interno di una deviazione standard. In altre parole abbiamo un “livello di confidenza” che, eseguendo una misura più volte, nel 68% dei casi il risultato cadrà entro una deviazione standard. Spesso, ma non sempre, si sceglie la deviazione standard, un livello di confidenza del 68%, come riferimento. Ovviamente questo non vale per una distribuzione poissionana o piatta. Per distribuzioni non gaussiane si fa il viceversa, si dice [x1, x2] al 95% C.L. Questo significa che il 95% delle misure cadono nell’intervallo [x1, x2] In generale quando la misura è molto più piccola dell’errore (esempio 0.2 ± 12) anche se la distribuzione è gaussiana si usa il livello di confidenza - ad esempio [-11.8, 12.2] 68% C.L.

Page 37: Teorema del Limite Centrale - Istituto Nazionale di Fisica ...camera/lab-fisica/dispense/4-gaussiana...In tutti i casi facendo un istogramma dei valori medi ottenuti in N prese dati

E’ tutto Chiaro ?

Dovreste aver chiari i seguenti argomenti: • Deviazione standard della media • Differenza tra la deviazione standard e la deviazione standard dalla media • Gaussiana • Distribuzione di ‘t’ di Student • Errore minimo • Livello di Confidenza