Corso di biomatematica lezione 4: La funzione di Gauss Davide Grandi.
-
Upload
ferdinanda-pisani -
Category
Documents
-
view
220 -
download
0
Transcript of Corso di biomatematica lezione 4: La funzione di Gauss Davide Grandi.
Corso di biomatematica Corso di biomatematica lezione 4:lezione 4:
La funzione di GaussLa funzione di Gauss
Davide Grandi
Sommario•Distribuzione di Gauss:•Rappresentazione matematica•integrali•valor medio•Stima della varianza•Somma in quadratura
Distribuzioni continue
Davide Grandi - Dottorato in Biologia
• Funzione di distribuzione normale o di Funzione di distribuzione normale o di GaussGauss
Partendo dall’idea di distribuzioni limite, abbiamo il
passaggio da una serie di valori discreti ad una funzione
continua (distribuzione di probabilità).Quindixi f(x)quindi avremo che f(x)dx saranno le misure
che cadono in un intervallo compreso tra x e x+ dx La sommatoria si sosituirà con l’integrale
Distribuzioni continue
Davide Grandi - Dottorato in Biologia
• Funzione di distribuzione normale o di Funzione di distribuzione normale o di GaussGauss
E avremo in particolare il valor medio
Ed inoltre la varianza sarà
Corrispondente allo scarto quadratico medio (detti i
gli scarti)
dxxxfx )(
dxxfxx )()( 22
N
i2
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
Valore vero di una grandezza: quello a cui ci si avvicina
sempre più facendo un gran numero di misure (vedi esempi
dei dadi)Se le misure sono soggette ad errori casuali
“piccoli” e posso trascurare gli errori sistematici, la loro
distribuzione può assumere la forma di una campana centrata
sul valore più probabile, in altre parole da funzione di
distribuzione di probabilità che meglio approssima la mia
distribuzione di dati può essere la funzione di Gauss:
expmx
2
)(2
2
21)(
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
La curva è centrata sul valore x=m ed in corrispondenza di
esso assume il valore
La funzione è normalizzataposso partire dalla distribuzione
e trovare il coefficiente di normalizzazione dalla condizione
21
Nexfmx
2
)(2
2
)(
1)(
dxxf
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Teorema del limite centraleTeorema del limite centraleLe medie di campioni di dimensioni n
sufficientemente grandi estratti da una popolazione
comunque distribuita, seguono la legge di distribuzione normale
con media m e varianza 2/nDa questo si deduce immediatamente
l’importanza di studiare la distribuzione normale o
gaussianaIl teorema si può utilizzare anche nel limite
della somma di un numero relativamente piccolo di
variabili, dell’ordine della decina
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Integrali della funzioneIntegrali della funzioneL’integrale della funzione di Gauss non è
risolvibile matematicamente, ma attraverso metodi
numerici. La probabilità che una variabile aleatoria cada
in un intervallo centrato su m (valor medio) di larghezza è
data da:
dxxp
m
m
)(
m
m
dxmx
e 2
)(2
2
21
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Integrali della funzioneIntegrali della funzioneNel grafico si vede la probabilità che la mia
variabile aleatoria cada in un intervallo di larghezza
t centrato sempre sul valo medio m
Questo corrisponde al un limite di confidenza del 68% t=1,95% t=2 etc.
dxxp
tm
tm
)(
tm
tm
dxmx
e 2
)(2
2
21
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Integrali della funzioneIntegrali della funzioneRicapitolando:Probabilità che le misure siano comprese
tra 1. m – e m+ 68,27%2. m – 2 e m+ 2 95,45%3. m –3 e m+ 3 99,73%
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Distribuzione standardizzataDistribuzione standardizzataEseguendo la sostituzione X=(x – m)/
riduco alla stessaforma tutte le distribuzioni normali,
rendendo m=0 il valor medio (distribuzione centrata nello zero) e
prendo come unità di misura, ovvero ho una distribuzione con Gli scarti x – m diventano scarti ridotti (x – m)/ e la probabilità sarà
expx2
2
21)(
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Utilizzo distribuzione standardizzataUtilizzo distribuzione standardizzataricordiamo che ora abbiamo lo scarto
standardizzatoz=(x – m)/ • Data una popolazione di pesci di
lunghezza media m=35 cm e deviazione standard =5 cm
Calcoliamo la probabilità di averel 40 (a destra di z=1)l<40 (a sinistra di z=1)l<25 (a sinistra di z= – 2)l 40 e l 50 (tra z=1 e z=3)l 30 e l 40 (tra z=– 1 e z=1)
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Utilizzo distribuzione standardizzataUtilizzo distribuzione standardizzataSapendo che area sottesa tra m e z=+1 è 34,13%a sinistra z= – 2 2,28%Avremo….
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Utilizzo distribuzione standardizzataUtilizzo distribuzione standardizzataSapendo che area sottesa tra m e z=+1 è 34,13%a sinistra z= – 2 2,28%
Avremo….l 40 (a destra di z=1)
15,87%l<40 (a sinistra di z=1)
84,13%l<25 (a sinistra di z= – 2)
2,28%l 40 e l 50 (tra z=1 e z=3)
15,73%l 30 e l 40 (tra z=– 1 e z=1)
68,26%
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Applicazione alle distribuzioni discreteApplicazione alle distribuzioni discreteMolte distribuzioni discrete sono
approssimate dalla distribuzione gaussianaLe distribuzioni discrete forniscono
probabilità per singoli valori, cioè la probabilità di ottenere
esattamente il numero x, mentre con le distribuzioni continue si
calcola l’area sottesa, quindi per applicarlo a distribuzioni
discrete si deve omeglio “dovrebbe” calcolare l’area sottesa
nell’intervallo x 0,5
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Media come migliore stimaMedia come migliore stimaNon essendo mai nota la funzione f(x)
eventualmente gaussiana, abbiamo solo a che fare con le
misure (discrete){x1, x2, x3,……xn}e vorrei arrivare alla miglior stima di XSe fossero noti X e potrei risalire alla f(x)
e quindi anche alla probabilità di ottenere i valori x1, x2, x3,
……xn
Ovvero per ottenere x compreso tra x1 e x+dx1 abbiamo
dxedxxxxPXx
11 2)1(
112
2
21)(
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Media come migliore stimaMedia come migliore stimaSemplificando avremo
La probabilità di ottenere l’intero insieme di N valori sarà il
prodotto delle probabilità, quindi
exPXxN
N 2
)(2
2
1)(
exxPXxi
NNX 2
)(
1,2
2
1).....(
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Media come migliore stimaMedia come migliore stimaLe stime migliori per X e sono quelle più
probabili, ovvero quelle che massimizzano P(x..), cioè
dobbiamo minimizzare l’esponente, quindi dovremo avere
Ovvero
da cui
02
2
1
N
ii Xx
02
1
N
ii Xx XN
xiN
i 1
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Media come migliore stimaMedia come migliore stimaLa stima migliore per si ottiene derivando
rispetto a e ponendo la derivata uguale a zero, quindi
O sostituendo il valor medio al valore vero
N
XxN
ii
2
1
N
xxN
ii
2
1
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Stima dello scarto quadratico medioStima dello scarto quadratico medioPartendo da una serie di dati vogliamo
confrontarci con la distribuzione gaussiana, ovvero stimare i
parametri che la caratterizzano (m e ).Ricordiamo l’errore di una singola misura:
Dove zi è lo scarto dalla media della misura i-esima, al
quadrato avrò
zii
zzz iiii 2222
2
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Stima dello scarto quadratico medioStima dello scarto quadratico medioSommando otteniamo
Divido per N otteniamo
Ora abbiamo che (distribuzione gaussiana)
222 Nzii
222
2 Nz
Nii
2
222
NNii
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Stima dello scarto quadratico medioStima dello scarto quadratico medioOvvero
Ed infine
N
2
2
NN
zi 22
2
1
22
Nzi
1
2
Nzi
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Stima dello scarto quadratico medioStima dello scarto quadratico medioInoltre dalla relazione
Deduco l’errore della media che sarà dunque
E non semplicemente
N
2
2
)1(
2
NNzi
x N
i
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Somma in quadraturaSomma in quadraturaPer introdurre la propagazione degli errori
vediamo come ad esempio stimare l’errore nella misura di
una grandezza Z=X+Y date le misure delle due grandezze
X e Y e le rispettive deviazioni standard sono x e y .Date le due distribuzioni di probabilità
avremo:eyP y
Y2
)(2
2
)(
exP x
X2
)(2
2
)(
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Somma in quadraturaSomma in quadraturaEssendo X e Y misurati indipendentemente,
la probabilità di ottenere X e Y è data dal prodotto delle
due, ovvero:
Ora possiamo calcolare la probabilità di ottenere X+Y si può
dimostrare che:
eyxP yx
YX
2
2
2
2
2
1
),(
eyxP
Zyx
YX
2)22(2
22
),(
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Somma in quadraturaSomma in quadraturaCioè che vale
Da cui
ovvero
),(),( zyxPyxP
edzzyxPyxP yx
YX
)22(2
2
),()(
22
yxz
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
• Media pesata e deviazione standardMedia pesata e deviazione standardRicordiamo la definizione IMPRECISA data
della media pesata e ridefiniamola correttamente, date
le incertezze i definiamo il peso i
da cui ottengo il valor medio
Davide Grandi - Dottorato in Biologia
2
1i
i
2
2
1i
i
i
p
x
x
Distribuzione Normale
Davide Grandi - Dottorato in Biologia
Ed ottengo l’espressione dell’errore che sarà:
Che per i = si riduce a
2
1
1
i
x
Nx