La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media...
Transcript of La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media...
3
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 5
La distribuzione Gaussiana
• È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche
• E’ la distribuzione di probabilità degli errori casuali
• E’ la distribuzione di probabilità delle statistiche campionarie
• E’ la distribuzione limite per altre distribuzioni di probabilità quando n →∞
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 6
4
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 7
Distribuzione delle differenze tra glicemia misurata al polpastrello ed all’avambraccio
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 8
La distribuzione Gaussiana
• È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche
• E’ la distribuzione di probabilità degli errori casuali
• E’ la distribuzione di probabilità delle statistiche campionarie
• E’ la distribuzione limite per altre distribuzioni di probabilità quando n →∞
6
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 11
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 12
• La distribuzione gaussiana come modello di una distribuzione di probabilità empirica
• Es. istogramma che descrive la distribuzione di frequenza di una variabile numerica in un gruppo di 400 soggetti:
7
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 13
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 14
• Aumento progressivamente la suddivisione dell’istogramma:
8
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 15
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 16
9
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 17
Distribuzione di frequenza (empirica)
Distribuzione di probabilità(teorica)
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 18
La forma della distribuzione di probabilità normale
10
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 19
La formula della distribuzione normale.
E’ definita da Media (µ) e Deviazione Standard (σ)
( ) ( )2
2
2exp*
21
σµ
πσ−−
=xxf
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 20
La distribuzione gaussiana o “normale”
comprende una famiglia di curve, i cui
parametri sono Media (µ) e Deviazione
Standard (σ)
11
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 21
Media (µ): posizione centrale
Deviazione Standard (σ): 'ampiezza' della
curva
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 22
Il grafico seguente mostra due curve normali con DS=1
(curva nera) e DS=2 (c.rossa). Entrambe hanno media=0.y
0. 00
0. 02
0. 04
0. 06
0. 08
0. 10
0. 12
0. 14
0. 16
0. 18
0. 20
0. 22
0. 24
0. 26
0. 28
0. 30
0. 32
0. 34
0. 36
0. 38
0. 40
x0
-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10
12
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 23
In questo grafico si mostra la relazione tra funzione di densità di probabilità gaussiana
(curva a campana, corrisponde ad una distribuzione normale standard) e la corrispondente funzione cumulativa (curva sigmoide).
-4.0 -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5X
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
GS2
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 24
Data una variabile la cui distribuzione di probabilità ègaussiana, possiamo misurare la probabilità corrispondente
a determinati intervalli di valori della variabile
13
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 25
P=0,025 P=0,025| x | = 1,960
0,95
0,500,50
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 26
P=0,025 P=0,025| x | = 1,960
0,95
14
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 27X = 1,645 P=0,05
0,95
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 28
Applicazione delle regole della distribuzione gaussiana
Poniamo ad esempio che, data una variabile con distribuzione gaussiana (es. la statura), io sia interessato a calcolare la probabilità di osservare un soggetto con valore x (o inferiore).
Conosco i parametri che descrivono la distribuzione di probabilità(media: µ e Deviazione Standard: σ).
Come procedo?
15
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 29
p(x<161,49) = ?
p(x>184.5)=?
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 30
Soluzione 1: calcolo l’integrale
LA DISTRIBUZIONE DEGLI ERRORI DI MISURA
La distribuzione normale
DISTRIBUZIONE DEGLI
ERRORI DI MISURA
Si supponga di eseguire, in condizioni assai simili e con lo stesso metodo analitico, un gran numero di misurazioni della emoglobina glicata, e di riportare in un grafico le frequenze relative dei valori ottenuti (x) con le prime 20, 40, ... 5120 misure.
LA FORMA DELLA DISTRIBUZIONE DEGLI ERRORI DI MISURA
All'aumentare del numero di misure, i valori tendono ad accentrarsi attorno alla loro media e l'istogramma assume una forma a campanasempre più regolare, che può essere approssimata con una funzione reale nota come funzione di Gauss o funzione normale.
0
0.03
0.06
0.09
0.12
0.15
75 80 85 90 95 100 105
n=20
0
0,03
0,06
0,09
0,12
0,15
75 80 85 90 95 100 105
n=40
0
0,03
0,06
0,09
0,12
0,15
75 80 85 90 95 100 105
n=80
0
0.03
0.06
0.09
0.12
0.15
75 80 85 90 95 100 105
n=160
0
0,03
0,06
0,09
0,12
0,15
75 80 85 90 95 100 105
n=320
0
0.03
0.06
0.09
0.12
0.15
75 80 85 90 95 100 105
n=640
0
0.03
0.06
0.09
0.12
0.15
75 80 85 90 95 100 105
n=1280
0
0,03
0,06
0,09
0,12
0,15
75 80 85 90 95 100 105
n=2560
0
0,03
0,06
0,09
0,12
0,15
75 80 85 90 95 100 105
n=5120
• La più importante distribuzione continua che trova numerose applicazioni nello studio dei fenomeni biologici.
• Proposta da Gauss (1809) nell’ambito della teoria degli errori.
• Detta anche curva degli errori accidentali
La curva di Gauss
Le caratteristiche della distribuzione normale Le caratteristiche della distribuzione normale
1.1. èè simmetricasimmetrica rispetto al valore mediorispetto al valore medio
2.2. il valore di x = il valore di x = µµ oltre che alla media aritmetica coincide con la moda e la oltre che alla media aritmetica coincide con la moda e la medianamediana
3.3. èè asintoticaasintotica all'asse delle x da entrambi i latiall'asse delle x da entrambi i lati
4.4. èè crescentecrescente per x<per x<µµ e e decrescentedecrescente per x>per x>µµ
5.5. possiede due punti di flesso per x = possiede due punti di flesso per x = µ±σµ±σ
6.6. ll’’area sotto la curva area sotto la curva èè = 1= 1 (essendo la probabilit(essendo la probabilitàà che si verifichi un che si verifichi un qualsiasi valore di x)qualsiasi valore di x)
σ = σ1 = σ2
MEDIA COME PARAMETRO DI POSIZIONE
Al variare della media aritmetica (a parità di dev.standard) la curva trasla
sull’asse delle x
DEV STANDARD COME PARAMETRO DI VARIABILITA’
Al variare della deviazione standard la curva modifica la sua
forma
In una distribuzione normale perfetta: 68.26% dei casi sono compresi fra -1 e +1 DS attorno alla media 95.46% dei casi sono compresi fra -2 e +2 DS attorno alla media 99.74% dei casi sono compresi fra -3 e +3 DS attorno alla media
INTERVALLI NOTI DI INTERVALLI NOTI DI PROBABILITPROBABILIT ÀÀ
DISTRIBUZIONE DISTRIBUZIONE
NORMALE NORMALE
STANDARDIZZATA STANDARDIZZATA
Distribuzione normaleDistribuzione normale
Distribuzione normale standardizzata
Distribuzione normale standardizzata
La curva di Gauss standardizzata
Si può trasformare una generica funzione gaussiana f(x) con media µ e varianza σ2, in unafunzione gaussiana standard con media 0 varianza 1, se si pone :
( x - µ )z =
σ
STANDARDIZZAZIONE
TAVOLA DEI VALORI DELLA DISTRIBUZIONE STANDARDIZZATA
TAVOLA DEI VALORI DELLA DISTRIBUZIONE STANDARDIZZATA
ESERCIZIO:ESERCIZIO: In una popolazione di ragazze di età inclusa tra i 18 e i 25 anni, la concentra-zione di emoglobina nel sangue (x) approssima la distribuzione gaussiana con media µµµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni possiamo calcolare, ad esempio, quante ragazze hanno emoglo-binemia inclusa tra 12.26 e 13.52 g/dl. Infatti:
0
0,1
0,2
0,3
0,4
11 11,7 12,4 13,1 13,8 14,5 15,2
emoglobinemia (g/dl)
12.26 13.52
µ=13.1 µ=13.1 µ=13.1 µ=13.1σ=0.7σ=0.7σ=0.7σ=0.7
0
0,1
0,2
0,3
0,4
-3 -2 -1 0 1 2 3
deviata gaussiana standard z
f(z)
11% 27%
62%
-1.2 +0.6
Nell'11% delle ragazze i valori di Hb sono minori di 12.26 g/dl, e nel 27% sono maggiori di 13.52 g/dl. Quindi il 62% delle ragazze ha valori di Hb compresi tra 12.26 e 13.52 g/dl.
z2 =
z1 = 70)10.13-26.12(
.
70)10.13-52.13(
.
= -1.2
= +0.6