La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media...

17
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 5 La distribuzione Gaussiana È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche E’ la distribuzione di probabilità degli errori casuali E’ la distribuzione di probabilità delle statistiche campionarie E’ la distribuzione limite per altre distribuzioni di probabilità quando n →∞ Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 6

Transcript of La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media...

Page 1: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

3

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 5

La distribuzione Gaussiana

• È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche

• E’ la distribuzione di probabilità degli errori casuali

• E’ la distribuzione di probabilità delle statistiche campionarie

• E’ la distribuzione limite per altre distribuzioni di probabilità quando n →∞

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 6

Page 2: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

4

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 7

Distribuzione delle differenze tra glicemia misurata al polpastrello ed all’avambraccio

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 8

La distribuzione Gaussiana

• È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche

• E’ la distribuzione di probabilità degli errori casuali

• E’ la distribuzione di probabilità delle statistiche campionarie

• E’ la distribuzione limite per altre distribuzioni di probabilità quando n →∞

Page 3: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

6

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 11

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 12

• La distribuzione gaussiana come modello di una distribuzione di probabilità empirica

• Es. istogramma che descrive la distribuzione di frequenza di una variabile numerica in un gruppo di 400 soggetti:

Page 4: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

7

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 13

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 14

• Aumento progressivamente la suddivisione dell’istogramma:

Page 5: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

8

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 15

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 16

Page 6: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

9

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 17

Distribuzione di frequenza (empirica)

Distribuzione di probabilità(teorica)

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 18

La forma della distribuzione di probabilità normale

Page 7: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

10

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 19

La formula della distribuzione normale.

E’ definita da Media (µ) e Deviazione Standard (σ)

( ) ( )2

2

2exp*

21

σµ

πσ−−

=xxf

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 20

La distribuzione gaussiana o “normale”

comprende una famiglia di curve, i cui

parametri sono Media (µ) e Deviazione

Standard (σ)

Page 8: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

11

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 21

Media (µ): posizione centrale

Deviazione Standard (σ): 'ampiezza' della

curva

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 22

Il grafico seguente mostra due curve normali con DS=1

(curva nera) e DS=2 (c.rossa). Entrambe hanno media=0.y

0. 00

0. 02

0. 04

0. 06

0. 08

0. 10

0. 12

0. 14

0. 16

0. 18

0. 20

0. 22

0. 24

0. 26

0. 28

0. 30

0. 32

0. 34

0. 36

0. 38

0. 40

x0

-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10

Page 9: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

12

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 23

In questo grafico si mostra la relazione tra funzione di densità di probabilità gaussiana

(curva a campana, corrisponde ad una distribuzione normale standard) e la corrispondente funzione cumulativa (curva sigmoide).

-4.0 -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5X

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

GS2

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 24

Data una variabile la cui distribuzione di probabilità ègaussiana, possiamo misurare la probabilità corrispondente

a determinati intervalli di valori della variabile

Page 10: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

13

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 25

P=0,025 P=0,025| x | = 1,960

0,95

0,500,50

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 26

P=0,025 P=0,025| x | = 1,960

0,95

Page 11: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

14

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 27X = 1,645 P=0,05

0,95

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 28

Applicazione delle regole della distribuzione gaussiana

Poniamo ad esempio che, data una variabile con distribuzione gaussiana (es. la statura), io sia interessato a calcolare la probabilità di osservare un soggetto con valore x (o inferiore).

Conosco i parametri che descrivono la distribuzione di probabilità(media: µ e Deviazione Standard: σ).

Come procedo?

Page 12: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

15

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 29

p(x<161,49) = ?

p(x>184.5)=?

Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 30

Soluzione 1: calcolo l’integrale

Page 13: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

LA DISTRIBUZIONE DEGLI ERRORI DI MISURA

La distribuzione normale

DISTRIBUZIONE DEGLI

ERRORI DI MISURA

Si supponga di eseguire, in condizioni assai simili e con lo stesso metodo analitico, un gran numero di misurazioni della emoglobina glicata, e di riportare in un grafico le frequenze relative dei valori ottenuti (x) con le prime 20, 40, ... 5120 misure.

LA FORMA DELLA DISTRIBUZIONE DEGLI ERRORI DI MISURA

All'aumentare del numero di misure, i valori tendono ad accentrarsi attorno alla loro media e l'istogramma assume una forma a campanasempre più regolare, che può essere approssimata con una funzione reale nota come funzione di Gauss o funzione normale.

Page 14: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

0

0.03

0.06

0.09

0.12

0.15

75 80 85 90 95 100 105

n=20

0

0,03

0,06

0,09

0,12

0,15

75 80 85 90 95 100 105

n=40

0

0,03

0,06

0,09

0,12

0,15

75 80 85 90 95 100 105

n=80

0

0.03

0.06

0.09

0.12

0.15

75 80 85 90 95 100 105

n=160

0

0,03

0,06

0,09

0,12

0,15

75 80 85 90 95 100 105

n=320

0

0.03

0.06

0.09

0.12

0.15

75 80 85 90 95 100 105

n=640

0

0.03

0.06

0.09

0.12

0.15

75 80 85 90 95 100 105

n=1280

0

0,03

0,06

0,09

0,12

0,15

75 80 85 90 95 100 105

n=2560

0

0,03

0,06

0,09

0,12

0,15

75 80 85 90 95 100 105

n=5120

• La più importante distribuzione continua che trova numerose applicazioni nello studio dei fenomeni biologici.

• Proposta da Gauss (1809) nell’ambito della teoria degli errori.

• Detta anche curva degli errori accidentali

La curva di Gauss

Le caratteristiche della distribuzione normale Le caratteristiche della distribuzione normale

1.1. èè simmetricasimmetrica rispetto al valore mediorispetto al valore medio

2.2. il valore di x = il valore di x = µµ oltre che alla media aritmetica coincide con la moda e la oltre che alla media aritmetica coincide con la moda e la medianamediana

3.3. èè asintoticaasintotica all'asse delle x da entrambi i latiall'asse delle x da entrambi i lati

4.4. èè crescentecrescente per x<per x<µµ e e decrescentedecrescente per x>per x>µµ

5.5. possiede due punti di flesso per x = possiede due punti di flesso per x = µ±σµ±σ

6.6. ll’’area sotto la curva area sotto la curva èè = 1= 1 (essendo la probabilit(essendo la probabilitàà che si verifichi un che si verifichi un qualsiasi valore di x)qualsiasi valore di x)

Page 15: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

σ = σ1 = σ2

MEDIA COME PARAMETRO DI POSIZIONE

Al variare della media aritmetica (a parità di dev.standard) la curva trasla

sull’asse delle x

DEV STANDARD COME PARAMETRO DI VARIABILITA’

Al variare della deviazione standard la curva modifica la sua

forma

In una distribuzione normale perfetta: 68.26% dei casi sono compresi fra -1 e +1 DS attorno alla media 95.46% dei casi sono compresi fra -2 e +2 DS attorno alla media 99.74% dei casi sono compresi fra -3 e +3 DS attorno alla media

INTERVALLI NOTI DI INTERVALLI NOTI DI PROBABILITPROBABILIT ÀÀ

DISTRIBUZIONE DISTRIBUZIONE

NORMALE NORMALE

STANDARDIZZATA STANDARDIZZATA

Page 16: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

Distribuzione normaleDistribuzione normale

Distribuzione normale standardizzata

Distribuzione normale standardizzata

La curva di Gauss standardizzata

Si può trasformare una generica funzione gaussiana f(x) con media µ e varianza σ2, in unafunzione gaussiana standard con media 0 varianza 1, se si pone :

( x - µ )z =

σ

STANDARDIZZAZIONE

TAVOLA DEI VALORI DELLA DISTRIBUZIONE STANDARDIZZATA

TAVOLA DEI VALORI DELLA DISTRIBUZIONE STANDARDIZZATA

Page 17: La distribuzione Gaussiana - Dipartimento di Matematica e ......distribuzione gaussiana con media µµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni

ESERCIZIO:ESERCIZIO: In una popolazione di ragazze di età inclusa tra i 18 e i 25 anni, la concentra-zione di emoglobina nel sangue (x) approssima la distribuzione gaussiana con media µµµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni possiamo calcolare, ad esempio, quante ragazze hanno emoglo-binemia inclusa tra 12.26 e 13.52 g/dl. Infatti:

0

0,1

0,2

0,3

0,4

11 11,7 12,4 13,1 13,8 14,5 15,2

emoglobinemia (g/dl)

12.26 13.52

µ=13.1 µ=13.1 µ=13.1 µ=13.1σ=0.7σ=0.7σ=0.7σ=0.7

0

0,1

0,2

0,3

0,4

-3 -2 -1 0 1 2 3

deviata gaussiana standard z

f(z)

11% 27%

62%

-1.2 +0.6

Nell'11% delle ragazze i valori di Hb sono minori di 12.26 g/dl, e nel 27% sono maggiori di 13.52 g/dl. Quindi il 62% delle ragazze ha valori di Hb compresi tra 12.26 e 13.52 g/dl.

z2 =

z1 = 70)10.13-26.12(

.

70)10.13-52.13(

.

= -1.2

= +0.6