Le distribuzioni di probabilità

22
Le distribuzioni di probabilità I modelli discreti: Distribuzione bernoulliana I modelli continui: Distribuzione normale o di Gauss In natura si osservano delle distribuzioni empiriche; per studiarle è necessario avere delle distribuzioni teoriche di riferimento. Se si considera un fenomeno discreto, come il lancio dei dadi, la distribuzione teorica può essere assimilata alla distribuzione empirica e questo permette di calcolare le frequenze relative, la media e la deviazione standard. Se invece il fenomeno è continuo si considera la funzione di densità e da questa, per integrazione, si ricavano le frequenze teoriche. Le distribuzioni teoriche 1 Cos'è la Statistica - G. Garau, L. Schirru

Transcript of Le distribuzioni di probabilità

Page 1: Le distribuzioni di probabilità

Le distribuzioni di probabilità

I modelli discreti:

Distribuzione bernoulliana

I modelli continui:

Distribuzione normale o di Gauss

In natura si osservano delle distribuzioni empiriche; per studiarle è necessario avere delle distribuzioni teoriche di riferimento. Se si considera un fenomeno discreto, come il lancio dei dadi, la distribuzione teorica può essere assimilata alla distribuzione empirica e questo permette di calcolare le frequenze relative, la media e la deviazione standard.Se invece il fenomeno è continuo si considera la funzione di densità e da questa, per integrazione, si ricavano le frequenze teoriche.

Le distribuzioni teoriche

1Cos'è la Statistica - G. Garau, L. Schirru

Page 2: Le distribuzioni di probabilità

La distribuzione binomiale

La distribuzione binomiale si utilizza quando si considerano eventi che si possono presentare con due sole modalità, ad esempio nascita di un bambino: maschio o femmina, oppure rispondere ad una proposta: accetto o rifiuto.

Es.: Nel lancio di una moneta possono verificarsi due soli eventi, evento “testa” ed evento “croce”. Il lancio di una moneta è considerato un esperimento bernoulliano perché sono possibili due soli eventi, tra loro indipendenti.

Se siamo interessati all’evento “testa”, ogni volta che, lanciando una moneta, esce testa è un successo e ogni volta che esce croce è un insuccesso.

Sia p la probabilità dell’evento successo e q (q=1-p) la probabilità dell’evento insuccesso.

Lanciando n volte la moneta l’evento successo può apparire 0, 1, 2, …, n volte.

Lanciando una moneta 10 volte l’evento testa (successo) può verificarsi 0, 1, 2, … , 9, 10 volte.

2Cos'è la Statistica - G. Garau, L. Schirru

Page 3: Le distribuzioni di probabilità

Sia X la Variabile Casuale numero di successi e sia p(x) = P(X=x) la relativa funzione di probabilità.Per trovare la p(x) bisogna determinare la probabilità di ottenere in n prove, x successi consecutivi, seguiti da n-x insuccessi.Indicando con A il successo e con l’insuccesso si ottiene la sequenza:A

volte volte

A ..., ,A ,A ,A A, ..., A, A,n-xx

La distribuzione binomiale

xnx

n-xx

qp q ... qq p ... pp volte volte

Dato che gli n eventi sono indipendenti, per la legge del prodotto, la probabilità di tale sequenza di risultati è:

Non essendo interessati all’ordine in cui si presentano i successi e gli insuccessi, ma solamente al numero di successi verificatisi nel totale delle prove, la sequenza si ottiene permutando in tutti i modi possibili le n lettere A e . A

3Cos'è la Statistica - G. Garau, L. Schirru

Page 4: Le distribuzioni di probabilità

Sapendo che di questi n elementi x sono uguali ad A e n-x sono uguali a si desume che il numero di sequenze è:

)!(!!

xnxn

xn

La distribuzione binomiale

Ciascuna di queste sequenze ha la stessa probabilità di verificarsi. Considerato che le

sequenze sono eventi disgiunti la probabilità della loro unione si ottiene sommando volte la

quantità costante . In definitiva:

A

)( xnx qp

)()( xnx qpxn

xXP

xn

)( xnx qp

4Cos'è la Statistica - G. Garau, L. Schirru

Page 5: Le distribuzioni di probabilità

Esempio

In un’urna ci sono N biglie di cui:- biglie bianche (in proporzione p)- biglie rosse (in proporzione q= 1-p)

Calcoliamo la probabilità di estrarre 2 biglie bianche in 3 estrazioni.

Descriviamo innanzitutto lo spazio campionario (spazio degli eventi = al numero delle disposizioni con ripetizione di 2 elementi presi 3 alla volta): 823

, krkn nD

},,,,,,,{ RRRRRBRBRBRRRBBBRBBBRBBB

La probabilità di estrarre 2 biglie bianche in 3 estrazioni può essere calcolata utilizzando la definizione di probabilità a priori, questo è vero, però, solo nel caso di eventi equiprobabili. In questo caso, in cui p è diverso da q, si deve invece conoscere la distribuzione di probabilità, è necessario, cioè definire la Variabile Casuale numero di biglie bianche ed associarci una funzione di densità.

5Cos'è la Statistica - G. Garau, L. Schirru

Page 6: Le distribuzioni di probabilità

Esempio

evento P(e)

RRR 1/8RRB 1/8RBR 1/8BRR 1/8RBB 1/8BRB 1/8BBR 1/8BBB 1/8

x P(x)

0 1/81 3/82 3/83 1/8

Distribuzione di probabilità Funzione di densità

0 biglie bianche

1 biglia bianca

2 biglie bianche3 biglie bianche

Leggendo nella funzione di densità e la probabilità associata a 2, vediamo 3/8 (=0.375) che non è altro che la probabilità di estrarre 2 biglie bianche in 3 estrazioni.

6Cos'è la Statistica - G. Garau, L. Schirru

Page 7: Le distribuzioni di probabilità

EsempioSe invece utilizziamo le formule, considerando p=q=0.5, otteniamo:

375.05.025.035.05.0!1!2

!3)(23

)()2( 12232

qpqp

xn

XP xnx

288.06.016.036.04.0!1!2

!3)(23

)()2( 12232

qpqp

xn

XP xnx

Abbiamo ottenuto lo stesso risultato di prima.

Nel caso in cui invece le probabilità degli eventi non siano uguali il risultato cambia, infatti, se p=0.4 e q=0.6 si avrà:

7Cos'è la Statistica - G. Garau, L. Schirru

Page 8: Le distribuzioni di probabilità

La forma della distribuzione binomiale

x P(x)

0 1/81 3/82 3/83 1/8

Funzione di densità Rappresentiamo graficamente la funzione di densità della Binomiale con n=3 e p=0.5

Quando le probabilità sono uguali (p=q=0.5) la distribuzione è simmetrica.

Quando le probabilità sono diverse, allora la distribuzione è asimmetrica, tuttavia al crescere di n (per n che tende ad infinito) la distribuzione tende a diventare simmetrica.

8Cos'è la Statistica - G. Garau, L. Schirru

Page 9: Le distribuzioni di probabilità

Gli indicatori di sintesi della distribuzione binomiale

nnn

nXVarpVar

nn

nXEpE

nXVar

nE(X)

)1()1()(

)(

)1()(

2

Valore atteso della binomiale

Varianza della binomiale

Con una semplice trasformazione della Binomiale si ottiene la V.C. Binomiale relativa, che descrive la proporzione di successi in n prove bernoulliane indipendenti

Valore atteso della proporzione campionaria

Varianza della proporzione campionaria

9Cos'è la Statistica - G. Garau, L. Schirru

Page 10: Le distribuzioni di probabilità

EsercizioUn’urna contiene 127 palline rosse, verdi e blu, in questa proporzione:• 39 rosse• 34 verdi• 54 bluEstraendo 6 palline, qual è la probabilità che escano almeno 4 palline blu?

Per risolvere l’esercizio è necessario calcolare innanzitutto le probabilità degli eventi: “esce la pallina blu” e “non esce la pallina blu”.

La probabilità che esca la pallina blu si calcola rapportando il numero di eventi favorevoli al numero di eventi possibili:

425.012754

Anche la probabilità che non esca la pallina blu si calcola rapportando il numero di eventi favorevoli al numero di eventi possibili:

p=0.425

q=0.575575.012773

1273934

Calcoliamo ora la probabilità richiesta:

)6()5()4()4( XPXPXPXP

10Cos'è la Statistica - G. Garau, L. Schirru

Page 11: Le distribuzioni di probabilità

Esercizio

La probabilità di estrarre almeno 4 palline blu in 6 estrazioni è il 21,58%.

)6()5()4()4( XPXPXPXP

2158.000589.0048.01619.0)4(

00589.0100589.01575.0425.0!0!6

!6)(66

)6(

048.0575.00139.06575.0425.0!1!5

!6)(56

)5(

1619.0331.00326.015575.0425.0!2!4

!6)(46

)4(

)()!(!

!)()(

06666

15565

24464

XP

qpXP

qpXP

qpXP

qpxnx

nqpxn

xXP xnxxnx

11Cos'è la Statistica - G. Garau, L. Schirru

Page 12: Le distribuzioni di probabilità

La distribuzione normale

La curva normale, anche nota come curva di Gauss è una distribuzione limite verso cui tendono molte distribuzioni teoriche, come ad esempio la binomiale al crescere del numero di prove.Questa curva approssima in modo soddisfacente molte distribuzioni empiriche, come la distribuzione degli errori di misura.

Si dice che una Variabile Casuale è normalmente distribuita se la sua funzione di densità è data da:

2

2)(21

22

1)(

x

eXP

dove

e è uguale alla deviazione standard di X

è uguale alla media di X

= 3.14159…

= 2.71828

12Cos'è la Statistica - G. Garau, L. Schirru

Page 13: Le distribuzioni di probabilità

L’importanza della normale nella teoria della probabilità è dovuta in gran parte ai cosiddetti teoremi del limite centrale. Tali teoremi stabiliscono le condizioni sotto le quali la somma di variabili casuali tende alla normale all’aumentare del numero delle variabili (convergenza in distribuzione alla normale).Rappresentiamo graficamente la curva normaleed enunciamo le sue caratteristiche.

x varia tra e

La massima densità si ha per x

Quindi moda, media e mediana coincidono. La curva dipende solo da x mentre la media e la deviazione standard sono costanti come anche ed e

È una distribuzione simmetrica intorno alla media. A due valori di x, uguali ma di segno opposto, corrisponde la stessa f(x). Questa simmetria implica la simmetria delle due aree opposte rispetto alla media e ci dice anche che la media coincide con la mediana.

Al crescere del valore assoluto di x la densità decresce e tende a 0 molto rapidamente

La forma della distribuzione dipende dai valori di e x

La distribuzione normale

13Cos'è la Statistica - G. Garau, L. Schirru

Page 14: Le distribuzioni di probabilità

La standardizzazione della curva normale consiste nel:

centrare la distribuzione intorno alla media x

dividere questa differenza per la deviazione standard

La V.C. generata da tale operazione è la variabile standardizzata zz

Xz

La z è una trasformata lineare della x.

La media e la varianza di una generica V.C. distribuita come una normale possono assumere qualsiasi valore, la V.C. standardizzata Z è unica con media nulla e varianza unitaria.La nuova variabile avrà la seguente funzione di densità:

2)(21

21)(

zezf

La distribuzione normale standardizzata

Il coefficiente consente di normalizzare l’area compresa tra la funzione di densità e l’asse delle x. Dopo tale operazione l’area vale 1 e può essere utilizzata come spazio di probabilità. La comodità di questa nuova distribuzione, z, consiste nel fatto che è stato calcolato l’integrale ed è stato tabulato.

21

14Cos'è la Statistica - G. Garau, L. Schirru

Page 15: Le distribuzioni di probabilità

Rappresentazione della normale standardizzata. Per la variabile normale standardizzata lo scarto quadratico medio è uguale a 1. Una variabile casuale aleatoria ha probabilità del 68.3% di discostarsi dalla media per meno di

15Cos'è la Statistica - G. Garau, L. Schirru

Page 16: Le distribuzioni di probabilità

Rappresentazione della normale standardizzata.

Una variabile casuale aleatoria ha probabilità del 95.4% di discostarsi dalla media per meno di 2

16Cos'è la Statistica - G. Garau, L. Schirru

Page 17: Le distribuzioni di probabilità

Rappresentazione della normale standardizzata.

Una variabile casuale aleatoria ha probabilità del 99.7% di discostarsi dalla media per meno di 3

17Cos'è la Statistica - G. Garau, L. Schirru

Page 18: Le distribuzioni di probabilità

Uso delle tavole di zLe tavole, riportate nell’appendice D del libro (pag.236), sono tabulate da 0 a z. I valori di Z si leggono nei marginali della tabella, mentre i valori delle probabilità si leggonoall’interno della tabella.

Trovare l’area compresa tra 0 e 1

)10( ZP

Significa trovare la probabilità che Z sia compreso tra 0 e 1

Basta, quindi cercare il valore che corrisponde a Z = 1. Tale valore corrisponde a 0.3413.

18Cos'è la Statistica - G. Garau, L. Schirru

Page 19: Le distribuzioni di probabilità

EsercizioTrovare l’area compresa tra 0 e 2

)20( ZPSignifica trovare la probabilità che Z sia compreso tra 0 e 2

In questo caso, al valore di Z = 2 corrisponde un’area pari allo 0, 4772.

19Cos'è la Statistica - G. Garau, L. Schirru

Page 20: Le distribuzioni di probabilità

EsercizioTrovare )12( ZPOssia trovare la probabilità che Z sia compreso tra -2 e +1

+

L’area tra -2 e 0 è identica all’area tra 0 e 2, per cui basta sommare le due probabilità ottenendo un’area pari a 0.8185

20Cos'è la Statistica - G. Garau, L. Schirru

Page 21: Le distribuzioni di probabilità

Approssimazione della binomiale alla normale

),(~ pnBXSe e se n è grande allora ) ,(~) ,( npqnpNpnB

* Si legge: la Binomiale si distribuisce approssimativamente come una Normale con media np e varianza npq

*

Estraete un campione di numerosità n=40 da una popolazione in cui il 40% delle persone ha una certa caratteristica A. Calcolate la probabilità di avere nel campione un certo numero di individui con questo carattere. Trovate ad esempio: )1916( XP

)4.0,40(~ BXIn questo caso: )1.3 ,16(~ NX

) ,(~) ,( npqnpNpnB

21Cos'è la Statistica - G. Garau, L. Schirru

Page 22: Le distribuzioni di probabilità

Per calcolare questa probabilità si utilizzano le tavole della distribuzione normale. Si standardizzano i limiti dell’intervallo:

)( 21 zzzP ;97.01.31619 ;0

1.31616

21

zz

334.0)97.00( zP

La probabilità che la caratteristica considerata appartenga a più di 16 individui, ma a meno di 19 è il 33,4%.

22Cos'è la Statistica - G. Garau, L. Schirru