Capitolo IV : Calcolo delle Probabilit...

34
Liceo Lugano 1, 2011-2012 3N (Luca Rovelli) Capitolo IV : Calcolo delle Probabilit` a 1. Introduzione Il calcolo delle probabilit` a ` e una branca relativamente giovane della matematica, le cui motivazioni originarie vanno ricercate nel gioco d’azzardo, e in particolare nella neces- sit` a di stimare le possibilit` a di vittoria nei giochi di dadi. I primi timidi tentativi in questo senso si devono al monaco francescano Luca Pacioli (1445-1517), all’eccentrico matematico e medico Girolamo Cardano (1501-1576) e a Galileo Galilei (1564-1642), ma la nascita ”ufficiale” del calcolo delle probabilit` a viene solitamente fatta risalire ad uno scambio epistolare tra Blaise Pascal (1623-1662) e Pierre de Fermat (1601-1665) dedi- cato alla discussione del ”problema del gioco incompiuto” (se una partita a dadi viene interrotta prima della sua conclusione, come va spartita la posta?), sottoposto nel 1654 a Pascal da Antoine Gombaud, il Cavaliere de M´ er´ e, matematico dilettante e inveterato giocatore d’azzardo. Nei secoli successivi a questa prima trattazione molti importanti matematici si sono oc- cupati di questioni probabilistiche. Di particolare rilievo sono i lavori di Jakob Bernoulli (1654-1705), che nell’Ars conjectandi (pubblicata postuma nel 1713) riassunse le conoscen- ze del tempo, e di Pierre-Simon Laplace (1749-1827), che nella sua Th´ eorie analytique des probabilit´ es, del 1812, diede una prima sistemazione formale alla teoria. Non vanno per`o dimenticati i contributi di altri Grandi le cui scoperte hanno fatto del calcolo delle probabilit` a uno dei capisaldi della matematica pura ed applicata, quali Edmund Halley (1656-1742), Abraham De Moivre (1667-1754), Daniel Bernoulli (1700-1782) e il princeps mathematicorum Carl Friedrich Gauss (1777-1825). La ricerca di una definizione rigorosa del concetto di probabilit` a ha avuto un percorso lungo e travagliato: intuitivamente si tratta di una misura della chance di un dato evento di avverarsi, e quindi di un modo per quantificare l’incertezza, ma questioni tecniche e filosofiche si sono costantemente frapposte a una sua sistemazione definitiva. Solo negli anni ’30 del XX secolo, grazie alle intuizioni del matematico sovietico Andrej Kolmogorov (1903-1987), si giunse alla definizione assiomatica oggi universalmente accettata, che fa uso della moderna teoria degli insiemi. Calcolo delle probabilit` a, corso scientifico (V0.1) 62 LiLu1, 3N (Luca Rovelli)

Transcript of Capitolo IV : Calcolo delle Probabilit...

Page 1: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Liceo Lugano 1, 2011-2012 3N (Luca Rovelli)

Capitolo IV :Calcolo delle Probabilita

1. Introduzione

Il calcolo delle probabilita e una branca relativamente giovane della matematica, le cuimotivazioni originarie vanno ricercate nel gioco d’azzardo, e in particolare nella neces-sita di stimare le possibilita di vittoria nei giochi di dadi. I primi timidi tentativi inquesto senso si devono al monaco francescano Luca Pacioli (1445-1517), all’eccentricomatematico e medico Girolamo Cardano (1501-1576) e a Galileo Galilei (1564-1642), mala nascita ”ufficiale” del calcolo delle probabilita viene solitamente fatta risalire ad unoscambio epistolare tra Blaise Pascal (1623-1662) e Pierre de Fermat (1601-1665) dedi-cato alla discussione del ”problema del gioco incompiuto” (se una partita a dadi vieneinterrotta prima della sua conclusione, come va spartita la posta?), sottoposto nel 1654a Pascal da Antoine Gombaud, il Cavaliere de Mere, matematico dilettante e inveteratogiocatore d’azzardo.

Nei secoli successivi a questa prima trattazione molti importanti matematici si sono oc-cupati di questioni probabilistiche. Di particolare rilievo sono i lavori di Jakob Bernoulli(1654-1705), che nell’Ars conjectandi (pubblicata postuma nel 1713) riassunse le conoscen-ze del tempo, e di Pierre-Simon Laplace (1749-1827), che nella sua Theorie analytiquedes probabilites, del 1812, diede una prima sistemazione formale alla teoria. Non vannopero dimenticati i contributi di altri Grandi le cui scoperte hanno fatto del calcolo delleprobabilita uno dei capisaldi della matematica pura ed applicata, quali Edmund Halley(1656-1742), Abraham De Moivre (1667-1754), Daniel Bernoulli (1700-1782) e il princepsmathematicorum Carl Friedrich Gauss (1777-1825).

La ricerca di una definizione rigorosa del concetto di probabilita ha avuto un percorsolungo e travagliato: intuitivamente si tratta di una misura della chance di un dato eventodi avverarsi, e quindi di un modo per quantificare l’incertezza, ma questioni tecniche efilosofiche si sono costantemente frapposte a una sua sistemazione definitiva. Solo neglianni ’30 del XX secolo, grazie alle intuizioni del matematico sovietico Andrej Kolmogorov(1903-1987), si giunse alla definizione assiomatica oggi universalmente accettata, che fauso della moderna teoria degli insiemi.

Calcolo delle probabilita, corso scientifico (V0.1) 62 LiLu1, 3N (Luca Rovelli)

Page 2: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

2. La nozione di ”probabilita”

Consideriamo i seguenti esempi introduttivi:

1) Lanciando piu volte una moneta, quanto spesso mi attendo l’esito ”testa”?

Apparentemente, una volta su due.

2) Estraendo (e reinserendo) piu volte una carta da un mazzo ben mischiato, quantospesso posso attendermi che si tratti di una carta di picche?

Apparentemente, una volta su quattro.

3) Lanciando piu volte un dado, quanto spesso mi attendo l’esito ”cinque”?

Apparentemente, una volta su sei.

In ognuno dei tre casi, la chance dell’evento considerato viene espressa da un numerocompreso tra zero e uno (rispettivamente 1

2, 1

4e 1

6). Tali numeri possono essere interpretati

in due maniere: da un lato vi e la consapevolezza che la moneta puo cadere in due modi,che vi sono 40 modi per estrarre una carta da un mazzo (di cui 10 modi per estrarne una dipicche) e che un dado puo fermarsi in sei modi diversi. Dall’altro, si puo ragionevolmentesupporre che la ripetizione prolungata degli esperimenti considerati avrebbe prodottofrequenze paragonabili a questi valori.

Considerazioni di questo tipo hanno dato origine a differenti approcci al calcolo delle pro-babilita, e quindi a piu definizioni del concetto di probabilita. La loro descrizione richiedeuna formulazione (intuitiva, per ora) di due concetti-chiave:

• un esperimento casuale e un esperimento (come il lancio di un dado o di una moneta)il cui esito puo essere considerato frutto del caso;

• un evento E e rappresentato da uno o piu esiti possibili di un esperimento casuale(ad esempio, ”il lancio di un dado ha dato un esito dispari”).

Prendiamo innanzitutto in considerazione la definizione data da Laplace nel gia menzio-nato Theorie analytique des probabilites.

L’approccio classico (o Laplaciano): se in un esperimento casuale un evento E puoverificarsi in k modi diversi su n realizzazioni possibili, tutte ugualmente probabili,allora la probabilita di E e

p(E) =k

n

(”casi favorevoli”

”casi possibili”

).

Esempi: facendo riferimento agli esempi introduttivi,

1) E: ”ottengo testa”; n = 2, k = 1, p(E) = 12

= 0, 5 ;

2) E: ”la carta estratta e di picche”; n = 40, k = 10, p(E) = 1040

= 14

= 0, 25 ;

3) E: ”ottengo l’esito 5”; n = 6, k = 1, p(E) = 16

= 0, 16 .

Calcolo delle probabilita, corso scientifico (V0.1) 63 LiLu1, 3N (Luca Rovelli)

Page 3: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Altri esempi:

4) Lanciando un dado, qual e la probabilita di ottenere un numero pari?

Con E: ”l’esito e pari”, vale n = 6, k = 3 (gli esiti favorevoli sono 2, 4 e 6), quindip(E) = 3

6= 1

2= 0, 5.

5) Qual e la probabilita di fare 6 al lotto?

Con E: ”indovino i 6 numeri” vale n =(

456

)= 8 145 060, k = 1 (c’e una sola

combinazione vincente), quindi p(E) =1

8145060∼= 0, 000000123.

6) Qual e la probabilita di ottenere tre volte ”testa” lanciando 3 monete?

Con E: ”tre esiti testa” vale n = 23 = 8, k = 1 (c’e un solo esito favorevole), quindi

p(E) =1

8= 0, 125.

7) Lanciando 10 monete, qual e la probabilita di ottenere esattamente 5 volte testa?

Possiamo descrivere gli esiti utilizzando sequenze di 10 lettere T e C, ad esempioTTCCTTCCTC rappresenta una sequenza di lanci con l’esito ”testa” al 1o, 2o, 5o,6o e 9o lancio.

Qui vale n = 210 = 1024, k =(

105

)= 252 (sono gli anagrammi di TTTTTCCCCC),

e con E: ”5 esiti testa” vale p(E) = 2521024∼= 0, 246.

Osservazioni:

(i) La definizione data di probabilita e insoddisfacente dal punto di vista matematico:supponendo che tutti gli esiti siano equiprobabili, essa fa riferimento a se stessa!

(ii) Anche dal punto di vista applicativo la definizione e lacunosa: supponendo l’equi-probabilita, essa e inutilizzabile ad esempio nel caso di un dado truccato.

(iii) Come mostrano gli ultimi 3 esempi, nell’ambito della probabilita classica sono utilile tecniche del calcolo combinatorio.

Passiamo ad un altro approccio ”tradizionale” alla probabilita, che non suppone piul’equiprobabilita, descritto sistematicamente dal logico inglese John Venn (1834-1923)nel saggio The Logic of Chance: An Essay on the Foundations and Province of the The-ory of Probability.

L’approccio frequentista: la probabilita di un evento E e il valore a cui si avvicinail rapporto f

n(”frequenza relativa”) dove f rappresenta il numero di realizzazioni di

E in n ripetizioni dell’esperimento casuale al crescere di n; con il linguaggio dei limiti(vedi programma di IV Liceo):

p(E) = limn→∞

f

n.

Calcolo delle probabilita, corso scientifico (V0.1) 64 LiLu1, 3N (Luca Rovelli)

Page 4: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Se, ad esempio, lanciando 1000 volte un certo dado l’esito ”6” si e verificato 432 volte,per E: ”l’esito e pari a 6” si puo ragionevolmente supporre che valga p(E) ∼= 432

1000= 0, 432

(il dado e probabilmente truccato!).

Osservazione: anche questo secondo approccio appare insoddisfacente. In particolare,esso presuppone la ripetibilita di un esperimento, spesso non plausibile.

Nel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti(1906-1985), si e fatta strada una nuova visione del concetto di probabilita, che vieneinterpretata come una misura del grado di fiducia e che quindi dipende esclusivamente dauna valutazione soggettiva1.

L’approccio soggettivo: la probabilita di un evento E e il valore p(E) che l’individuoche procede alla valutazione e disposto a pagare per ricevere una vincita unitaria nelcaso si verifichi E ad un ipotetico banco, il quale e a sua volta disposto ad accettare lascommessa.

Ad esempio: valuto che p(E) = 0, 5 per l’evento E : ”esito pari” nel lancio di un dado sesono disposto a scommettere 50 franchi sulla sua realizzazione a fronte di una posta paria 100 franchi.

Osservazione: per tutti e tre gli approcci menzionati e possibile identificare delle pro-prieta di fondo in comune. In particolare:

(i) la probabilita p(E) di un evento E e un numero compreso tra zero e uno;

(ii) la probabilita di un evento certo e pari a uno;

(iii) dati due eventi E1 e E2 tra loro incompatibili (cioe tali che il realizzarsi di uno deidue escluda il realizzarsi dell’altro), la probabilita che si realizzi E1 oppure E2 (cioealmeno uno dei due) e pari alla somma p(E1) + p(E2).

Sono proprio queste osservazioni ad aver ispirato ad Andrej Kolmogorov il suo approccioassiomatico, a cui e dedicato il prossimo paragrafo. Egli identifico nella teoria degli in-siemi il linguaggio adatto a descrivere gli eventi, i loro connettivi logici (”e”, ”oppure”) ela negazione (”non”).

3. Spazi di probabilita

Gli approcci descritti nel paragrafo precedente sono per la loro stessa natura filosofica-mente inconciliabili. Per ovviare a questo vero e proprio impasse, nel 1933 il matematicorusso Andrej Nikolaevic Kolmogorov propose una definizione assiomatica, basata non sulmodo in cui p(E) dev’essere definita ma solo sulle proprieta che la ”funzione” p(...) devepossedere. Alla base di tale approccio vi e la nozione di spazio campionario2, dalla qualeprende avvio la nostra discussione.

1il piu celebre trattato di De Finetti, Teoria della probabilita (1970) si apre con l’espressione provo-catoria la probabilita non esiste !

2detto anche insieme universo

Calcolo delle probabilita, corso scientifico (V0.1) 65 LiLu1, 3N (Luca Rovelli)

Page 5: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Definizione 1: uno spazio campionario Ω e un insieme i cui elementi rappresentanotutte le possibili realizzazioni di un esperimento casuale. Un sottoinsieme E ⊆ Ω e dettoevento. Un elemento e ∈ Ω e detto esito.

Esempi:

1) Per l’esperimento casuale ”lancio di un dado”, possiamo scegliere Ω = 1, 2, 3, 4, 5, 6.Allora all’evento E: ”l’esito e dispari” corrisponde E = 1, 3, 5.

2) Per l’esperimento casuale ”lancio di tre monete”, possiamo scegliereΩ = CCC,CCT,CTC,CTT, TCC, TCT, TTC, TTT.All’evento E: ”ottengo almeno due croci” corrispondeE = CCC,CCT,CTC, TCC.

3) (Un esempio di probabilita geometrica) Considera un bersaglioquadrato Q, all’interno del quale e inscritto un cerchio C. Im-maginando di colpire sempre il quadrato, per l’esperimento ca-suale ”tiro al bersaglio” posso porre Ω = Q (identificare cioelo spazio campionario con il quadrato stesso); in questo caso,all’evento ”colpisco il cerchio” corrisponde il cerchio C!

QC

Definizione 2: sia Ω uno spazio campionario.

(i) Se l’esperimento casuale ha prodotto un esito corrispondente a e e vale e ∈ E,diremo che l’evento E si e verificato.

(ii) Un evento e contenente un solo esito e detto elementare.

(iii) Ω (visto come sottoinsieme di Ω stesso) e l’evento certo (si verifica di sicuro),mentre ∅ e l’evento impossibile (non si verifica mai).

(iv) Sia E = Ω \ E; allora E e l’evento complementare ad E (E si verifica se Enon si verifica).

(v) Due eventi E1 e E2 sono detti incompatibili se E1 ∩E2 = ∅ (sono cioe insiemidisgiunti).

Esempi:

1) Sia nuovamente Ω = 1, 2, 3, 4, 5, 6 (v. sopra).

• E: ”l’esito e 4”, cioe E = 4, e elementare;

• sia E: ”l’esito e almeno 3”, cioe E = 3, 4, 5, 6; allora vale E = 1, 2, cioeE: ”l’esito e inferiore a 3”;

• gli eventi E1: ”l’esito e al massimo 2” e E2: ”l’esito e superiore a 4”, cioeE1 = 1, 2 e E2 = 5, 6, sono incompatibili.

Calcolo delle probabilita, corso scientifico (V0.1) 66 LiLu1, 3N (Luca Rovelli)

Page 6: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

2) Sia Ω = CCC,CCT,CTC,CTT, TCC, TCT, TTC, TTT (v. sopra).

• sia E: ”esattamente due teste”, cioe E = CTT, TCT, TTC; allora E =CCC,CCT,CTC, TCC, TTT;• gli eventi E1; ”almeno due teste” e E2: ”esattamente tre croci”, cioe E1 =CTT, TCT, TTC, TTT e E2 = CCC sono incompatibili;

• gli eventi E1; ”almeno due teste” e E2: ”almeno una croce”, cioe E1 =CTT, TCT, TTC, TTT e E2 = CCC,CCT,CTC,CTT, TCC, TCT, TTCsono compatibili; difatti vale E1 ∩ E2 = CTT, TCT, TTC 6= ∅.

Osservazioni: siano Ω uno spazio campionario e A,B ⊆ Ω due eventi.

(i) L’unione A ∪B rappresenta l’evento che si verifica se si verifica A oppure3 B.

ΩA B

Esempio: consideriamo, come nella pagina precedente, Ω = 1, 2, 3, 4, 5, 6 (lospazio campionario associato al lancio di un dado). Siano A: ”l’esito e dispari” e B:”l’esito e un numero primo”, cioe A = 1, 3, 5 e B = 2, 3, 5. Allora per l’eventoA ∪B: ”l’esito e dispari oppure primo” vale A ∪B = 1, 2, 3, 5.

(ii) L’intersezione A∩B rappresenta l’evento che si verifica se si verificano entrambi glieventi A e B.

ΩA B

Esempio: consideriamo nuovamente Ω = 1, 2, 3, 4, 5, 6, A: ”l’esito e pari” e B:”l’esito e un numero primo”. Allora per l’evento A∩B: ”l’esito e pari e primo” valeA ∩B = 2.

Le considerazioni che concludono il paragrafo, di natura molto formale, vengono inseriteper completezza. Dal momento che saremo principalmente interessati ad esperimenticasuali con un numero finito di esiti, e quindi a spazi campionari finiti, esse potrebberoessere per il momento tralasciate.

3in modo non esclusivo: A e B possono anche verificarsi entrambi!

Calcolo delle probabilita, corso scientifico (V0.1) 67 LiLu1, 3N (Luca Rovelli)

Page 7: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Come abbiamo visto, per formalizzare il concetto di ”evento” nel linguaggio della modernateoria delle probabilita si fa uso dei sottoinsiemi di uno spazio campionario Ω. Spesso,pero, non e conveniente (o addirittura non e possibile) prendere in considerazione tutti isottoinsiemi dello spazio campionario4, e ci si limita ad una famiglia piu ristretta. Per ”farfunzionare” i meccanismi dell’assiomatica di Kolmogorov occorre pero che tale famigliapossegga delle proprieta minime, che per i matematici contraddistinguono le cosiddetteσ-algebre (”sigma-algebre”):

Definizione 3: sia Ω un insieme. Una famiglia (o classe) Σ di sottoinsiemi di Ω e unaσ-algebra se vale

(σ1) Ω ∈ Σ (l’insieme Ω fa parte di Σ);

(σ2) se A ∈ Σ, allora A ∈ Σ (con A, anche il suo complemento fa parte di Ω);

(σ3) se A1, A2, A3, . . . ∈ Σ, allora A1 ∪ A2 ∪ A3 ∪ . . . ∈ Σ (l’unione di una famigliaenumerabile di sottoinsiemi in Σ fa parte di Σ).

Osservazioni:

(i) Da (σ1) e (σ2) segue immediatamente che ∅ ∈ Ω, dal momento che ∅ = Ω e Ω ∈ Σ.

(ii) Da (σ3) segue in particolare che con A ∈ Σ e B ∈ Σ vale anche A∪B ∈ Σ (e quindiche l’unione di una famiglia finita di sottoinsiemi in Σ fa parte di Σ).

(iii) Da (σ2) e (ii) segue che l’intersezione di due elementi di Σ e anch’essa in Σ (e quindiche cio vale anche per intersezioni finite); per verificarlo, basta utilizzare la relazione

di de Morgan A ∩B = A ∪B.

Esempi:

1) Per uno spazio campionario finito Ω, e sempre possibile lavorare con l’intera famigliadei sottoinsiemi di Ω. In questo caso, come abbiamo mostrato nell Cap. III, vale5

|Σ| = 2|Ω| (cioe, se Ω contiene n elementi allora include 2n sottoinsiemi).

2) Consideriamo nuovamente l’esperimento casuale ”lancio di un dado”; se sono interes-sato unicamente alla parita/disparita del risultato, all’interno di Ω = 1, 2, 3, 4, 5, 6posso limitarmi a scegliere la σ-algebra Σ = ∅,P ,D,Ω, con P = 2, 4, 6 eD = 1, 3, 5. Σ deve contenere ∅ e Ω per soddisfare la Def. 3.

3) Per l’esperimento ”tiro al bersaglio” (es. 3), pag. 66) e sufficiente la σ-algebraΣ = ∅, C,Q \ C,Q.

4in particolare, nel caso della ”probabilita geometrica” (come nell’esempio del bersaglio) la famigliadi tutti i sottoinsiemi risulta troppo vasta

5ricorda: |M | indica il numero di elementi (cioe la cosiddetta cardinalita) di un insieme finito M

Calcolo delle probabilita, corso scientifico (V0.1) 68 LiLu1, 3N (Luca Rovelli)

Page 8: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

4) Consideriamo il seguente esperimento casuale: spezzo in due parti uno spago lungo1 metro. Se sono interessato ad esempio alla lunghezza del frammento sinistro, enaturale scegliere Ω = [0, 1]. Inoltre, se voglio considerare soltanto eventi qualiE: ”il frammento sinistro e lungo tra 30 e 40 centimetri” non utilizzero quale Σl’intera famiglia dei sottoinsiemi di Ω, ma soltanto la piu piccola σ-algebra conte-nente gli intervalli chiusi di [0, 1]. In questo caso, sara naturale associare all’eventoE menzionato l’intervallo E = [0, 3; 0, 4].

Passiamo ora alla definizione rigorosa di spazio di probabilita, data da Kolmogorov nel1933. Essa sintetizza, essenzialmente, le proprieta che accomunano gli approcci classico,frequentista e soggettivo.

Definizione 4: uno spazio di probabilita e costituito da una terna (Ω,Σ, p), dove

• Ω e un insieme, lo spazio campionario;

• Σ e una σ-algebra di Ω, la classe degli eventi misurabili;

• p e una funzione Σ → R (cioe una legge che assegna univocamente un numeroreale ad ogni evento misurabile), la misura di probabilita

tale che

(p1) p(E) ≥ 0 per ogni E ∈ Σ (cioe: ogni evento misurabile ha probabilita positiva);

(p2) p(Ω) = 1 (cioe: l’evento certo ha probabilita 1);

(p3) se E1, E2, E3, . . . sono eventi incompatibili a due a due, allora

p(E1 ∪ E2 ∪ E3 ∪ . . .) = p(E1) + p(E2) + p(E3) + . . .

(cioe: le probabilita di eventi incompatibili si sommano).

Osservazione: gli assiomi della Def. 4 non danno alcuna indicazione sul modo in cuila funzione p debba essere costruita, e non hanno a priori alcuna attinenza con la realtafisica di un esperimento casuale. Essi stabiliscono soltanto quali sono le regole che p devesoddisfare. Il grosso vantaggio di un approccio assiomatico e dato dal fatto che ogni affer-mazione dimostrata a partire dagli assiomi e valida ogni qual volta essi sono soddisfatti.Cio permette di costruire una teoria matematica coerente.

Esempi:

1) Consideriamo l’esperimento ”lancio di un dado equo”. In entrambi gli approccitradizionali sembra sensato assegnare ad ogni evento elementare la stessa proba-bilita; con Ω = 1, 2, 3, 4, 5, 6 porremo quindi

p(1) = p(2) = p(3) = p(4) = p(5) = p(6) =1

6.

Calcolo delle probabilita, corso scientifico (V0.1) 69 LiLu1, 3N (Luca Rovelli)

Page 9: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Per l’evento E: ”l’esito e pari” varra quindi

p(E) = P (2, 4, 6) = p (2 ∪ 4 ∪ 6) = p(2) + p(4) + p(6) =1

6+

1

6+

1

6=

1

2.

2) Consideriamo la seguente variante dell’es. 1): il dado e truccato in modo tale chel’esito ”6” esca con frequenza tripla rispetto a tutti gli altri. Sara quindi sensatoassegnare ad esso una probabilita tripla rispetto alle probabilita dei restanti esiti.Sia quindi x la probabilita degli eventi ”1”, ”2”, ”3”, ”4” e ”5” (e quindi 3x laprobabilita di ”6”): dovra valere

1 = p(S) = p(1, 2, 3, 4, 5, 6) = p (1 ∪ 2 ∪ 3 ∪ 4 ∪ 5 ∪ 6)= p(1) + p(2) + p(3) + p(4) + p(5) + p(6)= x+ x+ x+ x+ x+ 3x = 8x ,

cioe 8x = 1, x = 18. Sara quindi sensato porre

p(1) = p(2) = p(3) = p(4) = p(5) =1

8e p(6) =

3

8.

Per l’evento E: ”l’esito e pari” varra quindi stavolta

p(E) = P (2, 4, 6) = p (2 ∪ 4 ∪ 6) = p(2) + p(4) + p(6) =1

8+

1

8+

3

8=

5

8.

3) Consideriamo l’esperimento ”spago lunga 1 metro che si spezza” (v. sopra). Suppo-nendo che possa spezzarsi in un punto qualsiasi, sara sensato scegliere la probabilitache il tratto sinistro sia lungo non meno di a metri e non piu di b metri in manieraproporzionale alla lunghezza dell’intervallo stesso. Porremo quindi

p ([a, b]) = b− a .

Per l’evento E: ”il tratto sinistro misura meno di 10 cm oppure piu di 70 cm” varraquindi

p(E) = p ([0; 0, 1] ∪ [0, 7; 1]) = p ([0; 0, 1])+p ([0, 7; 1]) = (0, 1−0)+(1−0, 7) = 0, 1+0, 3 = 0, 4 .

4) Per l’esperimento ”bersaglio quadrato” (vedi pag. 66) sara sen-sato scegliere la probabilita di un evento in modo proporzionalealla superficie che lo rappresenta. Indicando con r il raggio delcerchio, dovra quindi valere

p(C) =r2π

(2r)2=π

4∼= 0, 785 .

QC

Per la σ-algebra Σ = ∅, C,Q \ C,Q (cfr. pag. 68) sceglieremo quindi

p(∅) = 0 , p(C) =π

4∼= 0, 785 , p(Q \ C) = 1− π

4∼= 0, 215 e p(Q) = 1 .

Calcolo delle probabilita, corso scientifico (V0.1) 70 LiLu1, 3N (Luca Rovelli)

Page 10: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

4. Spazi campionari finiti

In questo paragrafo prenderemo in considerazione solo spazi campionari finiti. In altreparole, ci occuperemo soltanto di esperimenti casuali con un numero finito di esiti pos-sibili. In questo caso la definizione di spazio di probabilita assume una forma piu semplice:

Definizione 4′: uno spazio di probabilita finito e costituito da uno spazio campio-nario finito Ω e da una funzione p (la misura di probabilita) che associa ad ognievento E ⊆ Ω un numero reale p(E) in modo tale che valga quanto segue:

(p1) p(E) ≥ 0 per ogni E ⊆ Ω;

(p2) p(Ω) = 1;

(p′3) se E1 ed E2 sono eventi incompatibili, allora

p(E1 ∪ E2) = p(E1) + p(E2) .

In altre parole: scegliamo quale σ-algebra Σ la famiglia di tutti i sottoinsiemi di Ω e lacosiddetta σ-additivita (p3) (che contempla unioni infinite di eventi) e sostituita dallasemplice additivita (p′3) (che considera solo unioni finite).

La realizzazione pratica di una misura di probabilita su uno spazio finito e molto semplice:e sufficiente ”suddividere” equamente la probabilita totale tra gli eventi elementari.

Teorema 1: sia Ω = e1, e2, e3, . . . , en uno spazio campionario finito, e sianop1, p2, . . . , pn numeri reali nell’intervallo [0, 1] tali che valga

p1 + p2 + . . .+ pn = 1 .

Allora la leggep(ek1 , ek2 , . . . , ekm) = pk1 + pk2 + . . .+ pkm

definisce una misura di probabilita su Ω, con

p(e1) = p1 , p(e2) = p2 , . . . , p(en) = pn .

In altre parole: otteniamo una misura di probabilita su Ω semplicemente assegnando adogni evento elementare una probabilita in modo tale che il totale sia pari ad 1.

Esempi:

1) Una ”ruota della fortuna consiste” di 5 settori circolari,ciascuno di angolo al centro pari a 72, ai quali vengonoassociati premi da 0, 5, 10, 50 e 100 franchi. Qual e laprobabilita di vincere almeno 50 franchi?

Calcolo delle probabilita, corso scientifico (V0.1) 71 LiLu1, 3N (Luca Rovelli)

Page 11: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Potremmo procedere ”geometricamente” come visto nel paragrafo precedente, con-siderando lo spazio campionario (infinito!) di tutti i punti sulla superficie dellaruota. Oppure, tenendo conto del fatto che siamo interessati a cinque soli esiti,potremmo piuttosto lavorare con lo spazio campionario finito

Ω = 0, 5, 10, 50, 100 .

Dal momento che ogni settore ha la stessa ampiezza, assegneremo ad ogni eventoelementare la stessa probabilita x; chiaramente, deve valere

p(0)+p(5)+p(10)+p(50)+p(100) = 1 ⇐⇒ 5x = 1 ⇐⇒ x =1

5= 0, 2

e quindi p(0) = p(5) = p(10) = p(50) = p(100) = 15.

Per l’evento E: ”vinco almeno 50 franchi” vale quindi

p(E) = p(50, 100) = p(50) + p(100) =1

5+

1

5=

2

5= 0, 4 .

Nota che, data l’equiprobabilita, avremmo potuto procedere con la definizione Lapla-ciana: p(E) = k

n= 2

5.

2) Supponiamo ora che i settori della ruota corrispondentiai premi di 100, 50, 10, 5 e 0 franchi abbiano ampiezzedi 24, 48, 72, 96, 120. Qual e, ora, la probabilita divincere almeno 50 franchi?

Le ampiezze dei settori sono multiple di 24; con x = p(100) sara quindi sensatoporre

p(0) + p(5) + p(10) + p(50) + p(100) = 1 ⇐⇒ 5x + 4x + 3x + 2x + x = 1

⇐⇒ 15x = 1 ⇐⇒ x =1

15

e quindi

p(100) =1

15, p(50) =

2

15, p(10) =

3

15=

1

5, p(5) =

4

15, p(0) =

5

15=

1

3.

Per l’evento E: ”vinco almeno 50 franchi” vale quindi

p(E) = p(50, 100) = p(50) + p(100) =2

15+

1

15=

3

15=

1

5= 0, 2 .

Nota che, dal momento che non vi e piu equiprobabilita, la definizione classica nonpuo essere applicata (con 5 settori; lo si potrebbe pero fare dividendo la ruota in 15parti uguali...).

Per altri esempi analoghi si vedano le pagine 69 e 70 (esempi 1) e 2)).

Calcolo delle probabilita, corso scientifico (V0.1) 72 LiLu1, 3N (Luca Rovelli)

Page 12: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Osservazione: se, come nel primo esempio, lo spazio campionario Ω = e1, e2, . . . , ene equiprobabile, dobbiamo porre p(ei) = 1

nper ogni i. Per un evento E contenente k

elementi vale quindi

p(E) =1

n+

1

n+ . . .+

1

n︸ ︷︷ ︸k volte

=k

n

(”casi favorevoli”

”casi possibili”

).

Per spazi equiprobabili finiti, la definizione assiomatica ci riconduce quindi forzatamentealla definizione Laplaciana!

5. Teoremi sulla probabilita

Ricaviamo ora dagli assiomi di Kolmogorov alcune utili conseguenze.

Teorema 2: sia Ω uno spazio campionario, e E ⊆ Ω.

(i) (probabilita dell’evento impossibile) p(∅) = 0 ;

(ii) (probabilita dell’evento complementare) p(E) = 1− p(E).

Dimostrazione:

(i) Dato che Ω = Ω ∪∅ e Ω ∩∅ = 0, (cioe: Ω e l’unione disgiunta di Ω e ∅) per (p3)deve valere

1 = p(Ω) = p(Ω ∪∅) = p(Ω) + p(∅) = 1 + p(∅) ⇐⇒ 1 = 1 + p(∅)

e quindi p(∅) = 0.

(ii) Dato che Ω = E ∪ E e E ∩ E = 0, (cioe: Ω e l’unione disgiunta di E e E) per (p3)deve valere

1 = p(Ω) = p(E ∪ E) = p(E) + p(E)

e quindi p(E) = 1− p(E)

ΩEE

Esempi

1) Considera l’esperimento casuale ”lancio di due dadi” (equi), e l’evento E: ”la sommadei punti e superiore a 10”. Allora potremmo scrivere E = 5 + 6, 6 + 5, 6 + 6, equindi

p(E) =3

62=

1

12;

per l’evento E: ”la somma dei punti e al massimo 10” varra quindi

p(E) = 1− p(E) = 1− 1

12=

11

12.

Come gia mostra il precedente esempio, la relazione tra p(E) e p(E) puo rivelarsimolto utile nei casi in cui la probabilita dell’evento complementare e piu sempliceda calcolare.

Calcolo delle probabilita, corso scientifico (V0.1) 73 LiLu1, 3N (Luca Rovelli)

Page 13: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

2) Lanciando 6 monete, qual e la probabilita di ottenere almeno 2 volte ”testa”?

Sia E l’evento ”almeno due volte testa”, e siano E2, E3,. . . gli eventi ”esattamentedue volte testa”, ”esattamente tre volte testa” e cosı via. Allora vale E = E2∪E3∪E4 ∪ E5 ∪ E6 (unione disgiunta), e quindi, ragionando direttamente,

p(E) = p(E2) + p(E3) + p(E4) + p(E5) + p(E6) =

(62

)26

+

(63

)26

+

(64

)26

+

(65

)26

+

(66

)26

=15 + 20 + 15 + 6 + 1

64=

57

64.

Ragionando invece sul fatto che vale E: ”nessuna oppure una testa”, avremmopotuto calcolare innanzitutto la probabilita dell’evento complementare E = E0∪E1:

p(E) = p(E0) + p(E1) =

(60

)26

+

(61

)26

=1 + 6

64=

7

64

e quindi p(E) = 1− 764

= 5764

.

3) Un celebre esempio in cui conviene ricorrere alla probabilita dell’evento comple-mentare e il cosiddetto paradosso dei compleanni: in un gruppo di persone, qual ela probabilita che almeno due festeggino il compleanno lo stesso giorno?

Sia n ≤ 365 il numero di persone prese in considerazione6. Per risolvere il problema,trascuriamo gli anni bisestili e supponiamo che un compleanno possa cadere con lastessa probabilita in un qualsiasi giorno. Sia E l’evento ”almeno due compleanni co-incidono”; grazie alla definizione Laplaciana, per l’evento E: ”tutti gli n compleannicadono in giorni diversi” vale

p(E) =D365

n

D365

n

=365 · 364 · . . . · (365− n+ 1)

365n

(si tratta di distribuire n oggetti diversi su 365 posti). Quindi, la probabilita cercatae pari a

p(E) = 1− p(E) = 1− D365n

D365

n

=365n − 365 · 364 · . . . · (365− n+ 1)

365n.

Per n = 20 vale p(E) ∼= 0, 411; in una classe di 20 allievie quindi abbastanza probabile che (almeno) due compleannicoincidano. Inoltre, per n = 22 vale p(E) ∼= 0, 476 e pern = 23 vale p(E) ∼= 0, 507: a partire da 23 persone, e piuprobabile che due compleanni coincidano piuttosto che tuttele date siano differenti!

Il grafico a destra mostra la probabilita di p(E) in funzionedi n (con n ≤ 100); la sua crescita repentina e evidente.

6con n > 365 due compleanni coinciderebbero di sicuro, in virtu del principio dei cassetti: se k + 1oggetti sono riposti in k cassetti, un cassetto conterra piu di un oggetto

Calcolo delle probabilita, corso scientifico (V0.1) 74 LiLu1, 3N (Luca Rovelli)

Page 14: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Proseguiamo con un risultato di natura tecnica:

Lemma 3: sia Ω uno spazio campionario, e A,B ⊆ S. Allora vale

p(A \B) = p(A)− p(A ∩B) .

Dimostrazione: dal momento che A =(A \B

)∪(A ∩B

)(unione disgiunta), vale

p(A) = p(A \B

)+ p(A ∩B

)e la tesi segue immediatamente

ΩA B

Occupiamoci ora, dati due eventi A e B, della probabilita che si avveri A oppure B (cioeche almeno uno dei due eventi si verifichi).

ΩA B

L’intuizione ci fa supporre che la somma p(A) + p(B) contenga due volte la probabilitadell’intersezione A ∩ B (cioe che si avverino entrambi gli eventi A e B). Cio ci conducenaturalmente al seguente risultato (di cui diamo comunque una dimostrazione formale):

Teorema 4: siano A e B due eventi di uno spazio campionario Ω. Allora vale

p(A ∪B) = p(A) + p(B)− p(A ∩B) .

Dimostrazione: dato che A ∪ B = (A \ B) ∪ B e (A \ B) ∩ B = ∅, da(p3) ricaviamo,con l’ausilio del Lemma 3,

p(A ∪B) = p(A \B) + p(B) = p(A)− p(A ∩B) + p(B)

Esempio: estraggo una carta da un mazzo di 52; siano A: ”la carta e di picche” e B: ”lacarta e una figura”. Calcola la probabilita di C: ”la carta e di picche oppure una figura”.

Qui vale chiaramente p(A) = 1352

= 14

e p(B) = 1252

= 313

; per l’evento A ∩ B: ”la carta euna figura di picche” vale inoltre p(A ∩B) = 3

52, e infine

p(C) = p(A∪B) = p(A) + p(B)− p(A∩B) =1

4+

3

13− 3

52=

13 + 12− 3

52=

22

52=

11

26.

In effetti, 22 (= 13 + 12− 3) carte del mazzo sono figure oppure carte di picche.

Calcolo delle probabilita, corso scientifico (V0.1) 75 LiLu1, 3N (Luca Rovelli)

Page 15: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

6. Probabilita condizionata e indipendenza

Esempi introduttivi

1) Lancio un dado (equo). Sapendo che l’esito e pari, con quale probabilita esso saraun numero primo?

La risposta e immediata: il fatto che l’esito sia pari riduce, per cosı dire, lo spaziocampionario da 1, 2, 3, 4, 5, 6 a 2, 4, 6. Tra gli eventi elementari rimasti, l’unicoa rappresentare un numero primo e 2. Quindi, p = 1

3.

2) Il paradosso del secondo figlio7: ho due figli, e almeno uno di essi e maschio; conche probabilita lo sono entrambi?

Di primo acchito, potrebbe sembrare che l’informazione fornita non cambi la pro-babilita in questione. Consideriamo invece i sessi dei due figli in ordine di nascita: apriori, essi danno luogo allo spazio campionario ,, , , e l’informazioneriduce tale spazio a ,, . La probabilita cercata e quindi pari a 1

3.

Piu in generale, siano A e B due eventi di uno spazio campio-nario Ω. Supponiamo di voler determinare la probabilita di Bsapendo che A si e verificato, indicata con p(B|A) (leggi ”Bdato A”). Come sopra, ragionando sul fatto che la condizione”A si e verificato” attribuisce ad A il ruolo di ”nuovo” spaziocampionario, possiamo motivare la seguente

ΩB A

A ∩B

Definizione 5: sia Ω uno spazio campionario, e A,B ⊆ Ω. Allora la probabilitacondizionata di B dato A e pari a

p(B|A) =p(A ∩B)

p(A).

Altri esempi

1) Come cambia la probabilita del precedente es. 1 se il dado e truccato in modo taleche le facce 1, 2 e 3 compaiano con frequenza doppia?

Occorre innanzitutto definire una nuova misura di probabilita su Ω = 1, 2, 3, 4, 5, 6;se x = p(4)

(= p(5) = p(6)

)deve valere

p(1)+p(2)+p(3)+p(4)+p(5)+p(6) = 2x+2x+2x+x+x+x = 1 ⇐⇒ x =1

9,

quindi

p(1) =2

9, p(2) =

2

9, p(3) =

2

9, p(4) =

1

9, p(5) =

1

9, p(6) =

1

9.

7proposto nel 1959 dal matematico statunitense Martin Gardner (1914-2010) nella rubrica di giochimatematici di Scientific American (l’edizione americana di Le Scienze)

Calcolo delle probabilita, corso scientifico (V0.1) 76 LiLu1, 3N (Luca Rovelli)

Page 16: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Con A: ”l’esito e pari” e B: ”l’esito e primo” calcoliamo quindi

p(B|A) =p(A ∩B)

p(A)=

p(2)p(2) + p(4) + p(6)

=29

29

+ 19

+ 19

=1

2.

2) Da un’urna contenente 10 sferette rosse e 5 verdi vengono effettuate 2 estrazioni(senza reimmissione). Sapendo che la prima estratta e rossa, con quale probabilitala seconda sara verde?

Con A: ”la prima estratta e rossa” e B: ”la seconda estratta e verde” vale

p(A) =2

3, p(A ∩B) =

10 · 5D15

2

=50

210=

5

21,

e

p(B|A) =p(A ∩B)

p(A)=

52123

=5

21· 3

2=

5

14.

Potremmo (giustamente) obiettare che tale risultato e ovvio, e non richiede certa-mente le operazioni aritmetiche effettuate: togliendo una sferetta rossa dall’urna,abbiamo ridotto a 14 il numero di sferette, di cui 5 verdi!

In effetti, molto spesso e il calcolo di p(A ∩ B) a risultare piu problematico, e quindi lalegge della probabilita condizionata si rivela utile per quest’ultimo:

Teorema 5 (Teorema del prodotto, o della probabilita composta): sia Ω uno spaziocampionario, e A,B ⊆ Ω. Allora vale

p(A ∩B) = p(A) · p(B|A) .

Esempio: una confezione di 12 lampadine ne contiene 4 difettose. Con quale probabilitadue lampadine estratte a caso (senza reimmissione) saranno entrambe utilizzabili?

Con A: ”la prima e utilizzabile” e B: ”la seconda e utilizzabile” vale A ∩ B: ”entrambesono utilizzabili. Calcoliamo quindi

p(A ∩B) = p(A) · p(B|A) =8

12· 7

11=

14

33

dove p(B|A) = 711

rappresenta la probabilita che la seconda sia utilizzabile sapendo chela prima lo e.

Naturalmente il teorema del prodotto e generalizzabile all’intersezione di piu eventi: adesempio

p(A ∩B ∩ C) = p((A ∩B) ∩ C

)= p(A ∩B) · p(C|A ∩B) = p(A) · p(B|A) · p(C|A ∩B)

cioep(A ∩B ∩ C) = p(A) · p(B|A) · p(C|A ∩B)

Calcolo delle probabilita, corso scientifico (V0.1) 77 LiLu1, 3N (Luca Rovelli)

Page 17: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

e, piu in generale, per una famiglia A1, A2, . . . , An di eventi

p(A1 ∩A2 ∩A3 ∩ . . . ∩An) = p(A1)p(A2|A1)p(A3|A1 ∩A2) . . . p(An|A1 ∩A2 ∩ . . . ∩An−1)

(la dimostrazione rigorosa di questa affermazione fa uso del principio di induzione, vediCap. V).

Esempio: nella situazione dell’esempio precedente, qual e la probabilita di estrarre 2lampadine funzionanti seguite da due difettose?

Con A1: ”la I e OK”, A2: ”la II e OK”, A3: ”la III e difettosa”, A4: ”la IV e difettosa”vale

p(A1 ∩ A2 ∩ A3 ∩ A4) = p(A1)p(A2|A1)p(A3|A1 ∩ A2)p(A4|A1 ∩ A2 ∩ A3)

=8

12· 7

11· 4

10· 3

9=

28

495∼= 0, 057 .

Consideriamo ora il caso in cui il verificarsi di un evento A non influenza il verificarsi diun ulteriore evento B. Allora e chiaro che vale p(B|A) = p(B). Cio motiva la seguente

Definizione 6: due eventi A e B sono detti stocasticamente indipendenti (o anchesolo indipendenti) se vale

p(A ∩B) = p(A) · p(B) .

Nota che la definizione, in linea con l’approccio assiomatico, fa riferimento soltanto alleproprieta aritmetiche di p (e quindi non al modo in cui p viene definito concretamente);in realta, per la sua applicazione noi dedurremo spesso l’indipendenza dalla situazioneconcreta (dedurremo cioe l’indipendenza stocastica da un’indipendenza causale).

Tipicamente, vi e indipendenza nel caso di estrazioni ripetute con reimmissione.

Esempio: consideriamo nuovamente la situazione iniziale dell’esempio 3: un’urna con-tiene 15 sferette di cui 10 sono rosse e 5 verdi.

a) Con che probabilita 2 sferette estratte di seguito con reimmissione sono entramberosse?Se poniamo A: ”la prima e rossa” e B: la seconda e rossa” possiamo supporre chegli eventi A e B siano indipendenti, e pertanto

p(A ∩B) = p(A) p(B) =1

3· 1

3=

1

9.

b) Estraggo, con reimmissione, 5 sferette. Con quale probabilita le prime 3 sarannoverdi e le rimanenti due rosse?Anche in questo caso, l’indipendenza dei 5 eventi ”la prima e verde”, ”la seconda everde” e cosı via ci conduce, per l’esito che potremmo indicare con V V V RR, a

p(V V V RR) =1

3· 1

3· 1

3· 2

3· 2

3=

(1

3

)3

·(

2

3

)2

=22

35=

4

243∼= 0, 016 .

Calcolo delle probabilita, corso scientifico (V0.1) 78 LiLu1, 3N (Luca Rovelli)

Page 18: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

c) Estraggo, con reimmissione, 5 sferette. Con quale probabilita esattamente 2 di essesaranno verdi?

L’evento ”esattamente 2 sono verdi” si puo realizzare in(

52

)modi (come gli ana-

grammi di ”VVRRR”); ognuno di essi ha la probabilita calcolata al punto b), e trat-tandosi di eventi incompatibili le singole probabilita vanno sommate. Per l’eventoE: ”esattamente 2 sono verdi” vale quindi

p(E) =

(5

2

)(1

3

)3

·(

2

3

)2

= 10 · 4

243=

40

243∼= 0, 16 .

Osservazione: possiamo procedere in modo analogo ogni qual volta vi e la ripetizionedi un esperimento con due soli possibili esiti (fra loro complementari) in maniera tale chele prove ripetute diano luogo a eventi indipendenti. Piu tardi (IV.11), caratterizzeremoquesto tipo di situazioni mediante la cosiddetta distribuzione binomiale.

d) Quante sferette devo estrarre, con reimmissione, affinche la probabilita che almenouna di esse sia verde superi il valore 0,99?Sia En: ”in n estrazioni, almeno una sferetta e verde”; allora vale En: ”in n estrazionitutte le sferette sono rosse”. La probabilita di En e molto piu semplice da calcolare;in effetti vale

p(En) = 1− p(En) = 1−(

2

3

)n

e quindi

p(En) ≥ 0, 99 ⇐⇒ 1−(

2

3

)n

≥ 0, 99 ⇐⇒(

2

3

)n

≤ 0, 01

⇐⇒ n log2

3≤ log 0, 01 ⇐⇒ n ≥ −2

log 2− log 3∼= 11, 4 .

Occorrono quindi almeno 12 estrazioni.

A volte, l’indipendenza puo essere abbinata con il Teorema 4 (pag. 75).

Esempio: un tiratore fa centro il 50% delle volte; un secondo tiratore fa centro il 40%delle volte. Se sparano entrambi sul bersaglio, ...

a) ... con quale probabilita entrambi faranno centro?Possiamo supporre che gli eventi A: ”il primo fa centro” e B: ”il secondo fa centro”siano indipendenti; allora la probabilita cercata e

p(A ∩B) = p(A) · p(B) =1

2· 2

5=

1

5= 0, 2 .

b) ... con quale probabilita almeno uno di loro fara centro?Si tratta della probabilita dell’evento A ∪B; con il Teorema 4 avremo

p(A∪B) = p(A)+p(B)−p(A∩B) = p(A)+p(B)−p(A)·p(B) =1

2+

2

5−1

5=

1

2+

1

5=

7

10= 0, 7 .

Calcolo delle probabilita, corso scientifico (V0.1) 79 LiLu1, 3N (Luca Rovelli)

Page 19: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

7. Il teorema della probabilita totale

Esempio: ho due monete. La prima e equa, mentre la seconda e truccata in modo taleche l’esito ”testa” si verifichi con frequenza pari al 75%. Scelgo a caso una moneta e lalancio. Con quale probabilita l’esito sara ”croce”?

Sia A: ”scelgo la moneta equa”, B: ”scelgo la moneta truccata”, T : ”l’esito e testa” e C:”l’esito e croce”. Scrivendo C come unione disgiunta ricaviamo

p(C) = p((C ∩ A) ∪ (C ∩B)

)= p(C ∩ A) + p(C ∩B)

(ottengo croce se scelgo la prima moneta e ottengo croce oppure se scelgo la seconda eottengo croce); grazie al Teorema 5 vale poi

p(C∩A)+p(C∩B) = p(A) p(C|A)+p(B) p(C|B) =1

2· 14

+1

2· 12

=1

8+

1

4=

3

8= 0, 375 .

Osservazione: gli eventi A e B rappresentano una partizione dello spazio campionario,sono cioe incompatibili e tali che Ω = A ∪ B. Essi inducono quindi un’unione disgiuntadi ogni evento di Ω:

Ω

A B

C ∩ A C ∩B C = (C ∩ A) ∪ (C ∩B)

La situazione puo essere efficacemente rappresentata con l’ausilio di un diagramma adalbero; la scrittura al disopra dei rami delle corrispondenti probabilita facilita il calcolodi p(C):

12

mmmmmmmmmmmmmmmm12

PPPPPPPPPPPPPP

A34

14

@@@@@@@ B12

12

@@@@@@@

T C T C

p(C) =1

2· 1

4+

1

2· 1

2=

3

8.

L’idea puo essere facilmente generalizzata: se la collezione di eventi A1, A2, . . . , Anrappresenta una partizione di uno spazio campionario, se vale cioe

Ω = A1 ∪ A2 ∪ . . . ∪ An con Ai ∩ Aj = ∅ per i 6= j

allora ogni evento B ⊆ Ω viene ”partizionato” a sua volta:

ΩA1 A2 · · · An

B B = (B∩A1)∪(B∩A2)∪. . .∪(B∩An)

Calcolo delle probabilita, corso scientifico (V0.1) 80 LiLu1, 3N (Luca Rovelli)

Page 20: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Assieme all’assioma (p3) e al Teorema 5 si ricava immediatamente il

Teorema 6 (teorema della probabilita totale): sia Ω uno spazio campionario,A1, A2, . . . , An una sua partizione e B ⊆ Ω un evento. Allora vale

p(B) = p(B ∩ A1) + p(B ∩ A2) + . . .+ p(B ∩ An)

= p(A1) p(B|A1) + p(A2) p(B|A2) + . . .+ p(An) p(B|An) .

Esempio: un certo manufatto viene prodotto da 3 fabbriche; la prima delle tre garantisceil 50% della produzione, di cui il 93% di prima qualita; la seconda garantisce il 30% dellaproduzione, di cui il 99% di prima qualita, la terza garantisce il 20% della produzione, dicui il 95% di prima qualita. Con che probabilita un manufatto scelto a caso tra l’interaproduzione sara di prima qualita?

Definiamo innanzitutto i 3 eventi A1: ”il pezzo proviene dalla I fabbrica”, A2: ”il pezzoproviene dalla II fabbrica”, A3: ”il pezzo proviene dalla III fabbrica”. Allora vale

p(A1) =50

100=

1

2, p(A2) =

30

100=

3

10, p(A3) =

20

100=

1

5.

Con B: ”il pezzo e di prima qualita” sono altresı note le probabilita condizionate:

p(B|A1) =93

100, p(B|A2) =

99

100, p(B|A3) =

95

100=

19

20.

Non ci resta che calcolare

p(B) = p(A1)p(B|A1) + p(A2)p(B|A2) + p(A3)p(B|A3)

=1

2· 93

100+

3

10· 99

100+

1

5· 19

20=

119

125= 0, 952 (= 95, 2%) .

E direttamente con un diagramma ad albero:

12

eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee15

YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY

310

I fabbr.93100

sssssssss

FFFFFFFFFF II fabbr.99100

ssssssssss

GGGGGGGGGG III fabbr.1920

rrrrrrrrrr

HHHHHHHHHHH

I qual. no I qual. no I qual. no

p(”I qualita”) =1

2· 93

100+

3

10· 99

100+

1

5· 19

20=

119

125= 0, 952 .

Calcolo delle probabilita, corso scientifico (V0.1) 81 LiLu1, 3N (Luca Rovelli)

Page 21: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

8. Il teorema di Bayes

Ci occupiamo ora della cosiddetta probabilita delle cause, riutilizzando in parte gli esempidel paragrafo precedente.

Iniziamo con un semplice risultato, che mette in relazione la probabilita condizionata diA dato B con la probabilita condizionata di B dato A:

Lemma 7 : siano A e B due eventi di uno spazio campionario Ω. Allora vale

p(A|B) =p(A) · p(B|A)

p(B)risp. p(B|A) =

p(B) · p(A|B)

p(A).

Dimostrazione: segue da p(A ∩B) = p(A) · p(B|A) = p(B) · p(A|B)

Esempio: ho due monete. La prima e equa, mentre la seconda e truccata in modo taleche l’esito ”testa” si verifichi con frequenza pari al 75%. Scelgo a caso una moneta e lalancio. Ottengo ”testa”. Con quale probabilita si trattava della moneta truccata?

Sia A: ”scelgo la moneta equa”, B: ”scelgo la moneta truccata”, T : ”l’esito e testa” e C:”l’esito e croce”. Grazie al Lemma 7 possiamo ricondurre il calcolo di p(B|T ) (cioe dellaprobabilita che la moneta sia truccata sapendo che l’esito e ”testa”) al calcolo di p(T |B)(cioe della probabilita che l’esito sia ”testa” sapendo che la moneta e truccata):

p(B|T ) =p(B) · p(T |B)

p(T ).

E gia noto che vale p(B) = 12

e p(T |B) = 34; per il calcolo di p(T ) sfruttiamo un dia-

gramma ad albero (applichiamo cioe implicitamente il Teorema 6):

12

nnnnnnnnnnnnnn12

RRRRRRRRRRRRRRRRR

A34

14

;;;;;;;;; B12

~~~~~~~12

;;;;;;;;;

T C T C

p(T ) =1

2· 3

4+

1

2· 1

2=

5

8.

(chiaro: si tratta dell’evento complementare all’evento C di pag. 80!).

Vale quindi p(B|T ) =p(B) · p(T |B)

p(T )=

12· 1

258

=1

4· 8

5=

2

5.

Osservazione: dal momento che gli eventi A e B rappresentano una partizione dellospazio campionario, avremmo potuto tener conto direttamente della ”formula” per laprobabilita totale, e quindi calcolare

p(B|T ) =p(B) · p(T |B)

p(A)p(T |A) + p(B)p(T |B)=

12· 1

212· 3

4+ 1

2· 1

2

=2

5

(nota che il diagramma ad albero contiene tutte le informazioni necessarie!).

Calcolo delle probabilita, corso scientifico (V0.1) 82 LiLu1, 3N (Luca Rovelli)

Page 22: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Ragionando in modo analogo con una partizione qualsiasi ricaviamo immediatamente ilseguente risultato:

Teorema 8 : sia A1, . . . , Ak una partizione di uno spazio campionario Ω, e siaB ⊆ Ω. Allora vale, per k = 1, . . . , n,

p(Ak|B) =p(Ak) · p(B|Ak)

p(B)=

p(Ak) · p(B|Ak)

p(A1)p(B|A1) + p(A2)p(B|A2) + . . .+ p(An)p(B|An).

Esempio: un certo manufatto viene prodotto da 3 fabbriche; la prima delle tre garantisceil 50% della produzione, di cui il 93% di prima qualita; la seconda garantisce il 30% dellaproduzione, di cui il 99% di prima qualita, la terza garantisce il 20% della produzione, dicui il 95% di prima qualita. Ho acquistato un manufatto scadente. Con che probabilitaesso proveniva dalla prima fabbrica?

Siano nuovamente A1: ”il pezzo proviene dalla I fabbrica”, A2: ”il pezzo proviene dallaII fabbrica”, A3: ”il pezzo proviene dalla III fabbrica”, e sia B: ”il pezzo e scadente”.La probabilita cercata e p(A1|B). Rappresentiamo la situazione con un diagramma adalbero:

12

eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee15

YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY

310

I fabbr.93100

vvvvvvvvvvv7

100

IIIIIIIII II fabbr.99100

uuuuuuuuuuu1

100

IIIIIIIIII III fabbr.1920

uuuuuuuuuuu120

IIIIIIIIII

I qual. scad. I qual. scad. I qual. scad.

Calcoliamo

p(A1|B) =p(A1) · p(B|A1)

p(A1)p(B|A1) + p(A2)p(B|A2) + p(A3)p(B|A3)

=12· 7

10012· 7

100+ 3

10· 1

100+ 1

5· 1

20

=7

200· 125

6=

35

48∼= 0, 73 .

Un altro celebre esempio relativo all’applicazione del teorema di Bayes e il paradossodelle tre scatole, proposto dal matematico francese Joseph Bertrand nel suo Calcul desprobabilites (1889): sono date tre scatole, ognuna delle quali contiene due monete. Laprima contiene due monete d’oro, la seconda due d’argento e la terza una moneta d’oroe una d’argento. Scelgo a caso una scatola ed estraggo una moneta. E d’oro. Con cheprobabilita lo sara anche la seconda moneta della stessa scatola?

Siano O: ”la moneta estratta e d’oro”, A: ”la moneta estratta e d’argento”, OO: ”hoscelto la prima scatola”, AA: ”ho scelto la seconda” e OA: ”ho scelto la terza”. Laprobabilita cercata e p(OO|O), cioe la probabilita che la scatola scelta sia la prima sapendoche la moneta estratta e d’oro.

Calcolo delle probabilita, corso scientifico (V0.1) 83 LiLu1, 3N (Luca Rovelli)

Page 23: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Rappresentiamo la situazione per mezzo di un diagramma ad albero:

13

ggggggggggggggggggggggggg13

WWWWWWWWWWWWWWWWWWWWWWWWW

13

OO

1

0

>>>>>>>>> AA

0

~~~~~~~~1

>>>>>>>>> OA12

~~~~~~~~ 12

>>>>>>>>>

O A O A O A

e calcoliamo

p(OO|O) =p(OO) · p(O|OO)

p(OO)p(O|OO) + p(AA)p(O|AA) + p(O)p(O|OA)

= 13· 1

13· 1 +

1

3· 0 +

13· 1

2

=1

1 + 12

=2

3.

La probabilita che anche la seconda moneta sia d’oro e pari a 23.

9. Variabili aleatorie discrete

Spesso le caratteristiche degli esiti di un esperimento casuale vengono espresse per mezzodi valori numerici, ad esempio:

1) il numero di esiti Testa nel lancio di n monete;

2) la somma dei punteggi nel lancio di n dadi;

3) la percentuale di pezzi difettosi prodotti da una fabbrica in un determinato lasso ditempo.

Tali valori, associati ai rispettivi esiti, rappresentano funzioni aventi immagini nell’insiemeR dei numeri reali.

Definizione 7: sia Ω uno spazio campionario. Una funzione

X : Ω −→ R

e detta variabile aleatoria (o variabile casuale, o anche variabile stocastica). Se Ω eun insieme finito o enumerabile la variabile aleatoria si dice discreta.

Le variabili aleatorie vengono solitamente indicate da lettere maiuscole (X, Y , Z, W , ...).

Esempi

1) Consideriamo il lancio di 3 monete; allora possiamo porre

Ω = TTT, TTC, TCT, TCC,CTT,CTC,CCT,CCC.

Calcolo delle probabilita, corso scientifico (V0.1) 84 LiLu1, 3N (Luca Rovelli)

Page 24: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

SiaX(e) := il numero di T nell’esito e

la variabile aleatoria che computa il numero di esiti Testa; vale

X(TTT ) = 3 ; X(TTC) = X(TCT ) = X(CTT ) = 2 ;

X(TCC) = X(CTC) = X(CCT ) = 1 ; X(CCC) = 0 .

2) Consideriamo il lancio di due dadi, e quindi

Ω = ij |1 ≤ i, j ≤ 6 = 11, 12, 13, . . . , 64, 65, 66 .

SiaX(ij) := i+ j

la variabile aleatoria relativa alla somma dei due punteggi. Allora essa assumeravalori nell’insieme 1, 2, . . . , 11, 12; in particolare,

X(11) = 2 , X(12) = X(21) = 3 , X(13) = X(22) = X(31) = 4 ,

X(14) = X(23) = X(32) = X(41) = 5 , X(15) = X(24) = X(33) = X(42) = X(51) = 6 ,

X(16) = X(25) = X(34) = X(43) = X(52) = X(61) = 7 ,

X(26) = X(35) = X(44) = X(53) = X(62) = 8 , X(36) = X(45) = X(54) = X(63) = 9 ,

X(46) = X(55) = X(64) = 10 , X(56) = X(65) = 11 , X(66) = 12 .

3) Considera il seguente esperimento: lancio una moneta fino al primo esito Testa. Nerisulta uno spazio campionario infinito (ma enumerabile):

Ω = T,CT,CCT,CCCT,CCCCT, . . . .

La variabile aleatoriaX(C . . . CT︸ ︷︷ ︸

n

) := n

rappresenta il ”tempo d’attesa”, cioe il numero di lanci fino al primo esito T . Vale

X(T ) = 1 , X(CT ) = 2 , X(CCT ) = 3 , X(CCCT ) = 4 , . . .

Passiamo ora ad un’altra nozione fondamentale.

Definizione 8: sia X : Ω → R una variabile aleatoria (discreta). La funzione realedefinita da

f(x) := p(X = x)

che associa ad x ∈ R la probabilita che X assuma il valore x e la distribuzione diprobabilita della variabile aleatoria X.Se f(x) e la distribuzione di X, si scrive anche X ∼ f(x).

Calcolo delle probabilita, corso scientifico (V0.1) 85 LiLu1, 3N (Luca Rovelli)

Page 25: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Esempi (v. sopra)

1) Per il lancio di tre monete, se X rappresenta il numero di esiti Testa, vale

f(0) = p(X = 0) =1

8, f(1) = p(X = 1) =

3

8,

f(2) = p(X = 2) =3

8, f(3) = p(X = 3) =

1

8.

La distribuzione puo efficacemente essere rap-presentata per mezzo dell’istogramma a destra.

2) Sia X la somma dei punti nel lancio di tre dadi; tabelliamo i valori della sua distri-buzione, e in seguito ne disegniamo l’istogramma:

x 2 3 4 5 6 7 8 9 10 11 12p(X = x) 1

36118

112

19

536

16

536

19

112

118

136

3) Sia X il numero di lanci necessari ad ottenere il primo esito Testa; otteniamo

x 1 2 3 4 5 . . .

p(X = x) 12

14

18

116

132 . . .

e quindi p(X = x) = p(C . . . CT︸ ︷︷ ︸x

) =

(1

2

)x

.

Calcolo delle probabilita, corso scientifico (V0.1) 86 LiLu1, 3N (Luca Rovelli)

Page 26: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Osservazione: sia Ω uno spazio campionario e X una variabile aleatoria con insiemedelle immagini Im(X) = x1, x2, x3, . . .. Allora vale certamente

(i) f(xi) = p(X = xi) ≥ 0 ∀ i(dal momento che rappresentano delle probabilita),

(ii)∑

x∈ Im(X)

f(x) = f(x1) + f(x2) + f(x3) + . . . = 1

(dal momento che, complessivamente, gli eventi ”X = xi” rappresentano la certezza).

Tali proprieta vengono utilizzate per definire assiomaticamente il concetto di distribuzionediscreta di probabilita.

Verifichiamo (ii) per gli esempi trattati sopra:

1)∑

x∈ Im(X)

p(X = xi) = p(X = 0)+p(X = 1)+p(X = 2)+p(X = 3) =1

8+

3

8+

3

8+

1

8= 1

2)∑

x∈ Im(X)

p(X = xi) = p(X = 2) + p(X = 3) + p(X = 4) + . . .+ p(X = 12)

=1

36+

2

36+

3

36+

4

36+

5

36+

6

36+

5

36+

4

36+

3

36+

2

36+

1

36= 1

3)∑

x∈ Im(X)

p(X = xi) =1

2+

1

4+

1

8+

1

16+

1

32+ . . . ;

si tratta di una ”somma infinita”, per il cui studio necessiteremo della nozione dilimite (in particolare, interpreteremo ”somme infinite” come limiti di somme finite).

In questo caso, si tratta di una serie geometrica, cioe di una somma i cui terminisuccessivi hanno tra loro un rapporto costante (1

2, qui). Come vedremo, nel nostro

caso cio conduce a 12

+ 14

+ 18

+ . . . = 1. Non e difficile convincersi di cio suddividendoun segmento di lunghezza unitaria:

12

14

18

116

. . .

10. Valore atteso e varianza

Definizione 9: sia X : Ω → R una variabile aleatoria (discreta), con Im(X) =x1, x2, x3, . . .. Il suo valore atteso (o speranza matematica) e il numero reale indi-cato con E[X] (o anche con µX) e definito da

E[X] =∑i

xi · p(X = xi) = x1 · p(X = x1) + x2 · p(X = x2) + x3 · p(X = x3) + . . .

Se X ∼ f(x), possiamo anche scrivere E[X] =∑i

xi f(xi).

Calcolo delle probabilita, corso scientifico (V0.1) 87 LiLu1, 3N (Luca Rovelli)

Page 27: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Esempi

1) Sia Ω = 1, 2, 3, 4, 5, 6 lo spazio campionario relativo all’esperimento casuale ”lanciodi un dado equo”, e sia X la variabile aleatoria indicante il punteggio di un lancio.Allora vale

E[X] =6∑

i=1

i · p(X = i) = 1 · p(X = 1) + 2 · p(X = 2) + . . .+ 6 · p(X = 6)

=1

6+

2

6+

3

6+

4

6+

5

6+

6

6=

1 + 2 + 3 + 4 + 5 + 6

6=

21

6=

7

2= 3, 5 .

2) Sia X il numero di esiti Testa nel lancio di tre monete (vedi pag. 84); allora vale

E[X] =4∑

i=0

i · p(X = i) = 0 · p(X = 0) + 1 · p(X = 1) + 2 · p(X = 2) + 3 · p(X = 3)

= 0 · 1

8+ 1 · 3

8+ 2 · 3

8+ 3 · 1

8=

0 + 3 + 6 + 3

8=

12

8=

3

2= 1, 5 .

3) Sia X la somma dei punti nel lancio di due dadi (vedi pag. 85); allora

E[X] =12∑i=2

i · p(X = i)

= 2 · p(X = 2) + 3 · p(X = 3) + . . . + 11 · p(X = 11) + 12 · p(X = 12)

=2 · 1 + 3 · 2 + 4 · 3 + . . . + 11 · 2 + 12 · 1

36=

252

36= 7 .

4) Sia X il numero di lanci di una moneta necessari per ottenere il primo esito Testa(vedi pag. 85); allora il valore atteso e una ”somma infinita”

E[X] =∞∑i=1

i · p(X = i) =∞∑i=0

i

2i=

1

2+

2

4+

3

8+

4

16+

5

32+

6

64+ . . .

Il suo valore, cioe il valore cui si avvicina indefinitamente la successione delle sommefinite 1

2+ 2

4, 1

2+ 2

4+ 3

8, 1

2+ 2

4+ 3

8+ 4

16ecc. e pari a 2.

Osservazione: proviamo a considerare il valore atteso dal punto di vista frequentista;sia Ω uno spazio campionario finito, e sia X una variabile aleatoria su Ω con Im(X) =x1, x2, . . . , xn e siano p(X = x1) = f1

n, p(X = x2) = f2

n, . . . , p(X = x2) = fn

nle proba-

bilita stimate da n ripetizioni dell’esperimento casuale. Allora vale

Calcolo delle probabilita, corso scientifico (V0.1) 88 LiLu1, 3N (Luca Rovelli)

Page 28: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

E[X] =n∑

i=1

xi · p(X = i) =∞∑i=1

xi ·fin

=f1x1 + f2x2 + . . . fnxn

n.

Evidentemente, si tratta della media ponderata degli esiti nelle n ripetizioni dell’esperimen-to. Per tale motivo, il valore atteso E[X] viene a volte chiamato semplicemente media.Piu rigorosamente, dalla legge dei grandi numeri (vedi IV.13) segue che il valore attesopuo essere interpretato come il valore a cui si avvicina la media degli esiti se un espe-rimento casuale viene ripetuto n volte con ”n tendente a infinito”. In particolare, E[X]non e per forza un valore assumibile dalla variabile aleatoria X, come mostrano gli e-sempi precedenti (quindi, la denominazione ”valore atteso” non si rivela particolarmentefelice...).

Introduciamo ora una misura per la dispersione degli esiti in un esperimento casuale.

Definizione 10: sia X : Ω → R una variabile aleatoria (discreta), con valore attesoE[X] = µX .

(i) La variabile aleatoria (X − µX)2 e detta scarto quadratico di X.

(ii) Il valore atteso di quest’ultima e la varianza Var(X) = E [(X − µX)2].

(iii) La deviazione standard (o scarto tipo, o anche scarto quadratico medio) di Xe il numero reale S(X) =

√Var(X).

A volte, la deviazione standard viene indicata con σX , e quindi la varianza con σ2X . Nota

che σX viene espressa con la stessa unita di misura di X, e cio ne rende a volte preferibilel’impiego.

Dalla definizione segue immediatamente il

Lemma 9: siaX : Ω→ R una variabile aleatoria (discreta), con valore atteso E[X] = µe Im(X) = x1, x2, x3, . . .. Allora vale

Var(X) =∑i

(xi − µ)2 · p(X = xi)

= (x1 − µ)2 · p(X = x1) + (x2 − µ)2 · p(X = x2) + (x3 − µ)2 · p(X = x3) + . . .

Grazie al lemma (e agli esempi sottostanti) e possibile intuire perche lo scarto quadratico(X−µX)2 e preferibile al semplice scarto X−µX : utilizzando quest’ultimo la somma con-sisterebbe di addendi positivi e negativi che annullerebbero vicendevolmente i rispettivicontributi. A tal proposito sarebbe possibile impiegare anche lo scarto assoluto |X−µX |,ma la problematicita della funzione x 7→ |x| ne rende sconsigliabile l’utilizzo.

Calcolo delle probabilita, corso scientifico (V0.1) 89 LiLu1, 3N (Luca Rovelli)

Page 29: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Esempi (vedi sopra)

1) Lancio di un dado equo: Ω = 1, 2, 3, 4, 5, 6, X rappresenta il punteggio di unlancio. Allora vale µX = 3, 5 e

Var(X) = (1− 3, 5)2 p(X = 1) + (2− 3, 5)2 p(X = 2) + . . .+ (6− 3, 5)2 p(X = 6)

=2, 52 + 1, 52 + 0, 52 + 0, 52 + 1, 52 + 2, 52

6=

17, 5

6∼= 2, 92 .

Quindi vale σ2X∼= 2, 92 e σX ∼= 1, 71.

2) Sia X il numero di esiti Testa nel lancio di tre monete; allora µX = 1, 5 e

Var(X) = (0− 1, 5)2 p(X = 0) + . . . + (3− 1, 5)2 · p(X = 3)

=1 · 1, 52 + 3 · 0.52 + 3 · 0.52 + 1 · 1, 52

8=

6

8=

3

4= 0, 75 .

Quindi vale σ2X = 0, 75 e σX =

√0, 75 ∼= 0, 87.

11. La distribuzione binomiale

Esempio introduttivo: consideriamo l’esperimento casuale tre lanci di un dado equo.Ad ogni lancio, dichiariamo come un successo un esito 5 oppure 6 e come un insuccessoun esito inferiore a 5. Lo spazio campionario relativo all’esperimento puo essere sceltocome segue:

Ω = iii, iis, isi, iss, sii, sis, ssi, sssSia X : Ω → R la variabile aleatoria indicante il numero di successi. Calcoliamo ladistribuzione8 f(k) = p(X = k) di X, e rappresentiamone l’istogramma:

k 0 1 2 3

f(k)(

23

)3 ∼= 0, 30 3 · 13·(

23

)2 ∼= 0, 44 3 ·(

13

)2 · 23∼= 0, 22

(13

)3 ∼= 0, 04

8a volte, se X assume valori interi, si preferisce indicarli con k piuttosto che con x

Calcolo delle probabilita, corso scientifico (V0.1) 90 LiLu1, 3N (Luca Rovelli)

Page 30: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Consideriamo ora lo stesso esperimento ma con 50 lanci. Allora per la distribuzione di Xvale

f(k) = p(X = k) =

(50

k

)·(

1

3

)k

·(

2

3

)50−k

e l’istogramma ha l’aspetto seguente:

(nota che il valore massimo di f(k) vieneraggiunto per k ∼= 1

3 · 50).

L’esperimento considerato consiste in una successione di prove tra loro indipendenti aventitutte la stessa probabilita di successo, un cosiddetto processo bernoulliano.

Definizione 11

(i) Un esperimento casuale con due soli esiti tra loro complementari (successo einsuccesso) e detto esperimento di Bernoulli.

(ii) Una sequenza di n esperimenti di Bernoulli indipendenti tra loro dove la proba-bilita di successo e costante e detta processo di Bernoulli di lunghezza n.

L’esempio standard di un processo bernoulliano e costituito da una sequenza di n estra-zioni con reimmissione (osserviamo immediatamente che avremmo potuto sostituire nell’e-sempio introduttivo il lancio di un dado con l’estrazione da un’urna contenente due pallinenere e una bianca, dove quest’ultima rappresenta il ”successo”).

Formalizziamo la situazione: sia Ω lo spazio campionario degli esiti di un processo bernoul-liano di lunghezza n. Allora possiamo porre

Ω =ω = ω1ω2 . . . ωn |ωi ∈ s, i

(in altre parole: l’insieme di tutte le ”parole” di n lettere scelte tra s e i). Sia inoltreX la variabile aleatoria che indica il numero di successi (che ”conta”, cioe, il numero dis in una sequenza ω). Allora, vista l’indipendenza, la probabilita di k successi e pari apk(1− p)n−k, e per la distribuzione di X possiamo scrivere

f(k) = p(X = k) =

(n

k

)pk(1− p)n−k .

Calcolo delle probabilita, corso scientifico (V0.1) 91 LiLu1, 3N (Luca Rovelli)

Page 31: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Definizione 12: sia X una variabile aleatoria discreta; essa segue una distribuzionebinomiale di parametri n e p se vale

p(X = k) = Bn,p(k) =

(n

k

)pk(1− p)n−k .

In questo caso scriveremo anche X ∼ Bn,p(k).

E immediato verificare che una legge di questo tipo soddisfa gli ”assiomi” per una di-stribuzione di probabilita menzionati a pagina 87 : innanzitutto e chiaro che Bn,p(k) ≥ 0,e inoltre

n∑k=0

Bn,p(k) =n∑

k=0

(n

k

)pk(1− p)n−k = (p+ 1− p)n = 1n = 1

per la formula binomiale (vedi Cap. III, pag. 60).

Per il valore atteso e la varianza si ha quanto segue:

Teorema 10: sia X ∼ Bn,p(x). Allora vale

E[X] = np e Var(X) = np(1− p) .

Dimostramo soltanto la prima della due formule. Il valore atteso di X ∼ Bn,p(x) vale

E[X] =n∑

k=0

k · p(X = k) =n∑

k=1

k · Bn,p(k) =n∑

k=1

k

(n

k

)pk(1− p)n−k (1)

(si noti che il termine con k = 0 e nullo).

Trattiamo dapprima il termine k ·(nk

):

k

(n

k

)= k · n!

k!(n− k)!= k · n(n− 1)!

k(k − 1)!(n− k)!= n · (n− 1)!

(k − 1)!(n− k)!=

= n · (n− 1)!

(k − 1)!((n− 1)− (k − 1))!= n ·

(n− 1

k − 1

);

inseriamo il risultato in (1); utilizzando il fatto che pk = p · pk−1 si ricava

E[X] =n∑

k=1

n

(n− 1

k − 1

)ppk−1(1− p)n−k = np

n∑k=1

(n− 1

k − 1

)pk−1(1− p)n−k .

Sostituiamo k − 1 con m (e quindi anche i limiti della sommatoria con 0 e n− 1, e n− kcon n− (m+ 1) = (n− 1)−m); con l’aiuto della formula binomiale si ottiene

E[X] = npn−1∑m=0

(n− 1

m

)pm(1− p)(n−1)−m = np (p+ 1− p)n−1︸ ︷︷ ︸

1

= np

Calcolo delle probabilita, corso scientifico (V0.1) 92 LiLu1, 3N (Luca Rovelli)

Page 32: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

Osservazione: a dire il vero, se interpretiamo E[X] come una media, il risultato E[X] =np e perfettamente comprensibile. Se p rappresenta la probabilita di successo in unesperimento bernoulliano, allora lo si puo interpretare (”frequentisticamente”) come lapercentuale di successi nella sua ripetizione. In media, ci attenderemo quindi circa n · psuccessi in n esecuzioni dell’esperimento!

Esempio: supponiamo che il 3% di tutti gli smartphone di un dato modello siano difet-tosi. Allora p = 3

100rappresenta la probabilita che la scelta di un cellulare a caso (un

esperimento bernoulliano!) sia difettoso, e su una scelta di 1000 cellulari ci attenderemoall’incirca 1000 · 3

100= 30 pezzi difettosi (nota che, se la produzione e sufficientemente

vasta, potremmo considerare come praticamente indipendenti le estrazioni anche nel casoin cui non vi sia reimmmissione).

12. Altre distribuzioni discrete di probabilita

Iniziamo dalla cosiddetta distribuzione ipergeometrica.

Esempio: in un’urna sono presenti 7 palline bianche e 4 nere. Estraendone 5, qual e laprobabilita che esattamente 2 siano bianche?

Utilizzando la definizione Laplaciana, computiamo il rapporto tra le estrazioni possibilidi 2 bianche tra 7 e 3 nere da 4 e le estrazioni possibili di 5 palline da 11:

p =

(72

)·(

43

)(115

) =21 · 4462

=2

11∼= 0, 18 .

In generale, si considerano N oggetti, di cui R presentano una data caratteristica C.Estraendone n, senza reimmissione, la variabile aleatoria X indicante il numero di oggettiestratti aventi la caratteristica C segue una distribuzione data da

p(X = k) = HN,R,n(k) =

(Rk

)·(N−Rn−k

)(Nn

) .

Definizione 13: una variabile aleatoria discreta X per cui vale X ∼ HN,R,n segue unadistribuzione ipergeometrica di parametri N , R e n.

Quindi, una distribuzione ipergeometrica si applica nel caso di estrazioni senza reimmis-sione.

Esempi

1) Nell’esempio introduttivo, vale N = 11, R = 7 , n = 5; abbiamo calcolato

p(X = 2) = H11,7,5(2) =

(72

)·(

11−75−2

)(115

) ∼= 0, 18 .

Calcolo delle probabilita, corso scientifico (V0.1) 93 LiLu1, 3N (Luca Rovelli)

Page 33: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

2) quanto vale, nel Lotto svizzero a numeri (6 su 45), la probabilita di indovinarequattro numeri estratti?

Tra i sei numeri di una griglia, 4 devono appartenere ai 6 estratti e 2 ai rimanenti39. Quindi, se X indica i numeri azzeccati, vale

p(X = 4) = H45,6,6(4) =

(64

)·(

392

)(456

) ∼= 0, 0014 .

Per quanto riguarda valore atteso e varianza, vale il

Teorema 11: sia X ∼ HN,R,n. Allora

E[X] =nR

Ne Var(X) =

nR

N

(1− R

N

)(N − nN − 1

).

Ad esempio, per quanto riguarda l’estrazione del lotto, se X rappresenta i numeri azzec-cati vale n = 45, R = n = 6 e quindi E[X] = 6·6

45= 0, 8.

Descriviamo ora un’ulteriore distribuzione discreta, definita pero su uno spazio campio-nario infinito ma enumerabile.

Esempio: lancio una moneta fino al primo esito Testa. Se X rappresenta il numero dilanci necessari, abbiamo gia mostrato (pag. 86) che vale p(X = k) = 1

2k.

Piu in generale, si considera la ripetizione indipendente di un esperimento casuale (comeun’estrazione senza reimmissione) avente probabilita di successo pari a p. Allora, se Xrappresenta il ”tempo d’attesa”, cioe il numero di ripetizioni necessarie al primo successo,vale

p(X = k) = Gp(k) = (1− p)k−1p

(dal momento che a k − 1 insuccessi deve far seguito un successo).

Definizione 14: una variabile aleatoria discreta X per cui vale X ∼ Gp segue unadistribuzione geometrica di parametro p.

Esempio: quanto vale la probabilita di ottenere il primo esito 6 dopo 4 lanci di un dado?

Con p = 16, calcoliamo p(X = 5) = G 1

6(5) =

(56

)5 · 16

= 55

66∼= 0, 067.

Teorema 12: sia X ∼ Gp. Allora vale

E[X] =1

pe Var(X) =

1− pp2

.

Esempio: per quanto riguarda il ”tempo d’attesa” dell’esito 6 nel lancio di un dado, conp = 1

6varra E[X] = 6 (in media, dovremo attendere 6 lanci).

Calcolo delle probabilita, corso scientifico (V0.1) 94 LiLu1, 3N (Luca Rovelli)

Page 34: Capitolo IV : Calcolo delle Probabilit aweb.ticino.com/lucarovelli/appunti/3N_Cap4_Probabilita.pdfNel corso del XX secolo, in particolare grazie al matematico italiano Bruno de Finetti

13. La legge dei grandi numeri

Per concludere, menzioniamo un risultato fondamentale che, come abbiamo gia fattonotare, attribuisce un significato ben preciso alla nozione di valore atteso. Per la suacomprensione, occorre ancora specificare che due variabili aleatorie X e Y sono dette in-dipendenti se vale p(X = x e Y = y) = p(X = x) · p(Y = y). Cio e verificato ad esempionel caso di un processo di Bernoulli, dove gli esperimenti non si influenzano a vicenda.

Teorema 13 (la Legge forte dei grandi numeri)

Siano X1, X2, X3, . . . variabili aleatorie indipendenti e identicamente distribuite, conE[X1] = E[X2] = . . . = µ. Sia Sn la variabile aleatoria ottenuta sommando le prime nvariabili Xi:

Sn =n∑

i=1

Xi = X1 +X2 + . . .+Xn .

Allora vale

p

(limn→∞

Sn

n= µ

)= 1 ,

cioe: la media delle variabili aleatorie Xi si avvicina al valore atteso µ con probabilitapari a 1.

Proviamo ad applicare tale teorema nel caso di un processo di Bernoulli. Sia p la proba-bilita di successo e sia Xi la variabile aleatoria che assume il valore 1 se l’i-esimo esito eun successo e il valore 0 in caso contrario. Allora vale

E[Xi] = 1 · p(Xi = 1) + 0 · p(Xi = 0)︸ ︷︷ ︸0

= p .

La variabile aleatoria Sn = X1 + . . .+Xn computa il numero complessivo di successi in nripetizioni dell’esperimento; applicando il Teorema 14 ricaviamo

p

(limn→∞

Sn

n= p

)= 1 ,

cioe, in poche parole, al crescere delle ripetizioni dell’esperimento, la frequenza dei successisi avvicinera a p (con probabilita pari a 1).

Calcolo delle probabilita, corso scientifico (V0.1) 95 LiLu1, 3N (Luca Rovelli)