Matematica e Statistica per Scienze Ambientali ... · Roma, Gennaio 2013 ENRICO ROGORA Matematica e...

68
Matematica e Statistica per Scienze Ambientali Probabilit ` a - Appunti ENRICO ROGORA 1 1 Dipartimento di Matematica ”Sapienza”, Universit ` a di Roma Roma, Gennaio 2013 ENRICO ROGORA Matematica e Statistica

Transcript of Matematica e Statistica per Scienze Ambientali ... · Roma, Gennaio 2013 ENRICO ROGORA Matematica e...

Matematica e Statistica per Scienze AmbientaliProbabilita - Appunti

ENRICO ROGORA1

1Dipartimento di Matematica”Sapienza”, Universita di Roma

Roma, Gennaio 2013

ENRICO ROGORA Matematica e Statistica

Introduzione alla probabilita

Per introdurre il calcolo delle probabilita cominciamo con il fenomenoaleatorio piu semplice: il lancio di una moneta.Bisogna distinguere tra un prima (di conoscere l’esito del lancio) daun dopo. E chiaro che questa differenza e relativa: IO possoconoscere l’esito ma TU no. Assumeremo sempre che io e te si abbiala stessa conoscenza relativa al fenomeno aleatorio di cui si staparlando e useremo il NOI per riferirci a tutti coloro che condividonoquesta conoscenza.

Dopo

Siamo nel campo del certo. L’esito e Testa oppure Croce.

Prima

Siamo nel campo dell’incerto, ma la nostra ignoranza non ecompleta. Sappiamo che sono possibili due soli esiti. Inoltre, se nonabbiamo motivo di dubitare che la moneta sia contraffatta,condividiamo l’aspettativa che entrambi gli esiti siano EQUIPROBABILI.

ENRICO ROGORA Matematica e Statistica

La probabilita

La probabilita di un evento aleatorio ovvero di un evento possibile e di cui nonsi ha necessariamente una conoscenza completa, come l’evento esce testanel lancio di una moneta, e un numero che quantifica la nostra fiducia nel suoverificarsi. Piu il numero e grande, maggiore e la nostra fiducia. Un eventocerto ha probabilita 1. Un evento impossibile ha probabilita 0.La definizione classica definisce come probabilita di un evento il rapporto trail numero dei casi favorevoli e il numero dei casi possibili. Per esempio, laprobabilita di estrarre un asso da un mazzo di 40 carte e 4 (numero di casifavorevoli) diviso 40 (numero di casi possibili).La definizione frequentista definisce come probabilita di un evento il limitedelle frequenze relative di osservazione dell’evento in ripetizioni identiche diun esperimento, al tendere all’infinito del numero delle osservazioni.Secondo questo approccio anche eventi non impossibili possono avereprobabilita zero e anche eventi non certi possono avere probabilita 1.La definizione soggettivista definisce come probabilita di un evento il costo diuna scommessa equa sul verificarsi dell’evento, per cui la vincita paghi 1.Secondo questo approccio e possibile assegnare una probabilita anche aeventi non ripetibili.

ENRICO ROGORA Matematica e Statistica

La definizione frequentista: un esempioQuando asseriamo che un certo tiratore ha probabilita pari al 92% di colpire ilbersaglio, intendiamo dire che su 100 colpi sparati in certe e ben definitecondizioni (per esempio, il bersaglio posto a una determinata distanza, lastessa arma utilizzata, ecc.), ci sono circa 92 successi (e quindi circa 8 errori)IN MEDIA. Non intendiamo che ci saranno esattamente 92 successi ogni 100colpi; alle volte ce ne sarannoo 93, altre 94; altre volte il numero dei successipotra anche essere notevolmente piu grande di 92, altre volte notevolmentepiu piccolo; ma nella media, dopo un grande numero di ripetizioni di colpisparati nelle stesse condizioni la percentuale dei colpi andati a segno resterala stessa, purche con il passare del tempo nessun cambiamento essenzialeabbia luogo nelle condizioni di sparo. (Per esempio, il tiratore potrebbeaumentare le sue capacita e aumentare la sua percentuale di centri al 95%).L’esperienza mostra che per un tale tiratore, il numero di centri su 100 colpisara vicino a 92; quelle serie di 100 colpi per cui il il numero dei successi einferiore a 88 o superiore a 96, sebbene possano capitare, capiterannoraramente.Il numero 92% che serve come indice della bravura di un tiratore e di normamolto stabile; cioe la percentuale dei bersagli colpiti nella maggioranza dei tiri(nelle stesse condizioni) sara quasi sempre circa lo stesso, deviandosignificativamente dal suo valor medio solo in casi rari.

Gnedenko - Kinchin An el. intro to the theory of prob.ENRICO ROGORA Matematica e Statistica

Problema

Un tiratore ha l’80% di probabilita di colpire un bersaglio. Un secondo tiratore,nelle stesse condizioni del primo, ha il 70% di probabilita di colpire ilbersaglio. Qual e la probabilita che il bersaglio sia colpito quando entrambi itiratori sparano contemporaneamente?Assumiamo che siano sparati 100 colpi simultanei. Il bersaglio sara centratodal primo tiratore approssimativamente 80 volte. Le rimanenti 20 volte, in cuiil primo tiratore manca il bersaglio, ci aspettiamo che il secondo tiratore sia ingrado di colpirlo 14 volte, il che porta il totale a 94 e quindi la probabilitarichiesta e 94% (qui si usa l’ipotesi, ben fondata in questo esempio, che leprobabilita di colpire il bersaglio da parte di uno dei tiratori non sia influenzatadall’altro e quindi che, per il secondo tiratore, i venti tiri colpi mancati dalprimo siano tiri normali, in cui la probabilita di colpire il bersaglio continui adessere del 70%).In questo semplice problema si tratta di calcolare la probabilita di eventicomplicati a partire dalla probabilita di eventi piu semplici. Lo scopo delcalcolo delle probabilita e quello di stabilire regole generali che permettano diautomatizzare il piu possibile questo genere di calcoli. Come in molte altreparti della matematica e possibile ed utile partire introducendo enti primitivi eassiomi e dedurre da questi le regole generali del calcolo.

ENRICO ROGORA Matematica e Statistica

Un esempio importanteSupponiamo che un tiratore debba colpire un bersaglio diviso in duezone, come in figura

La prima zona, il centro del bersaglio, e indicato con 1, la seconda, lacorona circolare colorata, e indicata con 2, e abbiamo riservato ilnumero 3 per indicare l’esterno del bersaglio. Supponiamo, dopoaver osservato numerose serie di colpi, che mediamente, il tiratorecolpisca la zona 1 62 volte, la zona 2 31 e non colpisca il bersaglio 7volte. Consideriamo i tre eventi aleatori: il tiratore colpisce la zona 1del bersaglio, che indicheremo E1; il tiratore colpisce la zona 2 delbersaglio, che indicheremo E2; il tiratore non colpisce il bersaglio, cheindicheremo E3. La nostra aspettazione sull’esito di un lancio si puodunque quantificare ponendo

p(E1) = 0.62 p(E2) = 0.31, p(E3) = 0.7.ENRICO ROGORA Matematica e Statistica

Eventi incompatibili

Gli eventi Ei sono incompatibili, cioe:1 e impossibile che, contemporaneamente, il tiratore colpisca la

zona 1 e la zona 2 del bersaglio, quindi p(E1 e E2) = 0;2 e impossibile che, contemporaneamente, il tiratore colpisca la

zona 1 e la zona 3 del bersaglio, quindi p(E1 e E3) = 0;3 e impossibile che, contemporaneamente, il tiratore colpisca la

zona 2 e la zona 3 del bersaglio, quindi p(E2 e E3) = 0.In generale, se A e B sono due eventi: l’evento A e B che si verificase e solo se si verificano contemporaneamente A e B si dice prodottologico o intersezione di A e B; l’evento A o B che si verifica se e solose si verifica almeno uno tra A e B si dice somma logica o unione di Ae B. L’evento ¬A che si verifica se e solo se non si verifica A si dicenegazione o complementare di A.

ENRICO ROGORA Matematica e Statistica

La regola dell’addizione per eventi incompatibili

La regola piu semplice e piu importante per il calcolo delleprobabilita, che e a fondamento della teoria assiomatica e la regoladell’ addizione per eventi incompatibili.Consideriamo l’evento il tiratore colpisce il bersaglio, che indicheremoE . E chiaro che si verifica l’evento E quando si verifica l’evento E1 osi verifica l’evento E2.Poiche i due eventi sono incompatibili non possono verificarsicontemporaneamente e ci aspettiamo quindi che su 100 tiri in media,il tiratore colpisca il bersaglio 62 + 31 = 93 volte.Possiamo quindi misurare la nostra aspettazione del verificarsi dellasomma logica di due eventi incompatibili qualsiasi A e B, ponendo

p(A o B) = p(A) + p(B) .

ENRICO ROGORA Matematica e Statistica

Cautela

E facile commettere errori grossolani quando si parla di probabilita senon se ne conoscono le basi teoriche. Una porzione significativa diquesti errori riguarda l’errata applicazione della regola di addizioneper eventi incompatibili. Ecco un esempio. Un articolo apparso nelLos Angeles Times (24 Agosto, 1987) discuteva il rischio statisticodell’AIDS in questi termini:

Numersi studi condotti sui partner sessuali di persone infettate con ilvirus responsabile dell’AIDS mostrano che un singolo rapporto vaginalenon protetto comporta un rischio estremamente basso di infettare unpartner non infetto, forse compreso tra 1 su 100 e 1 su 1000. In mediaconsideriamo che il rischio sia di 1 su 500. 100 rapporti non protetti con unpartner infetto accrescono il rischio di infezione ad 1 su 5. Statisticamente,500 rapporti non protetti con un partner infetto o 100 rapporti con 5 partnerportano al 100% di probabilita di infezione (statisticamente, nonnecessariamente in realta)

ENRICO ROGORA Matematica e Statistica

Discussione dell’esempio

Seguendo questo ragionamento, 1000 rapporti non protetti con unpartner infetto condurrebbero ad una probabilita di infezione uguale a2. Per trovare l’errore in questo ragionamento che porta ad unaconclusione manifestamente assurda, consideriamo il caso di duerapporti. A1 denoti l’evento il virus si trasmette con il primo rapporto econ A2 l’evento il virus si trasmette con il secondo rapporto. I dueeventi non sono incompatibili in quanto il virus puo trasmettersi siacon il primo che con il secondo rapporto. Allora per calcolare laprobabilita dell’evento l’infezione si trasmette con il primo o con ilsecondo rapporto non possiamo usare la regola di addizione pereventi incompatibili cioe, quando gli eventi non sono incompatibilip(A1 o A2) 6= p(A1) + p(A2). Vale infatti una regola di addizione piugenerale, valida per coppie di eventi qualsiasi, che asserisce

p(A1 o A2) = p(A1) + p(A2)− p(A1 e A2).

Quindi, quando si valuta la probabilita di un evento composto A1 o A2non si puo trascurare il contributo dell’evento A1 e A2, che haprobabilita nulla solo per eventi incompatibili.

ENRICO ROGORA Matematica e Statistica

Estrazione dall’urna: paradosso di Simpson

Un’urna nera contiene 5 palline rosse e 6 palline verdi e un’urnabianca contiene 3 palline rosse e 4 palline verdi. E permessoscegliere un’urna e quindi scegliere una pallina a caso dall’urna.Scegliendo una pallina rossa si vince un premio. Quale urnaconviene scegliere per effettuare l’estrazione? Estraendo dall’urnanera, la probabilita di scegliere una pallina rossa e 4

11 ' 0.455 (ilnumero di modi in cui e possibile estrarre una pallina rossa diviso ilnumero totale degli esiti possibili). Estraendo dall’urna bianca, laprobabilita di scegliere una pallina rossa e 3

7 ' 0.429 e quindiconviene estrarre dall’urna nera.Consideriamo ora un altro gioco in cui una seconda urna neracontiene 6 palline rosse e 3 palline verdi. e una seconda urna biancache contiene 9 palline rosse e 5 palline verdi. La probabilita diestrarre una pallina rossa dall’urna nera e 6

9 ' 0.667 e quella diestrarre una pallina rossa dall’urna bianca e 9

14 ' 0.643. Cosı,conviene estrarre ancora dall’urna nera.

ENRICO ROGORA Matematica e Statistica

Paradosso di Simpson

Versiamo ora il contenuto della seconda urna nera alla prima urnanera e il contenuto della seconda urna bianca alla prima urna bianca.Ancora, vogliamo calcolare da quale urna conviene scegliere.L’intuizione suggerisce di scegliere ancora l’urna nera, ma calcoliamole probabilita. L’urna nera contiene ora 11 palline rosse e 9 pallineverdi, cosı la probabilita di estrarre una pallina rossa da quest’urna e1120 ' 0.55. L’urna bianca contiene 12 palline rosse e 9 palline verdicosı la probabilita di estrarre una pallina rossa da quest’urna e1221 ' 0.571. Cosı ora conviene scegliere di estrarre dall’urna bianca.Questo risultato contrario all’intuizione e un esempio del paradosso diSimpson, alla base di numerosi errori di interpretazione in statistica.

http://it.wikipedia.org/wiki/Paradosso_di_Simpson

ENRICO ROGORA Matematica e Statistica

Punto di vista assiomatico

E possibile e conveniente formalizzare l’idea di misurare la fiducia,ovvero di assegnare la probabilita all’ esito possibile di unesperimento, di una misurazione, o di una osservazione (Kolmogorov,1933).Senza entrare nel dettaglio di specificare la procedura attraverso cuisi giunge all’assegnazione esplicita delle probabilita, l’approccioassiomatico si occupa di stabilire gli enti fondamentali del calcolodelle probabilita (eventi aleatori e misura di probabilita) e dispecificare gli assiomi che gli enti fondamentali devono verificare, inmaniera analoga a quanto si fa puo fare per la geometria e perl’aritmetica.I concetti fondamentali per la teoria assiomatica della probabilitasono quelli di evento aleatorio, che formalizza il possibile risultato diun esperimento, di una misurazione o di una osservazione e dimisura di probabilita, che formalizza l’idea di fiducia nel verificarsi diun evento aleatorio.

ENRICO ROGORA Matematica e Statistica

Assiomi

Gli eventi aleatori o semplicemente eventi sono sottoinsiemi diuno spazio Ω detto spazio dei campioni e formano una σ-algebraF , cioe: Ω ∈ F ; se A ∈ F allora Ac ∈ F ; l’unione

⋃∞i=1 Ai di ogni

famiglia numerabile di sottoinsiemi Ai ∈ F e ancora un elementodi F .ad ogni evento A ∈ F e assegnanto un numero reale nonnegativo P(A) detto probabilita dell’evento A.P(Ω) = 1.Regola per l’addizione per eventi disgiunti, (o incompatibili). Sedue elementi A e B di F sono disgiunti, ovvero se A ∩ B = ∅,allora P(A ∪ B) = P(A) + P(B).Se Ann=1,2,...,∞ e una successione decrescente di eventi, (cioeAn+1 ⊂ An per ogni n = 1,2, . . . ,∞) e

⋂An = ∅), allora

limn→∞ P(An) = 0.

La terna (Ω,F ,P) si dice spazio di probabilita.

ENRICO ROGORA Matematica e Statistica

Esempi di spazi di probabilita

Lancio di una moneta: spazio campionario, Ω = T ,C; σalgebra degli eventi, F uguale alla famiglia di tutti i sottoinsiemi diΩ; esempio di evento: esce testa = T; si definisce unaprobabilita ponendo p(∅) = 0, p(T) = p, p(C) = 1− p,p(Ω) = 1, con 0 ≤ p ≤ 1.Lancio ripetuto tre volte di una moneta: spazio campionario,Ω = TTT ,TTC,TCT ,TCC,CTT ,CTC,CCT ,CCC; σ algebradegli eventi, F uguale alla famiglia di tutti i sottoinsiemi di Ω;esempio di evento: escono almeno dueteste= TTC,TCT ,CTT ,TTT; si definisce una probabilitaponendo p(E) = |E |/8, dove |E | indica il numero di elementi inE . Per esempio, la probabilita che escano almeno due teste ep(TTC,TCT ,CTT ,TTT) = 4/8 = 1/2.Estrazione di una carta da un mazzo di 40 carte: spaziocampionario; Ω = A♥,A♦,A♣,A♠, . . . ,K♠; σ algebra deglieventi, F uguale alla famiglia di tutti i sottoinsiemi di Ω; esempiodi evento: esce una figura di cuori = J♥,Q♥,K♥; si definisceuna probabilita ponendo p(E) = |E |/40. Per esempio, laprobabilita che esca una figura di cuori ep(J♥,Q♥,K♥) = 3/40.

ENRICO ROGORA Matematica e Statistica

Spazi di probabilita discretiLa teoria della probabilita per spazi campionari finiti e numerabili e piu semplice chenel caso generale. Alcuni parti degli assiomi sono automaticamente verificati. Inparticolare possiamo sempre assumere che la famiglia F degli eventi coincida con lafamiglia P(Ω) di tutti i sottoinsiemi di Ω. Poiche ogni sottoinsieme e in questi due casiunione al piu numerabile dei suoi punti, la probabilita in un insieme finito o numerabile(per brevita un insieme discreto) e completamente determinata dal suo valore sugliinsiemi costituiti da un singolo elemento (eventi elementari). Quando lo spazio deglieventi non e discreto, per esenpio quando Ω = R, questo non e piu vero.

Spazi di probabilita finiti

Ω = ω1, ω2, . . . , ωn.F = P(Ω).

P(ωi ) = pi con pi ≥ 0 e p1 + · · ·+ pn = 1. In generale, se E = ωj1 , . . . ωjk ,P(E) = pj1 + · · ·+ pjk . p1, . . . , pn si dice distribuzione di probabilita su Ω.

Spazi di probabilita numerabili

Ω = ω1, ω2, . . . .F = P(Ω).

P(ωi ) = pi con pi ≥ 0 eP∞

i=1 pi = 1. In generale, se E = ωji i∈I ,P(E) =

Pi∈I pji . p1, p2, p3, . . . si dice distribuzione di probabilita su Ω.

ENRICO ROGORA Matematica e Statistica

Esempio

Spazio di probabilita classico su un insieme finito

Lo spazio di probabilita classico su un insieme finito Ω e la terna(Ω,P(Ω),P) con P la probabilita uniforme che assegna ad ogniE ∈ P(Ω) la frazione di elementi di E , cioe |E |/|Ω|.

Calcoliamo la probabilta che estraendo una carta dal mazzo esca unfante o una figura di cuori. Lo spazio di probabilita adeguato alproblema e costituito dai simboli delle 40 carte e la probabilita equella uniforme che assegna ad ogni carta la stessa probabilita diessere estratta. Questa ipotesi e giustificata assumendo che il mazzovenga ben mescolato prima di ogni estrazione. SiaA = J♥, J♦, J♣, J♠ e B = J♥,Q♥,K♥ L’evento aleatorio di cuici interessa calcolare la probabilita corrisponde all’insieme E = A ∪ Be quindi

p(A∪B) = p(A)+p(B) = p(A∩B) =|A||Ω|

+|B||Ω|−|A ∩ B||Ω|

=4

40+

340− 1

40=

640.

ENRICO ROGORA Matematica e Statistica

Esempio

Sull’insieme Ω = 0,1,2, . . . ,n e definita una famigliaimportantissima di distribuzioni di probabilita. Queste distribuzionidipendono dai parametri n (intero non negativo) e p, numero realecompreso tra 0 e 1. La distribuzione binomiale di parametri n e b edefinita dalla seguente tabella

0 1 . . . k . . . n`n0

´pn(1− p)0 `n

1

´pn−1(1− p)1 . . .

`nk

´pn−k (1− p)k . . .

`nn

´p0(1− p)n

Per verificare che questa e effettivamente una distribuzione, bastaosservare che per la formula dello sviluppo della potenza di unbinomio,

p0 + p1 + · · ·+ pn = (p + (1− p))n = 1.

Per avere un esempio di distribuzione di probabilita sull’insieme deinumeri naturali, dove non e evidentemente possibile definire ladistribuzione uniforme, pasta porre pi = 1

2i .

ENRICO ROGORA Matematica e Statistica

Operazioni logiche e operazioni insiemistiche

L’insieme di tutti i sottoinsiemi di un insieme Ω e dotato di unastruttura algebrica e di una struttura di ordine in cui sono definite leseguenti operazioni e relazioni

Unione A ∪ B = x t .c. x ∈ A o x ∈ BIntersezione A ∩ B = x t .c. x ∈ A e x ∈ BComplemento Ac = x t .c. x 6∈ AOrdinamento A ⊆ B se e solo se x ∈ A implica x ∈ B

Nell’interpretazione assiomatica il prodotto logico di due eventi, cioel’evento A e B viene modellato come l’intersezione dei corrispondentisottoinsiemi dello spazio campionario. La somma logica di dueeventi, cioe l’evento A o B viene modellato come l’unione deicorrispondenti sottoinsiemi dello spazio campionario. La negazione diun evento A viene modellata come il complemento del corrispondentesottoinsieme dello spazio campionario.

ENRICO ROGORA Matematica e Statistica

Proprieta delle operazioni insiemistiche

1 A ∪ ∅ = A, A ∪ B = B ∪ A, A ∪ (B ∪ C) = (A ∪ B) ∪ C, A ∪ A = A2 A ∩ ∅ = ∅, A ∩ B = B ∩ A, A ∩ (B ∩ C) = (A ∩ B) ∩ C, A ∩ A = A3 A∩ (B ∪C) = (A∩B)∪ (A∩C) e A∪ (B ∩C) = (A∪B)∩ (A∪C)

4 (Ac)c = A, A ∪ Ac = Ω, A ∩ Ac = ∅5 (A ∩ B)c = Ac ∪ Ac e (A ∪ B)c = Ac ∩ Bc

6 A ⊂ B e B ⊂ C implica A ⊂ C. A ⊂ B e B ⊂ A implica A = B7 ∅ ⊂ A e A ⊂ Ω per ogni A e8 A ⊆ B se e solo se A ∪ B = B se e solo se A ∩ B = A

ENRICO ROGORA Matematica e Statistica

Conseguenze immediate degli assiomi

1 ∅ ∈ P, infatti il complementare di un evento e un evento e ∅ e ilcomplementare di Ω che e un elemento di F per ipotesi.

2 P(∅) = 0. Infatti ogni evento e incompatibile con l’insieme vuotoperche A ∩ ∅ = ∅, quindi, per la legge di addizione di eventiincompatibili P(Ω) = P(Ω ∪ ∅) = P(Ω) + P(∅), da cui la tesi

3 P(Ac) = 1− P(A). Infatti A e Ac sono incompatibili e quindi,piche A ∪ Ac = Ω, 1 = P(Ω) = P(A) + P(Ac), da cui la tesi.

4 Se A, B ∈ F , allora A ∩ B ∈ F infatti A ∩ B = (Ac ∪ Bc)c mostracom eA ∩ B si costruisce a partire da una successione dioperazioni applicate ad A e B che non fanno uscire da F .

5 Se A ⊆ B ∈ P allora P(A) ≤ P(B). Infatti, B = A ∪ (Ac ∩ B), edessendo A e Ac ∩ B eventi incompatibili,P(B) = P(A) + P(Ac ∩ B) ≤ P(A) perche la probabilita assumevalori non negativi.

ENRICO ROGORA Matematica e Statistica

Regola completa per l’addizioneAbbiamo posto come assioma la regola dell’addizione per eventiincompatibili. Vogliamo generalizzare tale regola al caso di unacoppia di eventi qualsiasi A e B. L’idea e quella di scrivere A ∪ Bcome unione di eventi disgiunti e applicare la regola di addizione pereventi incompatibili.E un semplice esercizio di teoria elementare degli insiemi dimostrareche

A ∪ B = (A ∩ Bc) ∪ (A ∩ B) ∪ (B ∩ Ac)

e che i tre eventi sono incompatibili. Allora, per la formula di additivitaper eventi incompatibili

P(A ∪ B) = P(A ∩ Bc) + P(A ∩ B) + P(B ∩ Ac)

che possiamo riscrivere

P(A∪B) = (P(A ∩ Bc) + P(A ∩ B))+(P(B ∩ Ac) + P(A ∩ B))−P(A ∩ B)

e quindiP(A ∪ B) = P(A) + P(B)− P(A ∩ B)

ENRICO ROGORA Matematica e Statistica

Esempio

Supponiamo che una moneta non truccata sia lanciata due volte. SiaA l’evento ”esce testa al primo lancio” e sia B l’evento ”esce croce alsecondo lancio”. Lo spazio dei campioni e

Ω = TT ,CT ,TC,CC

Assumiamo che ogni esito in Ω sia ugualmente probabile e abbiaquindi probabilita 1

4 . C = A ∪ B e l’evento ”esce testa al primo o alsecondo lancio”. Chiaramente P(C) 6= P(A) + P(B) = 1. Infatti,essendo A∩B l’evento ”esce testa al primo e al secondo lancio”, si ha

P(C) = P(A) + P(B)− P(A ∩ B) = 0.5 + 0.5− 0.25 = 0.75

ENRICO ROGORA Matematica e Statistica

Probabilita e combinatoriaNello studio di semplici giochi aleatori, di procedure di campionamento, di problemi diordinamento e di raggruppamento si tratta solitamente con spazi campionari finiti conprobabilita uniforme, dove la probabilita p(A) di un evento A e semplicemente

p(A) =|A||Ω|

.

Ci si riduce quindi, in questi casi, al problema di contare gli elementi di un insieme.Rivestono particolare importanza alcune regole standard di conteggio cherichiameremo e applicheremo nelle slide successive:

Numero delle coppie, terne, .. n-ple ordinate che si possono formare estraendogli elementi da due, tre,..., n insiemi non necessarriamente distinti. In particolarenumero D′n,k = nk delle k -ple ordinate che si possono estrarre da un insieme di nelementi, dette anche disposizioni con ripetizione di k oggetti scelti da n.Numero Dn,k = (n)k = n(n − 1)(n − 2) · · · (n − k + 1) delle k -ple ordinate dielementi distinti che si possono estrarre da un insieme di n elementi, dette anchedisposizioni senza ripetizione di k oggetti scelti da n. In particolare, il numeroDn,n conta il numero dei diversi ordinamenti che possiamo considerare su noggetti distinguibili o permutazioni di n oggetti. Tale numero coincide con ilfattoriale, precisamente, Dn,n = n!.Numero

Cn,k =“n

k

”=

Dn,k

Dk,k=

n(n − 1) · · · (n − k + 1)

k!=

n!

k! · (n − k)!

dei sottoinsiemi di k elementi che posso estrarre da un insieme di n elementi,dette anche combinazioni (senza ripetizione) di k oggetti scelti da n.

ENRICO ROGORA Matematica e Statistica

Prodotto di due spazi campionari

Definizione

Il prodotto cartesiano di due insiemi Ω1 e Ω2 e l’insieme delle coppieordinate (a,b) con a ∈ Ω1 e b ∈ Ω2, e si indica con il simbolo Ω1 × Ω2.Ovviamente, il prodotto cartesiano di due insiemi finiti e finito e

|Ω1 × Ω2| = |Ω1| · |Ω2|

Principio di moltiplicazione Se un esperimento ammette uno spaziocampionario finito Ω1 costituito da m possibili eventi elementari e unaltro esperimento ammette uno spazio campionario finito Ω2 costituitoda n possibili eventi elementari, allora lo spazio campionariodell’esperimento prodotto che ammette come eventi elementaripossibili le coppie ordinate (ai ,bj ) costituite da: un esito ai del primoesperimento e un esito bj del secondo, ammette come spaziocampionario il prodotto cartesiano Ω1 × Ω2 e ammette quindi mnpossibili eventi elementari.

ENRICO ROGORA Matematica e Statistica

Esempi

Esempio

Le carte di un mazzo francese (52 carte) hanno 13 possibili valori e 4possibili semi. Ci sono quindi 13× 4 possibili combinazioni(valore,seme)

Esempio

Una classe e fatta da 12 ragazzi e 18 ragazze. Il maestro sceglie unragazzo e una ragazza come rappresentanti di classe. Puo farequesta scelta in 12× 18 = 216 modi diversi.

ENRICO ROGORA Matematica e Statistica

Probabilita prodotto

Se (Ω1,P(Ω1), p1 e (Ω2,P(Ω2), p2, sono due spazi di probabilita finiti possiamoconsiderare sul prodotto degli spazi campionari la probabilita prodotto p1 . . . p2 definitadalla distribuzione p1 × p2(ω1, ω2) = p1(ω1) · p2(Ω2). Si ottiene in questo modo lospazio prodotto

Ω1 × Ω2,P(Ω1 ×⊗2), p1 × p2.

Si noti pero che sul prodotto degli spazi campionari si possono considerare anche altreprobabilita che estendono le probabilita assegnate, e non coincidono con la probabilitaprodotto. La scelta di una di queste corrisponde a precise ipotesi sulla dipendenza tra irisultati del primo esperimento e i risultati del secondo esperimento. La scelta dellaprobabilita prodotto equivale ad ipotizzare che i risultati del primo esperimento nonhanno influenza sui risultati del secondo esperimento.Per esempio, supponiamo che il primo esperimento consista nel rilevare l’esito di uncolpo sparato da un certo tiratore e il secondo esperimento consista nel rilevare l’esitodi un colpo sparato da un altro tiratore. L’esperimento combinato consiste nel rilevareentrambi gli esiti.Se i tiratori sparano contemporaneamente, da postazioni separate, e ragionevoleassumere che l’esito del primo tiro non abbia influenza sull’esito del secondo. Se peroil secondo tiratore spara dopo aver conosciuto l’esito del colpo sparato dal primotiratore, l’esito del primo tiro puo influenzare la concentrazione del secondo tiratore emodificare quindi le probabilita degli esiti possibili per il secondo tiro. In questasituazione la probabilita prodotto non sarebbe piu adeguata.

ENRICO ROGORA Matematica e Statistica

Prodotto di un numero finito di spazi campionari

Definizione

Il prodotto cartesiano di k insiemi Ω1, Ω2, . . . , Ωk e l’insieme delle k -ple ordinate(a1, b1, . . . , xk ) con a1 ∈ Ω1, a2 ∈ Ω2, . . . , ak ∈ Ωk , e si indica con il simboloΩ1 × · · · × Ωk . Ovviamente, il prodotto cartesiano di k insiemi finiti e finito e

|Ω1 × · · · × Ωk | = |Ω1| · · · |Ωk |

Principio di moltiplicazione esteso Se k esperimenti ammettono ciascuno uno spaziocampionario finito Ωi costituito da ni possibili eventi elementari, allora lo spaziocampionario dell’esperimento prodotto, che ammette come eventi elementari possibilile k -ple ordinate (a1, b1, . . . , xk ), ammette come spazio campionario il prodottocartesiano Ω1 × · · · × Ωk e ammette quindi n1 · · · nk possibili eventi elementari.

Esempio

Una parola binaria di 8 bit e una successione di 8 cifre, ognuna delle quali puo essere0 o 1. Quante diverse parole da 8 bit si possono avere?Ci sono due scelte per il primo bit, due per il secondo, ecc. e cosı ci sono

2× 2× · · · × 2 = 28 = 256

parole siffatte

ENRICO ROGORA Matematica e Statistica

Esempio

Esempio

Una molecola di DNA e una successione di quattro nucleotidi diversi,denotati A, B, G, T (A sta per Adenina, C sta per Citosina, G sta perGuanina, T sta per Timina). La molecola puo essere costituita damilioni di unita e puo quindi contenere una quantita enorme diinformazione. Per esempio, per una molecola con un milione di unitaci sono 4106

diverse possibili successioni. Questo e un numerostraordinariamente grande, con circa un milione di cifre.Un amminoacido e codificato da una successione di tre nucleotidi.Esistono 43 = 64 codici diversi ma esistono solo 20 amminoacidi,perche alcuni di essi possono venire codificati in modi diversi. Lamolecola di una proteina e composta da centinaia di amminoacidi equindi esiste un numero potenzialmente enorme di proteine. Peresempio esistono 20100 sequenze diverse di 100 amminoacidi.

ENRICO ROGORA Matematica e Statistica

Numeri grandi

Puo essere utile avere un’idea intuitiva della grandezza di un numerocon un milione di cifre, del tipo di quelli che abbiamo consideratonella slide precedente;pensiamo di scrivere un numero siffatto su un quaderno a quadretti,utilizzando un quadretto per ogni cifra. In una pagina sono contenuticirca 30× 50 = 1500 quadretti e quindi sono necessarie piu di 600pagine per scrivere un milione di cifre. Siccome ogni quadernocontiene un centinaio di pagine, sono necessari almeno 6 quaderni aquadretti solo per scrivere il numero.

ENRICO ROGORA Matematica e Statistica

Richiami sulle disposizioni e sulle permutazioni

Supponiamo di poter scegliere r elementi da un insieme finito di n elementi edi volerli disporli in una lista ordinata di k elementi. In quanti modi lopossiamo fare? Dipende se ci e permesso duplicare gli elementi della lista.Se non sono permesse duplicazioni, stiamo campionando senza ripetizioni.Allora k deve ovviamente essere minore e uguale a n e il numero richiesto eDn,k = n(n − 1)(n − 2) · · · (n − k + 1) in quanto sono possibili n scelte per ilprimo, (n-1) scelte per il secondo, (n-2) scelte per il terzo,. . . ,(n-k+1) scelteper il k -esimo.Se sono permesse duplicazioni stiamo campionando con ripetizioni. Ilnumero richiesto e D′n,k = nk in quanto sono possibili n scelte per il primo, nscelte per il secondo, n scelte per il terzo,. . . ,n scelte per il k -esimo.Il problema e equivalente a quello di estrarre palline marcate da un’urna. Nelprimo tipo di estrazione non e permesso rimettere la pallina nell’urna primadella successiva estrazione e si ha una estrazione senza reimbussolamento.Nel secondo tipo, dopo aver segnato la marca sulla pallina, e permessorimettere la pallina nell’urna prima della successiva estrazione e si ha unaestrazione con reimbussolamento.

ENRICO ROGORA Matematica e Statistica

Esempi

Esempio

In quanti modi si possono mettere in fila 5 bambini?Questo numero coincide con D5,5 = 5! = 5× 4× 3× 2× 1 = 120.

Esempio

Supponiamo di voler scegliere 5 bambini da una classe di dieci e dimetterli in fila? In quanti modi e possibile?Questo numero coincide con D10,5 = 10× 9× 8× 7× 6 = 30,240.

Esempio

In alcuni stati le targhe automobilistiche hanno sei caratteri: tre lettereseguite da tre cifre. Quante targhe distinte sono possibili?Ci sono D′26,3 = 263 = 17,576 modi di scegliere le lettere eD′10,3 = 103 = 1,000 modi di scegliere le cifre. Per il principio dimoltiplicazione, il numero delle targhe distinte e17,576× 1,000 = 17,576,000.

ENRICO ROGORA Matematica e Statistica

Esempi

Esempio

Continuando l’esempio delle targhe, se tutte le successioni di 6caratteri sono ugualmente probabili, qual e la probabilita che la targadi una nuova macchina non contenga ne lettere ne cifre duplicate?Chiamiamo A l’evento desiderato; lo spazio degli eventi Ω consiste ditutte le 17,576,000 targhe possibili. Essendo tutte questeugualmente probabili, la probabilita di A e il rapporto tra il numero dimodi in cui A puo presentarsi diviso il numero totale di tutti gli esitipossibili. Ci sono D26,3 = 15,600 successioni di lettere senzaripetizione e ci sono D10,3 = 720 successioni di cifre senzaripetizione. Per il principio di moltiplicazione, ci sono15,600× 720 = 11,232,000 successioni senza ripetizione. Laprobabilita di A e quindi

p(A) =11,232,00017,576,000

= 0.64

ENRICO ROGORA Matematica e Statistica

Il problema del compleanno

Supponiamo che una stanza contenga n persone. Qual e laprobabilita che almeno due di queste persone compia gli anni nellostesso giorno?Assumiamo che ogni giorno dell’anno sia ugualmente probabile comegiorno per il compleanno, trascuriamo gli anni bisestili, e denotiamocon A l’evento ”ci sono almeno due persone con un compleannocomune”. Come succede spesso e piu facile calcolare p(Ac) invecedi p(A). Questo perche A puo manifestarsi in molti modi, mentre Ac emolto piu semplice. Associando ad ogni persona la data del suocompleanno ci sono D′365,n = 365n esiti possibili, mentre Ac si puomanifestare in D365,n = 365× 364× · · · × (365− n + 1) modi. Quindi

p(Ac) =365× 364× · · · × (365− n + 1)

365n

ep(A) = 1− p(Ac) = 1− 365× 364× · · · × (365− n + 1)

365n

ENRICO ROGORA Matematica e Statistica

Il problema del compleanno (II)

La seguente tabella esibisce il valore di p(A) per diversi valori di n:

n p(A)4 0.01616 0.28423 0.50732 0.75340 0.89156 0.988

Dalla tabella segue che se ci sono solo 23 persone, la probabilita chealmeno due di loro compiano gli anni lo stesso giorno supera il 50%.

ENRICO ROGORA Matematica e Statistica

Variazioni sul problema del compleanno

A quante persone bisogna chiedere perche si abbia il 50% diprobabilita di trovare qualcuno che compia gli anni lo stesso giorno incui li compio io?Supponiamo che il lettore chieda ad n persone; A denoti l’evento ”ilgiorno del compleanno di almeno una delle persone a cui si e chiestoe lo stesso del mio”. Ancora, e piu facile lavorare con Ac . Il numerototale degli esiti possibili e D′365,n = 365n e il numero totale degli esitiin Ac e 364n. Cosı

p(Ac) =364n

365n

ep(A) = 1− 364n

365n

Perche questa probabilita sia di circa il 50%, n deve essere 253.

ENRICO ROGORA Matematica e Statistica

Richiami sulle combinazioni

Spostiamo la nostra attenzione da contare disposizioni a contarecombinazioni. Ora non siamo piu interessati all’ordine degliallineamenti, ma solo ai costituenti, senza riguardo all’ordine in cuiessi si presentano. In particolare ci poniamo la seguente domanda:scegliendo r oggetti tra n oggetti dati,senza ripetizioni e senzaprestare attenzione all’ordine, quante diverse scelte sono possibili?Abbiamo gia risposto a questa domanda quando abbiamo contato ilnumero dei sottoinsiemi di un insieme finito. Questo e il numero dellecombinazioni di r oggetti scelti da n, e lo indichiamo con il simboloCn,r . E chiaro che Dn,r = Dr ,r × Cn,r e quindi

Cn,r =n(n − 1) . . . (n − r + 1)

r !=

n!

(n − r)!r !

Questo numero, estremamente importante, si denota anche con ilsimbolo

(nr

)e conta il numero delle combinazioni di r oggetti scelti da

n o equivalentemente, il numero dei sottoinsiemi di un insieme con nelementi. I numeri

(nk

)sono anche detti coefficienti binomiali

ENRICO ROGORA Matematica e Statistica

Esempi

Esempio

Fino al 1991, un giocatore della lotteria di stato della Californiapotevava vincere indovinando 6 numeri compresi tra 1 e 49 chevenivano estratti a caso. Ci sono

(496

)= 13,983,816 modi per

scegliere 6 numeri tra 49 e quindi la probabilita di vittoria era di circa1 su 14 milioni. Se non c’erano vincitori, il montepremi andava adaggiungersi a quello dell’estrazione successiva. Nel 1991 le regolevennero modificate in modo tale che i vincitori dovessero selezionarecorrettamente 6 numeri compresi tra 1 e 53. Siccome(53

6

)= 22,957,480, la probabilita di vincere si abbasso a circa 1 su

23,000,000. Il montepremi si accumulo fino a raggiungere la cifrarecord di 120 milioni di dollari. Questo produsse una febbre per ilgioco che porto la gente ad acquistare biglietti ad un ritmo compresotra uno e due milioni all’ora, con gran vantaggio per le casse dellostato.

ENRICO ROGORA Matematica e Statistica

Esempi (II)

Esempio

Nella pratica dei controlli di qualita, solo una frazione della produzione di un processomanifatturiero viene campionato ed esaminato, siccome sarebbe troppo dispendioso intermini di tempo e denaro esaminare ogni manufatto e anche perche i test di controllopossono talvolta essere distruttivi. Supponiamo che ci siano n prodotti in un lotto, e traquesti ne vengano estratti un campione costituito da r elementi. Ci sono

`nr

´campioni

siffatti. Ora, supponiamo che il lotto contenga k prodotti difettosi. Qual e la probabilitache uno di questi campioni contenga esattamente m prodotti difettosi?Chiaramente questa domanda e rilevante al fine di valutare l’efficacia dello schema dicampionamento e l’ampiezza piu conveniente del campione puo essere calcolatavalutando queste probabilita per diversi valori di k . Chiamiamo A l’evento in questione.La probabilita di A e il numero dei modi in cui A puo presentarsi diviso il numero totaledei possibili esiti. Per trovare il numero di modi in cui A puo presentarsi, utilizziamo ilprincipio di moltiplicazione. Ci sono

`km

´modi di scegliere m prodotti difettosi nel

campione a partire dai k difettosi nel lotto, e ci sono`n−k

r−m

´modi di scegliere gli r −m

prodotti non difettosi nel campione dagli n − k prodotti non difettosi nl lotto. Percio, Apuo presentarsi in

`km

´`n−kr−m

´modi. Essendo p(A) il rapporto tra il numero di modi in cui

A puo manifestrasi diviso per il numero totale degli esiti possibili, si ha

p(A) =

`km

´`n−kr−m

´`nr

´ENRICO ROGORA Matematica e Statistica

Metodo della cattura e ricattura

Il cosiddetto metodo della cattura e ricattura e utilizzato talvolta per stimare l’ampiezzadi una popolazione di animali selvatici. Supponiamo che 10 animali siano catturati,marcati e liberati. In una successiva occasione, vengono catturati 20 animali, e si rilevache 4 di loro sono marcati. Quanto e grande la popolazione?Assumiamo che ci siano n animali nella popolazione, di cui 10 sono marcati. Se i 20animali catturati successivamente sono scelti in modo tale che tutti gli

` n20

´gruppi siano

tutti equiprobabili, (questa e una assunzione molto restrittiva), la probabilita che 4 diloro siano marcati e `10

4

´`n−1020−4

´` n20

´Evidentemente n non e determinato in modo esatto dalle informazioni disponibili, mapuo essere stimato. Un metodo per la stima, detto metodo della massimaverosimiglianza consiste nello scegliere il valore di n che rende maggiormenteprobabile l’esito osservato.Per trovare la stima di massima verosimiglianza, supponiamo in generale, che t animalisiano marcati. Quindi, di un secondo campione di ampiezza m, vengono ricatturati ranimali marcati. Stimiamo n come il massimizzatore della verosimiglianza

Ln =

`tr

´` n−tm−r

´`nm

´

ENRICO ROGORA Matematica e Statistica

Metodo della cattura e ricatturaPer determinare il valore di n che massimizza Ln, si consideri il quoziente deitermini successivi, che vale

Ln

Ln−1=

(n − t)(n −m)

n(n − t −m + r)

Questo rapporto e maggiore di 1, cioe Ln e crescente, se

(n − t)(n −m) > n(n − t −m + r)n2 − nm − nt + mt > n2 − nt − nm − nr

mt > nrmtr

> n

Cosı Ln cresce per n < mt/r e decresce per n > mt/r ; quindi il valore di nche massimizza Ln e il piu grande intero che non supera mt/r . Applicandoquesto risultato ai dati ottenuti precedentemente, vediamo che la stima dimassima verosimiglianza per n e mt/r = (20 · 10)/4 = 50. Questa stima eintuitiva in quanto coincide con il numero che uguaglia la proporzione deglianimali marcati rispetto agli animali del secondo campione con laproporzione degli animali marcati rispetto al totale. ma il metodo di massimaverosimiglianza costituisce un metodo generale per la stima dei parametri diun modello probabilistico.

ENRICO ROGORA Matematica e Statistica

Raggruppamenti in r classi

Proposizione

Il numero di modi in cui n oggetti possono essere raggruppati in rclassi con ni elementi nella i-esima classe (i = 1 . . . , r e

∑ri=1 ni = n)

e (n

n1n2 . . . nr

)=

n!

n1!n2! · · · nr !

Dimostrazione Questo si dimostra usando il conteggio dellecombinazioni e il principio di moltiplicazione. Si noti che il conteggiodelle combinazioni si ottiene come caso speciale della proposizionegenerale per r = 2. Ci sono

( nn1

)modi per scegliere gli oggetti nella

prima classe. Fatto questo, ci sono(n−n1

n2

)modi per scegliere gli

oggetti nella seconda classe. Continuando in questa maniera, cisono, complessivamente

n!

n1!(n − n1)!

(n − n1)!

(n − n1 − n2)!n2!· · · (n − n1 − n2 − · · · − nr−1)!

0!nr !

scelte possibili. Dopo le opportune semplificazioni abbiamo ilrisultato.

ENRICO ROGORA Matematica e Statistica

Esempi

Esempio

Un comitato di sette membri deve essere diviso in tre sottocomitati di tre, due e duemembri. Questo puo essere fatto in“ 7

3 2 2

”=

7!

3!2!2!= 210

modi.

Esempio

In quanti modi e possibile disporre l’insieme dei nucleotidi

A, A, G, G, G, G, C, C, C

in una successione di 9 lettere?E possibile applicare la proposizione sui raggruppamenti in r classi, dopo avercompreso che il problema puo essere riformulato come problema di trovare il numerodei modi in cui le nove posizioni nella successione possono essere divise insottoinsiemi di due, quattro e tre (le posizioni delle lettere A, G e C rispettivamente).Questo numero vale: “ 9

2 4 3

”=

9!

2!4!3!= 1260

ENRICO ROGORA Matematica e Statistica

Esempi

Esempio

In quanti modi n = 2m giocatori possono essere accoppiati e destinati a m campi digioco per il primo round di un torneo di tennis?In questo problema, ni = 2, i = 1, . . . , m, e per la proposizione C ci sono

(2m)!

2m

assegnazioni distinte.

Bisogna prestare attenzione ai problemi come quello appena discusso. Supponiamoche il problema sia quello di detreminare in quanti modi n = 2m giocatori possonoessere accoppiati per formare il primo round di un torneo di tennis, senza che allecoppie venga assegnato un campo di gioco. Allora il precedente risultato deve esserediviso per m!, e il numero delle coppie e

(2m)!

m!2m

I numeri` n

n1n2...nr

´sono chiamati coefficienti multinomiali e appaiono nell’espansione

(x1 + x2 + · · ·+ xr )n =X“ n

n1n2 . . . nr

”xn1

1 xn22 . . . xnr

r

dove la somma e estesa a tutti gli interi non negativi n1, n2, . . . , nr tali chen1 + n2 + · · ·+ nr = n.

ENRICO ROGORA Matematica e Statistica

La probabilita di un evento vari al variare delleinformazioni

La probabilita di un evento dipende dalle informazioni che abbiamosull’evento stesso. Vogliamo indagare come varia la probabilita di un eventovariando le nostre informazioni. Partiamo con un esempio.Supponiamo di avere due manufatti identici ma prodotti in due fabbrichediverse. La prima fabbrica fornisce il 70% dei manufatti mentre la seconda nefornisce il 30%. La prima fabbrica garantisce una durata standard all’83% deimanufatti e la seconda al 63%. Scegliendo a caso un manufatto senzaconoscerne la provenienza, la probabilita che abbia una durata standard edel 77%. Infatti, in media, su cento manufatti scelti a caso: 70 provengonodalla prima fabbrica e di questi in media l’83%, cioe 58 hanno una duratastandard; 30 provengono dalla prima fabbrica e di questi in media il 63%,cioe 19 hanno una durata standard. Quindi, in media, su 100 manufatti sceltia caso, 58 + 19 = 77 hanno durata standard. Se pero sappiamo concertezza che manufatti provengono dalla prima fabbrica, allora la probabilitache abbiano una durata standard sale all’83% e questo mostra come, ingenerale, aggiungendo nuove condizioni ad un esperimento, un’osservazioneo una misura, le probabilita degli eventi si possono modificare.

ENRICO ROGORA Matematica e Statistica

Probabilita condizionata

Nell’esempio che abbiamo discusso abbiamo considerto dueprobabilita relative all’evento: pescare un manufatto standard. Quellaincondizionata, del 77% e quella condizionata all’evento il manufattoproviene proviene dalla prima fabbrica, che e dell’83%. Indicando conA l’evento manufatto standard e con B l’evento manufatto provenientedalla prima fabbrica, indichiamo con P(A) la probabilitaincondizionata e con P(A|B) la probabilita condizionata al verificarsidell’evento B.Ogni probabilita e in effetti una probabilita condizionata, ma sisuppone esista un set di eventi fissato, rispetto a cui la probabilita sidice incondizionata, e che quelle condizionate si ottenganoaggiungendo nuove condizioni, a quelle fissate.

ENRICO ROGORA Matematica e Statistica

Legge di moltiplicazione delle probabilita

Siano A e B due eventi fissati. Sia l il numero medio di volte in cui sirealizzano entrambi gli eventi A e B in n ripetizioni dello stessoesperimento e sia m il numero medio di volte in cui si realizza l’eventoB. e chiaro che

ln

=lm

mn

Secondo l’interpretazione frequentista della probabilita, questauguaglianza si puo riformulare nella maniera seguente:

P(A ∩ B) = P(A|B) · P(B).

che prende il nome di legge di moltiplicazione delle probabilita.

ENRICO ROGORA Matematica e Statistica

Probabilita condzionata e teorema di Bayes

Siano A e B due eventi di Ω e sia P(B) > 0. La probabilita di Acondizionata a B e

P(A|B) =P(A ∩ B)

P(B)

Teorema di Bayes (Prima formulazione)

P(A|B) =P(B|A)P(A)

P(B)

DIMOSTRAZIONE Dalla definizione di P(A|B) si ha che

P(A ∩ B) = P(A|B)P(B)

e, dalla definizione di P(B|A),

P(B ∩ A) = P(B|A)P(A)

da cui la tesi.

ENRICO ROGORA Matematica e Statistica

Applicazioni del teorema di Bayes (I)

Si consideri una scuola che ha il 60% di studenti maschi e il 40% distudentesse femmine. Le studentesse indossano in egual numerogonne o pantaloni; gli studenti indossano tutti quanti i pantaloni. Unosservatore, da lontano, nota uno studente coi pantaloni. Qual e laprobabilita che quello studente sia una femmina?Il problema puo essere risolto con il teorema di Bayes, ponendol’evento A che lo studente osservato sia femmina, e l’evento B che lostudente osservato indossi i pantaloni. Per calcolare P(A|B),dovremo sapere:P(A), ovvero la probabilita che lo studente sia femmina senzanessun’altra informazione. Per l’osservatore tutti gli studenti hanno lastessa probabilita di essere osservati, quindi, essendo le studentesseil 40% del totale, la probabilita che lo studente visto sia femminarisultera P(A) = 2/5.

Continua

ENRICO ROGORA Matematica e Statistica

Applicazioni del teorema di Bayes (II)

P(B|A), ovvero la probabilita che uno studente indossi i pantaloni,noto che lo studente e femmina. Poiche le femmine indossano gonnee pantaloni in egual numero, la probabilita sara di 1/2.P(B), ovvero la probabilita che uno studente qualsiasi (maschio ofemmina) indossi i pantaloni. Poiche il numero di coloro che indossa ipantaloni e di 80 (60 maschi + 20 femmine) su 100 studenti framaschi e femmine, la probabilita P(B) e di 80/100 = 4/5. Cio detto,possiamo applicare il teorema:

P(A|B) =P(B|A)P(A)

P(B)=

1/2× 2/54/5

=14

Pertanto la probabilita che lo studente con i pantaloni sia femmina e1/4, cioe 25%.

ENRICO ROGORA Matematica e Statistica

Teorema di Bayes, seconda forma

Siano A e B due eventi qualsiasi. Allora, B si puo scrivere comeunione di due eventi incompatibili nella forma seguenteB = (A ∩ B) ∪ (Ac ∩ B) e quindi

P(B) = P(B ∩ A) + P(B ∩ Ac).

allora, per il teorema della moltiplicazione,P(B) = P(B|A)P(A) + P(B|Ac)P(Ac). Sostituendo questo risultatonella prima forma del teorema di Bayes abbiamo

P(A|B) =P(B|A)P(A)

P(B|A)P(A) + P(B|Ac)P(Ac).

ENRICO ROGORA Matematica e Statistica

Formula per la probabilita totale e terza forma delteorema di Bayes

Sistema completo di eventi

Una famiglia A1, . . . , An di eventi si dice sistema completo di eventi se: i) glieventi sono a due a due incompatibili; ii) uno degli eventi si deve semprerealizzare.

Dato un sistema completo di eventi A1, . . . , An, possiamo decomporre unqualsiasi evento B nella somma logica di eventi incompatibili

B = (A1 ∩ B) ∪ · · · ∪ (An ∩ B).

Per il teorema di Bayes, prima forma, abbiamo allora la formula per laprobabilita totale

P(B) = P(B|A1)P(A1) + · · ·+ P(B|An)P(An)

da cui segue immediatamente

Terza forma del teorema di Bayes

P(Ai |B) =P(B|Ai)P(Ai)Pnj=1 P(B|Aj)P(Aj)

ENRICO ROGORA Matematica e Statistica

Esempio (I)

Supponiamo che un bersaglio sia posizionato su un segmento MN,suddiviso in 5 segmenti piu piccoli, come in figura

Supponiamo che la posizione precisa del bersaglio non sia nota, masi conoscano solo le probabilita che il bersaglio sia contenuto neidiversi segmenti:

P(a) = 0.48; P(b′) = P(b′′) = 0.21; P(c′) = P(c′′) = 0.05

Essendo piu probabile che il bersaglio si trovi nel segmento a eevidente che verso quel segmento conviene sparare

Continua

ENRICO ROGORA Matematica e Statistica

Esempio (II)

A causa di inevitabili errori di mira, tirando verso a possiamodisuggere il bersaglio (evento K ) anche quando non si trova nelsegmento a. Supponiamo di conoscere le seguenti probabilita dicolpire il bersaglio, tirando verso a, nelle ipotesi che il bersaglio sitrovi in uno qualunque dei segmenti della suddivisione e

P(K |a) = 0.56 P(K |b′) = 0.18 P(K |b′′) = 0.16 P(K |c′) = 0.06 P(K |c′′) = 0.04

Supponiamo che aver sparato un colpo e di aver colpito il bersaglio.Ci domandiamo:Come cambiano le probabilita di osservare il bersaglio nei diversisegmenti, p.e. P(a|K )? A questa domanda possiamo rispondere conla formula di Bayes.

Continua

ENRICO ROGORA Matematica e Statistica

Esempio (III)

Essendo gli eventi a,b′, · · · , c′′ un sistema completo, abbiamo, per laterza forma della formula di Bayes che P(a|K ) e uguale a:

P(a)P(K |a)

P(a)P(K |a) + P(b′)P(K |b′) + P(b′′)P(K |b′′) + P(c′)P(K |c′) + P(c′′)P(K |c′′)=

0.48 · 0.560.48 · 0.56 + 0.21 · 0.18 + 0.21 · 0.16 + 0.05 · 0.06 + 0.05 · 0.04

∼ 0.78

e analogamente

P(b′|K ) P(b′′|K ) P(c′|K ) P(c′′|K )0.11 0.10 0.01 0.00

Si noti che nelle espressioni per il calcolo delle nuove probabilita diosservare il bersaglio nei diversi intervalli, il denominatore rimanesempre lo stesso e coincide con P(K ) = 0.35.

ENRICO ROGORA Matematica e Statistica

Eventi indipendenti

Dati due eventi A,B ∈ F(Ω), con P(B) > 0 e P(A) > 0, seP(A|B) = P(A) allora il verificarsi dell’evento A non dipende dalverificarsi dell’evento B.In questo caso allora

p(A ∩ B) = p(A) · p(B) (1)

che esprime anche la condizione, nelle ipotesi P(B) > 0 e P(A) > 0,che il verificarsi dell’evento B non dipende dal verificarsi dell’evento ALa condizione (1) ha senso anche quando P(A) o P(B) sono uguali azero e probabilita condizionate non possono essere definite.

DefinizioneDue eventi A e B si dicono indipendenti quando vale la condizione (1).

ENRICO ROGORA Matematica e Statistica

Eventi complementari indipendentiSuccede in molti casi interessanti, che due o piu eventi pur nonessendo incompatibili siano tali pero che i loro complementari sonoindipendenti. Questo permette di semplificare il calcolo di P(A ∪ B)nel seguente modo.Siano A e B due eventi qualsiasi

P(A ∪ B) = P(

((A ∪ B)c)c)

= P ((Ac ∩ Bc)c) = 1− P(Ac ∩ Bc)

se possiamo assumere che Ac e Bc sono indipendenti, allora

P(A ∪ B) = 1− P(Ac) · P(Bc) = 1− (1− P(A)) · (1− P(B))

Piu in generale, se A1, . . . ,An sono eventi i cui complementari sonoindipendenti

P(⋃

i=1,...,n

Ai ) = 1−∏

i=1,...,n

(1− P(Ai ))

e ancora, se gli Ai sono equiprobabili, di probabilita p

P(⋃

i=1,...,n

Ai ) = 1− (1− p)n

ENRICO ROGORA Matematica e Statistica

Probabilita di trasmissione del virus dell’HIV

Torniamo al calcolo della probabilita dell’evento E di contrarre il virusdell’HIV in 500 rapporti non protetti, per ognuno dei quali laprobabilita di trasmissione del virus e pari a 1

500 . Indichiamo con Ail’evento il virus viene trasmesso durante l’i-esimo rapporto nonprotetto. Allora E =

⋃1=1,...,500 Ai .

Abbiamo gia osservato che gli eventi Ai non sono incompatibili inquanto il virus puo essere scambiato in diversi rapporti e quindi nonpossiamo utilizzare la formula della somma per eventi incompatibili. Eragionevole assumere pero che gli eventi complementari degli Ai ,cioe gli eventi il virus NON viene trasmesso durante l’i-esimo rapportonon protetto, siano indipendenti e quindi, possiamo utilizzare laformula della slide precedente e quindi

P(E) = 1−(

1− 1500

)500

= 0.63.

ENRICO ROGORA Matematica e Statistica

Test diagnosticiUn test diagnostico viene praticato per rivelare la presenza di unamalattia. Alcuni test sono dicotomici, cioe danno risposta positiva onegativa, come per esempio il test per l’HIV. Altri danno risposte suscale continue (per esempio misurano la concentrazione di una certasostanza) e possono essere dicotomizzati fissando delle soglie. Ingenerale, ai fini dell’interpretazione del risultato di un test diagnosticobisogna considerare quattro popolazioni:

Malati, che indicheremo con M+.Sani, che indicheremo M−.Positivi al test, che indicheremo T +.Negativi al test, che indicheremo T−.

Si introducono le seguenti quantita:Specificita del test, Sp = P(T−|M−).Sensibilita del test, Se = P(T +|M+).Valore predittivo di un esito positivo Vp+ = P(M+|T +).Valore predittivo di un esito negativo Vp− = P(M−|T−).Prevalenza della malattia Pr = P(M+).

ENRICO ROGORA Matematica e Statistica

Test diagnostici (II)

Le quantita caratteritiche di un test diagnostico sono legate tra lorodal teorema di Bayes. Per esempio, essendo M− e M+ unapartizione dell’intera popolazione

Vp− = P(M−|T−) =P(T−|M−)P(M−)

P(T−|M−)P(M−) + P(T−|M+)P(M+)

Osserviamo che P(T−|M+) = 1− P(T +|M+) e cheP(M−) = 1− P(M+) e quindi

Vp− =Sp(1− Pr)

Sp(1− Pr) + (1− Se)Pr

e analogamente

Vp+ =Se · Pr

Se · Pr + (1− Sp)(1− Pr)

ENRICO ROGORA Matematica e Statistica

Test diagnostici (III)

A parita di specificita e sensibilita, il valore predittivo di un esitopositivo dipende dalla prevalenza della malattia. E massimo perprevalenze molto basse e diventa sempre piu basso al crescere dellaprevalenza. Se, per esempio, la specificita e 0.95 e la sensibilita e0.7, il valore predittivo e intorno al 50% quando la prevalenza dellamalattia e circa del 10%.

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Prevalenza

vp e

sito

pos

itivo

ENRICO ROGORA Matematica e Statistica

Il test della cartomante

Supponiamo che il test sia completamente scorrelato dalla malattia,per esempio che sia determinato dal lancio di una moneta truccatacon probabilita p che esca testa, ovvero test positivo. Allora

Vp− = P(M−|T−) = P(M−) = 1− Pr

e, analogamente Vp+ = P(M+|T +) = P(M+) = Pr .

Sp = P(T−|M−) = P(M−|T−)P(T−)/P(M−) =

P(M−)P(T−)/P(M−) = P(T−) = (1− p)

e, analogamente Sp = P(T +) = p. Quindi nei test della cartomante,Vp− + Vp+ = 1 e Sp− + Sp+ = 1. Si noti che se la prevalenza di unamalattia e molto bassa, il test della cartomante ha un valore predittivodi un esito negativo molto alto semplicemente perche e improbabileche una persona sia malata.

ENRICO ROGORA Matematica e Statistica

Il test perfetto

Il test perfetto e quello che non commette errori e quindi

Se = 1 Sp = 1

eVp− = 1 Vp+ = 1.

Si noti che nel test perfetto, Vp− + Vp+ = 2 e Sp− + Sp+ = 2.

ENRICO ROGORA Matematica e Statistica

Trasmissione dei caratteri ereditari

La legge di Hardy Weinberg riguarda la trasmissione dei caratteriereditari. I caratteri ereditari sono codificati nel genoma, suddiviso incromosomi che contengono a loro volta i geni, le unita ereditariafondamentali degli organismi viventi. I geni sono a loro volta formatida sequenze ben determinate di quattro basi azotate (Adenina,Timina, Citosina, Guanina).I caratteri fenotipici di un individuo (colore degli occhi, conformazionedel naso, capelli lisci o ricci, ecc.) sono singolarmente determinati daun singolo gene o da un poole di geni, che possono avere piuvarianti, dette alleli.In un organismo diploide ogni gene e costituito da due alleli, ognunodei quali puo presentarsi in diverse forme. Per semplificarel’esposizione, assumiamo che gli alleli di un determinato gene G sipresentino in due forme che indicheremo A0 e A1 rispettivamente.Quindi i geni si presentano in tre genotipi

A0A0, A0A1 A1A1.

Si noti che il genotipo A0A1 non e distinguibile dal genotipo A1A0.

ENRICO ROGORA Matematica e Statistica

Genotipo e fenotipo

Assumiamo che il fenotipo associato al gene G si possa presentare indue forme (per esempio: buccia liscia o buccia rugosa di un certolegume), che indicheremo F0 e F1 rispettivamente. L’associazione tragenotipo e fenotipo e

A0A0 A0A1 A1A1F0 F0 F1

Si noti quindi che nella determinazione del fenotipo l’allele A edominante in quando il genotipo eterozigote A0A1 e uguale a quelloomozigote A0A0.

ENRICO ROGORA Matematica e Statistica

Trasmissione dei caratteriSupponiamo di avere una popolazione in cui la frequenza dei diversi genotipi sia

p00 p01 p11

rispettivamente. Assumiamo che la popolazione sia sufficientemente grande da poteridentificare le frequenze relative con le probabilita di osservazione. La frequenzarelativa dei diversi alleli e allora

p0 = p00 +12

p01 p1 =12

p01 + p11.

Vogliamo studiare come si distribuiscono i genotipi e gli alleli nella generazionesuccessiva. Oltre ad assumere che la popolazione sia molto grande, assumiamo che:non avvengano mutazioni; non ci sia selezione naturale; gli accoppiamenti siano deltutto casuali; gli individui siano tutti fertili allo stesso modo; non ci siano immigrazionine emigrazioni. Consideriamo inoltre che valgano le leggi di Mendel: di disgiunzione edi indipendenza (cfr. Villani - Gentili, p. 208). Come conseguenza di queste ipotesi,nella generazione successiva abbiamo:

p00 = p20 p01 = 2p0p1 p11 = p2

1

La distribuzione degli alleli nella nuova generazione e allora

p0 = p00 +12

p01 = p20 + p0p1 = p0(p0 + p1) = p0

e analogamente

p1 =12

p01 + p11 = p0p1 + p21 = p1

ENRICO ROGORA Matematica e Statistica

Legge di Hardy-Weinberg

Da quanto visto, segue che, nelle ipotesi fatte, la distribuzione deglialleli non varia e la distribuzione delle frequenze geneche si stabilizzaalla prima iterazione del ciclo riproduttivo, rimanendo poi sempre lastessa.La distribuzione di equilibrio si dice di Hardy-Weinberg. Ladistribuzione di equilibrio e una distribuzione teorica. Una qualunqueviolazione delle ipotesi puo portare facilmente a distribuzioni limite dicarattere essenzialmente diverso (cfr. Benedetto, Degli Esposti,Maffei).

ENRICO ROGORA Matematica e Statistica

Paradossi

Il calcolo delle probabilita ha degli aspetti non intuitivi e paradossaliche si presentano fin dall’inizio. Vale la pena conoscere alcuni deiparadossi piu elementari per stare in guardia nelle applicazionifrettolose del calcolo delle probabilita ed essere sempre vigili nelconsiderare argomenti che ne fanno uso. Ecco una breve lista diparadossi elementari che e bene conoscere

ll problema di Monty HallIl paradosso delle tre carteIl paradosso di San PietroburgoIl paradosso di Bertrand

ENRICO ROGORA Matematica e Statistica