Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e...

78
Introduzione al Calcolo delle Probabilit` a Calcolo Combinatorio Probabilit` a condizionata e indipendenza di eventi Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento di Matematica, Universit` a degli Studi di Milano [email protected] http://www.mat.unimi.it/users/michel Alessandra Micheletti Biostatistica 2012

Transcript of Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e...

Page 1: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Bioinformatica e Biostatistica - 2011/12Modulo di Biostatistica

Alessandra Micheletti

Dipartimento di Matematica, Universita degli Studi di [email protected]

http://www.mat.unimi.it/users/michel

Alessandra Micheletti Biostatistica 2012

Page 2: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Introduzione

Il Calcolo delle Probabilita e la base su cui poggiano tutti i metodistatistici.

ESEMPIO: immaginate di aver messo a punto un metodo che dovrebbepermettere di predeterminare il sesso del nascituro, facendo aumentare leprobabilita di generare una femmina. Se, messo alla prova su uncampione di 100 coppie, il vostro sistema porta ad avere

a) 98 femmine e 2 maschib) 60 femmine e 40 maschipotete affermare che il metodo funziona nel caso a)?

E nel caso b)?

Alessandra Micheletti Biostatistica 2012

Page 3: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Caso a): sebbene sia possibile avere 98 femmine su 100 nascite anchesenza interventi esterni, si tratta di una situazione talmente improbabileda essere scartata (la sua prob. e dell‘ordine di 10−27), quindiconcluderemo che il metodo e efficace → evento raro o estremo(vedremo che sara bassa la probabilita di commettere un errore nel trarrequesta conclusione)

Alessandra Micheletti Biostatistica 2012

Page 4: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Caso b): se assumiamo che, in assenza di trattamenti la prob. di nascitadi un maschio sia 1

2 , la probabilita di osservare fino a 40 maschi su 100nuovi nati in assenza di trattamenti e 0.028 = 2.8% (vedremo come sicalcola piu avanti). Questa probabilita e abbastanza bassa da poter direche il trattamento e efficace?Con che probabilita commetto un errore nell’assumere che il trattamentosia efficace in questo caso?

E quindi evidente che per effettuare inferenza statistica sui dati occorreprima imparare gli elementi alla base del Calcolo delle Probabilita.

Alessandra Micheletti Biostatistica 2012

Page 5: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Eventi e Spazio dei Campioni

Un esperimento aleatorio e caratterizzato dall’insieme Ω di tutti i suoipossibili esiti (risultati).

Ω = spazio dei campioni

ogni elemento ω ∈ Ω e detto evento elementare.

ESEMPI? (Provateci voi....)

Alessandra Micheletti Biostatistica 2012

Page 6: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Esempi

Alessandra Micheletti Biostatistica 2012

Page 7: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Lo spazio dei campioni puo essere

finito (es.: lancio di un dado: Ω = 1, 2, 3, 4, 5, 6)infinito numerabile (es.: numero di telefonate che arrivano a uncentralino in un mese: Ω = N = numeri naturali)infinito non numerabile (es.: durata del funzionamento di unalampadina: Ω = R+ = numeri reali positivi)

Alessandra Micheletti Biostatistica 2012

Page 8: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Lo spazio dei campioni puo essere

finito (es.: lancio di un dado: Ω = 1, 2, 3, 4, 5, 6)infinito numerabile (es.: numero di telefonate che arrivano a uncentralino in un mese: Ω = N = numeri naturali)infinito non numerabile (es.: durata del funzionamento di unalampadina: Ω = R+ = numeri reali positivi)

Alessandra Micheletti Biostatistica 2012

Page 9: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Lo spazio dei campioni puo essere

finito (es.: lancio di un dado: Ω = 1, 2, 3, 4, 5, 6)infinito numerabile (es.: numero di telefonate che arrivano a uncentralino in un mese: Ω = N = numeri naturali)infinito non numerabile (es.: durata del funzionamento di unalampadina: Ω = R+ = numeri reali positivi)

Alessandra Micheletti Biostatistica 2012

Page 10: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Sia P(Ω) = sottoinsiemi di Ω.

Vorremo definire una ”probabilita” come una funzione definita su P(Ω) avalori in [0, 1] che ad ogni A sottoinsieme di Ω associ un numerocompreso fra 0 e 1.

Di quali sottoinsiemi di Ω (detti eventi) vorremo calcolare la probabilita?

Alessandra Micheletti Biostatistica 2012

Page 11: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Esempio: Consideriamo il lancio di un dado. Possibili eventi sono:A =il risultato del lancio e 1 = 1B =il risultato del lancio e un numero pari = 2 ∪ 4 ∪ 6 = 2, 4, 6C =il risultato del lancio e maggiore di 2

= 3 ∪ 4 ∪ 5 ∪ 6 = 3, 4, 5, 6D =il risultato del lancio e maggiore di 2 ed e pari = B ∩ C = 4, 6E =il risultato del lancio e minore o uguale a 2= CC

.........

Alessandra Micheletti Biostatistica 2012

Page 12: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

L’evento A e semplice, mentre gli eventi B,C ,D sono composti e sipossono vedere come unione o intersezione di altri eventi, elementari enon.

Dunque eventi di nostro interesse saranno dati da unioni, intersezioni,complementari di altri eventi.

Dato uno spazio dei campioni Ω, diremo che un insieme F di sottoinsiemidi Ω e una famiglia di eventi aleatori se essa e una σ-algebra.

Alessandra Micheletti Biostatistica 2012

Page 13: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

σ-algebra

Definizione. Una famiglia F di sottoinsiemi di Ω e una σ-algebra sesoddisfa le seguenti condizioni:

A1. Ω ∈ F ;

A2. se Ann∈N, con An elementi di F , allora⋃

n∈N An ∈ F ;

A3. se A ∈ F allora AC ∈ F .

Proprieta derivanti dalla definizione:1) Anche l’insieme vuoto ∅ e un elemento di F

Alessandra Micheletti Biostatistica 2012

Page 14: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

σ-algebra

Definizione. Una famiglia F di sottoinsiemi di Ω e una σ-algebra sesoddisfa le seguenti condizioni:

A1. Ω ∈ F ;

A2. se Ann∈N, con An elementi di F , allora⋃

n∈N An ∈ F ;

A3. se A ∈ F allora AC ∈ F .

Proprieta derivanti dalla definizione:1) Anche l’insieme vuoto ∅ e un elemento di F

Alessandra Micheletti Biostatistica 2012

Page 15: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

2) Le unioni finite di elementi di F appartengono a F

3) Le intersezioni di elementi di F appartengono a F

4) se A,B ∈ F allora A− B ∈ F

Alessandra Micheletti Biostatistica 2012

Page 16: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

2) Le unioni finite di elementi di F appartengono a F

3) Le intersezioni di elementi di F appartengono a F

4) se A,B ∈ F allora A− B ∈ F

Alessandra Micheletti Biostatistica 2012

Page 17: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

2) Le unioni finite di elementi di F appartengono a F

3) Le intersezioni di elementi di F appartengono a F

4) se A,B ∈ F allora A− B ∈ F

Alessandra Micheletti Biostatistica 2012

Page 18: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

La coppia (Ω,F) viene detta spazio probabilizzabile.Su di essa si puo definire correttamente una misura di probabilita.

Ci sono vari modi per definirla.

Alessandra Micheletti Biostatistica 2012

Page 19: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Impostazione assiomatica alla Kolmogorov

Definizione. Dato uno spazio probabilizzabile (Ω,F), si definisice misuradi probabilita o semplicemente probabilita P ogni funzione P : F → [0, 1]che soddisfi le seguenti proprieta:

P1. P(Ω) = 1

P2. sia Ann∈N una famiglia di eventi disgiunti, ossia tali cheAi ∩ Aj = ∅ per i 6= j ; allora

P

(k⋃

i=1

Ai

)=

k∑i=1

P(Ai ) (se la famiglia e finita)

P

(∞⋃i=1

Ai

)=∞∑i=1

P(Ai ). (se la famiglia e infinita)

P2. si chiama ADDITIVITA e ci dice che la probabilita di unioniDISGIUNTE di eventi e uguale alla somma delle probabilita dei singolieventi

Alessandra Micheletti Biostatistica 2012

Page 20: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Impostazione assiomatica alla Kolmogorov

Definizione. Dato uno spazio probabilizzabile (Ω,F), si definisice misuradi probabilita o semplicemente probabilita P ogni funzione P : F → [0, 1]che soddisfi le seguenti proprieta:

P1. P(Ω) = 1

P2. sia Ann∈N una famiglia di eventi disgiunti, ossia tali cheAi ∩ Aj = ∅ per i 6= j ; allora

P

(k⋃

i=1

Ai

)=

k∑i=1

P(Ai ) (se la famiglia e finita)

P

(∞⋃i=1

Ai

)=∞∑i=1

P(Ai ). (se la famiglia e infinita)

P2. si chiama ADDITIVITA e ci dice che la probabilita di unioniDISGIUNTE di eventi e uguale alla somma delle probabilita dei singolieventi

Alessandra Micheletti Biostatistica 2012

Page 21: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Equiprobabilita: il modello uniforme

Consideriamo ancora l’esempio del lancio di un dado EQUILIBRATO.Sappiamo che Ω = 1, 2, 3, 4, 5, 6.

Per assegnare le probabilita P(i), i = 1, . . . , 6 dobbiamo chiederciquanto siamo disposti a scommettere su ciascun numero (=eventoelementare).

Intuitivamente, se ”ci fidiamo” del fatto che il dado sia equilibrato,assegneremo a ogni evento elementare probabilita

1

numero di elementi in Ω=

1

6.

Alessandra Micheletti Biostatistica 2012

Page 22: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Equiprobabilita: il modello uniforme

Consideriamo ancora l’esempio del lancio di un dado EQUILIBRATO.Sappiamo che Ω = 1, 2, 3, 4, 5, 6.

Per assegnare le probabilita P(i), i = 1, . . . , 6 dobbiamo chiederciquanto siamo disposti a scommettere su ciascun numero (=eventoelementare).

Intuitivamente, se ”ci fidiamo” del fatto che il dado sia equilibrato,assegneremo a ogni evento elementare probabilita

1

numero di elementi in Ω=

1

6.

Alessandra Micheletti Biostatistica 2012

Page 23: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Definizione. Lo spazio di probabilita (Ω,F ,P) costituisce un modelloequiprobabile o uniforme se

M1. Ω e finito;

M2. F e l’insieme di tutti i sottoinsiemi di Ω

M3. per ogni ω ∈ Ω, P(ω) = costante.

Alessandra Micheletti Biostatistica 2012

Page 24: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Definizione. Lo spazio di probabilita (Ω,F ,P) costituisce un modelloequiprobabile o uniforme se

M1. Ω e finito;

M2. F e l’insieme di tutti i sottoinsiemi di Ω

M3. per ogni ω ∈ Ω, P(ω) = costante.

Alessandra Micheletti Biostatistica 2012

Page 25: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Definizione. Lo spazio di probabilita (Ω,F ,P) costituisce un modelloequiprobabile o uniforme se

M1. Ω e finito;

M2. F e l’insieme di tutti i sottoinsiemi di Ω

M3. per ogni ω ∈ Ω, P(ω) = costante.

Alessandra Micheletti Biostatistica 2012

Page 26: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Per il modello uniforme valgono le seguenti proprieta

P1. per ogni ω ∈ Ω si ha

P(ω) =1

numero di elementi di Ω

P2. per ogni evento A sottoinsieme di Ω si ha

P(A) =numero di elementi di A

numero di elementi di Ω

o anche

P(A) =casi favorevoli

casi possibili←− definizione classica della probabilita di

un evento:poco operativa, soprattutto se Ω ha infiniti elementi! Esempi?

Alessandra Micheletti Biostatistica 2012

Page 27: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Per il modello uniforme valgono le seguenti proprieta

P1. per ogni ω ∈ Ω si ha

P(ω) =1

numero di elementi di Ω

P2. per ogni evento A sottoinsieme di Ω si ha

P(A) =numero di elementi di A

numero di elementi di Ω

o anche

P(A) =casi favorevoli

casi possibili←− definizione classica della probabilita di

un evento:poco operativa, soprattutto se Ω ha infiniti elementi! Esempi?

Alessandra Micheletti Biostatistica 2012

Page 28: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

E se ”non mi fido” sul fatto che il dado sia equilibrato?

Posso lanciare il dado molte volte e calcolare la frequenza relativaall’evento esce il numero i rispetto al numero totale di lanci:

f (i) =numero di volte in cui e uscito i

numero totale di lanci

e posso approssimare P(i) con f (i).

Cosa accade pero al variare del numero di lanci?

Alessandra Micheletti Biostatistica 2012

Page 29: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Quelli sopra sono istogrammi che riportano le frequenze relative dellancio di un dado equilibrato.Notiamo che le frequenze si stabilizzano attorno a 1/6 solo per un altonumero di lanci.

Alessandra Micheletti Biostatistica 2012

Page 30: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Cio puo indurre a identificare la frequenza relativa di un evento con lasua probabilita, quando il numero degli esperimenti sia sufficientementegrande (tenda a ∞).

Cio corrisponde alla definizione frequentista della probabilita→ anch’essa poco operativa, talvolta, poiche non e sempre possibileeffettuare molti esperimenti

Esempio: supponete di voler calcolare la probabilita di morire ingerendo 1mg di mercurio....

Alessandra Micheletti Biostatistica 2012

Page 31: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Cio puo indurre a identificare la frequenza relativa di un evento con lasua probabilita, quando il numero degli esperimenti sia sufficientementegrande (tenda a ∞).

Cio corrisponde alla definizione frequentista della probabilita→ anch’essa poco operativa, talvolta, poiche non e sempre possibileeffettuare molti esperimenti

Esempio: supponete di voler calcolare la probabilita di morire ingerendo 1mg di mercurio....

Alessandra Micheletti Biostatistica 2012

Page 32: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Cio puo indurre a identificare la frequenza relativa di un evento con lasua probabilita, quando il numero degli esperimenti sia sufficientementegrande (tenda a ∞).

Cio corrisponde alla definizione frequentista della probabilita→ anch’essa poco operativa, talvolta, poiche non e sempre possibileeffettuare molti esperimenti

Esempio: supponete di voler calcolare la probabilita di morire ingerendo 1mg di mercurio....

Alessandra Micheletti Biostatistica 2012

Page 33: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Proprieta derivanti dalla definizione alla Kolmogorov

1. P(AC ) = 1− P(A) per ogni evento A ∈ F .

2. P(∅) = 0

Alessandra Micheletti Biostatistica 2012

Page 34: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Eventi che hanno probabilita 1 si dicono certi, eventi che hannoprobabilita 0 si dicono impossibili.

Esempio.L’evento il giorno di Pasqua cade di domenica e un evento certo.L’evento il giorno di Pasqua cade di mercoledi e un evento impossibile.

Alessandra Micheletti Biostatistica 2012

Page 35: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

3. se A,B ∈ F e B e contenuto in A, allora P(A) = P(B) + P(A− B)Infatti A e unione disgiunta di B e di A− B ⇒ applico additivita.

4. se A,B ∈ F e B e contenuto in A, allora P(B) ≤ P(A)

Alessandra Micheletti Biostatistica 2012

Page 36: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Esempi: Nel lancio di un dado equilibrato, sianoA = esce un numero pari, A− B = esce 2 o 4

Alessandra Micheletti Biostatistica 2012

Page 37: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

5. se A,B ∈ F qualsiasi,

P(A ∪ B) = P(A) + P(B)−P(A ∩ B)

Alessandra Micheletti Biostatistica 2012

Page 38: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Esempio. Nel lancio di un dado equilibrato, consideriamoA = esce un numero compreso fra 2 e 4 = 2, 3, 4 P(A) = 3

6B = esce un numero ≥ 3 = 3, 4, 5, 6 P(B) = 4

6

A ∩ B = esce un numero compreso fra 2 e 4 e ≥ 3 = 3, 4

P(A ∩ B) = 26

A ∪ B = esce un numero compreso fra 2 e 4 o ≥ 3 = 2, 3, 4, 5, 6

P(A ∪ B) = 56 = 3

6 + 46 −

26

Alessandra Micheletti Biostatistica 2012

Page 39: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Esempio. Nel lancio di un dado equilibrato, consideriamoA = esce un numero compreso fra 2 e 4 = 2, 3, 4 P(A) = 3

6B = esce un numero ≥ 3 = 3, 4, 5, 6 P(B) = 4

6

A ∩ B = esce un numero compreso fra 2 e 4 e ≥ 3 = 3, 4

P(A ∩ B) = 26

A ∪ B = esce un numero compreso fra 2 e 4 o ≥ 3 = 2, 3, 4, 5, 6

P(A ∪ B) = 56 = 3

6 + 46 −

26

Alessandra Micheletti Biostatistica 2012

Page 40: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Esempio. Nel lancio di un dado equilibrato, consideriamoA = esce un numero compreso fra 2 e 4 = 2, 3, 4 P(A) = 3

6B = esce un numero ≥ 3 = 3, 4, 5, 6 P(B) = 4

6

A ∩ B = esce un numero compreso fra 2 e 4 e ≥ 3 = 3, 4

P(A ∩ B) = 26

A ∪ B = esce un numero compreso fra 2 e 4 o ≥ 3 = 2, 3, 4, 5, 6

P(A ∪ B) = 56 = 3

6 + 46 −

26

Alessandra Micheletti Biostatistica 2012

Page 41: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

6. Principio di inclusione-esclusione: siano A1, . . . ,An ∈ F , allora

P(⋃n

i=1 Ai ) =∑n

i=1 P(Ai )−∑

i<j P(Ai ∩ Aj)

+∑

i<j<k P(Ai ∩ Aj ∩ Ak) + · · ·+ (−1)n+1P(A1 ∩ · · · ∩ An)

Alessandra Micheletti Biostatistica 2012

Page 42: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Distribuzioni NON equiprobabili

La distribuzione equiprobabile o uniforme e solo un esempio dei tanti tipidiversi di distribuzione che incontreremo.

Esempio. Si consideri il lancio di 2 dadi e si sommino i puntini delle duefacce superiori. Lo spazio dei campioni del lancio dei due dadi e

Ω = (1, 1), (1, 2), (2, 1), (1, 3), (3, 1), . . . , (6, 6)

mentre lo spazio dei campioni della variabile somma delle due facce e:

Ω1 = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.

Notiamo che gli elementi di Ω sono equiprobabili (supponendo che i dadisiano entrambi equilibrati e i dadi non si influenzino a vicenda nei lanci),mentre gli elementi di Ω1 non lo sono.

Alessandra Micheletti Biostatistica 2012

Page 43: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Lavoriamo su Ω per calcolare le probabilita degli elementi (eventielementari) di Ω1:

P(i) =casi favorevoli

casi possibili=

numero di coppie con cui ottengo i

numero totale di coppie in Ω

Alessandra Micheletti Biostatistica 2012

Page 44: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

P(somma facce sia 2) =numero di coppie che danno somma 2

numero totale di coppie in Ω=

1

36

P(somma facce sia 3) =numero di coppie che danno somma 3

numero totale di coppie in Ω=

2

36

P(somma facce sia 4) =numero di coppie che danno somma 4

numero totale di coppie in Ω=

3

36

...

Alessandra Micheletti Biostatistica 2012

Page 45: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Quindi l’istogramma delle probabilita degli elementi di Ω1 e

Alessandra Micheletti Biostatistica 2012

Page 46: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Se aumentiamo il numero di dadi che lanciamo e approssimiamo ladistribuzione della somma delle facce con l’approccio frequentista (simulo10000 lanci e disegno l’istogramma delle frequenze relative) otteniamo:

Alessandra Micheletti Biostatistica 2012

Page 47: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Questo esempio ci mostra che

esistono vari tipi di ”aleatorieta”;

le diverse aleatorieta si rappresentano attraverso diverse misure diprobabilita. Esse sono legate a diverse distribuzioni delle variabili ingioco;

per calcolare tali distribuzioni spesso si puo far ricorso a spazi deicampioni ausiliari, i cui elementi sono equiprobabili, in modo daricorrere a un conteggio degli elementi degli insiemi considerati, percalcolare opportuni rapporti di casi favorevoli/ casi possibili

Per calcolare tali rapporti in casi piu complessi di quelli visti finora faremoricorso al calcolo combinatorio.

Alessandra Micheletti Biostatistica 2012

Page 48: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Questo esempio ci mostra che

esistono vari tipi di ”aleatorieta”;

le diverse aleatorieta si rappresentano attraverso diverse misure diprobabilita. Esse sono legate a diverse distribuzioni delle variabili ingioco;

per calcolare tali distribuzioni spesso si puo far ricorso a spazi deicampioni ausiliari, i cui elementi sono equiprobabili, in modo daricorrere a un conteggio degli elementi degli insiemi considerati, percalcolare opportuni rapporti di casi favorevoli/ casi possibili

Per calcolare tali rapporti in casi piu complessi di quelli visti finora faremoricorso al calcolo combinatorio.

Alessandra Micheletti Biostatistica 2012

Page 49: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Questo esempio ci mostra che

esistono vari tipi di ”aleatorieta”;

le diverse aleatorieta si rappresentano attraverso diverse misure diprobabilita. Esse sono legate a diverse distribuzioni delle variabili ingioco;

per calcolare tali distribuzioni spesso si puo far ricorso a spazi deicampioni ausiliari, i cui elementi sono equiprobabili, in modo daricorrere a un conteggio degli elementi degli insiemi considerati, percalcolare opportuni rapporti di casi favorevoli/ casi possibili

Per calcolare tali rapporti in casi piu complessi di quelli visti finora faremoricorso al calcolo combinatorio.

Alessandra Micheletti Biostatistica 2012

Page 50: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

Eventi e Spazio dei Campioniσ-algebraImpostazione assiomatica alla KolmogorovEquiprobabilita: il modello uniformeProprieta di PAltre distribuzioni

Questo esempio ci mostra che

esistono vari tipi di ”aleatorieta”;

le diverse aleatorieta si rappresentano attraverso diverse misure diprobabilita. Esse sono legate a diverse distribuzioni delle variabili ingioco;

per calcolare tali distribuzioni spesso si puo far ricorso a spazi deicampioni ausiliari, i cui elementi sono equiprobabili, in modo daricorrere a un conteggio degli elementi degli insiemi considerati, percalcolare opportuni rapporti di casi favorevoli/ casi possibili

Per calcolare tali rapporti in casi piu complessi di quelli visti finora faremoricorso al calcolo combinatorio.

Alessandra Micheletti Biostatistica 2012

Page 51: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Permutazioni

Assegnati n oggetti distinti si dice che essi sono ordinati in unallineamento se sono collocati in posizioni numerate da 1 a n.

Esempio.T,G,C,AG,C,A,TA,C,T,G....sono allineamenti delle 4 basi che compongono i nucleotidi del DNA.

Domanda: quante sequenze ordinate diverse posso formare con le 4 basiA,C,G,T?

Alessandra Micheletti Biostatistica 2012

Page 52: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Posizioni:12

22

32

42

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;per ogni scelta sulle prime tre posizioni, posso riempire la posizione 4 in 1solo modo.

Il numero di sequenze cercato e 4 · 3 · 2 · 1, ossia il prodotto dei primi 4interi.

Alessandra Micheletti Biostatistica 2012

Page 53: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Posizioni:12

22

32

42

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;per ogni scelta sulle prime tre posizioni, posso riempire la posizione 4 in 1solo modo.

Il numero di sequenze cercato e 4 · 3 · 2 · 1, ossia il prodotto dei primi 4interi.

Alessandra Micheletti Biostatistica 2012

Page 54: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Posizioni:12

22

32

42

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;per ogni scelta sulle prime tre posizioni, posso riempire la posizione 4 in 1solo modo.

Il numero di sequenze cercato e 4 · 3 · 2 · 1, ossia il prodotto dei primi 4interi.

Alessandra Micheletti Biostatistica 2012

Page 55: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Posizioni:12

22

32

42

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;per ogni scelta sulle prime tre posizioni, posso riempire la posizione 4 in 1solo modo.

Il numero di sequenze cercato e 4 · 3 · 2 · 1, ossia il prodotto dei primi 4interi.

Alessandra Micheletti Biostatistica 2012

Page 56: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Posizioni:12

22

32

42

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;per ogni scelta sulle prime tre posizioni, posso riempire la posizione 4 in 1solo modo.

Il numero di sequenze cercato e 4 · 3 · 2 · 1, ossia il prodotto dei primi 4interi.

Alessandra Micheletti Biostatistica 2012

Page 57: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Posizioni:12

22

32

42

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;per ogni scelta sulle prime tre posizioni, posso riempire la posizione 4 in 1solo modo.

Il numero di sequenze cercato e 4 · 3 · 2 · 1, ossia il prodotto dei primi 4interi.

Alessandra Micheletti Biostatistica 2012

Page 58: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Supponiamo ora di avere n elementi diversi (ad esempio n lettere diverse,n palline di colori tutti diversi, n bambini da disporre in una fila, ....) e cichiediamo quante sequenze ordinate diverse, Pn, degli n elementipossiamo formare?

Procedendo come prima troviamo che

Pn = n · (n − 1) · (n − 2) · (n − 3) · · · · · 1 = n!

e Pn si dicono permutazioni di n elementi

Alessandra Micheletti Biostatistica 2012

Page 59: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Disposizioni semplici

Definizione. Si dice disposizione semplice di n oggetti di classe k ogniallineamento di k oggetti diversi scelti fra gli n (notazione: Dn,k .ATTENZIONE: k < n)

Esempio. Oggetti: A,C,G,T (n = 4)Quante triplette (sequenze di k = 3 oggetti) formate da basi tutte diversefra loro possiamo formare?

Cerco D4,3.

Posso elencarle: ATG, GCA, GAC, ...

Alessandra Micheletti Biostatistica 2012

Page 60: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Oppure: come prima, considero le posizioni da riempire12

22

32

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;

Quindi D4,3 = 4 · 3 · 2

Alessandra Micheletti Biostatistica 2012

Page 61: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Oppure: come prima, considero le posizioni da riempire12

22

32

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;

Quindi D4,3 = 4 · 3 · 2

Alessandra Micheletti Biostatistica 2012

Page 62: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Oppure: come prima, considero le posizioni da riempire12

22

32

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;

Quindi D4,3 = 4 · 3 · 2

Alessandra Micheletti Biostatistica 2012

Page 63: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Oppure: come prima, considero le posizioni da riempire12

22

32

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;

Quindi D4,3 = 4 · 3 · 2

Alessandra Micheletti Biostatistica 2012

Page 64: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Oppure: come prima, considero le posizioni da riempire12

22

32

La posizione 1 la posso riempire in 4 modi diversi;per ogni scelta sulla prima posizione posso riempire la posizione 2 in 3modi diversi;per ogni scelta sulle prime due posizioni, posso riempire la posizione 3 in2 modi diversi;

Quindi D4,3 = 4 · 3 · 2

Alessandra Micheletti Biostatistica 2012

Page 65: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

In generale:

Dn,k = n · (n − 1) · (n − 2) · · · · · (n − k + 1)

=n · (n − 1) · · · · · (n − k + 1) · (n − k) · (n − k − 1) · · · · · 1

(n − k) · (n − k − 1) · · · · · 1

=n!

(n − k)!

Alessandra Micheletti Biostatistica 2012

Page 66: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Disposizioni con ripetizione

Definizione. Si dice disposizione con ripetizione di n oggetti di classe kogni allineamento di k oggetti scelti fra gli n, dove gli oggetti possonoessere anche ripetuti piu volte (notazione: DR

n,k . ATTENZIONE: qui puoessere k < n, k = n, k > n)

Esempio. Oggetti: A,C,G,T (n = 4)Quante triplette (sequenze di k = 3 oggetti) possiamo formare, ripetendoanche le basi? (Esempi: TTG, ACT,CTC,...)

Dunque DR4,3 = 43

Alessandra Micheletti Biostatistica 2012

Page 67: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

In generale:

Dunque DRn,k = nk

Esercizio: in quanti modi diversi posso riempire una colonna di unaschedina del totocalcio?

Alessandra Micheletti Biostatistica 2012

Page 68: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

In generale:

Dunque DRn,k = nk

Esercizio: in quanti modi diversi posso riempire una colonna di unaschedina del totocalcio?

Alessandra Micheletti Biostatistica 2012

Page 69: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

In generale:

Dunque DRn,k = nk

Esercizio: in quanti modi diversi posso riempire una colonna di unaschedina del totocalcio?

Alessandra Micheletti Biostatistica 2012

Page 70: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Combinazioni

Definizione. Si dice combinazione di k oggetti scelti fra n ogniraggruppamento, comunque ordinato, di k degli n oggetti, diversi fra loro.

Quindi due combinazioni differiscono solo per gli elementi checontengono e non per l’ordine con cui appaiono: CGT e GTC sono lastessa combinazione!

Contiamo le combinazioni di n elementi di classe k (denotiamole conCn,k):

Alessandra Micheletti Biostatistica 2012

Page 71: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventi

PermutazioniDisposizioniCombinazioni

Cn,k = Dn,k/n. di sequenze di k oggetti che differiscono

solo per l’ordine degli elementi

=Dn,k

Pk

=n(n − 1)(n − 2) . . . (n − k + 1)

k!

=n!

k!(n − k)!=:

(n

k

)(nk

)e detto coefficiente binomiale

Alessandra Micheletti Biostatistica 2012

Page 72: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventiRegola della Probabilita totale

Probabilita condizionata

Definizione 1. Siano A1,A2 due eventi in F con P(A1) > 0. Si diceprobabilita condizionata di A2 dato che si e realizzato A1 la quantita

P(A2|A1) =P(A1 ∩ A2)

P(A1).

Esempio. Supponiamo di lanciare un dado due volte in sequenza. SiaA2 = la somma dei due lanci da 2Se i lanci non si influenzano, lanciare due volte un dado o una volta duedadi, e poi sommarne le facce, e la stessa cosa. Quindi abbiamo gia vistoche

P(A2) =1

36

Alessandra Micheletti Biostatistica 2012

Page 73: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventiRegola della Probabilita totale

Supponiamo ora di sapere che si e verificatoA1 = il primo lancio da 1

adessoP(A2|A1) =

Alessandra Micheletti Biostatistica 2012

Page 74: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventiRegola della Probabilita totale

Eventi indipendenti

Definizione. Due eventi A1,A2 in F sono indipendenti se

P(A2|A1) = P(A2)

o, equivalentemente, se

P(A1 ∩ A2) = P(A1)P(A2).

Dunque la probabilita dell’intersezione di due eventi indipendenti e ilprodotto delle probabilita dei singoli eventi.

Alessandra Micheletti Biostatistica 2012

Page 75: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventiRegola della Probabilita totale

Esempio. Nell’esempio precedente di due lanci di un dado, consideriamo

A1 = il primo lancio da 1A2 = il secondo lancio da 3

Alessandra Micheletti Biostatistica 2012

Page 76: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventiRegola della Probabilita totale

Regola della Probabilita totale

Notiamo che dalla definizione di probabilita condizionata abbiamo cheper ogni coppia di eventi A e B

P(A ∩ B) = P(A|B)P(B)

Alessandra Micheletti Biostatistica 2012

Page 77: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventiRegola della Probabilita totale

Supponiamo ora che gli eventi B1,B2, . . . ,Bk formino una partizione di Ωossia

Bi ∩ Bj = ∅ per ogni i 6= j⋃ki=1 Bi = Ω

Allora A = (A∩B1)∪ (A∩B2)∪ · · · ∪ (A∩Bk) e le unioni sono disgiunte

Alessandra Micheletti Biostatistica 2012

Page 78: Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica · 2012-03-25 · Bioinformatica e Biostatistica - 2011/12 Modulo di Biostatistica Alessandra Micheletti Dipartimento

Introduzione al Calcolo delle ProbabilitaCalcolo Combinatorio

Probabilita condizionata e indipendenza di eventiRegola della Probabilita totale

Applicando quindi la additivita otteniamo

P(A) = P(A ∩ B1) + P(A ∩ B2) + · · ·+ P(A ∩ Bk)

ossia

P(A) = P(A|B1)P(B1) + P(A|B2)P(B2) + · · ·+ P(A|Bk)P(Bk)

Questa e detta regola della probabilita totale.

Alessandra Micheletti Biostatistica 2012