Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in...

34
Matematiche Complementari Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo ([email protected]) Dipartimento di Matematica, Universit` a di Roma Tor Vergata Programma del Corso per l’AA 2008-09 1. Elementi di calcolo differenziale e integrale per la comprensione ed illustrazione di semplici equazioni differenziali per la dinamica di una popolazione (Malthus, Verlhurst): sig- nificato e calcolo di derivate ed integrali per funzioni di una variabile. 2. Elementi di Probabilit` a e Statistica: probabilit` a in spazi finiti, probabilit` a condizionata (Teor. di Bayes); variabili aleatorie, distribuzioni binomiale e normale. Campioni ed indici (media, varianza). Stimatori in Statistica inferenziale. Testi consigliati per consultazione, oltre alle presenti Note: 1. C. Cammarota: Elementi di Calcolo e di Statistica, L.S.D., Roma. 2. Per un’introduzione alle equazioni differenziali ordinarie, vedi L.Lamberti e C.Mascia: http://www.mat.uniroma2.it/˜triolo/soloEdo.pdf Per un corso di Calcolo online, c’` e il sito web: http://www.sosmath.com/ 3. Collana Schaum: Probabilit`a e Statistica, McGraw-Hill, Milano 4. Corso on-line di Matematica per Biotecnologie, di D.Benedetto (La Sapienza): http://brazil.mat.uniroma1.it/dario/biotec2007/appunti/appunti.pdf 1. Introduzione Il programma originariamente scritto per il corso di Matematiche Complementari com- prendeva essenzialmente modelli di dinamica delle popolazioni, dal punto di vista determinis- tico e stocastico. Questi argomenti necessitano naturalmente di una preparazione di base sia sul calcolo differenziale ed integrale che sul Calcolo delle Probabilit` a. Ci` o` e risultato purtroppo difficile da trovare anche tra studenti diligenti e motivati, dopo l’incongrua riduzione per legge della didattica di base. Si ` e quindi rivelato necessario, almeno in quest’anno accademico 2007-08, dover fornire in questa sede, elementi di teoria delle equazioni differenziali ed elementi di Probabilit` ae Statistica. Il programma si ` e quindi considerabilmente ridotto nella parte pi` u specificatamente “ecologica”, prendendo in esame solo le prime equazioni d’evoluzione per una popolazione. Si spera che miglioramenti apportati a livello di laurea triennale permetteranno in futuro di fornire in questo corso specialistico quelle nozioni matematiche un p` o pi` u avanzate, necessarie per muoversi con maggior facilit` a nell’attuale letteratura scientifica in Ecologia. In Appendice ` e riportato il testo (esteso) di una conferenza rivolta ad un uditorio di ricercatori biologi e medici, sulla modellizzazione matematica in biomedicina. 1

Transcript of Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in...

Page 1: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

Matematiche ComplementariLaurea Magistrale in Ecologia ed Evoluzione

prof. L. Triolo ([email protected])Dipartimento di Matematica, Universita di Roma Tor Vergata

Programma del Corso per l’AA 2008-09

1. Elementi di calcolo differenziale e integrale per la comprensione ed illustrazione disemplici equazioni differenziali per la dinamica di una popolazione (Malthus, Verlhurst): sig-nificato e calcolo di derivate ed integrali per funzioni di una variabile.

2. Elementi di Probabilita e Statistica: probabilita in spazi finiti, probabilita condizionata(Teor. di Bayes); variabili aleatorie, distribuzioni binomiale e normale. Campioni ed indici(media, varianza). Stimatori in Statistica inferenziale.

Testi consigliati per consultazione, oltre alle presenti Note:

1. C. Cammarota: Elementi di Calcolo e di Statistica, L.S.D., Roma.2. Per un’introduzione alle equazioni differenziali ordinarie, vedi L.Lamberti e C.Mascia:

http://www.mat.uniroma2.it/˜triolo/soloEdo.pdfPer un corso di Calcolo online, c’e il sito web: http://www.sosmath.com/

3. Collana Schaum: Probabilita e Statistica, McGraw-Hill, Milano4. Corso on-line di Matematica per Biotecnologie, di D.Benedetto (La Sapienza):

http://brazil.mat.uniroma1.it/dario/biotec2007/appunti/appunti.pdf

1. Introduzione

Il programma originariamente scritto per il corso di Matematiche Complementari com-prendeva essenzialmente modelli di dinamica delle popolazioni, dal punto di vista determinis-tico e stocastico. Questi argomenti necessitano naturalmente di una preparazione di base siasul calcolo differenziale ed integrale che sul Calcolo delle Probabilita. Cio e risultato purtroppodifficile da trovare anche tra studenti diligenti e motivati, dopo l’incongrua riduzione per leggedella didattica di base.

Si e quindi rivelato necessario, almeno in quest’anno accademico 2007-08, dover fornirein questa sede, elementi di teoria delle equazioni differenziali ed elementi di Probabilita eStatistica. Il programma si e quindi considerabilmente ridotto nella parte piu specificatamente“ecologica”, prendendo in esame solo le prime equazioni d’evoluzione per una popolazione.Si spera che miglioramenti apportati a livello di laurea triennale permetteranno in futuro difornire in questo corso specialistico quelle nozioni matematiche un po piu avanzate, necessarieper muoversi con maggior facilita nell’attuale letteratura scientifica in Ecologia.

In Appendice e riportato il testo (esteso) di una conferenza rivolta ad un uditorio diricercatori biologi e medici, sulla modellizzazione matematica in biomedicina.

1

Page 2: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

2

2. Calcolo Combinatorio

Si esaminano in questo capitolo le nozioni indispensabili di Disposizioni e Combinazioni,presenti sia nel Calcolo, attraverso l’uso dei coefficienti binomiali, che nei primi calcoli prob-abilistici.

2.1. Disposizioni. Dati n elementi diversi, diciamo i numeri {1, 2, 3, ..n}, ci si chiede inquanti modi differenti si possono “disporre” questi n elementi in gruppi di k ≤ n, ponendo cioeattenzione all’ordine in cui si piazzano i diversi elementi; Dk

n e il numero di tali Disposizionidi n oggetti di classe k.

Ad esempio da un gruppo di ventuno lettere diverse, in quanti modi si possono formaredelle “parole” di quattro lettere? Il calcolo diDk

n e abbastanza rapido: il primo elemento si puoscegliere in n modi diversi, il secondo in n−1 modi, fino al k−esimo, in n−k+1 modi restanti,da cui Dk

n = n(n−1)..(n−k+1). Quindi, per l’esempio proposto, D421 = 21·20·19·18 = 143640.

In particolare, se k = n, le disposizioni di n oggetti di classe n si dicono Permutazioni din elementi ed il loro numero risulta Pn ≡ Dn

n = n(n − 1)..2 · 1; si usa per tale espressionepiuttosto comune in matematica il simbolo n! (n fattoriale). Per convenzione si estenderasuccessivamente la definizione del fattoriale anche ad n = 0, ponendo 0! = 1.

In tal modo si puo scrivere l’identita Dkn = n!

(n−k)! .

Il valore di n! cresce molto rapidamente con n: ad esempio le permutazioni di 52 cartesono circa 8 · 1067.

Un esempio ulteriore: in quanti modi diversi n oggetti diversi (molecole, o persone) pos-sono disporsi in cerchio? Se conta solo l’ordine relativo tra gli elementi, tale numero sara(n− 1)!, dato che una rotazione non cambia la posizione relativa degli elementi.

Si possono considerare anche le permutazioni con ripetizioni: consideriamo k elementidiversi, ad esempio lettere dell’alfabeto, vogliamo contare quante parole diverse, lunghe l =n1 + n2 + ..nk si possono formare con n1 copie del primo elemento, n2 copie del secondoelemento,..nk copie del k-esimo elemento; in generale questo numero Pn1,n2,..nk sara datodalla formula

Pn1,n2,..nk =(n1 + n2 + ..nk)!

n1!n2! · ..nk!Questa formula si ottiene pensando alle permutazioni di n1 + n2 + ..nk elementi diversi, edividendo poi per le permutazioni corrispondenti alla presenza di n1, n2,..nk copie del primo,del secondo,.. del k-esimo elemento.

Quindi se abbiamo 4 lettere diverse {a,b,c,d}, quante parole con due a, con tre b, con unac e due d si possono formare? La lunghezza e quindi 2+3+1+2= 8 e il calcolo si fa dividendoil numero delle permutazioni di 8 elementi (8!) per il prodotto 2!3!2! ottenendo 1680.

2.2. Combinazioni. Dati n elementi diversi, diciamo i numeri {1, 2, 3, ..n}, ci si chiedeora di calcolare in quanti modi differenti si possono “estrarre” gruppi di k ≤ n elementi, senzaquindi porre attenzione all’ordine in cui si piazzano i diversi elementi; Ckn e il numero di taliCombinazioni di n oggetti di classe k.

Il calcolo di Ckn risulta derivabile senza particolari difficolta da Dkn:

Ckn =Dkn

k!=

n!

(n− k)!k!

Page 3: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

3

Infatti, fissati k elementi, le loro k! permutazioni corrispondono alla stessa combinazione. Unesempio concreto e dato dal calcolo di quante combinazioni di 5 carte si possono formare conun mazzo di 52:

C552 =

D552

5!= 2598960

In matematica si usa per Ckn il simbolo(nk

)(coefficiente binomiale “n sopra k”) che appare in

molte ed importanti formule, ad esempio nello sviluppo del binomio di Newton:

(a+ b)n =n∑k=0

(n

k

)an−kbk

Dalla definizione segue la proprieta di simmetria(n

k

)=

(n

n− k

)e l’importante proprieta ricorsiva:(

n

k

)+

(n

k + 1

)=

(n+ 1

k + 1

)che da luogo al cosiddetto triangolo di Tartaglia-Pascal(

00

)(10

) (11

)(20

) (21

) (22

)(30

) (31

) (32

) (33

)(40

) (41

) (42

) (43

) (44

). . . . .

=

11 11 2 11 3 3 11 4 6 4 1. . . . .

2.3. Disposizioni con ripetizioni. Concludiamo questi brevi cenni di calcolo combi-natorio con la nozione di Disposizioni con ripetizioni. Supponiamo di dover assegnare targhediverse ad 106 veicoli: una targa numerica sara composta da 6 caselle in ciascuna delle qualie presente una cifra da 0 a 9. In effetti se abbiamo n simboli da disporre ( l’ordine conta!) ink caselle, poiche i simboli possono ripetersi, possiamo scegliere in n modi diversi il simbolonella prima casella, sempre in n modi diversi quello nella seconda, etc, totalizzando quindi nk

differenti disposizioni di n simboli, di classe k con ripetizioni.Ci si puo allora chiedere quante caselle sono sufficienti per assegnare targhe alfabetiche

(24 simboli) al milione di auto considerato prima: ora n = 24 e cerchiamo k in modo che24k ≥ 106: prendendo il logaritmo in base 10 si ha

k log 24 ≥ 6⇒ k ≥ 6

1.38..= 4.34.. (244 = 331776)

Occorrono quindi almeno 5 caselle.Se aggiungiamo le 10 cifre numeriche, si hanno 34 simboli e dunque il calcolo permette di

dire che occorrono solo 4 caselle: infatti

k log 34 ≥ 6⇒ k ≥ 6

1.53..= 3.91.. (344 = 1336336)

In linea di principio, basterebbero due simboli {0, 1}, ma il numero di caselle cresce sino a 20:

k log 2 ≥ 6⇒ k ≥ 6

0.301..= 19.93.. (220 = 1048576)

Page 4: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

4

Un altro esempio d’interesse biologico: in quanti modi diversi i quattro simboli A,T,G,Cpossono formare una stringa lunga 107 (esempio ispirato dal DNA del lievito)? La cifra

astronomica 4107 ≈ 106·10

6dice che la chimica fornisce vincoli molto forti per la formazione

di sequenze “reali” di basi nucleotidiche.Di particolare interesse e il caso di n = 2, in cui i due simboli possono essere presi pari a

0 o ad 1.Una disposizione con ripetizione degli elementi dell’insieme {0, 1}, di classe k, corrisponde

ad un particolare sottoinsieme di un generico insieme E di k elementi. Tale corrispondenzasi vede nel modo seguente: supponiamo che i k elementi dell’insieme siano individuati dainumeri 1, 2, ..k. Un sottoinsieme di E si determina con una stringa lunga k dei simboli 0 e1, dove 0 nel posto i-esimo significa assenza dell’elemento i-esimo ed 1 significa presenza diquell’elemento: la stringa composta da tutti 1 corrisponde all’insieme E, quella compostada tutti 0 all’insieme vuoto. Esempio: la stringa di 6 cifre, {1, 0, 1, 0, 0, 0}, corrisponde alsottoinsieme formato dal primo e dal terzo elemento di un insieme di sei elementi.

Tutti i sottoinsiemi, compreso l’insieme vuoto, e l’intero insieme di k elementi sarannoallora 2k: si dice in modo sintetico che l’insieme delle parti di un insieme di k elementi, ha2k elementi. Verifichiamolo come esercizio a partire dalla formula del binomio prendendoa = b = 1: poiche

(km

)e il numero di sottoinsiemi con m elementi estratti dall’insieme di k

elementi, la loro somma dovra essere 2k, ed e proprio quello che si ottiene dalla formula

(1 + 1)k = 2k =k∑

m=0

(k

m

)

3. Sistemi dinamici discreti

Lo studio dell’evoluzione di un sistema a tempi discreti, come la crescita di una popo-lazione batterica registrata ad intervalli di tempo di lunghezza costante, e un argomento dichiaro interesse applicativo, ed e anche stato alla base di sviluppi recenti nella teoria deisistemi dinamici (caos deterministico). Formalmente si puo anche considerare come una dis-cretizzazione di evoluzioni a tempo continuo, legandosi quindi alle metodologie numeriche perla soluzione di equazioni differenziali. Si considerano qui di seguito gli elementi base dellateoria, e qualche applicazione di carattere biologico.

3.1. Equazioni alle differenze del primo ordine. Supponiamo di voler misurareuna grandezza y dipendente dal tempo ad intervalli di tempo fissi t1, t2, ..tk, .. (ad es. unapopolazione batterica ad ogni ora) e di scoprire che yk ≡ y(tk) soddisfa ad una relazione deltipo

yk+1 = αyk + fk (3.1)

dove α e un parametro reale ed {fk}; k = 1, 2, .. e una successione data. E naturale volervalutare il comportamento di tale grandezza al crescere di k.

Alla forma in (3.1) si arriva anche partendo da una discretizzazione dell‘equazione dif-ferenziale del primo ordine:

y(t) = ay(t) + F (t)

Page 5: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

5

Si ha infatti, approssimando la derivata con il rapporto incrementale corrispondente ad un∆t = τ :

yk+1 − ykτ

= ayk + Fk ⇔ (3.2)

yk+1 = yk + aτyk + τFk (3.3)

e si ottiene la forma semplificata (3.1) ponendo α = 1 + aτ, fk = τFkCome nel caso dell’equazione differenziale occorre supplementare la legge d’evoluzione

(3.1) con un dato iniziale per ottenere una soluzione unica che soddisfi appunto la condizioneiniziale.

In tal caso infatti, dal valore iniziale y0 si ricava y1 = αy0 + f1 e cosı via; la legged’evoluzione con il dato iniziale costituisce un sistema dinamico discreto e lineare.

Vogliamo vedere ora come si puo ricavare la soluzione della (3.1) in generale e poi in modoesplicito, nel caso in cui fk ≡ f , vale a dire quando il “dato” {fk} si riduce ad una costante.Come nel caso dei sistemi lineari di equazioni, consideriamo dapprima il sistema omogeneoassociato e descriviamone le soluzioni; cerchiamo poi una soluzione particolare del sistemacompleto (non omogeneo), e naturalmente la somma delle soluzioni sara ancora soluzione di(3.1). Il problema sara quindi risolto completamente quando si determinera la soluzione chesoddisfa il dato iniziale.

• Primo passo: cercare le soluzioni dell’equazione omogenea associata (in generalesaranno infinite, dipendenti da un parametro reale)

uk+1 = αuk (3.4)

• Secondo passo: cercare una soluzione particolare dell’equazione non-omogenea dipartenza

pk+1 = αpk + fk (3.5)

La soluzione del problema con un dato iniziale specifico si otterra considerando la soluzionegenerale come somma della generica soluzione dell’equazione omogenea e della soluzione par-ticolare, calcolando poi il parametro libero mediante l’imposizione del dato iniziale.

Vediamo dunque che le soluzioni dell’omogenea si ottengono esplicitamente dalla relazionericorsiva (3.4), dove c e una costante arbitraria

uk+1 = αuk = α(αuk−1) = ... = αk+1c (3.6)

La successione soluzione dell’omogenea si puo discutere in funzione dei parametri: α = 0 oc = 0 da la soluzione identicamente nulla uk ≡ 0, mentre α = 1 da una soluzione costanteuk ≡ c, k = 1, 2, .., c ha il significato di valore iniziale per la soluzione uk. Continuandonell’analisi, con c 6= 0, se α = −1, uk = (−1)kc, ovvero uk = ±c a seconda della parita dik; se α > 1 la soluzione diverge a sign (c)∞, (sign (c) = 1 se c > 0, e −1 se c < 0); mentrese α < −1, |uk| → ∞ per k → ∞, con un cambio di segno per uk ad ogni passo. Infine, se|α| < 1, uk → 0 per k →∞.

Di tali andamenti se ne puo dare anche una rappresentazione grafica nel piano.Cerchiamo ora una soluzione particolare dell’equazione non-omogenea, supponendo che il

dato fk sia costante: fk ≡ f 6= 0. Troviamo una soluzione anch’essa costante, pk ≡ p, ∀k, seα 6= 1: basta scrivere l’equazione lineare

Page 6: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

6

p = αp+ f (3.7)

che ha come soluzione

p =f

1− α(3.8)

Se invece α = 1, si trova immediatamente una soluzione particolare non costante (pre-cisamente una per cui p1 = f):

pk+1 = pk + f = (pk−1 + f) + f =

pk−1 + 2f = .. = (k + 1)f

La soluzione generale di (3.1) sara la somma di uk e pk:

per α 6= 1 : yk = αkc+ p = αkc+ f1−α (3.9)

per α = 1 : yk = c+ kf (3.10)

Infine imponendo il dato iniziale, ad esempio il valore y0, per k = 0, si ha la soluzionecompleta:

per α 6= 1 : yk = αk(y0 − p) + p, k = 0, 1, 2, .. (3.11)

per α = 1 : yk = y0 + kf, k = 0, 1, 2, .. (3.12)

L’analisi si completa valutando l’andamento asintotico per k → ∞: il caso interessante equando |α| < 1, perche si vede subito che yk → p; notare che il valore limite non dipende daldato iniziale e costituisce un equilibrio asintoticamente stabile.

In effetti vediamo subito che per α 6= 1, se ponessimo il dato iniziale y0 pari a p, lasoluzione resterebbe sempre costante; pero nel caso α < 1, un dato iniziale diverso portaasintoticamente verso p, mentre per |α| > 1 la soluzione se ne allontana, dato che |yk| → ∞.Quindi p e un equilibrio in ogni caso, ma e stabile (di piu, e globalmente attrattivo) per |α| < 1ed instabile per |α| > 1.

Infine, per α = 1 non ci sono equilibri (abbiamo supposto f 6= 0).

3.2. Equazioni alle differenze del secondo ordine. Analogamente alle equazionidifferenziali di ordine superiore, come ad esempio l’equazione di Newton della dinamica delpunto materiale (del secondo ordine), si possono considerare equazioni “discrete” in cui sonocoinvolti valori presi in piu di due istanti consecutivi.

Consideriamo infatti la discretizzazione dell‘equazione differenziale lineare non omogeneadel secondo ordine:

y(t) + ay(t) + by(t) = F (t)

Risulta

yk+2 − 2yk+1 + ykτ2

+ ayk+1 − yk

τ+ byk = Fk ⇔ (3.13)

yk+2 + (aτ − 2)yk+1 + (1− aτ + bτ2)yk = τ2Fk (3.14)

e si ottiene la forma semplificata

yk+2 = αyk+1 + βyk + fk (3.15)

ponendo α = 2− aτ, β = aτ − 1− bτ2, fk = τ2Fk.

Page 7: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

7

Procediamo come nel caso precedente, passando all’ omogenea associata e poi alla ricercadi una soluzione particolare della non-omogenea.

• Primo passo: cercare le soluzioni dell’equazione omogenea associata (in generalesaranno infinite, dipendenti da due parametri reali)

uk+2 = αuk+1 + βuk (3.16)

• Secondo passo: cercare una soluzione particolare dell’equazione non-omogenea dipartenza

pk+2 = αpk+1 + βpk + fk (3.17)

Per l’omogenea cerchiamo soluzioni simili a quelle trovate direttamente nel caso del primoordine:

uk = rkc (3.18)

Sostituendo in (3.16), si trova per r un’equazione algebrica di secondo grado

r2 − αr − β = 0(equazione caratteristica)

le cui soluzioni dipendono dai parametri α e β:

• Se α2 + 4β > 0, ci sono due radici reali distinte r+ e r−, date da

r± =α±

√α2 + 4β

2

e la soluzione sara una sovrapposizione lineare delle due soluzioni

uk = c+rk+ + c−r

k−

• Se α2 + 4β < 0, ci sono due radici distinte complesse coniugate s+ e s−, date da

s± =α± i

√|α2 + 4β|2

= ρ exp(±iθ)

dove ρ = |s±| e θ = arg s+; la soluzione sara una sovrapposizione del tipo

uk = ρk(c1 cos(kθ) + c2 sin(kθ))

• Se α2 + 4β = 0, ci sono due radici reali coincidenti pari a α/2 una soluzione sara deltipo costante per potenze di α/2 e si puo verificare che un’altra soluzione e data davk = k(α/2)k. La soluzione sara quindi una sovrapposizione del tipo

uk = (c1 + c2k)(α

2)k

Soluzioni particolari {pk}, per fk ≡ f le troviamo in modo simile a quello visto precedente-mente per il primo ordine:

• se α+ β 6= 1, pk = p = f1−α−β

• se α+ β = 1, e α 6= 2, pk = f2−αk

• se α = 2 e β = −1, pk = k2f/2

Page 8: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

8

Esempio.La successione di Fibonacci.Si tratta di un sistema del secondo ordine definito nel modo seguente :

Fk+2 = Fk+1 + Fk, k = 0, 1, 2, .., e F0 = F1 = 1

Si puo arrivare, seguendo lo schema visto prima per le equazioni omogenee alla formulaesplicita

Fk =1√5

[(1 +√

5

2])k+1 − (

1−√

5

2])k+1]

Notare che il rapporto Fk+1/Fk tende per k → ∞, al numero 1+√5

2 = 1.6180.. (sezione

aurea), e che malgrado la presenza del numero irrazionale√

5 ≈ 2.2361.. nella formula prece-dente, gli Fk sono tutti numeri naturali.

L’origine di questa successione sta nel Libro XII del Liber Abaci di Leonardo Pisano, dettoil Fibonacci (1202): Fk rappresenta il numero di coppie di conigli adulti al k−esimo mese; sisuppone che ogni coppia adulta produce ogni mese una coppia che diventa adulta in un mese,e cosı via; si parte con una coppia matura, e si suppone anche che ogni coppia rimane persempre nella conigliera...In tal modo la successione e data da 1, 1, 2, 3, 5, 8, 13, ...

Si puo anche osservare che il numero delle coppie immature corrisponde alla stessa suc-cessione spostata di un posto, 0, 1, 1, 2, 3, 5, 8, .., per cui la popolazione totale ad ogni tempo edata ancora da una successione dello stesso tipo 1, 2, 3, 5, 8, 13, ... Il comportamento asintoticodescritto sopra significa che per valori grandi di k l’evoluzione degli Fk e bene approssimatada una crescita esponenziale (il rapporto tra le popolazioni successive e vicino a 1.6 > 1).

4. Elementi di Probabilita e Statistica

Si inizia questa sezione conclusiva con alcune nozioni elementari di Statistica descrittiva,introducendo gli indici piu usati nell’analisi di dati, per poi passare ad esporre qualche ele-mento del Calcolo delle Probabilita, e concludendo con una breve esposizione preliminare diStatistica inferenziale.

4.1. Statistica descrittiva. La Statistica descrittiva consiste nella costruzione di op-portuni indici e/o di grafici per ordinare in modo razionale ed efficiente i dati raccolti. Laraccolta dei dati si fa tramite un Campionamento. Poiche l’acquisizione di dati da un’interapopolazione= classe di individui o unita potrebbe essere onerosa, se ne prende un sottoin-sieme (campione) cercando di non distorcerne la rappresentativita. Il numero n di individuiselezionati forma un campione di ampiezza, o rango n, (Refs 1,3).

4.1.1. Indici di posizione. Il campione consista in n misure (o valori) {x1, x2, ..., xn}; sidefiniscono i seguenti indici:

• media (campionaria) x (e la media aritmetica dei valori registrati):

x :=1

n

n∑k=1

xk

Page 9: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

9

• media geometrica xg(per dati, o valori, positivi):

xg := (

n∏k=1

xk)1n

Notare che la media geometrica e l’esponenziale della media aritmetica dei logaritmidei dati

xg = e1n

∑nk=1 log xk = 10

1n

∑nk=1 log10 xk

• mediana med {x1, x2, .., xn}: ordiniamo i valori presi, vale a dire li numeriamo inmodo tale che x1 ≤ x2 ≤ ... ≤ xn;

– se n e dispari, med {x1, x2, .., xn} = x(n+1)/2,

– se n e pari, med {x1, x2, .., xn} = 12(xn/2 + x1+n/2)

Ad esempio, i 10 numeri qui elencati (gia ordinati) rappresentino dei voti presi nell’esame diMatematica da un campione di 10 studenti, {21, 21, 22, 24, 24, 25, 26, 27, 27, 30};

la loro media e 24.7, mentre la mediana e 24,5.4.1.2. Indici di variabilita. Per valutare quantitativamente quanto i dati siano sparsi o

raggruppati si possono introdurre:

• l’intervallo di variazione, o campo ∆ ( in inglese, range)∆ = max{x1, x2, .., xn}−min{x1, x2, .., xn}, ovvero per dati ordinati, ∆ = xn−x1.

• Varianza campionaria S2:

S2 ≡ 1

n

n∑k=1

(xk − x)2 =1

n

n∑k=1

xk2 − x2(dallo sviluppo dei quadrati)

Le differenze xk −x sono gli scarti dalla media, e vale per essi l’identita evidente

n∑k=1

(xk − x) = 0

Talvolta, in alcuni testi la varianza campionaria S2 e definita con il fattore davanti alla sommadei quadrati degli scarti pari a 1/(n − 1) anziche 1/n. Con questa scelta il significato dellavarianza come stimatore delle caratteristiche della popolazione diventa piu preciso. La radicequadrata S della varianza campionaria si dice deviazione standard.

Esempi. Supponiamo per valutare la qualita di semi di un vivaio, si prendano 7 sacchettida 100 semi e si contino quanti semi per ognuno di essi germinano correttamente; si trovi{82, 75, 60, 54, 91, 58, 63}.

Il range e dato da 91− 54 = 37.La media risulta x = 1

7

∑7k=1 xk = 483/7 = 69.

Gli scarti dalla media sono {13, 6,−9,−15, 22,−11,−6}, per cui la varianza campionaria

risulta S2 = 17

∑7k=1(xk − 69)2 = 164.5, e la deviazione standard e S ≈ 12.8.

Naturalmente una media alta (vicino a 100), con una deviazione standard piccola (rispetto

alla media) sono indici di buona qualita del prodotto. E anche chiaro che una valutazione piuaccurata si avrebbe con un campione piu numeroso.

Da questo esempio si capisce che compito essenziale della statistica e quello di fare affer-mazioni globali (sull’intera popolazione), razionalmente basate sui dati disponibili a partireda un campione (inferenza).

Page 10: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

10

4.1.3. Quantili ed istogrammi. Se ordiniamo i dati come e stato visto in precedenza, sidice che costituiscono una statistica ordinata.

Data una statistica ordinata {x1, x2, .., xn}, dividiamo l’intervallo [x1, xn] in quattro partitali che in ciascuna caschi lo stesso numero di valori: vale a dire, un quarto o il 25% del rangodel campione, con opportune correzioni se n/4 non e intero. Per scrivere l’argomento in modopreciso, occorre premettere la definizione di parte intera, [x], di un generico numero reale x.Si tratta semplicemente del massimo tra i numeri interi che siano minori od eguali al numerostesso; pertanto, se il numero x e intero, coincide con la sua parte intera [x]; se non e intero,“si va indietro” fino ad arrivare al primo intero (minore di x). Ovviamente, per un qualunquex, [x] ≤ x < [x] + 1. Esempi: [10/5] = [2] = 2, [10/4] = [2.5] = 2, [π] = 3, [−1.5] = −2...

Tornando alla definizione di quartile, se n/4 non e intero, (ovvero n/4 > [n/4]), il primoquartile q25 e dato dal valore di quell’x avente come indice il primo intero maggiore di n/4,(cioe [n/4] + 1); se invece n/4 e intero (n/4 = [n/4]), q25 e la media aritmetica tra l’x aventecome indice proprio n/4 ed il successivo; analogamente per gli altri due quartili (q50 e q75).Naturalmente q50 coincide con la mediana.

In formule:

q25 =

{x[n

4]+1 se n/4 non e intero

12(xn

4+ xn

4+1) se n/4 e intero

Per i dati introdotti inizialmente {21, 21, 22, 24, 24, 25, 26, 27, 27, 30}, q25 = 22, q50 =24.5, q75 = 27, che si legge nel modo seguente: il 25% dei voti sono tra il minimo (21) e22, un altro 25% tra 22 e 24.5, ( e quindi 50% tra il minimo e 24.5), un altro 25% tra 24.5 e27, ed infine l’ultimo quarto tra 27 ed il massimo 30.

Questo discorso puo farsi anche per diverse percentuali (quantili), e descrive in modoquantitativo la distribuzione dei dati.

Un’utile rappresentazione grafica della statistica si fa tramite l’istogramma. Partendodalla statistica ordinata, si divide l’intervallo I = [x1, xn] in m parti non necessariamenteeguali: I = ∪mk=1Ik, eseguendo questa partizione sull’asse delle ascisse.

Si costruiscono poi m rettangoli, il k-esimo con base Ik, detti classi,e con area pari al cor-rispondente numero nk di dati della statistica, (cioe che capitano in Ik) (se le basi sono eguali,le altezze sono proporzionali alle aree, e quindi le ordinate corrispondono alle frequenze). Tal-volta, sopratutto quando il campione e molto ampio, conviene normalizzare: invece di nk siconsiderano le frequenze fk := nk/n. Le relazioni corrispondenti sono

m∑k=1

nk = n;m∑k=1

fk = 1

Se le classi hanno stessa ampiezza, quella con maggiore altezza si dice classe modale omoda; nel caso in figura, e quella con estremi 20 e 28.

4.1.4. Correlazione e regressione. Quando si esaminano due grandezze diverse sullo stessocampione (es. per un campione di persone, peso e altezza, peso e consumo di grassi, etc) ecertamente interessante sapere se ci sia una qualche relazione tra le grandezze in esame evalutarla anche quantitativamente.

Page 11: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

11

y

1215

25

20

4 12 20 28 36 44

× × × × × ×

−−−−

x

6

-

Figure 1. Un istogramma non normalizzato con m = 6, n = 84, x1 =4, x84 = 44

Siano {x1, x2, .., xn} e {y1, y2, .., yn} i valori registrati per le due grandezze X e Y, e x, yle corrispondenti medie. Si definisce covarianza (tra X e Y), la seguente quantita:

σXY ≡1

n

n∑i=1

(xi − x)(yi − y) =1

n

n∑i=1

xiyi − xy

Ricordando la disuguaglianza di Cauchy-Schwartz (vedi alla fine della sezione), e ladefinizione di deviazione standard, si ha che

−σXσY ≤ σXY ≤ σXσYQuindi il coefficiente di correlazione

ρXY =σXYσXσY

e compreso tra −1 ed 1: valori positivi (negativi) corrispondono ad una correlazione positiva(negativa), e un valore nullo corrisponde ad assenza di correlazione (lineare).

Esempio. Sia xi, per i = 1, 2, ..5 la quantita X di grassi assunti, in grammi al giorno, dallapersona i-esima, ed yi, per i = 1, 2, ..5 la quantita Y di calorie assunte al giorno dalla stessapersona. Precisamente per la X si registrano i valori {63, 64, 23, 128, 82} e per Y si registranoi valori {1800, 2000, 1100, 4100, 1900}. Sviluppando i calcoli, dopo aver normalizzato la Y conun fattore 100, si ha:

x = 72, σX ≈ 34; y = 21.80, σY ≈ 10.10; σXY ≈ 323

Da qui si ha per il coefficiente di correlazione ρXY = 0.94, mostrando quindi una correlazionefortemente positiva.

Questi concetti si applicano nel calcolo della retta di regressione. Supponiamo di associarealle coppie di valori (xi, yi), per i = 1, 2, ..n, i punti nel piano (X,Y ), di ascisse ed ordinatecorrispondenti. In generale questi punti saranno “dispersi” nel piano (fig. 2), ma talvolta evisibile un certo allineamento (fig. 3)

Il calcolo permette di determinare in ogni caso (non degenere) la retta nel piano (XY )che minimizza lo scarto quadratico dei dati da essa ∆(a, b) ≡

∑ni=1(yi− axi− b)2(metodo dei

Page 12: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

12

y

×

×

×× ×

×

x

6

-

Figure 2. Dati molto dispersi

y

×

×

××

×

×

x

6

-

Figure 3. Dati alquanto allineati

minimi quadrati): consiste nel cercare i parametri a e b della retta di equazione y = ax + b,in modo tale che ∆(a, b) sia minimo. Cerchiamo quindi a e b tali che

∂∆(a, b)

∂a= 0;

∂∆(a, b)

∂b= 0

vale a dire{ ∑ni=1(yi − axi − b) = n(y − ax− b) = 0∑ni=1 xi(yi − axi − b) = n[σXY − aσX2 + x(y − ax− b)] = n[σXY − aσX2] = 0

(l’ultima eguaglianza si ottiene usando la relazione immediatamente precedente).Si ha in definitiva

a =σXYσ2X

, b = y − ax = y − σXYσ2X

x

Per l’esempio precedente si ha che a ≈ 0.28, b ≈ 1.64

Page 13: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

13Cal × 10−2

×

××

×

×

Gras

6

-

Figure 4. Dati e retta di regressione (Calorie/Grassi)

Le nozioni di correlazione e regressione possono estendersi anche in un contesto nonlineare(vedi Ref.3).

La disuguaglianza di Cauchy-Schwartz ha un’utilizzazione assai frequente in Matematica,e conviene quindi vederla un po in dettaglio.

Per qualunque scelta dei numeri (a1, a2, ..an) e (b1, b2, ..bn), e sempre vero che

(n∑i=1

aibi)2 ≤ (

n∑i=1

a2i )(n∑i=1

b2i )⇔ |n∑i=1

aibi| ≤

√√√√ n∑i=1

a2i

√√√√ n∑i=1

b2i

La dimostrazione consiste nell’osservare che per ogni λ,

0 ≤n∑i=1

(ai + λbi)2 =

n∑i=1

a2i + 2λn∑i=1

aibi + λ2n∑i=1

b2i

Per cui il discriminante (∑n

i=1 aibi)2 − (

∑ni=1 a

2i )(∑n

i=1 b2i ) dev’essere nonpositivo.

4.2. Elementi di Probabilita. La nascita della teoria della Probabilita si puo collocarenel diciassettesimo secolo (Fermat, Pascal, Huyghens), per la valutazione delle corrette as-pettative nell’ambito del gioco d’azzardo e delle assicurazioni. Successivamente fu introdottoil Calcolo delle Probabilita per opera di Laplace (1774) e Bernoulli (1778). Rinviando aimanuali specifici per osservare lo sviluppo di questa disciplina, attualmente assai rilevante sianelle applicazioni alle scienze fisiche, biologiche ed economiche, che negli sviluppi teorici, limi-tiamoci ai primi elementi indispensabili per ottenere un modello matematico dell’incertezza(e del rischio).

4.2.1. Definizioni di Probabilita. Risulta intuitivamente chiaro, quando si getta un dadoa sei facce (numerate 1,2,..6), o una moneta (T o C), cosa significa ad es. che la probabilitache “esca” T sia di 1/2 = 50%; analogamente la probabilita che il dado mostri la faccia 1 siadi 1/6; ed egualmente la probabilita che il dado mostri un numero pari sia 1/2. In tutti questicasi l’evento aleatorio si manifesta in una sola modalita su due o su sei, nei primi due esempi,ed in tre modalita su sei nel terzo (infatti “faccia pari” significa che esca due, quattro o sei).Formalizzando un po, se un evento E puo verificarsi in kE modalita egualmente probabili, su

Page 14: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

14

un totale di n, la probabilita P (E) di E e data da

P (E) =kEn

Questa definizione e alquanto limitata e implica la conoscenza di “eguale probabilita” primadi aver definito la probabilita.

Conviene quindi passare ad una definizione “assiomatica”.In analogia all’assegnazione delle masse ai corpi materiali, si associano dei numeri com-

presi tra 0 ed 1 agli eventi aleatori in esame. Quest’assegnazione potrebbe essere speri-mentalmente verificata: se consideriamo la solita moneta, dove l’evento aleatorio consiste nelgettarla su di un piano avendole impresso un buon momento angolare, in un numero n di proveripetute uscira T un numero kn (aleatorio) di volte. La legge dei grandi numeri, conseguenzadell’impostazione assiomatica del Calcolo delle Probabilita, dice che

limn→∞

knn

=1

2

Quindi la frequenza relativa knn dell’evento, in n prove indipendenti, tende alla probabilita (

questa proprieta, nel cosiddetto approccio frequentistico, fornisce la definizione della proba-bilita di un evento).

Per sviluppare un po il calcolo occorre pero dare qualche definizione generale.Partiamo dallo spazio degli eventi S, i cui elementi sono gli eventi elementari (es. Smon. =

{T,C}; Sdado = {1, 2, 3, 4, 5, 6}), ed i cui sottoinsiemi sono gli eventi generici (per il dado un

evento non elementare, potrebbe essere {1} ∪ {2} da leggere, “uno o due”). E opportunoconsiderare tra gli eventi anche l’insieme vuoto ∅. In generale quindi due sottoinsiemi A e Bdi S sono due eventi, e anche A∪B (A o B), o A∩B (A e B) sono altri due eventi, cosı comeAc (complementare di A) e l’evento “non A”. Esempi.

• Per il dado l’evento P (“esce un numero pari”) si puo scrivere come P = {2, 4, 6} ={2}∪{4}∪{6} e l’evento complementare D (“esce un numero dispari”)si puo scriverecome D = P c = {1, 3, 5} = {1} ∪ {3} ∪ {5}• Sempre per il dado, l’evento P (“esce un numero pari”) e l’evento B (“esce un numero

minore di 3”) hanno un’intersezione P ∩ B = {2, 4, 6} ∩ {1, 2} = {2} (= “esce unnumero pari e minore di 3”); l’evento unione sara P ∪ B = {2, 4, 6} ∪ {1, 2} ={1, 2, 4, 6} (= “esce un numero pari o un numero minore di 3”).

Una volta definito uno spazio S = {x1, x2, ..xn} (qui considerato finito per semplicita), laprobabilita consiste nell’assegnazione di un valore numerico compreso tra zero ed uno aglieventi elementari ( quindi e una funzione p : S → [0, 1], definita sullo spazio degli eventi) conle proprieta seguenti, che permettono di definirne il valore per tutti gli eventi:

p(∅) = 0; p(S) =

n∑i=1

p(xi) = 1; p(A) =∑xi∈A

p(xi)

L’assegnazione della probabilita agli eventi di uno spazio di n eventi elementari e del tuttosimile ad assegnare le masse degli n punti materiali elementari (gli “atomi”), con la con-venzione che la massa totale sia uno, e valutando la massa dei corpi formati da piu puntisemplicemente sommando le masse degli atomi costituenti.

Come conseguenza della definizione si ha dunque che per due eventi disgiunti (A ∩ B =∅) vale la proprieta additiva p(A ∪ B) = p(A) + p(B); questo significa che per due eventimutuamente esclusivi, e cioe che non possono mai verificarsi assieme, (per il dado, A = P e

Page 15: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

15

B = {1}), la probabilita che si realizzi l’evento A o l’evento B e la somma delle rispettiveprobabilita.

Si inoltre, dalla definizione, che p(Ac) = 1−p(A) (la probabilita che piova o che non piovae uno..) e che se A ⊂ B, p(A) ≤ p(B).

Una probabilita p su di uno spazio finito S = {x1, x2, ..xn} si dice uniforme se p(xi) =1/n, i = 1, 2, ..n. Questo e il caso della moneta (n = 2) o del dado (n = 6).

La probabilita dell’intersezione di due eventi introduce una importante nozione tipica-mente probabilistica (dipendenza/indipendenza) che vedremo in seguito. Per ora calcoliamoin base alla definizione, nel caso del dado, p(P∩B), dove P corrisponde a “uscita di un pari”, eB a “uscita di un numero minore di tre”: bisogna osservare che P∩B = {2, 4, 6}∩{1, 2} = {2},e quindi p(P ∩B) = 1/6.

Esempi.

• Il gioco del lotto: fissata una ruota, si estraggono 5 numeri su di un totale di 90. Lospazio S consiste quindi nelle combinazioni di 90 elementi di classe 5 (in totale sono(905

)= 43949268); la probabilita uniforme e dunque, per qualunque combinazione x,

p(x) = 1/43949268 ≈ 2.3 · 10−8.• Il DNA: sono presenti nel DNA umano i nucleotidi A (adenina), G (guanina), C

(citosina) e T (timina) (primi due sono purine ed i secondi pirimidine), in percentualitali da poter assegnare le seguenti probabilita

p(A) = 0.304; p(G) = 0.196; p(C) = 0.199; p(T ) = 0.301La probabilita di estrarre a caso una purina sara quindi p(pur) = p(A) + p(G) =

0.304 + 0.196 = 0.5 e sara quindi eguale alla probabilita che venga una pirimidina.• Esempio del compleanno in comune.

Supponendo che gli anni abbiano 365 giorni, che le nascite avvengano con la stessaprobabilita, ed indipendentemente per diversi individui, calcolare la probabilita chealmeno due persone in un gruppo di r ≥ 1, abbiano il compleanno in comune. Adogni giorno dell’anno corrisponde un numero tra 1 e 365, quindi lo spazio degli eventie costituito dalle disposizioni con ripetizione di classe r di 365 oggetti, quindi da 365r

elementi. E facile valutare la probabilita P c dell’evento complementare, e cioe chenon ci sia alcun compleanno in comune: tutte le possibili date di compleanno deller persone senza ripetizioni, sono tante quante le disposizioni di 365 oggetti di classer (365(365− 1)(365− 2)...(365− r + 1)), quindi

P c =365(365− 1)(365− 2)...(365− r + 1)

365r= 1(1− 1

365)(1− 2

365)...(1− r − 1

365)

La probabilita cercata e 1 − P c e svolgendo i calcoli si vede mentre per r = 2, siottiene 1− 364/365 = 0.00273.., per r > 23, questo valore supera 0.5.• La coppia di dadi.

Per una coppia di dadi lo spazio degli eventi e il prodotto nel senso insiemisticodegli spazi corrispondenti ai due dadi: per ogni uscita del primo dado sono possibilisei del secondo, quindi lo spazio ha 36 elementi (eventi elementari), ad ognuno deiquali si attribuisce la probabilita 1/36 (notare che risulta il prodotto delle probabilitarelative agli eventi “fattori” 1/6 · 1/6). La domanda interessante (soprattutto per igiocatori) e: qual’e la probabilita di ottenere un dato punteggio (somma dei punti deidue dadi)? Basta valutare a quali eventi corrispondono i vari punteggi e calcolarnele probabilita.

Page 16: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

16

Punteggio Eventi Probabilitak = 2 (1, 1) 1/36k = 3 (1, 2) ∪ (2, 1) 1/18k = 4 (1, 3) ∪ (2, 2) ∪ (3, 1) 1/12k = 5 (1, 4) ∪ (2, 3) ∪ (3, 2) ∪ (4, 1) 1/9k = 6 (1, 5) ∪ (2, 4) ∪ (3, 3) ∪ (4, 2) ∪ (5, 1) 5/36k = 7 (1, 6) ∪ (2, 5) ∪ (3, 4) ∪ (4, 3) ∪ (5, 2) ∪ (6, 1) 1/6k = 8 (2, 6) ∪ (3, 5) ∪ (4, 4) ∪ (5, 3) ∪ (5, 2) 5/36k = 9 (3, 6) ∪ (4, 5) ∪ (5, 4) ∪ (6, 3) 1/9k = 10 (4, 6) ∪ (5, 5) ∪ (6, 4) 1/12k = 11 (5, 6) ∪ (6, 5) 1/18k = 12 (6, 6) 1/36

4.2.2. La distribuzione geometrica. Supponiamo di sapere che la probabilita di cogliereun bersaglio al tiro a segno sia pari a p, 0 < p < 1; consideriamo l’evento Bn ≡{ i primi n-1tiri non colpiscono, ma l’ennesimo sı}. Risulta dunque che Pr{Bn} = qn−1p; q ≡ 1 − p; perle proprieta delle progressioni geometriche

∞∑n=0

qn =1

1− q, pertanto

∞∑n=1

qn−1p = 1

Vedremo piu avanti altri aspetti di questa distribuzione, nella sezione riguardante le variabilialeatorie.

4.2.3. La distribuzione binomiale. Questa distribuzione fornisce la probabilita che unevento di probabilita 0 < p < 1 si ripeta (esattamente) 0 ≤ k ≤ n volte su n prove in-dipendenti. Ad esempio si puo pensare all’uscita di k = 3 volte del numero uno in n = 10lanci di un dado (p = 1/6), o di k = 300 volte T in n = 500 lanci di una moneta (p = 1/2).Il calcolo consiste nel considerare prima la probabilita di una particolare successione di provein cui l’evento si ripete esattamente k volte, e quindi di probabilita pk(1− p)n−k, e di contare

poi quante sequenze lunghe n contengono lo stesso numero k di successi ((nk

)). E cruciale qui

l’indipendenza delle prove, che permette di calcolare, ad esempio la probabilita di A1 = {siverifica l’evento solo nella prima prova}: P (A1) = p(1− p)n−1. Analogamente la probabilitadi Ai, sara la stessa ∀i, e quella di Ai,j , dove Ai,j ={si verifica l’evento solo nelle prove i-esimae j-esima}, i 6= j, e data da P (Ai,j) = p2(1− p)n−2; il calcolo si generalizza a k successi in kprove diverse.

Analogamente al punteggio di un dado, associato al presentarsi della corrispondente faccia,e opportuno associare all’evento in esame ( verificarsi di k successi in n prove indipendenti),unnumero X(n, p), definita dal numero di “successi” (vale a dire del verificarsi dell’evento diprobabilita p) nelle n prove ripetute, ha lo stesso valore k per tutti questi

(nk

)eventi esclusivi,

corrispondenti ciascuno a fissare su quali delle k prove si e verificato l’evento; quindi per laproprieta additiva, si ha Pr(X(n, p) = k) = Pnk (p) =

(nk

)pk(1− p)n−k.

Osserviamo che, come dev’essere per ogni distribuzione di probabilita, poiche X(n, p)assume certamente un valore tra 0 ed n,∑

Pr(X(n, p) = k) =

n∑k=0

(n

k

)pk(1− p)n−k = (p+ 1− p)n = 1

Page 17: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

17

Prima di tornare su altri aspetti teorici assai rilevanti della distribuzione binomiale, vedi-amone una rappresentazione grafica in un caso particolare ed un paio di esempi.

k

P 100k

10 20 30 40 50 60 80 100

0.02

0.04

0.06

0.08

0.1

6

-

Figure 5. Alcuni punti del grafico della distribuzione binomiale con p =0.2, n = 100

Si vede abbastanza chiaramente un andamento “a campana” attorno al valor medio 20;si tornera piu avanti su questo punto di portata assai generale.

Vediamo ora un altro esempio che si colloca all’inizio (frivolo) del calcolo delle probabilita.

• Problema di S.Pepys (posto a Newton nel 1693): e piu probabile che l’uno esca al-meno una volta in sei lanci di un dado (evento E1), o che esca almeno due voltein dodici lanci (evento E2)? La prima probabilita si calcola usando la distribuzionebinomiale corrispondente a sei prove relativamente ad un evento elementare di prob-abilita 1/6: l’evento complementare ad E1, ovvero “uno non esce neppure una voltain sei prove” ha la probabilita corrispondente a zero successi, vale a dire P 6

0 (1/6) =(1 − 1/6)6 = (5/6)6 = 0.334898..; pertanto P (E1) = 1 − 0.3349.. = 0.6651... Ancheper valutare P (E2) conviene passare al complementare, e si ottiene quindi: P (E2) =1 − [P 12

0 (1/6) + P 121 (1/6)] = 1 − [(5/6)12 + 12/6(5/6)11] = 1 − 0.3813.. = 0.6187..

Concludiamo quindi che E1 ha una probabilita maggiore di E2.

4.2.4. La Probabilita condizionata. Vediamo un po piu in dettaglio la nozione di indipen-denza, poiche talvolta la si assume per poi sviluppare i calcoli successivi. Ad esempio, nellancio simultaneo di un dado e di una moneta, se le procedure di lancio si possono considerarenon legate tra loro, gli eventi elementari congiunti si considerano indipendenti, in modo taleche, se ε denota T o C, e k un intero tra 1 e 6, P (ε, k) = P (ε)P (k) = 1/2 · 1/6 = 1/12. Seinvece, per un misterioso dispositivo che accoppia i due lanci, quando la moneta da T, il dadomostra solo facce dispari (uniformemente), e quando esce C, il dado esce pari, non ci sarapiu indipendenza: P (T, 1) = P (T, 3) = P (T, 5) = 1/6, e P (T, 2) = P (T, 4) = P (T, 6) = 0, esimmetricamente per P (C, k). Come si vede la probabilita che esca T senza guardare l’uscitadel dado (probabilita marginale dell’evento T) e sempre 1/2, e cosı anche le altre probabilitamarginali, ma certamente non si verifica l’indipendenza tra gli eventi congiunti.

In generale, in uno spazio di probabilita {S, P}, non saranno mai indipendenti un eventoA 6= S con 0 < P (A) < 1 ed il suo complementare Ac, dato che P (A ∩ Ac) = P (∅) = 0 6=P (A)(1− P (A)).

Page 18: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

18

Anche per due eventi A e B tali che B ⊂ A, (A implica B), con P (B) < P (A) < 1, si hache P (A ∩B) = P (B) 6= P (A)P (B).

La nozione di dipendenza porta all’importante nozione di probabilita condizionata cosıdefinita.

Se P (B) > 0, la probabilita condizionata di A, dato B, (B e l’evento condizionante, ed Aquello condizionato), in simboli P (A|B), e

P (A|B) :=P (A ∩B)

P (B)

E facile verificare che, fissato B, la probabilita condizionata, come funzione di A (genericoevento di S), gode delle stesse proprieta della probabilita, con l’ovvia relazione P (B|B) = 1.Esprime quindi la variazione dell’assegnazione delle probabilita, quando si sa che l’evento Bsi e verificato.

Naturalmente se i due eventi A e B sono indipendenti,

P (A|B) =P (A ∩B)

P (B)= P (A); P (B|A) =

P (B ∩A)

P (A)= P (B)

mentre se sono identici (A = B), vale a dire estremamente dipendenti,

P (A|A) =P (A ∩A)

P (A)=P (A)

P (A)= 1

Esempio.Nel lancio del dado, calcoliamo le P (k|D), dove k = 1, 2, .., 6 e D = {1, 3, 5} (quindi

la condizione D, l’evento dato, e l’uscita di un dispari). Si ha P (k|D) = 0 se k e pari, eP (k|D) = 1/3 se k e dispari.

E opportuno esaminare nel seguente esempio l’origine di un diffuso pregiudizio, le strategieda seguire nel gioco del lotto basate sui cosiddetti ritardi. Consideriamo, senza perderel’essenziale, ma con maggiore semplicita espositiva, che i lanci successivi di una moneta (T oC) siano indipendenti e che si sia verificata una (assai improbabile) successione di 100 T.

Il pregiudizio consiste nel pensare che nel centounesimo lancio, quasi che la moneta debbapareggiare i conti, ci si deve aspettare l’uscita di C con maggior fiducia: cioe che la prob-abilita di C sia maggiore di 1/2. Cio e naturalmente falso, per l’indipendenza delle proveripetute; l’errore si avvalora talvolta di valutazioni numeriche, consistente in questo casonell’uso scorretto della disuguaglianza (corretta) seguente:

P (X101(1/2) = 0) = (1

2)101 < P (X101(1/2) = 1) = 101(

1

2)101

Qui l’evento di maggiore probabilita consiste nell’uscita di una (sola) C in 101 lanci, maindipendentemente dal fatto che cio avvenga nella prima, nella seconda, o nell’ultima (lacentounesima) prova, mentre l’evento in cui si e interessati consiste nell’uscita di C al cen-tounesimo lancio, e la sua probabilita, sempre pari a 1/2, non dipende da cosa si e verificatonelle prime cento prove.

Anzi, come si e verificato nelle case da gioco, osservazioni prolungate di uscite di numerial gioco della roulette possono dare indicazioni sul fatto che sia apprezzabile una piccoladifferenza tre le probabilita di uscita dei numeri stessi (utilizzabile per puntate ben studiate);nel caso precedente, l’uscita di 100 T potrebbe suggerire che la moneta sia truccata (vedi il cap.sull’inferenza statistica), e che quindi ci si potrebbe piuttosto attendere che al centounesimolancio esca ancora T (perche con buona probabilita la moneta ha due T!).

Page 19: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

19

Applicazioni assai importanti della nozione di condizionamento derivano dalla seguenteformula, (qui in forma semplificata), che riguarda la valutazione dell’inversione del ruolo traevento condizionante ed evento condizionato.

Formula di BayesSe P (A)P (B) > 0, vale l’identita

P (B|A) =P (A|B)P (B)

P (A)=

P (A|B)P (B)

P (A|B)P (B) + P (A|Bc)(1− P (B))

La dimostrazione e un semplice esercizio sulla definizione di probabilita condizionata, edusa la decomposizione, del tutto generale, di un evento A nell’unione di due eventi tra lorocomplementari (usando E = B ∪Bc, A = A ∩ E, e quindi A = (A ∩B) ∪ (A ∩Bc):

P (B|A) =P (A ∩B)

P (A)=

P (A|B)P (B)

P (A ∩B) + P (A ∩Bc)=

P (A|B)P (B)

P (A|B)P (B) + P (A|Bc)(1− P (B))

L’interesse di questa relazione si puo apprezzare in questo esempio (di uso corrente nellapratica epidemiologica e farmacologica), dove si vede in concreto il significato di probabilitacondizionata.

Valutazione del falso positivo e del falso negativo.In generale un test clinico non e mai perfetto: per un individuo sottoposto a test, il

risultato puo essere positivo T+, o negativo T− sia se l’individuo e malato (M), o se sano(S := M c); si definisce sensibilita del test la probabilita condizionata P (T+|M), vale a direla probabilita che il test sia positivo in presenza della malattia, e specificita del test, laprobabilita condizionata P (T−|S), vale a dire la probabilita che il test sia negativo in assenzadella malattia. Un buon test dovrebbe avere entrambe vicino ad uno (ed infatti la loro sommadefinisce l’efficienza del test).

Supponendo di conoscere quanto l’infezione sia diffusa, in termini di P (M) (probabilitache un individuo sia malato), vogliamo calcolare la probabilita f+ del falso positivo, vale adire f+ = P (S|T+) = 1 − P (M |T+), ed anche quella del falso negativo f− = P (M |T−) =1− P (S|T−).

Risulta (ripetendo la deduzione dell’identita di Bayes)

P (M |T+) =P (M ∩ T+)

P (T+)=P (T+|M)P (M)

P (T+)

Il denominatore P (T+) lo calcoliamo mediante la decomposizione in parti disgiunte

P (T+) = P (T+ ∩ (M ∪ S)) = P (T+ ∩M) + P (T+ ∩ S) = (P (T+|M)P (M) + P (T+|S)P (S)

Le quantita P (T+|S) e P (S) sono note dai dati del problema, poiche P (T+|S) = 1 −P (T−|S) e P (S) = 1− P (M).

Vediamo ora un caso numerico: se P (T−|S) = 0.80, P (T+|M) = 0.90, P (M) = 0.01,calcolare f+ ed f−. Valutiamo prima P (T+):

P (T+) = P (T+|M)P (M) + P (T+|S)P (S) = 0.90 · 0.01 + (1− 0.80)(1− 0.01) = 0.207

Completando

f+ = 1− P (M |T+) = 1− 0.90 · 0.01

0.207= 1− 0.0435 = 0.956

Risulta assai alto! Analogamente si trova f− = 0.0013Variando i valori numerici, si ottengono risultati assai differenti: se ad esempio fosse

P (M) = 0.10, ed il resto invariato, si avrebbe f+ = 0.667 e f− = 0.014.

Page 20: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

20

Vediamo ora un altro esempio simile, ma in contesto studentesco: consideriamo aleatoril’esito e la preparazione di un esame.

Sia S l’evento { superare l’esame} (ed Sc { il non superarlo}); sia B l’evento {avere unabuona preparazione}, (ed Bc {il non averla}).

Supponiamo che

P (S) = 0.8, P (B) = 0.6; P (S|B) = 0.95

Puo essere interessante valutare

P (S|Bc); P (B|S); P (Sc|B)

La prima probabilita condizionata potrebbe riguardare il ruolo della fortuna per chi non siprepara bene, la seconda valuta l’efficacia dell’esame, come garanzia di buona preparazione,e la terza il peso della sfortuna per chi si e ben preparato. Con quei dati si ottiene

P (S|Bc) = 0.58; P (B|S) = 0.71; P (Sc|B) = 0.05

Cambiandoli, si apprezza cosa determina le differenze, anche notevoli, nei risultati.

4.3. Le variabili aleatorie, v.a. Come nel caso del dado, dove l’uscita di una facciapuo formularsi in termini numerici, dicendo che la variabile numerica punteggio ha proprio ilvalore corrispondente ai punti mostrati dalla faccia uscita, cosı piu in generale e utile definireuna variabile numerica associata ad eventi aleatori (questa funzione, definita sullo spazio deglieventi E, si chiama appunto variabile aleatoria, o casuale).

In tal modo i dati della precedente tabella relativa alle uscite di una coppia di dadipossono rappresentare la distribuzione della v.a. punteggio dei due dadi. In generale, se unav.a. Z assume valori discreti (in corrispondenza con un sottoinsieme dei numeri interi, quindidenotabili con ak, k = 1, 2, ...), la sua distribuzione e assegnata dalle probabilita corrispondentipk : Pr{Z = ak} = pk, k = 1, 2, ...

Naturalmente sara pk ≥ 0,∑

k pk = 1. Caratteristiche interessanti della distribuzione diprobabilita sono il valore atteso (o medio) EZ ≡

∑k akpk e la varianza V ar Z ≡

∑k(ak −

EZ)2pk (il simbolo E sta per Expectation, ed il valore atteso di una generica funzione φ(Z)non e altro che Eφ(Z) ≡

∑k φ(ak)pk).Una variabile con un numero n, finito, di valori costitu-

isce un caso particolare: in questo caso le probabilita pk sono positive solo in corrispondenzaagli n valori possibili.

Talvolta, soprattutto in letteratura fisica, si usa 〈φ(Z)〉 in alternativa al simbolo Eφ(Z).Sviluppando il quadrato, si vede che V ar Z =

∑k(a

2k − 2akEZ + (EZ)2)pk = EZ2 − (EZ)2.

Ritroviamo in questi termini i risultati sulle notevoli distribuzioni introdotte precedentemente:per la distribuzione geometrica, consideriamo la v.a. Xp = n. d’ordine del primo colpovincente: vale a dire l’evento {Xp = n} ≡ al verificarsi dell’evento Bn. Pertanto Pr{Xp =

n, n = 1, 2, ..} = qn−1

p .

Considerando ora la distribuzione binomiale, vediamo innanzitutto che viene definita inmodo naturale la variabile numerica (aleatoria) X(n, p) come numero di successi in n prove,edi cui possiamo ora valutare le caratteristiche sia in modo diretto, sia attraverso la rappre-sentazione di X(n, p) come somma di v.a. “elementari” Un calcolo diretto permette infatti divalutare il valore medio di X(n, p), e vedremo successivamente una giustificazione elementaredel risultato, quando s’interpreta X(n, p) come somma di n variabili aleatorie:

EX(n, p) :=

n∑k=0

kPr(Xn = k) =

n∑k=0

k

(n

k

)pk(1− p)n−k = np

Page 21: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

21ρ

x−1 10

1

6

-

ρtρu

Figure 6. Densita delle distribuzioni, uniforme e triangolare

Di qui vediamo che il rapporto tra il valore atteso del numero di volte in cui si verifical’evento in n prove e il numero n, e esattamente pari alla probabilita dell’evento stesso. Sipotrebbe anche calcolare la varianza V arX(n, p), ottenendo con un calcolo diretto alquantopiu complesso, che

V arX(n, p) :=∑

(k − np)2Pr(Xn = k) = np(1− p)

Consideriamo il caso di v.a. continue, vale a dire con valori possibili in sottoinsiemi di R, nonescludendo l’intero insieme R.

Un caso molto semplice e quello della v.a. Xu con distribuzione uniforme in un intervallo,ad esempio [−1, 1]. Questo significa che tutti i valori possibili di Xu sono i numeri reali

compresi tra −1 ed 1, e che per ogni intervallo(a, b) ∈ [−1, 1], Pr{Xu ∈ (a, b)} =∫ ba ρudx La

costante ρu costituisce la densita della distribuzione uniforme ed e calcolata imponendo che∫ 1−1 ρudx = 1. Si ottiene quindi ρu = 1

2 , e con questa informazione calcoleremo valor medio e

varianza di Xu (il valore atteso EXu sara nullo per simmetria).Definiamo ora la v.a. “triangolare” Xt, la cui distribuzione ha una densita ρt(x) cosı

definita:

ρt(x) ≡ 0, per |x| > 1; ρt(x) = 1 + x, per − 1 ≤ x ≤ 0; ρt(x) = 1− x, per 0 ≤ x ≤ 1

Per quanto riguarda EXt e V arXt, possiamo dire subito che per simmetria il valor mediorisultera nullo, mentre, ad occhio, la varianza sara minore di quella della Xu, poiche la dis-tribuzione di Xt e certamente meno sparpagliata di quella di Xu attorno al comune valormedio 0.

Risulta infatti

V arXu = EX2u = 1

2

∫ 1−1 x

2dx = 12 [x

3

3 ]1−1 = 13 (4.1)

V arXt = EX2t =

∫ 1−1 ρt(x)x2dx =

∫ 0−1(1 + x)x2dx+

∫ 10 (1− x)x2dx = 1

6 (4.2)

Occorre ora estendere la nozione di dipendenza e indipendenza alle variabili casuali.Caso discreto: se Pr(X = ak) = pk, k = 1, 2, .. e Pr(Y = bj) = rj , j = 1, 2, ..,

chiameremo Pr{(X = ak) ∩ (Y = bj)} ≡ qkj , k = 1, 2, ..; j = 1, 2, .. la probabilita congiuntadella coppia di v.a. X,Y .

Page 22: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

22

Naturalmente sussiste una relazione di consistenza:∑

k qkj = rj e∑

j qkj = pk, dato

che Pr{(X = ak)} = Pr{(X = ak) ∩ ∪j(Y = bj)} =∑

j Pr{(X = ak) ∩ (Y = bj)},(∪j(Y = bj) = E). Le distribuzioni di X e di Y sono le distribuzioni marginali relativamentealla distribuzione congiunta della coppia (X,Y ).

Le due v.a. discrete risultano dunque indipendenti se e solo se la distribuzione congiuntasi fattorizza nel prodotto delle due distribuzioni: qkj = pkrj , k = 1, 2, ..; j = 1, 2, ...

Occorre ora dedurre alcune conseguenze importanti, limitandoci per la dimostrazione alcaso di una coppia di v.a. discrete:

• Per una coppia di v.a. (anche non indipendenti), E(X + Y ) = EX + EY• Per una coppia di v.a. indipendenti, E(XY ) = EXEY• Per una coppia di v.a. indipendenti, V ar(X + Y ) = V arX + V arY

Vediamo in poche righe come si giustificano queste affermazioni:1.Per una coppia di v.a. (anche non indipendenti),

E(X + Y ) =∑

kj(ak + bj)qkj =∑

kj akqkj +∑

kj bjqkj = (4.3)∑k ak

∑j qkj +

∑j bj∑

k qkj =∑

k akpk +∑

j bjrj = Ex+ EY (4.4)

2.Per una coppia di v.a. indipendenti,

E(XY ) =∑kj

akbjqkj =∑kj

akbjpkrj =∑k

akpk∑j

bjrj = EXEY

3.Per una coppia di v.a. indipendenti,

V ar(X + Y ) = E((X + Y )2)− (E(X + Y ))2 = (4.5)

EX2 + 2EXY + EY 2 − (EX)2 + 2EXEY + (EY )2 = V arX + V arY (4.6)

Questi risultati si estendono facilmente ad un numero arbitrario di v.a. ed anche al casocontinuo.

In particolare, se n v.a. (Z1, Z2, .., Zn), hanno tutte la stessa distribuzione,hanno anchestesso valor medio e stessa varianza: EZ1 = EZ2 = ... = µ; V arZ1 = V arZ2 = ...V arZn = σ2,si ha che E(Z1 + Z2 + ...Zn) = nµ, e V ar(Z1 + Z2 + ...Zn) = nσ2

Accenniamo al caso continuo: due v.a. X ed Y , con distribuzioni data da densita continueρX e ρY , si dicono indipendenti se

P ({X ∈ (a, b)} ∩ {Y ∈ (c, d)}) = P ({X ∈ (a, b)})P ({Y ∈ (c, d)}), ∀a ≤ b, c ≤ d. Questa relazione esprime proprio che gi eventi {X ∈ (a, b)} e {Y ∈ (c, d)} sono indipen-denti, per ogni coppia di intervalli (a, b) e (c, d); si potrebbe dimostrare che la densita delladistribuzione congiunta ρXY si fattorizza nel prodotto delle densita: ρXY (x, y) = ρX(x)ρY (y).

4.3.1. Legge dei grandi numeri e distribuzione normale. Abbiamo visto che nel caso delladistribuzione binomiale la frequenza del verificarsi X(n, p)/n di un evento di probabilita p inn prove ha un valore atteso pari a p; la legge dei grandi numeri dice qualcosa di piu precisosu X(n, p)/n.

Legge (debole) dei grandi numeri.Per qualunque ε > 0,

limn→∞

P (|X(n, p)/n− p| > ε) = 0

Page 23: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

23

Vale a dire, la probabilita che la differenza tra la frequenza di successi in n prove e il suovalore atteso p differisca piu di un ε arbitrario e infinitesima quando il numero di prove tendeall’infinito.

Esiste un raffinamento di questa legge (legge forte dei grandi numeri), per cui si rinviaalla bibliografia.

Introduciamo ora una distribuzione assai importante, onnipresente in probabilita e sta-tistica, la distribuzione normale. Una variabile casuale X, di media µ e varianza σ2 (equiva-lentemente, di deviazione standard σ), si dice distribuita normalmente se

P (X ≤ x) =

∫ x

−∞

1

σ√

2πe−

(y−µ)2

2σ2 dy

I valori possibili della variabile X sono tutti i numeri reali; l’integrando e la densitafµ,σ(x) := P (X ≤ x)′ di tale distribuzione (per la forma di fµ,σ la distribuzione normale sidice anche gaussiana)

fµ,σ(x) =1

σ√

2πe−

(x−µ)2

2σ2

Con un cambiamento di variabile si puo considerare la variabile normale standard (ostandardizzata): Z = (X − µ)/σ, che ha quindi la distribuzione di una variabile casualenormale di media 0 e deviazione standard 1; la densita di tale distribuzione e dunque

φ(z) := f0,1(z) =1√2πe−

z2

2

z

φ(z)

0 1 2 3−1−2−3

.1

.2

.3

.4

6

-

Figure 7. Densita della distribuzione normale standard

Mentre l’area sotto l’intero grafico, per definizione di densita di probabilita, vale 1, dalcalcolo numerico (i risultati sono riportati su tabelle numeriche di facile reperimento) si hache l’area corrispondente alla base [−1, 1] vale 0.683.. = 68%, quella corrispondente alla base[−2, 2] vale 0.954.. = 95.4..%, ed infine quella sopra la base [−3, 3] vale 0.997.. = 99.7..%.Il significato di questo calcolo per una generica variabile casuale normale non standard e il

Page 24: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

24

seguente: quei valori numerici sono le probabilita di scarti dalla media entro una, due, tredeviazioni standard, in formule

P (|X − µ| ≤ σ) = 0.683..; P (|X − µ| ≤ 2σ) = 0.954..; P (|X − µ| ≤ 3σ) = 0.997..

Talvolta puo essere utile determinare l’intervallo corrispondente ad una fissata probabilita:dal calcolo numerico si ha

P (|Z| ≤ .68) = 0.50; P (|Z| ≤ 1.96) = 0.95; P (|Z| ≤ 2.57) = 0.99

Analogamente a quanto visto in Statistica, si possono definire i quantili per una variabilecasuale, ad esempio per la normale standard, il quantile di ordine α ∈ (0, 1) e quel valore zα,tale che

P (Z ≤ zα) = α ⇔∫ zα

−∞φ(x)dx = α

Abbiamo quindi {α .900 .950 .975 .990

zα 1.282 1.645 1.960 2.326

Vediamo ora cosa succede alla distribuzione binomiale (di parametri p, n) per un numeroelevato di prove n. Si puo dimostrare che (Teorema del limite centrale):

limn→∞

P (X(n, p)− pn√np(1− p)

∈ [a, b]) =

∫ b

aφ(x)dx

Occorre qualche commento per apprezzare questo risultato. Se n e molto grande, la variabilebinomiale X(n, p), centrata e normalizzata con la sua deviazione standard, e cioe (X(n, p)−pn)/

√np(1− p), ha una distribuzione vicina a quella della normale standard Z, vale a dire

che prendendo a = −1 e b = 1, per n grande,

P (X(n, p)− pn√np(1− p)

∈ [−1, 1]) ≈∫ 1

−1φ(x)dx = 0.68..

equivalentemente

P (pn−√np(1− p) ≤ X(n, p) ≤ pn+

√np(1− p)) ≈ 0.68

Per una moneta, l’evento T ha probabilita p = 1/2, possiamo dunque calcolare, per n = 10000,essendo X10000(0.5) il numero (aleatorio) delle uscite di T , il suo valor medio < X10000(0.5) >

sara pari a np = 10000/2 = 5000, la deviazione standard σ =√

10000/4 = 50 ed possiamo in-fine valutare alcune probabilita interessanti, relativi all’appartenza di X10000(0.5) ad intervallicentrati sul valor medio e larghi una, due e tre deviazioni standard:

P (4950 ≤ X10000(0.5) ≤ 5050) ≈ .68

P (4900 ≤ X10000(0.5) ≤ 5100) ≈ .95; P (4850 ≤ X10000(0.5) ≤ 5150) ≈ 0.99

Se dovessimo trovare un valore esterno all’intervallo [4950, 5050] , potremmo sospettare che lamoneta sia truccata, ma senza crederci troppo, dato che la probabilita di tale evento e circa1− 0.68 = 0.32, ma se invece il valore risulta esterno all’intervallo [4900, 5100] avremmo cheil sospetto si avvalora al 95%, ed infine se si ha un risultato esterno all’intervallo [4850, 5150],si potrebbe dire che al 99% la moneta e truccata.

L’importanza del teorema del limite centrale sta nella sua universalita: in una formu-lazione nemmeno troppo generale, date n variabili casuali indipendenti Y1, Y2, ..Yn con la

Page 25: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

25

stessa media µ e varianza σ2, la loro somma centrata e normalizzata ha una distribuzione chetende per n→∞ alla normale standardizzata: per n grande

P (

∑nk=1 Yk − nµ√

nσ∈ [a, b]) ≈

∫ b

aφ(x)dx

Il legame con il caso binomiale si vede subito rappresentando la variabile binomiale X(n, p)come somma di n variabili casuali indipendenti, ed egualmente distribuite, Y1, Y2, .. cosı defi-nite:

Yk =

{1 se si verifica l’evento A alla k−esima prova (con prob. = p)

0 altrimenti (prob. = 1− p)

La loro somma conta infatti quanti successi si sono verificati in n prove:∑n

k=1 Yk = X(n, p).Poiche le {Yk} hanno la medesima distribuzione (detta di Bernoulli, di parametro p), il

loro comune valore atteso e pari a < Yk >= 1 · P (A) + 0 · P (Ac) = p, e la comune varianzae pari a: < (Yk− < Yk >)2 >= (1 − p)2 · P (A) + (0 − p)2 · P (Ac) = (1 − p)2p + p2(1 − p) =p− 2p2 + p3 + p2− p3 = p(1− p). Da qui si vede un altro modo per ottenere le caratteristichefondamentali della distribuzione binomiale: EX(n, p) = np; V arX(n, p) = np(1− p).

Vediamo un altro esempio sulla valutazione approssimata della distribuzione binomialeper valori “grandi” di n mediante la distribuzione normale.

Un vivaio produce semi la cui qualita e misurata dalla probabilita di germinazione, cheponiamo pari a .90. Calcolare la probabilita che su 100 semi ne germinino almeno 96 (vale adire che X ≥ 96).

I dati sono dunque p = 0.90, p(1− p) = 0.09, n = 100.

Risulta np = 90,√np(1− p) = 3, e quindi si puo scrivere

P (X ≥ 96) = P (X − 90

3≥ 2) ≈

∫ ∞2

φ(x)dx ≈ 0.025

In questo caso si valuta l’area sotto la coda destra della gaussiana (da 2 a ∞).Il calcolo esplicito mediante la binomiale e il seguente:

P (X ≥ 96) =

100∑k=96

(100

k

)(0.9)k(0.1)100−k = 0.024..

L’accordo e dunque soddisfacente.

4.4. Applicazioni alla Statistica inferenziale. Vediamo un esempio concreto simileal caso del lancio ripetuto di una moneta.

Vogliamo valutare l’ipotesi che una malattia colpisca in egual misura uomini e donne: inun campione di 1000 malati si constata che 540 sono uomini e 460 donne. Cosa possiamo diresull’ipotesi di eguale vulnerabilta? Fissiamo lo spazio degli eventi e la misura di probabilita.La situazione e identica a quella di dover analizzare 1000 prove ripetute per un evento di prob-abilita 1/2 (in questo caso, quello che un malato, sui 1000 esaminati, sia uomo). Se X e lavariabile casuale “numero di uomini malati su 1000”, il suo valore atteso e np = 1000·0.5 = 500e la varianza pari a np(1 − p) = 1000 · 0.5 · 0.5 = 250. La deviazione standard e pari a 15.8e quindi possiamo considerare la variabile centrata e normalizzata (X − 500)/15.8 che e conbuona approssimazione distribuita come la normale standard. Definiamo livello di significa-tivita del test un parametro α ∈ (0, 1) e generalmente piccolo (0.01, 0.05, 0.10 sono i valoricomunemente considerati), che ha il significato di area sotto le code simmetriche della densita

Page 26: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

26

della normale standard, e piu precisamente quella di destra a partire dal quantile z1−α/2, equella di sinistra dal quantile opposto: la regione esterna ai due quantili sara la regione dirigetto. Ossia, respingiamo l’ipotesi, con livello di significativita α, se il valore calcolato dalcampione cade nella regione di rigetto, complementare dell’intervallo (−z1−α/2, z1−α/2). Nelnostro caso se poniamo α = .01, si trova dalla tabella numerica che z1−α/2 ≡ z0.995 = 2, 57 ,e poiche

540− 500

15.8= 2.53 < 2.57

non respingiamo l’ipotesi al livello di significativita dell’1%. Porre il livello di significativitaal 10% avrebbe determinato il rigetto dell’ipotesi.

Consideriamo ora il problema inferenziale consistente nel valutare i parametri di unadistribuzione incognita avendo a disposizione un campione: vale a dire che il campione es-tratto dalla popolazione e costituito dai valori di variabili casuali indipendenti ed egualmentedistribuite. Stiamo cioe supponendo che i valori misurati x1, x2, ..xn sono valori assunti davariabili casuali X1, X2, ..Xn, le cui proprieta vorremmo indagare a partire dai valori numericiche costituiscono il campione. Consideremo per semplicita di sapere gia che le variabili sononormali, e supponiamo dapprima che sia nota solo la varianza.

Vediamo un esempio concreto: in un laboratorio di acquacultura si allevano pesci la cuilunghezza e una variabile normale di deviazione standard pari a 4 cm. Non ne conosciamoil valore atteso, ma un campione di 100 unita (l1, l2, ..l100) fornisce un valor medio pari a 25cm. Vogliamo stimare il parametro ignoto, valore atteso della lunghezza.

Se consideriamo le lunghezze L1, L2, ..L100 variabili normali di media µ ignota e deviazionestandard σ (nota), possiamo utilizzare il fatto che la variabile casuale media aritmetica L :=1/n

∑Lk e ancora normale con la stessa media µ e deviazione standard σ/

√n: questa quantita

si chiama errore standard della media. (Si osservi che la media aritmetica ha una varianzapiu piccola di quella delle singole variabili, in effetti l’operazione di media determina unacerta concentrazione della variabile L, rispetto ai singoli addendi). Poiche per una variabilenormale standard Z,

P (−1.96 ≤ Z ≤ 1.96) = 0.95

per la variabile L di deviazione standard σ/√n = 4/10 = 0.4, possiamo scrivere un’analoga

formula

P (|L− µ| ≤ 1.96 · 0.4) ≈ 0.95

Inserendo per L la media campionaria 25 cm, possiamo dire che l’incognita media µ stanell’intervallo (24.2, 26.2) con un livello di confidenza del 95%.

Se invece fosse nota la media µ, ma non la varianza, il campione fornisce uno stimatoreopportuno, simile alla varianza campionaria (qui si considera noto il valore atteso µ)

S2 :=1

n

n∑k=1

(Lk − µ)2

S2 risulta quindi la variabile casuale somma dei quadrati delle n variabili gaussiane indipen-denti e centrate (Lk − µ), k = 1, 2, ..n. Per variabili standard, la somma dei loro quadrati ela variabile casuale denominata χ2(n) (chi quadro ad n gradi di liberta) la cui distribuzionee ben nota e tabellata per parecchi valori di n (se n cresce la densita diventa molto simile aduna gaussiana).

Page 27: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

27

Tenendo conto della varianza incognita σ2, possiamo dire che

S2 =1

nσ2χ2(n)⇔ σ2 =

nS2

χ2(n)

In concreto occorrera consultare le tabelle che forniscono i quantili per la distribuzione χ2(n)in modo da stabilire gli intervalli di confidenza. Nel caso in cui ne media e ne varianza sononote a priori, lo stimatore del valore atteso resta la media del campione X, ma per la varianzasi utilizza

S2 :=1

n− 1

∑(Xk −X)2

Si dovra poi ricorrere per la valutazione degli intervalli di confidenza ad un’altra distribuzione(la t di Student).

Si rinvia ai testi di statistica per questa estensione e per altre applicazioni.

5. Appendice

Come scritto nell’Introduzione, si riporta qui il testo un po esteso di una conferenza tenutaper un uditorio di biologi e medici sulla modellizzazione deterministica della dinamica dellepopolazioni, per arrivare ad esporre un recente modello sulla dinamica di un’infezione virale.

• Modelli analitici per la dinamica di una popolazione: le leggi di Malthus (esponen-ziale) e di Verhulst (logistica).• Popolazioni in competizione: il modello di Lotka-Volterra• Il modello base di Nowak e May per la diffusione di un virus in un organismo.

5.1. Modelli analitici per la dinamica di una popolazione. Molti fenomeni in cuisi vuole conoscere l’andamento temporale di una o piu grandezze, si formulano assegnandola derivata di tali quantita in funzione delle grandezze stesse (e talvolta anche del tempo): sitratta di un’equazione differenziale ordinaria, nel caso di una sola grandezza, o di un sistemadi equazioni differenziali ordinarie, per piu grandezze. La descrizione di una popolazionemediante una variabile continua che si evolve deterministicamente e accettabile quando ilnumero di individui e elevato: quindi in presenza di poche unita occorre utilizzare un modelloaleatorio, del tipo processo di nascita e morte. Un’altra semplificazione piuttosto drasticadi questo modello consiste nell’ignorare la struttura spaziale (ipotesi del “campo medio”): sitrascura il fatto che in certe situazioni, ad esempio di competizione tra due popolazioni, una diloro si puo concentrare in determinate regioni ed anche se globalmente ha un valore piccolo,localmente puo innescare un processo aggressivo/invasivo, non visibile a livello di campomedio. In questo caso il problema diventa piu complesso, le concentrazioni ( o densita) sonofunzioni dello spazio e del tempo e le equazioni diventano “a derivate parziali”.

Tornando allo schema di campo medio, il problema diventa quindi quello di determinare lefunzioni soluzioni dell’equazioni differenziali; se le derivate fossero date in funzione del tempo,si tratterebbe di calcolarne le primitive (anche se non in termini di funzioni elementari, siconsidera un problema “risolubile per quadrature” ). Vediamo il caso di una sola funzioneincognita: tipicamente si ha che x(t) = f(x) (caso autonomo) e risolubile per quadrature,mentre x(t) = f(x, t) (caso non autonomo) generalmente non lo e (salvo il caso detto “ avariabili separabili”, f(x, t) = h(t)g(x)). Risulta infatti in questo caso, che comprende quello

Page 28: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

28

autonomo (per h(t) ≡ 1)

dx

dt= h(t)g(x) ⇔ dx

g(x)= h(t)dt ⇔

∫1

g(x)dx =

∫h(t)dt (5.1)

Dette poi Γ(x) e H(t) le primitive rispettivamente di 1/g(x) e di h(t), la soluzione di (5.1) siottiene, almeno in linea di principio, con la seguente formula, dove figura la funzione Γ−1(·),inversa di Γ(·)

Γ(x(t))− Γ(x(t0)) = H(t)−H(t0)⇔ x(t) = Γ−1(Γ(x(t0)) +H(t)−H(t0))

Consideriamo ora un caso concreto (legge di Malthus). x(t) denota una popolazione a cui ilmodello assegna una velocita di crescita proporzionale alla popolazione stessa

x(t) = kx(t), k costante positiva

k ha il significato di tasso relativo di crescita. In questo caso, e possibile risolvere esattamentel’equazione: la soluzione e unica se si assegna una condizione iniziale e si ha:

x(t) = x0 exp kt ≡ x0ekt

Per valutare quanto rapidamente cresce questa funzione, definiamo il tempo di raddoppio t2:

x(t2) = 2x0 ⇔ exp kt2 = 2⇔ t2 =log 2

k

Quindi, per un qualunque n intero positivo,

x(nt2) = x0 exp knt2 ≡ x0(exp kt2)n ≡ 2nx0

Se inseriamo alcuni dati numerici reali (per una popolazione batterica): t2 = 10′, poiche inun giorno ci sono 1440’, e 1440/10 = 144, la popolazione diventerebbe 2144 ≈ 2.23 · 1043 voltequella iniziale. Il che significa che se inizialmente si ha un solo batterio di diametro 10µ (equindi di volume ≈ 5.2 · 10−16m3), si arriva, in un solo giorno di crescita esponenziale, almostruoso volume di 1.2 · 1028m3, e quindi a superare di 107 volte il volume della terra ( divolume ≈ 1021m3)!

Naturalmente (fortunatamente) la crescita esponenziale rappresenta solo situazioni inizialiin cui il sistema segua incondizionatamente la legge di Malthus . Piu realisticamente, il tassorelativo di crescita dipende dalla presenza di un “nutriente” variabile, che e consumato dallapopolazione in crescita e che quindi varia nel tempo.

Possiamo supporre ad esempio che il tasso sia proporzionale alla concentrazione C delnutriente: k = k(C) = hC, con h costante positiva, e che la concentrazione C diminuisca

in modo proporzionale alla velocita di crescita di x: C = −αx, dove 1/α e la “resa” delnutriente. Si ottiene in tal modo un sistema di due equazioni differenziali

x = hCx

C = −αhCx

La cui soluzione si puo ottenere utilizzando le proprieta del sistema stesso: combinandole equazioni si ha che

C + αx = 0⇒ C + αx = M = cost

Page 29: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

29

sostituendo si ottiene l’equazione logistica per x:

x = h(M − αx)x = xr(1− x

X) (5.2)

dove r = hM e il tasso di crescita iniziale e X = M/α e la “carrying capacity” (capacita dicarico).

Qualitativamente, 0 ed X sono stati stazionari, il primo instabile ed il secondo stabile

xX0

-- �e×

Figure 8. Regioni di crescita e decrescita di x

Piu in generale, per un’equazione differenziale autonoma

x = f(x), con f(x) di segno variabile

si puo disegnare il grafico di f(x) e individuare sull’asse x:

• i punti stazionari x1, x2, .., : f(xi) = 0,• i valori per cui x, come funzione di t, e crescente: f(x) > 0, punti di crescita,• i valori per cui x, come funzione di t e decrescente: f(x) < 0, punti di decrescita.

f(x)

xx1 x2

6

-� - �

Figure 9. Discussione grafica dell’equazione x = f(x)

L’equazione logistica (5.2) e autonoma e si puo risolvere esplicitamente:

x(t) =x0X

x0 + (X − x0) exp(−rt)Notiamo che qualunque sia il dato iniziale x0 = x(0), la soluzione x(t) tende, per t → ∞, alvalore X della carrying capacity; il suo andamento si vede chiaramente dal grafico seguente.

Page 30: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

30

X

x0

x′0

x

t

6

-

Figure 10. Soluzioni dell’equazione logistica

.L’interpretazione dell’equazione logistica puo essere anche lievemente diversa: la derivata

di x in funzione di x stesso contiene il termine positivo (di crescita) lineare rx e quello negativo(di decrescita) quadratico rx2/X: per valori piccoli prevale il termine lineare, con crescitaapprossimativamente esponenziale; per valori grandi quello quadratico di “sovraffollamento”,che tende a far decrescere la popolazione, e piu importante, e il valore soglia e dato dallacarrying capacity X.

Osserviamo infine che si puo facilmente localizzare il punto in cui, partendo da un datoiniziale non troppo grande (0 < x0 < X/2), il tasso di crescita diventa massimo, per poidecrescere a zero per tempi grandi: basta derivare l’equazione (5.2) e cercare dove si annullala derivata seconda (dalla formula seguente, sara per x = X/2)

x(t) = x(1− x

X) + x(− x

X) = x(1− 2

x

X)⇒ x(t) ↑ per x0 < x <

X

2, x(t) ↓ per

X

2< x < X

Nella figura 9, il dato x0 e gia circa X/2 e quindi non si vede il flesso.

5.2. Popolazioni in competizione. Se consideriamo ora due popolazioni simultanea-mente presenti, descritte dalle variabili x ed y, la loro evoluzione sara regolata da un sistemadi due equazioni differenziali, generalmente nonlineari, che, anche se non dipendenti esplicita-mente da t, non saranno direttamente risolubili per “quadrature”, come nel caso di una solaequazione.

Il sistema delle due equazioni accoppiate si scrive talvolta in termini dei tassi relativi dicrescita

x = xf(x, y)

y = yg(x, y)

f e g sono determinate dal modello specifico, e sara certamente interessante valutarne gli zeridiversi da (0, 0)

(x, y) : f(x, y) = 0, g(x, y) = 0

Page 31: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

31

Tali valori costituiscono gli stati stazionari del sistema perche se si parte dal valore in-iziale (x, y), la soluzione del sistema differenziale e semplicemente costituita dalla coppia dellecostanti (x, y). Naturalmente anche lo stato vuoto (x = 0, y = 0), e stazionario.

Il passo successivo sara poi quello di valutare la stabilita di tali stati dato che solo quellistabili saranno veramente osservabili. Vediamo in concreto il celebre modello di Lotka-Volterra(modello preda-predatore) per la dinamica di due popolazioni, di prede (x), e di predatori (y).Le equazioni differenziali descrivono analiticamente diversi fatti che determinano l’evoluzionedel sistema, in termini della forma dei secondi membri f e g, e dei parametri ivi presenti.

x = x(a− by) = ax− bxyy = y(−c+ dx) = −cy + dxy

Nella prima equazione il primo termine descrive la crescita esponenziale, con tasso a, delleprede, in assenza dei predatori; il secondo termine descrive la loro diminuzione dovuta allapredazione, relativamente proporzionale al numero dei predatori y.

L’evoluzione istantanea dei predatori, nella seconda equazione, consiste nel primo terminedi decrescita esponenziale, in assenza di prede, e in un secondo termine che descrive l’aumentoproporzionale al numero di prede. Tutti i parametri sopra definiti sono positivi, e si calcolanofacilmente i due stati stazionari: risultano (0, 0) e (c/d, a/b). Dal calcolo della stabilita si vedeche lo stato “vuoto” (0, 0) e instabile. La procedura di linearizzazione non da un risultatodecisivo per l’altro stato: con altri metodi si determina la sua stabilita, ma anche qualcosa dipiu.

Si puo infatti stabilire che le soluzioni con dati iniziali positivi risultano tutte periodiche,in modo tale che si puo rappresentare graficamente l’andamento generale del sistema in questomodo

b

y

x

6

-

Figure 11. Le curve soluzioni del modello di Lotka-Volterra

Lo studio grafico-qualitativo anche nel caso generale, fa uso delle curve degli zeri dellefunzioni f e g: la loro intersezione fornisce gli stati stazionari e nelle regione delimitate daqueste curve si puo determinare qualitativamente l’evoluzione del sistema.

Page 32: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

32

5.3. Il modello base di Nowak e May. Il sistema consiste nelle equazioni che regolano,in un individuo malato, l’evoluzione delle tre popolazioni formate da cellule sane, dalle celluleinfettate, e dai virus liberi:

x = popolazione delle cellule sane,y = popolazione delle cellule infette,v = popolazione dei virus liberi.Il modello base proposto in May, Nowak e:

x = λ− dx− βxvy = βxv − ayv = ky − uv

Il significato dei vari parametri, che spiega anche in termini qualitativi la struttura delleequazioni e il seguente:

λ: tasso costante di produzione delle cellule sane1/d: tempo medio di vita delle cellule saneβ: forza dell’infezione1/a: vita media delle cellule infettek: tasso relativo di produzione di virus da una cellula infetta (cioe, numero di virus

prodotti nell’unita di tempo da una cellula infetta)1/u: vita media di un virione.I punti stazionari si trovano risolvendo il sistema algebrico

0 = λ− dx− βxv0 = βxv − ay0 = ky − uv

le soluzioni sono

d, 0, 0), e (

au

βk,λ

a− du

kβ,λk

au− d

β)

Naturalmente i parametri dovranno soddisfare alcune condizioni perche tali punti dello spazio{(x, y, v)} descrivano densita nonnegative. Il calcolo della stabilita dello stato stazionario“sano” (x0 ≡ λ

d , 0, 0) fornisce la seguente importante interpretazione dei parametri: lo statoe asintoticamente stabile se

au− βλk

d> 0⇔ 1 >

βλk

adu

R0 =βλk

adue il tasso riproduttivo di base

Se R0 < 1, lo stato iniziale “sano” resta tale, ed una perturbazione virale si estingue. Se R0 >1 si ha un’iniziale espansione esponenziale dell’infezione ( con tasso relativo r0 = a(R0 − 1)),che poi viene frenata dai termini nonlineari. L’altro equilibrio (di “coesistenza”) ha coordinate(x∗, y∗, v∗) che si possono scrivere in questo modo

x∗ =x0

R0, y∗ =

ud

βk(R0 − 1), v∗ =

d

β(R0 − 1)

Page 33: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

33

se R0 >> 1, i valori diventano

x∗ ≈ x0

R0, y∗ ≈ ud

βkR0 =

λ

a, v∗ ≈ d

βR0 =

λk

au

da cui si vede che mentre il valore dell’equilibrio di coesistenza x∗ = x0/R0 diventa moltominore di quello “sano” x0, la popolazione delle cellule infette y∗ ≈ λ/a e quella dei virusliberi v∗ ≈ λk/au raggiungono valori indipendenti dalla forza dell’infezione β. Se poi il viruse fortemente citopatico (a >> d), si ha che y∗ ≈ λ/a << x0 = λ/d.

Modelli piu sofisticati ( M.Nowak, C.Bangham Population dynamics of immune responsesto persistent viruses, Science, 272, 7479, 1996) possono tener conto della risposta immunitariae del fatto che per mutazioni, si formano diversi ceppi virali con resistenze diverse.

Ref. M. Nowak, R. May, Virus dynamics: Mathematical principles of Immunology andVirology, Oxford, 2000.

6. Complementi ed Esercizi

1. Uso della formula di Bayes per valutare un’ipotesi. Supponiamo che una fabbrica didadi da gioco ne produca di squilibrati con una probabilita pari a 1%. Il dado squilibratoDs presenta la faccia 6 con probabilita pari al 20%. Calcolare la probabilita che il dado siasquilibrato, supponendo che su k lanci esca sempre il 6 (evento k{6}).

R. I dati sono dunque i seguenti: P(Ds) = 0.01; P({6}|Ds) = 0.2 = 1/5, (P({6}|De) =1/6); si deve valutare P(Ds|k{6}). Dalla formula di Bayes

P(Ds|k{6}) =P(k{6}|Ds)P(Ds)

P(k{6})ma P(k{6}) = P(k{6}|Ds)P(Ds) + P(k{6}|De)P(De); inserendo i numeri si ha la formula

P(Ds|k{6}) =5−k0.01

5−k0.01 + 6−k0.99=

1

1 + (5/6)k99

In particolare, si ha P(Ds|10{6}) = 0.06..;P(Ds|25{6}) = 0.96... Cambiando l’entita dellosquilibrio, ad esempio, ponendo P({6}|Ds) = 1/2, si ha P(Ds|4{6}) = 0.45..; P(Ds|10{6}) =0.99...

2. Applicazioni alla genetica di popolazioni. Supponiamo che un gene si presenti nelle dueforme alleliche A ed a e che al tempo iniziale (convenzionalmente 0) le modalita AA, Aa e aasi presentino rispettivamente con le probabilita PAA, PAa, Paa, (PAA+PAa+Paa = 1). Sottoalcune ipotesi semplificatrici (assenza di mutazioni, accoppiamenti casuali, etc), valutiamocome varia nelle generazioni successive (al tempo 1, 2, etc) la distribuzione genotipica (vale a

dire P(k)AA, P

(k)Aa , P

(k)aa k = 1, 2, ...

R. Occorre innanzitutto valutare le frequenze alleliche al tempo 0 (resteranno invariate);risulta chiaramente che pA = PAA + PAa/2; pa = Paa + PAa/2 = 1 − pA; Dalle ipotesi si hache la distribuzione nella prima generazione e data dalla regola binomiale:

P(1)AA = p2A, P

(1)Aa = 2pApa, P

(1)aa = p2a

Page 34: Programma del Corso per l’AA 2008-09triolo/Archivio/mat_complement07.pdf · Laurea Magistrale in Ecologia ed Evoluzione prof. L. Triolo (triolo@mat.uniroma2.it) Dipartimento di

34

con l’invarianza delle frequenze alleliche:

p1A = P 1AA + P 1

Aa/2 = pA; p1a = P 1aa + P 1

Aa/2 = pa

Le successive generazioni presentano poi la stessa distribuzione dei genotipi, perche le fre-qunze alleliche sono quelle iniziali e quelle genotipiche si ottengono da esse mediante la regolabinomiale (legge di Hardy-Weinberg).