Biliardo Bayes AQ -...

26
Il biliardo di Bayes tra riferimenti storici e spunti di didattica della La storia della matematica in classe Convegno nazionale. L’Aquila 15/10/2015 spunti di didattica della statistica Vittorio Colagrande Liceo Scientifico “G. Galilei” Lanciano

Transcript of Biliardo Bayes AQ -...

Page 1: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Il biliardo di Bayestra riferimenti storici e spunti di didattica della

La storia della matematica in classeConvegno nazionale. L’Aquila 15/10/2015

spunti di didattica della statistica

Vittorio Colagrande

Liceo Scientifico “G. Galilei” Lanciano

Page 2: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Introduzione

Nel 2013 si celebrava a livello mondiale il 250-mo anniversariodella prima formulazione del Teorema di Bayes. L’importanza diuna tale ricorrenza risiede nel fatto che, a partire dal ragionamentobayesiano, si è sviluppato quell’approccio metodologico all’analisidei dati costituito dalla statistica bayesiana.

In riferimento a questo evento, durante il pi greco day del 2014,organizzato dal Liceo Scientifico di Lanciano e dalla sezione localeorganizzato dal Liceo Scientifico di Lanciano e dalla sezione localedella Mathesis, sono state proposte agli studenti del Liceo alcuneriflessioni relative all’inferenza statistica secondo la metodologiabayesiana

Scopo di questa comunicazione è quello di riformulare taliconsiderazioni per fornire uno stimolo per la costruzione di unpossibile percorso didattico rivolto agli studenti degli ultimi annidelle scuole superiori su temi di approfondimento di statistica eprobabilità, facendo riferimento alla situazione problematica delbiliardo introdotta da Thomas Bayes nel suo lavoro scientificoprincipale.

Page 3: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Saggio sulla soluzione di un problema nella dottrina del caso

Nel 1763 viene pubblicato su

Philosophical Transactions of theRoyal Society of London

il lavoro postumoil lavoro postumo

An Essay toward solving a Problem in the

Doctrine of Chances

del ministro presbiteriano

Thomas Bayes

Page 4: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

L’Essay è una delle due memorie trovate tra gli appunti diBayes dopo la morte e pubblicate dalla Royal Society perinteressamento dell’amico reverendo Richard Price .

Price nella parte iniziale della comunicazione inserisce alcuneosservazioni personali per evidenziare l’importanza dellasoluzione di Bayes al fine di fondare razionalmente ogni

Essay

soluzione di Bayes al fine di fondare razionalmente ogniragionamento relativo a fatti passati e a previsioni del futuro.

Ma si spinge ancora oltre, ritenendo il lavoro dell’amico in gradodi offrire valide argomentazioni per dimostrare l’esistenza di Dio:

“The purpose I mean is, to shew what reason we have forbelieving that there are in the constitution of things fixt lawsaccording to which things happen, and that, therefore, the frameof the world must be the effect of the wisdom and power of anintelligent cause; and thus to confirm the argument taken fromfinal causes for the existence of the Deity”.

Page 5: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Nello specifico, l’Essay presenta inizialmente una definizionedi probabilità:

la probabilità di un evento qualunque è il rapporto tra il valoreatteso, calcolato in dipendenza del verificarsi dell’evento, e laprobabilità (chance) della cosa attesa al verificarsi dell’evento.

Essay

Successivamente tratta di alcune leggi della probabilitàaffrontando anche la problematica dell’indipendenza deglieventi e della probabilità condizionata.

Page 6: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Ma scopo dichiarato dell’autore è quello di trattare ilproblema:

Essay

Dato il numero di volte in cui un evento incognito si è verificato

e il numero di volte in cui non si è verificato: è richiesta la

probabilità (chance) che la probabilità (probability) del suo

verificarsi in una singola prova sia compresa tra due gradi di

probabilità (“degrees of probability”) prefissati.

Singolare risulta il fatto che, nella presentazione ediscussione della soluzione, Bayes fa riferimento allasituazione fisica di un tavolo da biliardo.

Page 7: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Postulato1. Si supponga che il tavolino o il piano quadratoABCD sia costruito e livellato in modo tale che, se una dellebiglie O oppure W è gettata su di esso, sia uguale laprobabilità che si fermi in una qualsiasi parte del piano e chesi fermi necessariamente in una di esse.

Essay (sezione II)

Postulato 2. Si supponga che la biglia W sia gettata perprima; nel punto in cui si ferma si tracci la parallela os al latoAD, che incontra CD e AB in s e o rispettivamente. Poi si gettila biglia O p+q = n volte e, se O si ferma tra os e AD in unsingolo lancio, si dice che si è verificato l’evento M in unasingola prova .

Page 8: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Essay

Il piano ABCD viene suddiviso inrettangoli con un lato su AB el’altro parallelo ad AD, in uno diessi, diciamo bfFL, cade la lineaos e il rapporto tra l’area di talerettangolo e l’area del quadrato,rettangolo e l’area del quadrato,secondo Bayes, può essereassunto come misura dellaprobabilità che il segmento oscada tra bL e fF. La probabilità,poi, dell’evento M, una voltaindividuata la linea os, è data dalquoziente tra l’area del rettangoloAosD e quella del quadrato.

Page 9: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Essay

Lemma 1. La probabilità che il punto o cada tra due puntiqualsiasi sulla linea AB è pari al quoziente tra la distanza traquesti punti e la lunghezza dell’intero segmento AB.

Lemma 2. Gettata la biglia W e tracciata la linea os, laprobabilità dell’evento M in una singola prova è il quoziente traprobabilità dell’evento M in una singola prova è il quoziente traAo e AB.

L’evento M rappresenta il successo in un singolo lancio dibiglia e la sua probabilità corrisponde a quella incognitarelativa alla posizione del punto o.

Dopo alcune costruzioni grafiche e dimostrazioni di tipogeometrico e per assurdo, l’autore è in grado di provare laproposizione fondamentale del lavoro.

Page 10: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Essay

Proposizione 9. Se, prima diconoscere la posizione del punto o, siammette che l’evento M si è verificato pvolte e non si è verificato q volte in p+qprove, allora posso congetturare che ilpunto o giace tra due punti qualsiasi f epunto o giace tra due punti qualsiasi f eb della linea AB e conseguentementeche la probabilità dell’evento M in unasingola prova è compresa tra il rapportodi Ab su AB e di Af su AB. Taleprobabilità è il rapporto di quella partedella figura AiB che è compresa tra leperpendicolari condotte sopra AB incorrispondenza dei punti f e b, rispettoall’intera figura AiB.

La figura AiB è individuata dallato AB del quadrato e dallacurva ottenuta considerando ungenerico punto b su AB, ilrapporto Ab/AB e calcolando

.)1( p qxxp

qp

AB

bmy −

+==

Page 11: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Allo scopo di risolvere il problema di partenza, Bayes,ragionando in termini di rapporti di aree di rettangoli eoperando con le serie, dimostra la proposizione conclusiva.

Essay

Proposizione 10. Se un eventoincognito si è verificato p volte in p+qincognito si è verificato p volte in p+qprove e da due punti f e t della baseAH si tracciano le perpendicolari fC etF fino alla curva di figura 4, laprobabilità che la probabilitàdell’evento sia compresa tra ilrapporto Af su AH e il rapporto At suAH è data dal rapporto tra la partetFCf di figura compresa tra leordinate e l’intera figura ACFH.

La curva di figura èindividuata dalla equazione:

Essendo y e x rispettivamentei rapporti tra le misure deisegmenti hD e Ah e la baseAH

qxxy )1(p −=

Page 12: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Essay

L’originalità della proposta consiste nell’esprimere una stimainiziale della (distribuzione di) probabilità dell’evento incognito(probabilità “a priori”) e, successivamente, aggiornare talestima (probabilità “a posteriori”) sulla base di nuoveinformazioni legate all’evento. Nel biliardo viene ipotizzata unamisura iniziale della probabilità relativa alla posizione dellamisura iniziale della probabilità relativa alla posizione dellaprima biglia e, sulla base delle posizioni assunte dallaseconda, tale stima viene revisionata producendo laprobabilità a posteriori.

Il risultato, noto come Teorema di Bayes, derivaessenzialmente dalla proposizione 9. Esso permette diaffrontare e risolvere il problema dell’inferenza inversa:calcolare la probabilità di un evento (ipotesi) sulla base diinformazioni note e osservare di quanto cambia tale probabilitàalla luce di nuove informazioni.

Page 13: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Essay

Con le applicazioni di tale risultato alle scienze fisiche enaturali effettuate successivamente da Pierre Simone Laplacesi può dire che il calcolo delle probabilità sia entratoufficialmente a far parte della metodologia induttiva dellascienza.

Nel corso del 19° secolo e nella prima metà del 20° il metodoNel corso del 19° secolo e nella prima metà del 20° il metododi Bayes-Laplace è caduto in disuso e anche osteggiato.

Il pensiero bayesiano è stato ravvivato da studiosi quali BrunoDe Finetti e Jimmy Jeffreys e ha dato origine, nella secondametà del 20° secolo, al moderno movimento della statisticabayesiana guidato in particolare da Leonard Jimmie Savage eDennis Victor Lindley.

Tuttavia tale paradigma statistico è risultato molto difficile damettere in atto fino agli anni ottanta del novecento a motivosoprattutto di complessità computazionali.

Page 14: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Si consideri un tavolo da biliardo. Dallasponda AB viene lanciata sul tavolo una bigliaW, libera di rotolare e di fermarsi in unaqualsiasi posizione, supposta incognita.Un’altra biglia, poi, viene lanciata

Riformulando il problema del biliardo

Esperimento del biliardo

Un’altra biglia, poi, viene lanciataripetutamente sul tavolo, allo stesso mododella W; si tiene conto di quante volte essa siferma a sinistra della prima biglia (“successo”)e di quante alla destra (“insuccesso”). Sullabase di tali eventi osservati per la secondabiglia, si stima la (distribuzione di) probabilitàdella posizione orizzontale (parallelamente adAB) assunta dalla prima.

Page 15: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

La probabilità della posizione orizzontale di W è la variabilealeatoria

con densità a priori uniforme in [0,1]

AB

AO=θ

Il biliardo

Le osservazioni sperimentali relative alla seconda biglia, lanciataripetutamente n volte, sono realizzazioni x = (x1, x2,…, xn) delvettore aleatorio X= (X1, X2, …, Xn) dato da:

. )()( ]1,0[ θθπ I=

= destra a biglia 0

sinistra a biglia 1iX

Page 16: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

La variabile aleatoria “n° di successi su n prove”

per θ fisso, ha distribuzione binomiale e, quindi, la probabilità diz successi sugli n lanci della seconda biglia è data da:

∑=

=n

iiXZ

1

Il biliardo

Osservati Z=z successi, attraverso il Teorema di Bayes nellaformulazione per variabili casuali continue, si ricava la densità diprobabilità a posteriori di θ:

( ) .)1( z zn

z

nzf −−

= θθθ

( ) ( ))(

)()1(

)(

)( ]1,0[

zZP

I

z

n

zZP

zfz

znz

=−

=

=⋅

=− θθθθθπ

θπ

ψψψ dzZP znz −−

== ∫ )1(

z

n )(

1

0

Page 17: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

In primo approccio didattico per il calcolo dell’integrale

si può osservare che

ψψψθ dznz

∫−−=Ψ

1

0)1()(

Il biliardo

=+=Ψ

0z se 1

1

)( nz

e quindi . .

Pertanto la densità a posteriori è data da

( ) zn

z

nz −−

−+= )1(

z)!(n !

)!1( z θθθπ

≥−Ψ

+−

+=Ψ1z se )1(

1zn

z1)(

z

nz

1)!(n

)!(!)(

+−=Ψ znz

z

Page 18: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Introducendo, poi, le funzioni gamma e beta:

risulta e quindi

∫+∞ −−=Γ

0

1)( dyyet tt

Il biliardo

)(

)()(),(

βαβαβα

+ΓΓΓ=B

)1 ,1()( +−+=Ψ znzBz

e si tratta di una densità di probabilità beta di parametri

( )1)zn1,B(z

)1(z

+−+−=

−zn

zθθθπ

.1n e 1 +−=+= zz βα

Page 19: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Simulazione “didattica” del biliardoSi riportano di seguito i risultati di una simulazione effettuataattraverso un programma (script) nell’ambiente statistico R per unnumero di lanci della seconda biglia pari a n=100 ed n =1000.

n = 100 z = 22 n = 1000 z = 247

Page 20: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Il biliardo

Per quanto attiene la richiesta del problema di Bayes, vacalcolato l’integrale della densità a posteriori tra due prefissativalori θ1 e θ2 del parametro θ

( )∫=<< 2

1

)( 21

θ

θθθπθθθ dzzP

.

∫1θ

Tralasciando il calcolo analitico, per un esempio numerico sipossono utilizzare i risultati della simulazione precedente pern=1000 e la funzione pbeta(x,α,β) del software R calcolata incorrispondenza di θ1 = 0.221 e θ2 = 0.274

%.95)754 ,248 ,221.0()754 ,248 ,274.0(

)247221.00()247274.00()247274.0221.0(

≈−=<<−<<=<<

pbetapbeta

PPP θθθ

Page 21: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Il biliardo.

In vari contesti operativi è opportuno sintetizzare ladistribuzione ottenuta con degli indici, quali la moda, il valoremedio o la mediana. Spesso si fa riferimento al valor medio

( ) . 2

1 )1(

!)(n !

)!1( 1

0 ++=−

−+= ∫

n

zd

zz

nzE znz θθθθθ

2!)(n ! 0 +− ∫ nzz

Nel caso delle simulazioni, per n = 100 e per n = 1000 il valormedio è risultato pari, rispettivamente, a 0.2255 e 0.2475,mentre il valore “vero” del parametro θ è 0.2503.Si tratta di una stima puntuale, ma l’informazione risulterebbepiù completa se venisse considerata una stima intervallareattraverso gli intervalli di credibilità I = (θ1, θ2)

. .)()( 21 prefissataprobabzPzIP =<<=∈ θθθθ

Page 22: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Il biliardo.

Si osservi ora che la distribuzione uniforme assunta comedistribuzione a priori è un caso particolare della beta pern=z=0.Partendo dalla distribuzione a posteriori ottenuta inprededenza, il processo può essere reiterato assumendo taledistribuzione come informazione iniziale, effettuando ulterioridistribuzione come informazione iniziale, effettuando ulteriorilanci di biglie e aggiornando nuovamente la distribuzione diprobabilità.La densità a posteriori che si ottiene è ancora una distribuzionebeta dipendente dalla distribuzione assunta come a priori, dalnumero di lanci n1 effettuati e dal numero di successi z1

( ) .1)nn1,B(

)1(,

111

)(

1

111

+−−+++−=

+−++

zzzzzz

zznnzz θθθπ

Page 23: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

variabile aleatoria (parametro).

L’informazione iniziale su di essa può essere espressamediante una “opportuna” densità di probabilità a priori

Ω∈θ

Cenni di inferenza statistica

( ). θπL’informazione campionaria viene analizzata considerandorealizzazioni x di un opportuno vettore casuale X eindividuando la funzione di verosimiglianza:

Se f(x,θ) è la densità di probabilità congiunta di X e θ, per laprobabilità condizionata risulta

( )

( ). x θf

( ) ( ) . )x(x)(x),x( fff ⋅=⋅= θπθπθθ

Page 24: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Si ricava, quindi, la formula di Bayes che fornisce la densità diprobabilità a posteriori

( ) ( ))x(

x)(x

f

f θθπθπ

⋅=

Cenni di inferenza statistica

essendo

Si può quindi vedere come il livello di conoscenza ad un datoistante si incrementa attraverso l’acquisizione di nuovi dati (leinformazioni campionarie), dati che permettonol’aggiornamento della conoscenza mediante il passaggio dalladistribuzione di probabilità a priori alla distribuzione diprobabilità a posteriori, che a sua volta può costituire ladistribuzione a priori in una fase successiva del processo diapprendimento dall’esperienza.

. )()( )( θθπθ dxfxf ∫Ω ⋅=

Page 25: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

Conclusione

Aspetti inferenziali specifici, senza dubbio, possonodifficilmente entrare a far parte di argomenti curriculari oanche di approfondimento delle scuole superiori, salvo inquegli indirizzi di studio che prevedono l’insegnamentospecifico della statistica. In questi può essere significativointrodurre elementi di statistica bayesiana anche per unintrodurre elementi di statistica bayesiana anche per unconfronto con l’approccio classico, frequentista all’inferenza.In ogni caso, la proposta presentata può avere una valenzadidattica in diversi corsi di studio ai fini soprattutto di favorireulteriormente lo sviluppo da parte dello studente della logicadell’incerto ma anche per fornire esempi applicativi dimetodiche acquisite in altri contesti matematici, quale quellodell’analisi.

Page 26: Biliardo Bayes AQ - php.math.unifi.itphp.math.unifi.it/convegnostoria/convegnostoria3/materiali/cola... · Dato il numero di volte in cui un evento incognito si è verificato e il

D.M. Cifarelli, P. Muliere, Statistica Bayesiana: Appunti ad usodegli studenti, G. Iuculano, 1989.

G. D’Agostini, D. Esposito, Così è… probabilmente, il saggio,l’ingenuo e la signorina Bayes, www.ilmiolibro.it, 2014.

A.I. Dale, A History of Inverse Probability: From Thomas

Bibliografia

Bayes to Karl Pearson, Springer-Verlag, 1991.

International Society for Bayesian Analysis,URL https://bayesian.org/

R Core Team, R: A language and environment for statisticalcomputing, URL http://www.R-project.org/, 2015.

S.M. Stigler , The True Title of Bayes’s Essay, StatisticalScience, 28,3,283,288.

M. Valli, La Rivoluzione di Bayes, Il Saggiatore, 2013.