Il metodo Monte CarloIl metodo Monte...

46
1 Alessandro De Falco, INFN Cagliari 5/8/14 Il metodo Monte Carlo Il metodo Monte Carlo

Transcript of Il metodo Monte CarloIl metodo Monte...

Page 1: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

1Alessandro De Falco, INFN Cagliari 5/8/14

Il metodo Monte CarloIl metodo Monte Carlo

Page 2: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

2Alessandro De Falco, INFN Cagliari 5/8/14

Che cosa è il metodo Monte CarloChe cosa è il metodo Monte Carlo

Col termine di metodo Monte Carlo (MC) si indica l'insieme delle tecniche di calcolo che fanno uso di variabili casuali generate artificialmente per la risoluzione di problemi matematici

L'idea è antica (ago di Buffon, 1777) ma è rimasta sostanzialmente inutilizzata fino all'avvento dei calcolatori

Possibilità di generare numeri pseudocasuali

Potenza di calcolo

Prime applicazioni sistematiche: Von Neumann e Ulam (primi anni '40, Manhattan Project) nome coniato da Nicholas Metropolis

L'uso del metodo Monte Carlo è cresciuto di pari passo con lo sviluppo e la diffusione dei calcolatori

Page 3: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

3Alessandro De Falco, INFN Cagliari 5/8/14

Simulazioni Monte CarloSimulazioni Monte Carlo

Le simulazioni Monte Carlo sono ampiamente utilizzate in diversi campi

Medicina

Economia

Biologia

Meteorologia

In generale sono fondamentali per capire sistemi complessi e/o intrinsecamente probabilistici.

Ci occuperemo della problematica in fisica con riferimenti alle alte energie

Perche' eseguire delle simulazioni

Simulazione dei processi fisici

Simulazione del fondo

Risposta del rivelatore

Page 4: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

4Alessandro De Falco, INFN Cagliari 5/8/14

Perche' eseguire le simulazioni: esempiPerche' eseguire le simulazioni: esempiIn un esperimento di fisica delle particelle:

Le quantita' fisiche da misurare sono basate su processi casuali

✔ Conoscere la natura di questi processi. ✔ Riprodurre il processo al calcolatore

Oltre alle quantita' di interesse, e' presente un fondo che deve essere rigettato/valutato.

✔ Es. vogliamo studiare il processo in collisioni tra nuclei pesanti ad alta energia con uno spettrometro ed un sistema di PID

✗ Identifichiamo i kaoni e ne misuriamo l'impulso; costruiamo lo spettro di massa invariante delle coppie di kaoni.

✗ Nelle collisioni verranno create anche coppie di kaoni scorrelate che costituiscono parte del fondo.

✗ Ci sara' inoltre una contaminazione di pioni non correttamente identificati✔ L'esperimento e' in grado di compiere la misura?

Quale e' il rapporto segnale/fondo aspettato?Quali selezioni cinematiche possiamo operare per migliorare questo rapporto?

✔ Riprodurre il fondo al calcolatore (e studiare le caratteristiche del fondo con i dati reali)

K K−

Page 5: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

5Alessandro De Falco, INFN Cagliari 5/8/14

L'apparato sperimentale distorce l'evento fisico✔ Quali sono i processi fisici che avvengono all'interno dell'apparato?

Con quale probabilita' avvengono? Come modificano l'evento fisico iniziale? Con quali fluttuazioni?

✔ La geometria di un rivelatore e' spesso complessa.Come si calcola l'accettanza (numero di eventi di un certo tipo misurabili dall'apparato sul totale degli eventi di quel tipo) dell'apparato? Come le varie (in)efficienze dei rivelatori modificheranno la risposta dell'apparato?

✔ Simulazione della risposta del rivelatore alle particelle

✔ Ottimizzazione deldesign del rivelatore

✔ Calcolo di risoluzioni,efficienze, accettanze...

Spettrometro per muoni

Assorbitore

Bersaglio

MWPC

Magnete

Odoscopi per il trigger

Page 6: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

6Alessandro De Falco, INFN Cagliari 5/8/14

Le quantita' misurate sono una convoluzione di distribuzioni di probabilita' su un gran numero di variabili.

Il problema, dal punto di vista matematico, si riduce ad una integrazione su n dimensioni in un dominio non facilmente parametrizzabile.

LA SOLUZIONE ANALITICA E' QUASI SEMPRE IMPOSSIBILE!

Sciame adronico in un calorimetro adronico di ALICE

protonia 100 GeV

protonia 2760 GeV

Page 7: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

7Alessandro De Falco, INFN Cagliari 5/8/14

Che cosa è il metodo Monte CarloChe cosa è il metodo Monte Carlo

Come abbiamo detto, una tecnica Monte Carlo e' una qualunque tecnica che fa uso di numeri casuali per risolvere un problema.

Siamo interessati a un parametro di una popolazione: usiamo una sequenza di numeri casuali per costruire un campione della popolazione, ed otteniamo delle stime statistiche del parametro

Sia F la soluzione di un certo problema (F puo' essere un numero reale, o un array, o semplicemente una variabile logica). La stima ottenuta col metodo Monte Carlo dipendera' anche dall'insieme dei numeri casuali utilizzati nel calcolo.

Il termine simulazione Monte Carlo fu coniato all'inizio della seconda guerra mondiale da von Neumann e Ulam a Los Alamos, che studiavano la dinamica delle esplosioni nucleari nell'ambito del progetto Manhattan. Il nome fu ispirato alla casualita' dei risultati nelle case da gioco.

Page 8: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

8Alessandro De Falco, INFN Cagliari 5/8/14

Che cosa è il metodo Monte CarloChe cosa è il metodo Monte Carlo

Come abbiamo detto, una tecnica Monte Carlo e' una qualunque tecnica che fa uso di numeri casuali per risolvere un problema.

Siamo interessati a un parametro di una popolazione: usiamo una sequenza di numeri casuali per costruire un campione della popolazione, ed otteniamo delle stime statistiche del parametro

Sia F la soluzione di un certo problema (F puo' essere un numero reale, o un array, o semplicemente una variabile logica). La stima ottenuta col metodo Monte Carlo dipendera' anche dall'insieme dei numeri casuali utilizzati nel calcolo.

Il termine simulazione Monte Carlo fu coniato all'inizio della seconda guerra mondiale da von Neumann e Ulam a Los Alamos, che studiavano la dinamica delle esplosioni nucleari nell'ambito del progetto Manhattan. Il nome fu ispirato alla casualita' dei risultati nelle case da gioco.

Page 9: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

9Alessandro De Falco, INFN Cagliari 5/8/14

Applicazione del metodo Monte CarloApplicazione del metodo Monte Carlo

Storicamente, i primi calcoli su larga scala basati sul metodo Monte Carlo vennero eseguiti per lo studio di scattering e assorbimento dei neutroni. Questi processi hanno natura casuale, e dunque si puo' facilmente far corrispondere un campione ipotetico, costruito coi numeri casuali, al campione reale.

D'altra parte i risultati ottenuti (valori medi, varianze etc) sono “deterministici”, e potrebbero essere ottenuti con i metodi tradizionali del calcolo analitico. In questo caso il calcolo consisterebbe nell'integrazione multidimensionale

Il metodo Monte Carlo puo' essere applicato ogni volta che si puo' stabilire una corrispondenza tra il risultato desiderato e il comportamento atteso di un sistema stocastico. Tale corrispondenza puo' esistere per un sistema intrinsecamente probabilistico, ma anche per un sistema di natura deterministica.

In ogni caso, l'appropriatezza del metodo dipendera' dalle sue proprieta' matematiche, e non da una somiglianza piu' o meno superficiale col problema in studio.

Page 10: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

10Alessandro De Falco, INFN Cagliari 5/8/14

Un semplice esempio Un semplice esempio

Page 11: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

11Alessandro De Falco, INFN Cagliari 5/8/14

Nota: il calcolo in questo caso può essere svolto analiticamente, in maniera esatta e in modo molto più efficiente

Il metodo Monte Carlo -sempre, non solo in questo esempio- fornisce un risultato approssimato, soggetto a fluttuazioni

Quanto vale l'incertezza statistica sul valore che ho determinato in questo modo?

Di quanto devo aumentare la statistica per ridurre le fluttuazioni di un ordine di grandezza?

Esercizio: scrivere un programma che simula il lancio di una coppia di dadiRiempire un istogramma coi risultati ottenuti e disegnarlo

Page 12: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

12Alessandro De Falco, INFN Cagliari 5/8/14

Formalmente, il calcolo col metodo Monte Carlo e' equivalente all'integrazione. Infatti, se vogliamo studiare il parametro F facendo uso di una serie di numeri casuali x

i(i=1,...,n, 0<x

i<1,

f(xi)=cost. ), il risultato ottenuto sara' una stima dell'integrale:

ovvero, e' il valore di aspettazione di F

Le basi matematiche per l'integrazione Monte Carlo sono le basi della statistica

Definizione di una variabile casuale: una variabile che può assumere diversi valori (discreti o continui in un range specificato) i cui valori non possono essere predetti

Distribuzioni delle variabili casuali. Media varianza, covarianza

La legge dei grandi numeri

Il teorema del limite centrale

Fondamenti matematici dell'integrazione Monte Carlo

Fondamenti matematici dell'integrazione Monte Carlo

F=∫dx1∫dx2 ...∫ dxn F x1, x2,. .. , xn

F

Page 13: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

13Alessandro De Falco, INFN Cagliari 5/8/14

Legge dei grandi numeri e convergenzaLegge dei grandi numeri e convergenza

La legge dei grandi numeri riguarda il comportamento delle somme di grandi numeri di variabili casuali.

Consideriamo una funzione f(u)

Scegliamo N numeri casuali ui con distribuzione uniforme tra a e b

La media aritmetica delle f(ui) converge al valore di aspettazione di f

Ovvero la media aritmetica e' uno stimatore consistente dell'integrale a secondo membro, poiche' converge al valore dell'integrale (sotto certe condizioni: f integrabile, finita ovunque in (a,b), continua q.d.)

La legge dei grandi numeri implica che la stima Monte Carlo di un integrale e' una stima consistente di un integrale

1N ∑

i=1

N

f ui

N ∞

1b−a∫a

b

f udu

Page 14: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

14Alessandro De Falco, INFN Cagliari 5/8/14

Teorema del limite centraleTeorema del limite centrale

Date n variabili casuali indipendenti xi (i=1,...n) generate da una

distribuzione qualunque, aventi media i e varianza finita

i , la variabile

è distribuita come una gaussiana standard N(0,1)

Da ciò discende che se tutte le i e tutte le

i sono uguali,

x=∑i=1

n x i

nf x∝exp −1

2x−

2

2/n

z=∑i=1

nx i− ∑

i=1

ni

∑i=1

n i

2

f z=e−

12

z2

Page 15: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo
Page 16: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

Protomontecarlo: l'ago di Buffon (hit or miss)Protomontecarlo: l'ago di Buffon (hit or miss)Simulazione fatta a mano per stimare , ideata nel '700.

Strumenti:1- un pavimento a linee parallele

equispaziate con passo d 2- un ago lungo d

Lancio l'ago ripetutamente sul pavimento

Conto la frequenza con cui l'ago cade in modo da attraversare il confinetra due strisce (hit). Per un numero grandedi tentativi, questa sara' pari a 2/

Questo metodo (hit or miss) e' molto inefficiente

d

d

Infatti, se indichiamo con l'angolo tra l'ago e la perpendicolare alle linee per un particolare lancio, la proiezione dell'ago lungo la perpendicolare sara' d | cos | e la probabilita' che in quel lancio l'ago attraversi una linea e' d | cos | / d = | cos |ogni angolo ha la stessa probabilita' calcolo il valore medio di | cos | come 1

/2 ∫0

/2

cos d =2

Page 17: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

17Alessandro De Falco, INFN Cagliari 5/8/14

Ago di Buffon: ulteriori considerazioni Ago di Buffon: ulteriori considerazioni

La soluzione del problema dell'ago di Buffon constiste dal punto di vista matematico nel calcolo del valore medio di un integrale.

Nota 1: il metodo dell'ago di Buffon è una tecnica Monte Carlo applicata ad un problema che non ha una interpretazione statistica immediata, ma è formulato in modo da poter essere risolto con metodi statistici.

Nota 2: il problema della convergenza lenta puo' essere affrontato con tecniche di calcolo che vanno al di la' di dello scopo di queste lezioni(vedi F. James, Monte Carlo Theory an Practice (Ferbel))

Ovviamente, poichè la varianza della stima montecarlo va come possiamo aumentare n o, a parità di n, ridurre

Diamo solo un esempio immediato nel seguito

2/n

Page 18: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

18Alessandro De Falco, INFN Cagliari 5/8/14

Hit or Miss vs crude Monte CarloHit or Miss vs crude Monte CarloConsideriamo un altro metodo per valutare :

Hit or miss:Estraggo una coppia (x,y) di numeri casuali con distribuzione piatta tra 0 e 1Incremento un contatore seReitero il processo per N volte. Divido il valore del contatore per n e ottengo una stima del rapporto tra un quarto dell'area del cerchio con r=1 e l'area del quadrato di lato 1.Moltiplicando il risultato per 4 ottengo . CONVERGENZA LENTA Il risultato della k-ma estrazione non è pesato e può dare solo 0 o 1. Le estrazioni che danno 0 non contribuiranno a ridurre le fluttuazioni statistiche

Crude Monte Carlo:Per ogni x

i estratto, calcolo

La media aritmetica di questi termini converge, per grandi N, al valore dell'integrale della funzione

CONVERGENZA PIU' RAPIDA uso tutte le xi estratte

1N ∑

i=1

N

1−x i2 N ∞

∫0

1

1−x2 dx=4

x2y2

≤1

1−xi2

0 1

1

y

x

Esercizio: calcolare con hit or miss e col crude MC

Page 19: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

19Alessandro De Falco, INFN Cagliari 5/8/14

Risultato del precedente esercizio con il metodo Crude MC (nero) o Hit Or Miss (rosso).

Nel nostro esempio, N=100

Il risultato e' un numero casuale con una distribuzione approssimativamente gaussiana. Piu' e' lenta la convergenza, maggiore e' la larghezza della distribuzione.

Ripeto la stima 10000 volte per avere la distribuzione della stima coi due metodi

Il metodo hit or miss, in questo caso, ha una RMS circa doppia rispetto al crude MC

Page 20: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

20Alessandro De Falco, INFN Cagliari 5/8/14

Estraggo N coppie (x,y) di numeri random a distribuzione piattaConto il numero K di coppie per cui y<=g(x)Stimo l'integrale come K/NPosso generalizzare facilmente il calcolo al caso xmin<x<xmax mediante la trasformazionex = xmin + (xmax-xmin) x0-1 0<x0-1<1ed eseguire un'analoga trasformazione per yIl metodo e' inefficiente per funzioni di singola variabile, ma diventa potente per funzioni di piu' variabili.

Integrazione di una funzione (hit or miss)Integrazione di una funzione (hit or miss)

Vogliamo determinare l'integrale I 0=∫

0

1

g x dx 0g x1 per 0x1

x

y

(xi,y

i)

(xj,y

j)

Page 21: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo
Page 22: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

22Alessandro De Falco, INFN Cagliari 5/8/14

Finora abbiamo parlato di numeri casuali generati da un computer, senza accennare al modo in cui vengono generati

I computers svolgono i calcoli in maniera deterministica!

I numeri generati al computer hanno un numero finito di cifre. Una variabile potra' essere scritta nella formadove a

i potra' essere uguale a 0 o ad 1, con probabilita' 1/2

Una variabile cosi' costruita ammettera' 2k valori diversi possibili. Se e' possibile estrarre in maniera casuale i valori degli a

i, x avra' una

distribuzione uniforme sui 2k valori discreti; x/2k sara' distribuita tra 0 e 1.

Ogni numero (pseudo)casuale estratto da un computer sara' funzione dei numeri estratti in precedenza.

Generazione di numeri casuali al calcolatoreGenerazione di numeri casuali al calcolatore

x=a0 20a121

...ak −12k−1

xn=f xn−1 , xn−2, .... x1

Page 23: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

23Alessandro De Falco, INFN Cagliari 5/8/14

Una possibile funzione per la generazione di numeri random a distribuzione piatta e' data da:

In questa maniera generiamo una sequenza con periodicità m (purchè c e m non abbiano fattori comuni, a-1 sia un multiplo di tutti i fattori primi di k e a-1 sia multiplo di 4 se m è multiplo di 4)

Ovviamente se durante la sequenza si ripete uno dei numeri (interi), tutta la sequenza si ripeterà a partire da quel numero

Per ottenere una sequenza abbastanza lunga dobbiamo usare a ed m abbastanza grandi, ma non tali per cui a*m causa un overflow

Solitamente si usa m=2k

Un generatore che segue questo algoritmo è un generatore lineare congruente

Es.: routine drand48 nei sistemi AIX genera numeri random tra 0 e 1 con buone proprietà spettrali. Drand48 usa k=48, c=B(hex), a=5DEECE66D(hex)

Metodo lineare congruenteMetodo lineare congruente

xn=mod axn−1c ,m

xn=mod axn−1c ,2k

Page 24: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

24Alessandro De Falco, INFN Cagliari 5/8/14

DOPO 150 EVENTI DOPO 4096 EVENTI DOPO 40960 EVENTI

(Il contatore in ascisseviene riazzerato ogni 4096 eventi)

Esercizio: scrivere un generatore di numeri casuali con a=5, c=13, k=12 verificare che la periodicita' e' 4096. verificare che la distribuzione e' piatta

Page 25: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo
Page 26: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

26Alessandro De Falco, INFN Cagliari 5/8/14

Generatori di numeri casuali in ROOTGeneratori di numeri casuali in ROOT

http://root.cern.ch/download/doc/ROOTUsersGuideHTML/ch13s02.html

root usa quattro tipi di generatore di numeri random:

Tipo Periodicità Commenti

TRandom Lineare congruente 231=2 109

(pochissimo!!!)non usare!

TRandom1 basato su RANLUX 10171 lento

TRandom2 maximally equidistributed combined Tausworthe

1026 veloce (usare per campioni nontroppo grandi)

TRandom3 Marsene-Twister 106000 consigliato

Page 27: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

27Alessandro De Falco, INFN Cagliari 5/8/14

Page 28: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

28Alessandro De Falco, INFN Cagliari 5/8/14

Numeri casuali con distribuzione dataCalcolo analitico

Numeri casuali con distribuzione dataCalcolo analitico

E' possibile estrarre numeri casuali x con distribuzione f(x) a partire da un set di numeri casuali y a distribuzione piatta g(y)=1

Se sappiamo integrare f(x), possiamo ricavare X in funzione di Y. Estraendo Y con distribuzione piatta tra 0 e 1 otterremo le X corrispondenti distribuite come f(x)

Esercizio: generare dei numeri random con distribuzioni:

f xdx=g y dy=dy Y =∫0

Y

dy=∫xmin

X

f xdx=F X

f x=1

cosh2ax

Distribuzione simile ad una gaussiana

f x=1

1x2

Page 29: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

29Alessandro De Falco, INFN Cagliari 5/8/14

Se non sappiamo integrare analiticamente f(x) possiamo ancora estrarre numeri casuali distribuiti secondo f(x) in un intervallo (a,b) procedendo in due modi:

Metodo 1: Calcoliamo numericamente la funzione integrale a passi discreti e

✔ Determino fmax nell'intervallo (a,b)

✔ Estraggo x con distribuzione uniforme, in modo che a<= x < b

✔ Estraggo y con distribuzione uniforme, in modo che 0<=y<fmax

✔ Tengo x se y<f(x)

✔ Le x cosi' ottenute sono distribuite secondo la distribuzione f`

Calcolo numericoCalcolo numerico

Page 30: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

30Alessandro De Falco, INFN Cagliari 5/8/14

Distribuzione qualsiasi con rootDistribuzione qualsiasi con root

Si possono generare numeri casuali distribuiti secondo una funzione f(x) utilizzando il metodo TF1::GetRandom()

TF1 è la classe delle funzioni a una variabile

P.es. voglio generare numeri distribuiti come(N

0, x

0: parametri della funzione)

Esistono diverse funzioni predefinite di uso comune

f x=N 0 x e−x /x

0

TF1 *f = new TF1(“f”,”[0]*x*exp(-x/[1])”,0,10); // range: tra 0 e 10f->SetParameters(1,1); // due valori a piacere per N

0 e x

0

Double_t var=f->GetRandom();

Page 31: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

31Alessandro De Falco, INFN Cagliari 5/8/14

Generazione parametricaGenerazione parametrica

Noto un modo per generare numeri casuali con distribuzione qualunque, possiamo costruire un generatore di particelle parametrico:

Conosciamo le distribuzioni cinematiche di ciascuna particella che vogliamo generare.

Parametrizziamo queste distribuzioni ed estraiamo dei numeri casuali distribuiti come le distribuzioni cinematiche

Esempio: siamo interessati alle J/ prodotte in reazioni inclusive

Riveliamo la J/tramite il suo decadimento in muoni

La cinematica della J/è completamente determinata una volta noti:

Ricaviamo dalla letteratura (previsioni teoriche, misure sperimentali) le distribuzioni di pt,y,.

Generiamo una terna di numeri casuali distribuiti come pt,y,della J/e costruiamo il

quadrimpulso della J/mediante queste grandezze e la massa della J/(nota: è una risonanza, dotata di una funzione spettrale)

pp J /anything

J /

pt= px2 py

2 y=12

log Epz

E−pz =atan

p y

p x

Page 32: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

32Alessandro De Falco, INFN Cagliari 5/8/14

La J/decade in due muoni: Il decadimento a due corpi e' semplice da trattare, occorre solo la distribuzione dell'angolo polare dei muoni nel C.M. (teoria, misure)

Possiamo dunque calcolare due quadrimpulsi, relativi alla coppia di muoni.

A questo punto abbiamo generato una coppia di muoni provenienti dalla reazione

Semplice e rapido

pp J /anything

Page 33: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

33Alessandro De Falco, INFN Cagliari 5/8/14

Esercizio: 1- scrivere un codice che genera J/ con le seguenti distribuzioni:

2- ricavare le distribuzioni di p

x, p

y, p

z, cos della J/

3- Aggiungere al precedente codice il decadimento in due muoni, con:

4- Calcolare il quadrimpulso dei due muoni. Calcolare la massa invariante per verificare che corrisponde a quella della J/Ricavare inoltre le distribuzioni di p

x, p

y, p

z, cosdella somma dei 4-impulsi dei due

muoni e confrontarle con quelle ottenute per la particella madre (sono le stesse)

dNdpT

∝ pT e−m

T/T

dNdy

∝e

−12

y2

y2

dNd

∝costante

pT= p x2p y

2 mT= pT2 mJ /

2

mJ /=3.1 GeV T=0.190 GeV y=1

: angolo azimutale

m=0.105 GeV

pz=mT sinh y

dNd

CM = costante CM : angolo polare del muone nel S.R. della J /

Page 34: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

34Alessandro De Falco, INFN Cagliari 5/8/14

Studio MC di distribuzioniStudio MC di distribuzioni

Come abbiamo visto, il MC permette di studiare delle distribuzioni difficilmente trattabili dal punto di vista analitico

Inoltre, se è vero che il risultato è affetto da incertezze statistiche, è anche vero che certe approssimazioni possono essere evitate

Esempio (da: Rotondi et al. Probabilità, statistica e simulazione, Springer) misurariamo due angoli x e y. L'apparato ha una risoluzione gaussianaOtteniamo:

vogliamo ora determinare:

Z è una variabile casuale così come X e YSemplicisticamente scriviamo:

ma ATTENZIONE: queste formule valgono in approssimazione lineare e per errori percentuali piccoli

x=20o±3o y=13o±3o

Z=sin XsinY

z= sin xsin y

=1.52

[Z ]=cos xsin y

2

180

2

x2sin x cos y

sin2 y 2

180

2

y2

Page 35: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

35Alessandro De Falco, INFN Cagliari 5/8/14

Risolviamo lo stesso esercizio con un semplice Monte Carlo

Page 36: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

36Alessandro De Falco, INFN Cagliari 5/8/14

Risultato:Ben diverso da ottenuto col calcolo analitico ma usando approssimazioni che in questo caso non si adattano bene (funzione ben lontana dalla linearità ed errore percentuale grande)

Nota: la distribuzione di z non è gaussiana

z=1.61±0.49z=1.52±0.41

z

con

tegg

i per

bin

da

0.0

5

Page 37: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

37Alessandro De Falco, INFN Cagliari 5/8/14

Nell'esercizio gli errori relativi sono del 15% (su x) e del 23% (su y)

Che risultato avremmo se l'errore fosse 6 volte più piccolo?

Col calcolo analitico:Col MC:

x=20o±0.5o y=13o±0.5o

zoom

z=1.520±0.068z=1.523±0.068

Distribuzione quasi gaussiana

Page 38: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

38Alessandro De Falco, INFN Cagliari 5/8/14

Uso del MC per ricavare gli intervalli di confidenzaUso del MC per ricavare gli intervalli di confidenzaPer ricavare l'intervallo di confidenza [ per un parametro ad

un certo CL=1-c1-c

2 dobbiamo calcolare degli integrali:

Possiamo usare il MC per calcolare questi integrali quando p non è integrabile analiticamente

Generiamo per ogni valore di un istogramma p(z,)

Contiamo per ciascun istogramma la frazione f di eventi per cui z<=z

mis

Troviamo quando

questo metodo (metodo della griglia) richiede una mole di calcolo non indifferente

∫zmis

p z ;1dz=c1∫−∞

zmis

p z ;2dz=c2 zmis

: risultato della misura

1−f ≈∫zmis

p z ;1dz=c1f≈∫−∞

zmis

p z ;2dz=c2

Page 39: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

39Alessandro De Falco, INFN Cagliari 5/8/14

Monte Carlo parametricoMonte Carlo parametrico

Invece di simulare le interazioni, usa parametrizzazioni delle distribuzioni dei prodotti di reazione, che vengono dai fit dei dati e dalle estrapolazioni

Veloce, soprattutto per reazioni complesse

Puo' essere piu' accurato del Monte Carlo microscopico se la teoria contiene incertezze/approssimazioni

Le signole pdf sono riprodotte, ma non le correlazioni tra i prodotti di interazione

Non puo' essere esteso oltre il range dei dati

Page 40: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

40Alessandro De Falco, INFN Cagliari 5/8/14

Biased Monte CarloBiased Monte Carlo

Campiona da distribuzioni artificiali, e applica un peso alle particelle per correggere il bias.

Predice quantita' medie, ma non i momenti di ordine superiore (il suo scopo e' quello di minimizzare la varianza)

Stesso valore di aspettazione con varianza minore-> converge rapidamente

Non riproduce correlazioni e fluttuazioni

Solo alcune variabili “privilegiate” convergono piu' rapidamente

Esempio: Fasci di neutrini con long base line dal decadimento dei pioniI pioni sono forzati al decadimento diverse volteI neutrini sono forzatamente emessi nella direzione in avanti Simula lo spettro di energia dei neutrini in un angolo solido <1mrad (<1km a una base line di 730 km)Pessima statistica per i muoni in avanti

Page 41: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

41Alessandro De Falco, INFN Cagliari 5/8/14

Codice di trasportoCodice di trasportoDescrive l'interazione delle particelle con la materia

Utilizzato per descrivere la distorsioni introdotte dal rivelatoreUsato anche per il design di elementi degli acceleratori, dosimetria...

Ogni particella e' seguita nel suo cammino attraverso la materia

Ad ogni passo, per ciascuna particella,

viene valutata la probabilita' di interazione secondo i diversi possibili processi fisici

eventualmente viene simulata una interazione e modificata la cinematica della particella

Se l'interazione produce dei secondari, vengono tracciati anch'essi

L'accuratezza e l'affidabilita' del Monte Carlo dipende dai modelli dei dati di ingresso.

L'accuratezza statistica dipende dal numero di “storie”.

La convergenza statistica puo' essere accelerata con tecniche di bias

Page 42: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

42Alessandro De Falco, INFN Cagliari 5/8/14

Fast simulationFast simulation

Solo la sorgente e' completamente simulata

La risposta del rivelatore e' parametrizzata

Molto veloce

Disegnato sul particolare rivelatore

Spesso usato come primo passo per gli studi di ottimizzazione del rivelatore e performances di fisica

Page 43: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

43Alessandro De Falco, INFN Cagliari 5/8/14

Pacchetti softwarePacchetti software

Un elenco non esaustivo dei programmi Monte Carlo piu' diffusi

Simulazione di eventi

Pythia/Jetset

Koralz, Koralw,Hzha, Herwig,.... processi specifici

Simulazione del rivelatore

Geant 3/4

Fluka

Mars

Mcnpx

Naturalmente l'utente deve creare la simulazione di suo interesse

Page 44: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo
Page 45: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo
Page 46: Il metodo Monte CarloIl metodo Monte Carlogruppo3.ca.infn.it/defalco/analisi_dati/Analisi_dati_04_MonteCarlo.pdf · ad alta energia con uno spettrometro ed un sistema di PID ... costruiamo

46Alessandro De Falco, INFN Cagliari 5/8/14

Interazioni adronicheInterazioni adroniche

Non c'e' un modello universale che descriva le interazioni adrone-nucleo:

Il nulceo e' un sistema a molti corpi di dimensione finita

La QCD perturbativa non puo' essere applicata per interazioni soft, che dominano i processi importanti per il codice di trasporto

Le interazioni adroniche sono le piu' difficili da trattare nel Monte Carlo, e le piu' soggette ad errori sistematici.