Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi...

31
Universit` a degli Studi di Trieste FACOLT ` A DI SCIENZE MATEMATICHE,FISICHE E NATURALI Corso di Laurea Triennale in Fisica Tesi di Laurea Triennale Esempi di deconvoluzione di distribuzioni sperimentali da effetti del rivelatore Candidato: Alessandro Angioi Matricola SM2000095 Relatore: Dott. Giuseppe Della Ricca Correlatore: Dott. Vieri Candelise Anno Accademico 2011-2012

Transcript of Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi...

Page 1: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

Universita degli Studi di Trieste

FACOLTA DI SCIENZE MATEMATICHE, FISICHE E NATURALICorso di Laurea Triennale in Fisica

Tesi di Laurea Triennale

Esempi di deconvoluzione didistribuzioni sperimentali da effetti del rivelatore

Candidato:

Alessandro Angioi

Matricola SM2000095

Relatore:

Dott. Giuseppe Della Ricca

Correlatore:

Dott. Vieri Candelise

Anno Accademico 2011-2012

Page 2: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel
Page 3: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

—A Bianca, Maura e Claudia

Page 4: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel
Page 5: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

R I N G R A Z I A M E N T I

Per questa tesi, vorrei innanzitutto ringraziare Giuseppe Della Ricca e VieriCandelise per la loro dedizione e la loro pazienza nel lavoro che abbiamosvolto insieme. Voglio ringraziare anche i miei genitori, ai quali devo tutto,inclusa l’opportunità di studiare fisica a Trieste, e ringrazio mia sorella perl’appoggio morale che mi ha fornito durante questi mesi di lavoro per la tesi.Inoltre mi sento in debito con tutti i professori che ho avuto nell’arco di que-sta triennale, per la passione verso la fisica e l’insegnamento che ciascuno diloro ha mostrato. Un ringraziamento anche agli amici ed ai colleghi che hotrovato a Trieste; credo fermamente che non sarei mai riuscito a concluderequesto corso di studi senza di voi! Infine, ringrazio i miei parenti e tuttigli amici di famiglia, che mi hanno fatto crescere in un ambiente bizzarro evariegato, ma soprattutto molto umano e pieno d’affetto.

iii

Page 6: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel
Page 7: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

I N D I C E

1 introduzione al metodo 1

1.1 Il problema dell’Unfolding 1

1.2 Esempio semplice 1

1.3 Unfolding basato sul teorema di Bayes 2

1.4 Unfolding SVD 3

2 lhc, cms e fisica dei jet 9

2.1 LHC 9

2.2 CMS 11

2.3 Fisica dei Jet 14

3 validazione ed analisi dati 17

3.1 Descrizione dei dati 17

3.2 Operazioni preliminari all’Unfolding 17

3.3 Test di validazione 18

3.4 Unfolding dei dati 19

4 conclusioni 21

bibliografia 23

v

Page 8: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel
Page 9: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

1 I N T R O D U Z I O N E A L M E TO D O

1.1 il problema dell’unfoldingNella fisica delle alte energie, ci si trova spesso a dover misurare delle distri-buzioni che sono in qualche modo distorte da effetti come accettanza limita-ta o risoluzione finita del rivelatore. Risulta quindi poco sensato confrontaredirettamente le predizioni teoriche con i dati misurati senza prima compierequalche studio atto a deconvolvere (to unfold) gli effetti del rivelatore dalladistribuzione misurata.

Chiamato b il vettore che ha come componente i-esima il numero dientries dell’i-esimo bin della distribuzione misurata, e chiamato x il vettoreche ha come componente i-esima il rapporto tra l’i-esimo bin della distri-buzione soggiacente all’evento che vogliamo misurare e l’i-esimo bin delladistribuzione che il rivelatore dovrebbe misurare secondo una simulazioneMonte Carlo del fenomeno, l’effetto del rivelatore è descritto da una matriceA, che agisce su x per dare b:

Ax = b. (1)

dove Aij è il numero di eventi che sono migrati dal j-esimo bin di x all’i-esimo bin di b. Sia nE il numero di bin dell’istogramma b e nC il numerodi bin dell’istogramma x; ne consegue che A ∈ CnE×nC . Si supponga inol-tre che nE 6 nC. Questa matrice A viene solitamente trovata attraversouna simulazione Monte Carlo del processo di misura con il rivelatore, vistal’estrema difficoltà di trovare un’espressione analitica di essa a causa dellacomplessità tecnica dei tipici rivelatori.

Si potrebbe pensare che per ottenere x sapendo b ed A si possa calcolareA−1 e scrivere

x = A−1b (2)

il problema però è più complesso di così, per almeno due buone ragioni:

• non esiste alcuna ragione fisica, e nemmeno una ragione statistica, perla quale in generale debba esistere la matrice A−1.

• anche nei casi in cui la matrice la matrice A−1 esiste, la sua inversa èdi solito inutile al fine di deconvolvere dagli effetti del rivelatore i datimisurati; le soluzioni di (1) date da (2) infatti possono essere moltosensibili a piccole variazioni di b, il quale è affetto da errori statistici.

Per capire meglio quest’ultimo punto, prendiamo in considerazione un esem-pio tratto da Höcker e Kartvelishvili, 1995, p.5

1.2 esempio sempliceSupponiamo che l’apparato sperimentale sia descritto da una matrice

A =1

2

(1+ ε 1− ε

1− ε 1+ ε

)(3)

1

Page 10: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

2 introduzione al metodo

è facile intuire qual’è il comportamento di questo rivelatore al variare di ε:per ε = 1 il rivelatore è perfetto; infatti per tale valore di ε la matrice Adiventa l’identità, quindi x = b, ovvero il rivelatore non distorce minima-mente la distribuzione che si cerca. Per quanto riguarda il comportamentoper ε = 0, invece, il rivelatore è praticamente ”cieco”: supponendo infattiche la distribuzione incognita sia x = (x1, x2), la distribuzione misurata sa-rà b = Ax = 1

2 (x1 + x2, x1 + x2), quindi qualunque fosse la distribuzionevera degli eventi, il rivelatore misura una distribuzione uniforme.

La matrice A−1 esiste per ogni ε diverso da zero, e vale

A−1 =1

(1+ ε −1+ ε

−1+ ε 1+ ε

)=1

2

(1 1

1 1

)+1

(1 −1

−1 1

)(4)

e quindi, posto b = (b1,b2)

x = A−1b =b1 − b22ε

(1

−1

)+b1 + b22

(1

1

)(5)

Ipotizziamo che la differenza tra b1 e b2 non sia statisticamente rilevante,ad esempio ponendo (b1 − b2)

2 6 (b1 + b2), e quindi che in un processo dimisura b1 − b2 sia effettivamente un numero casuale. Allora, la soluzione(3) del sistema è la somma di una parte casuale ed una statisticamente signi-ficativa. Per valori di ε non troppo piccoli, il primo termine è abbastanzainnocuo; prendendo però un valore di ε sufficientemente piccolo si può fardominare il primo termine sul secondo, e ciò porta ad avere una soluzionex che non ha più nulla a che fare col fenomeno che si sta studiando.

Analizzeremo due modi per superare questo problema: uno basato sulteorema di Bayes (G.D’Agostini, 1994) e uno basato sulla decomposizioneSVD (Höcker e Kartvelishvili, 1995)

1.3 unfolding basato sul teorema di bayesSi consideri la distribuzione di eventi che soggiace al fenomeno che si stastudiando (che chiameremo distribuzione ”vera”) come un insieme di cause{Cj, j = 1, . . . ,nC} che può produrre un insieme di effetti {Ei, i = 1, . . . ,nE}.Poniamo come i-esimo effetto l’osservazione di un certo numero di eventinell’i-esimo bin dell’istogramma b dei dati misurati. Applicando il teoremadi Bayes, si trova che

P(Cj|Ei) =P(Ei|Cj)P(Cj)∑nCl=1 P(Ei|Cl)P(Ci)

(6)

dove P(A|B) è la probabilità di A condizionata dal fatto che si è verificato B.Questa formula a prima vista può apparire non utilizzabile poiché richiedeuna conoscenza a priori di P(Cj); tuttavia si può far partire il processo diinferenza da una distribuzione a priori uniforme, e aggiornarla a posterioriattraverso la formula di Bayes dopo l’osservazione.

Nella formula di Bayes si vede anche che la probabilità condizionata aposteriori P(Cj|Ei) dipende da P(Ei|Cj) = A ′ij; quest’ultima probabilità sipuò calcolare a partire dalla matrice A precedentemente definita normaliz-zandone a 1 i vettori riga.1

1 Si ricordi che la j-esima componente della i-esima riga di A rappresenta il numero di eventimisurati nell’i-esimo bin che nella distribuzione vera erano nel j-esimo; normalizzando la i-esima riga di A si ottiene quindi una matrice A ′ tale che A ′ij sia la probabilità che un eventonel bin i della distribuzione misurata fosse originariamente nel bin j della distribuzione vera.

Page 11: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

1.4 unfolding svd 3

È importante notare che 0 < εj =∑nEi=1 P(Ei|Cj) 6 1: non è necessa-

rio che un evento venga misurato. La causa di ciò è che i rivelatori realihanno un’accettanza limitata. Il termine εj indica quindi l’efficienza che siha nel rilevare la causa Cj in uno qualsiasi degli eventi misurati, ovverola probabilità che la causa Cj sia misurata dal rivelatore, anche se nel binerrato.

Dopo un numero Nobs di osservazioni sperimentali, si ottiene una distri-buzione n(E) = {n(E1), . . . ,n(EnE)}. Il valore atteso del numero di cause daattribuire solo agli eventi osservati è

n(Cj)∣∣obs

=

nE∑i=1

P(Cj|Ei)n(Ei) (7)

tenendo conto dell’efficienza del rivelatore,

n(Cj) =1

εj

nE∑i=1

P(Cj|Ei)n(Ei) εj 6= 0 (8)

dove la divisione per εj non è mai un problema poiché se esiste un j taleche εj = 0, l’esperimento è cieco a Cj, e quindi non era corretto da principioaccorparlo alle cause del processo.

Dalla distribuzione unfoldata n(C) = {n(C1), . . . ,n(CnC)} possiamo ri-cavare il vero numero di eventi, la probabilità delle cause e l’efficienzatotale

Ntrue =

nC∑j=1

n(Cj)

P(Cj) = P(Cj|n(E)) =n(Cj)

Ntrue

ε =Nobs

Ntrue

Se la distribuzione iniziale non è consistente coi dati, si può verificareche la distribuzione così ottenuta tenderà ad avere valori compresi tra quel-li della distribuzione iniziale e quelli della distribuzione vera; questo sug-gerisce di applicare iterativamente i passaggi fatti finora scegliendo comenuova distribuzione iniziale quella ottenuta dall’applicazione precedentedell’algoritmo.

1.4 unfolding svdIl metodo di unfolding SVD consente, attraverso l’analisi dei valori sin-golari di una certa matrice, di regolarizzare le soluzioni del sistema (1),sopprimendone le componenti spurie e velocemente oscillanti.

Definizione (singular value decomposition). Sia A ∈ Cm×n; una sua decom-posizione ai valori singolari (SVD) è una fattorizzazione della forma

A = USVT ,

dove

• U è una matrice unitaria m×m

Page 12: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

4 introduzione al metodo

• S è una matrice diagonale m×n

• V è una matrice unitaria n×n

I valori {Si,i, i = 1, . . . ,n} sono detti valori singolari della matrice A; posso-no sempre essere presi in modo che S1,1 > S2,2 > · · · > Sn,n

Torniamo quindi al problema (1), e guardiamolo da un diverso punto divista: esso è la soluzione di un problema di minimi quadrati

nE∑i=1

(nC∑j=1

Aijxj − bi)2

= min (9)

Questa soluzione è adeguata nel caso in cui l’equazione sia esatta, oppurese gli errori sulle varie componenti di b fossero identici. Questo non èciò che avviene in generale; la cosa più sensata da fare è considerare unproblema ai minimi quadrati dove si minimizza la forma quadratica

nE∑i=1

(∑nCj=1Aijxj − bi

∆bi

)2= min (10)

ovvero, si pesano i vari termini dell’equazione a seconda dell’errore associa-to. L’espressione (10) può essere generalizzata scrivendo

(Ax− b)TB−1(Ax− b) = min (11)

dove B è la matrice di covarianza dei dati B.Nel caso più generale in cui B non sia diagonale, possiamo comunque

scalare le equazioni in modo analogo a (11); infatti B, essendo una matri-ce di covarianza, deve essere simmetrica e definita positiva, quindi la suadecomposizione ai valori singolari deve essere

B = QRQT , Rii ≡ ri2 > 0, B−1 = QTR−1Q. (12)

Scalando sia A che b in questo modo:

Aij ≡1

ri

∑m

QimAmj bi ≡1

ri

∑m

Qimbm (13)

sostituendo in (11), troviamo

(Ax− b)T (Ax− b) = min (14)

la cui minimizzazione ci porta al sistema

nC∑j=1

Aijxj = b. (15)

Dopo le trasformazioni effettuate, la matrice di covarianza di b non è altroche la matrice identità2, e inoltre tutte le equazioni hanno uguale importan-za.

2 In (13) si è prima ruotato il vettore b applicando ”a destra” (nel senso del prodotto righe percolonne) la matriceQ, e poi diviso ogni componente per il corrispondente valore singolare del-la matrice R. Facendo la stessa rotazione alla matrice B, troviamo QTBQ = QTQRQTQ =R =⇒ se dividiamo ogni componente di b per il corrispondente valore singolare della matriceR, la matrice di covarianza ruotata diventa l’identità.

Page 13: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

1.4 unfolding svd 5

I passaggi fatti finora hanno solo cambiato la forma del sistema da risolve-re, ma le soluzioni sono rimaste le stesse; in particolar modo, se si cercasse dirisolvere esattamente il sistema (15) si troverebbero ancora i comportamentispuri della soluzione. Queste componenti spurie devono essere soppresseutilizzando una qualche condizione a priori sulla soluzione; un modo difarlo è aggiungere un termine di regolarizzazione all’espressione che si staminimizzando

(Ax− b)T (Ax− b) + τ(Cx)TCx = min. (16)

In questa formula, la matrice C definisce la condizione di regolarità che siimpone alla soluzione, ed il parametro τ determina il peso di questa con-dizione; ad esempio, ponendo Cik = δik si cerca di minimizzare la normaeuclidea del vettore x, e se si facesse tendere τ ad infinito la soluzione sa-rebbe il vettore nullo, indipendentemente da A e b. Una scelta abbastanzagenerale è quella di imporre che l’istogramma x, che è il rapporto tra ladistribuzione unfolded u che stiamo cercando e la distribuzione che il rive-latore dovrebbe misurare secondo la simulazione Monte Carlo, abbia del-le variazioni tra bin adiacenti molto piccole. Definendo la curvatura delladistribuzione discreta x come∑

j

[(xj+1 − xj) − (xj − xj−1)]2 (17)

allora la scelta

C =

−1 1 0 0 . . .

1 −2 1 0 . . .

0 1 −2 1 . . .

. . . . . .

. . . 1 −2 1

. . . 1 −1

(18)

sopprimerà le soluzioni x che hanno grandi curvature. La minimizzazionedi (16) porta ad un nuovo sistema, che ha NC equazioni in più:

(A√τ ·C

)x =

(b

0

). (19)

Questo sistema è sovradeterminato, e si può applicare l’SVD alla matrice(nE + nC)× nC nel lato sinistro dell’equazione per risolverlo; questo peròcomporterebbe l’effettuare la decomposizione SVD per ogni valore di τ. Esi-ste però un metodo più efficiente, chiamato damped least squares (C.E.Lawsone R.J.Hanson, 1974, Cap. 25, Sez. 4) che consente di esprimere la soluzionedi (19) per ogni τ attraverso la soluzione del problema con τ = 0. La pri-ma cosa da fare è rendere il termine di regolarizzazione proporzionale allamatrice identità I:(

AC−1√τ · I

)Cx =

(b

0

). (20)

Bisogna fare attenzione al fatto che la matrice C, per come è stata definita,non è invertibile (per avere un indizio di ciò, si può notare che tutte le righe,

Page 14: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

6 introduzione al metodo

e tutte le colonne, hanno somma zero). Per superare questo problema, bastaaggiungere una piccola componente diagonale,

C =

−1+ ξ 1 0 0 . . .

1 −2+ ξ 1 0 . . .

0 1 −2+ ξ 1 . . .

. . . . . .

. . . 1 −2+ ξ 1

. . . 1 −1+ ξ

(21)

con ξ che sia abbastanza grande da rendere l’inversione numericamentepossibile, ma abbastanza piccola da non cambiare la condizione di minimacurvatura; nella maggior parte dei casi, ξ = 10−3 o 10−4 è una buona scelta.Risolviamo quindi il sistema (20) con τ = 0; iniziamo col decomporre aivalori singolari la matrice AC−1:

AC−1 = USVT (22)

e chiamiamo si gli elementi della diagonale di S; in seguito ruotiamo b eCx:

d ≡ UT b, z ≡ VTCx. (23)

ed in conclusione, il sistema può essere scritto come

si · zi = di, i = 1, . . . ,nC. (24)

che ha come soluzione

z(0)i =

disi

x(0) = C−1Vz(0) (25)

e la distribuzione unfolded u(0) può essere ottenuta moltiplicando ognicomponente di x(0) per la corrispondente componente della ricostruzioneMonte Carlo; avendo scelto τ = 0, però, otteniamo la soluzione non regola-rizzata. Grazie al metodo descritto da C.E.Lawson e R.J.Hanson, 1974, Cap.25, Sez. 4, si può calcolare la soluzione per ogni τ in maniera molto sem-plice; in sostanza, introdurre un τ 6= 0 è equivalente al sostituire di con

d(τ)i = di

s2is2i + τ

(26)

e quindi la soluzione del sistema diventa

z(τ)i =

disi

s2i + τx(τ) = C−1Vz(τ). (27)

Le matrici di covarianza Z e X possono essere calcolate, tenendo contoche la matrice di covarianza di d è unitaria, come

Z(τ)ik =

s2i(s2i + τ)

2δik (28)

X(τ) = C−1VZ(τ)VTCT−1

. (29)

Per ottenere la distribuzione unfolded u e la sua matrice di covarianza U,si devono moltiplicare x e X per la ricostruzione Monte Carlo m:

u(τ)i = mix

(τ)i (30)

U(τ)ik = miX

(τ)ik mi. (31)

Page 15: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

1.4 unfolding svd 7

Una cosa fondamentale per l’unfolding SVD è la scelta di un τ appropria-to; questo si può fare facendo un grafico logaritmico delle componenti did; tali componenti rappresentano i coefficienti dell’espansione in funzioniortogonali (definite dai vettori colonna di U) di b. Per distribuzioni abba-stanza regolari, soltanto i primi termini della espansione dovrebbero esseresignificativi, mentre gli altri dovrebbero essere statisticamente compatibilicon zero (ricordiamo che la varianza delle componenti di d è 1). Nel grafico,quindi, si dovrebbero riuscire a distinguere due comportamenti diversi dellecomponenti di d: per piccoli i, i di dovrebbero essere statisticamente signifi-cativi, e man mano dovrebbero decrescere fino a diventare variabili casualidistribuite secondo una gaussiana standard. Il valore critico i = k dopo ilquale i di non sono più statisticamente significativi è il rango effettivo delsistema; ovvero k è il numero di equazioni statisticamente significative delsistema. Una buona scelta del parametro di regolarizzazione τ è quindi

τ = S2kk, (32)

poiché dalla forma delle soluzioni (27), e considerando che i valori singo-lari (le componenti diagonali di S) sono una successione monotonamentedecrescente, si evince che gli zi con i > k verranno fortemente soppressi.

Page 16: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel
Page 17: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

2 L H C , C M S E F I S I C A D E I J E T

2.1 lhc

L’LHC (Large Hadron Collider) è un collisore protone-protone e Pb-Pb situatoal CERN di Ginevra. L’anello acceleratore percorre una circonferenza di cir-ca 27Km, ed è situato nel tunnel sotterraneo che precedentemente ospitaval’acceleratore LEP. L’obiettivo di questa macchina è il riuscire ad accelerarefasci di protoni a 7TeV per la fine del 2013; per essere in grado di curvare unfascio di particelle così energetiche, essa impiega oltre 1900 elettromagnetiche generano un campo di 8.4T (vedi LHC Study Group, 1995). Tali magne-ti sfruttano il fenomeno della superconduzione, che avviene a temperaturemolto basse; in particolare, i magneti di LHC devono essere mantenuti allatemperatura di 1.9K per funzionare; si raggiunge tale scopo attraverso unsistema di raffreddamento ad elio liquido.

Gli scopi scientifici di questa macchina sono molteplici; uno dei più im-portanti è la verifica della validità del Modello Standard. Esso è una teoriaquantistica dei campi che descrive tre delle quattro forze fondamentali a noinote (interazione elettromagnetica, forte e debole) ed il loro rapporto condelle particelle elementari (per le quali c’è forte evidenza del fatto che sianoprive di struttura). Il Modello standard è una teoria che ha avuto un nu-mero enorme di conferme sperimentali e sta alla base della comprensionedelle particelle attuale; tuttavia in esso ci sono alcuni tasselli mancanti chenon consentono di spiegare alcuni fenomeni, ed inoltre sono presenti ungran numero di parametri liberi da determinare sperimentalmente. Inoltre,prima della costruzione di LHC non è mai stata trovata alcuna evidenzasperimentale di un bosone scalare, l’Higgs, teorizzato nel modello standard,con un ruolo di primaria importanza; è infatti l’accoppiamento dell’Higgscon le particelle che dovrebe fornire massa alle particelle stesse.

Gli obiettivi scientifici principali di LHC possono essere riassunti così:

• Trovare quale sia l’origine della massa delle particelle del modello stan-dard; in particolare, le teorie più accreditate prevedono l’esistenza del-l’Higgs. In merito a questa ricerca, il 4 Luglio 2012 il CERN con unannuncio ufficiale ha comunicato la scoperta di un nuovo bosone che

Figura 1: Collocazione geografica di LHC

9

Page 18: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

10 lhc, cms e fisica dei jet

Figura 2: Complesso di acceleratori al CERN

ha delle caratteristiche compatibili con quelle che sono state ipotizzateper il bosone di Higgs.

• Studiare uno stato della materia chiamato Quark Gluon Plasma, nelquale gluoni e quark si muovono liberamente, senza essere soggetti alprincipio di confinamento dei quark.1 Capire le caratteristiche di talestato è molto importante, perché si ipotizza che tale stato fosse quelloprevalente dell’universo pochi istanti dopo il Big Bang

• Osservare i cosiddetti partner supersimmetrici, ipotizzati dalle teoriesupersimmetriche (SUSY) che associano ad ogni fermione del modellostandard un superpartner bosonico e ad ogni bosone un superpartnerfermionico attraverso un’operazione di simmetria; tali partner perònon sono mai stati osservati in natura. Le teorie supersimmetrichesono un argomento di ricerca molto fertile, poiché potrebbero consen-tire di spiegare la materia oscura (un problema irrisolto della fisicamoderna) e di formulare una descrizione unificata delle quattro for-ze fondamentali; inoltre risolvono vari problemi teorici del modellostandard.

• Cercare una spiegazione della asimmetria tra materia ed antimaterianell’universo; si cerca di raggiungere tale scopo attraverso lo studiodella violazione della simmetria CP nelle interazioni deboli.

I fasci di protoni di LHC sono composti da circa 2800 pacchetti contenenticiascuno 100 miliardi di particelle; i pacchetti distano l’uno dall’altro circa7m (nel sistema del laboratorio), e sono accelerati da delle cavità risonantia radiofrequenze disposte periodicamente lungo l’anello2 ; prima di essereimmessi in LHC, questi fasci sono accelerati da degli acceleratori ausiliariposti in cascata, che forniscono attraverso vari stadi sempre più energiacinetica al fascio, come mostrato in Figura 2.

1 Per spiegare come più quark con caratteristiche identiche possano occupare lo stesso statoall’interno degli adroni senza violare il principio di Pauli, si introduce una quantità chiamata”carica di colore”. Esiste un principio, chiamato principio di confinamento, che asserisce cheparticelle che hanno carica di colore non sono osservabili individualmente.

2 La suddivisione del fascio in pacchetti è qualcosa di comune a tutte le macchine acceleratricicircolari; proprio a causa della geometria circolare, i campi elettrici e magnetici oscillanti dispo-sti lungo la macchina acceleratrice tendono ad accelerare solo particelle aventi fase compresain un certo range rispetto al campo elettrico e magnetico.

Page 19: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

2.2 cms 11

In quattro punti dell’anello, chiamati punti di interazione, i fasci prove-nienti da due direzioni diverse vengono focalizzati in un punto di una came-ra a vuoto attraverso dei quadrupoli magnetici; questo processo (chiamatobunch crossing) viene effettuato ogni 25ns e provoca in media 20 eventi discattering inelastico tra protoni (un numero esiguo di eventi, rispetto allemigliaia di eventi con piccolo momento trasferito); ogni secondo si avrannoquindi 30 milioni di crossings, che daranno origine ad una media di 600milioni di eventi.

Figura 3: Tunnel di LHC

In fisica delle particelle, è comune defi-nire ”luminosità” la costante che lega lafrequenza di eventi alla sezione d’urto; ta-le quantità ha le dimensioni di T−1L−2.Si può dimostrare che la luminosità di uncollider è pari a

L = fnN1N2A

,

dove f è la frequenza di rivoluzione dei fa-sci nel collider, N1 e N2 sono il numero dipacchetti nel primo e nel secondo fascio ed

A è la sezione geometrica dei fasci. LHC è stato progettato in modo da rag-giungere un’elevata luminosità: 1034s−1cm−2; tale luminosità è richiestadal fatto che gran parte della nuova fisica che si cerca in LHC è compostada eventi molto rari.

Una luminosità così alta, però, genera anche il problema logistico di co-me gestire i dati misurati, sia per quanto riguarda la quantità di essi, cheper la velocità di trasferimento. In un rivelatore di LHC si generano cir-ca 300GBytes/s di dati; un sistema di trigger (ad esempio, per i triggerdi CMS vedi CMS Collaboration, 2000), discriminando gli eventi ”interes-santi” da quelli che non lo sono, riesce a filtrare questi dati fino a circa300MBytes/s, e deve riuscire a farlo in circa un microsecondo, anche se lacompleta ricostruzione di certi eventi può richiedere fino ad un secondo.

Un altro problema (al quale ci si riferisce col nome di pile up) causato dauna luminosità così alta è che quando si generano nuove particelle in unurto, altre particelle provenienti da un urto precedente non hanno ancoralasciato il rivelatore; affinché non si confondano particelle prodotte in dueeventi diversi è necessaria quindi una grandissima risoluzione temporale deirivelatori, ed il clock dato ai milioni di componenti elettronici deve esseresincronizzato in modo estremamente preciso.

In LHC, sono presenti quattro esperimenti in presenza dei quattro puntidi interazione: CMS, ATLAS, ALICE e LHCb; i primi due sono rivelato-ri general purpose, costruiti per dare risposte ad un po’ tutti i problemiprecedentemente esposti, ALICE è dedito soprattutto allo studio del Quark-Gluon Plasma nelle interazioni Pb-Pb e LHCb allo studio della fisica delquark bottom.

2.2 cmsL’esperimento CMS (Compact Muon Solenoid) è un rivelatore general pur-pose progettato per poter esplorare un ampia gamma di fenomeni fisicidifferenti (CMS Collaboration, 1994). Esso è costituito da diversi rivelatoriposti attorno al punto di incontro tra i fasci durante i bunch crossing, ed

Page 20: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

12 lhc, cms e fisica dei jet

Figura 4: Spaccato di CMS

ha una struttura composta da una parte cilindrica (barrel) e da due tappi(endcap) al fine di coprire la maggior parte possibile di tutto angolo soli-do che circonda il punto di interazione; questa ermeticità è fondamentaleper identificare con precisione gli eventi in cui ci sia ”energia mancante”,ovvero nei quali vengono prodotte particelle che non interagiscono col rive-latore, e delle quali quindi bisogna ricostruire energia e momento a partiredall’energia delle altre particelle misurate e dal principio di conservazionedel quadrimomento. Partendo dall’interno, le componenti di CMS sono:

Tracker

Figura 5: Silicon Strip neltracker di CMS

Nella parte più interna di CMS si trova untracciatore al silicio (vedi CMS Collaboration,1997d), che si occupa di identificare le traiet-torie delle particelle cariche prodotte nelle col-lisioni; la curvatura della traiettoria di questeparticelle causata dal campo magnetico prodot-to dal solenoide in cui è alloggiato il trackerconsente una misura del loro momento. Il trac-ciatore di CMS è fatto da vari strati di diversisensori al silicio; nei primi tre livelli è compo-sto da 66 milioni di pixel detector, sensori mol-

to piccoli (100µm× 150µm) che consentono di distinguere singole particelle,anche in presenza di un flusso molto intenso. I quattro livelli successivi so-no composti da strip di silicio di 10cm× 180µm, seguiti da altri sei livelli distrip da 25cm× 180µm. In totale, sono presenti 9, 6 milioni di canali per lestrip di silicio. I sensori sono via via più grandi man mano che ci si allontanadal punto di interazione.

Page 21: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

2.2 cms 13

ECAL

All’esterno del tracker è presente un calorimetro elettromagnetico (ECAL)costituito da scintillatori di cristalli di tungstenato di piombo (PbWO4), ilcui scopo è misurare l’energia di particelle che hanno interazioni elettroma-gnetiche con la materia (elettroni, positroni e fotoni) facendole sciamare emisurando il segnale prodotto dallo sciame (vedi CMS Collaboration, 1997a).Il PbWO4 è un materiale molto denso (8.3g/cm3) e dotato di piccola lun-ghezza di radiazione (0.89cm) e piccolo raggio di Molière (2.2cm); i cristalliutilizzati hanno una dimensione di 22mm× 22mm× 230mm, e sono colloca-ti in una matrice di fibra di carbonio per tenere i singoli cristalli otticamenteisolati; per la lettura del segnale generato sono utilizzati dei fotodiodi a va-langa. In tutto il barrel sono collocati 61, 200 cristalli, mentre per ciascunendcap ne sono stati utilizzati 7, 324.

HCAL

Figura 6: Vista frontale diCMS, senza endcap

Il calorimetro adronico (HCAL), ha lo scopo dimisurare l’energia degli adroni prodotti in ognievento. Esso è costituito da strati di materialiassorbitori densi (ottone) inframezzati da scin-tillatori; quando un adrone interagisce con l’as-sorbitore, genera una cascata di particelle, chevia via attraversano i vari livelli di assorbitorie scintillatori, producendo sempre più particel-le via via meno energetiche, ed attraverso unalettura del segnale proveniente dai vari strati discintillatori, si può risalire all’energia dell’adro-ne di partenza. HCAL, al fine di essere il più er-metico possibile, è costituito da varie parti leg-germente differenti l’una dall’altra (vedi CMS

Collaboration, 1997b), sia geometricamente che per il tipo di materiali uti-lizzati: HB ed HO nel barrel, HE nell’endcap e HF in una regione chiamataforward (3.0 < |η| < 5.0). HF in particolare è abbastanza diverso dalle al-tre zone di HCAL, in quanto deve riuscire a misurare l’energia di singoleparticelle in una zona in cui si hanno un gran numero di particelle moltoenergetiche prodotte.

Magnete

I tre componenti appena elencati sono collocati dentro un magnete solenoi-dale da 3.8T , lungo 13m con un diametro di 6m; è il magnete solenoidalesuperconduttore più grande mai prodotto al mondo, ed il suo forte campomagnetico orientato lungo l’asse della beamline è ciò che rende possibilela misura dell’impulso delle particelle generate nelle collisioni. Il magne-te è circondato da un giogo di ferro che fa in modo che le linee di flussodel campo magnetico siano il più uniformi possibile; esso inoltre ”filtra” leparticelle lasciando passare ai livelli successivi del rivelatore solo muoni (inquanto emettono una piccolissima radiazione di bremsstrahlung, quindi so-no molto penetranti) e particelle che interagiscono in maniera estremamentetrascurabile con la materia (neutrini).

Page 22: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

14 lhc, cms e fisica dei jet

Figura 7: Rivelatori di CMS

Rivelatori di µ

Infine, nella parte più esterna del rivelatore, è presente un sistema di ri-velazione per i muoni CMS Collaboration, 1997c. I muoni più energeticipossono penetrare facilmente attraverso diversi metri di materiale, quindisistemi simili ai calorimetri precedentemente descritti non vanno bene; alfine di misurare il momento dei muoni vengono utilizzati circa 250 Drifttubes e 540 Cathode Strip Chambers, rivelatori che consentono di calcolare latraiettoria dei muoni, e in più sono presenti 610 Resistive Plate Chambers, chesono importanti soprattutto per i trigger, in quanto attraverso la loro estre-ma granularità temporale riescono a dare una veloce e istantanea misuradel momento dei muoni, fornendo così indicazioni significative riguardo imuoni al trigger. Nel barrel vengono impiegati i Drift tubes, mentre negli en-dcap sono presenti le Cathode Strip Chambers; sia nel barrel che negli endcapvengono inoltre utilizzate le Resistive Plate Chambers.

2.3 fisica dei jetDallo studio delle collisioni protone-protone (p-p) si cerca di trovar rispostealla maggioranza dei quesiti che LHC e CMS sono stati costruiti per risol-vere; inoltre, i dati ai quali applicheremo gli algoritmi di unfolding sarannoproprio quelli relativi ad urti p-p.

Un fascio di protoni può essere visto come un fascio di gluoni e quarks,chiamati collettivamente partoni (vedi Griffiths, 1987); ciascun partone avràuna frazione dell’energia dei fasci, cioè un’energia x× Ep, dove Ep è l’ener-gia dei fasci e x è detta variabile di Bjorken, e può assumere solo valori tra0 e 1. Consideriamo il caso di un urto p-p: chiamiamo i due protoni A e B;sia a un partone di A e sia b un partone di B; vale che

~pa = xa~pA

~pb = xb~pB

Nel modello a partoni, possiamo calcolare la sezione d’urto di un certoprocesso p+ p→ X come

σp+p→X =∑a,b

∫dxadxbfa(xa,Q2)fb(xb,Q2)σa+b→X

dove con la somma su a e b si intende di effettuare una somma per tuttii partoni di A e B, con Q si è indicato il momento trasferito nel processo

Page 23: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

2.3 fisica dei jet 15

Figura 8: Scattering p-p nel modello a partoni

Figura 9: Processo che nello stato finale ha Z + 3 jet

e sia fa(xa,Q2) che fb(xb,Q2) sono le Parton Distribution Function (PDF),definite come la densità di probabilità che un partone abbia una frazionedi momento longitudinale rispettivamente xa o xb e modulo quadro delmomento trasferito Q2.

Meson

Antigreen

Green

Baryon

Red

Blue Green

Figura 10: Vari modi diformare parti-celle non colo-rate

I quark e gli antiquark possono emettere gluo-ni in modo analogo al processo di bremsstrahlungper cui gli elettroni emettono fotoni nell’interazio-ne elettromagnetica; i gluoni a loro volta possonocreare coppie quark-antiquark.

I quark e i gluoni, inoltre, sono particelle chehanno una carica di colore, ovvero un numero quan-tico che è stato introdotto per spiegare come pos-sano coesistere nello stesso stato in un adrone deiquark con tutti i numeri quantici uguali senza vio-lare il principio di Pauli. Una caratteristica impor-tante delle particelle aventi carica di colore è quelladel confinamento; l’interazione tra particelle ”colo-rate” (aventi carica di colore), infatti, ha la caratte-ristica di essere asintoticamente nulla più si avvici-nano le due particelle, ma più si allontanano le dueparticelle, più il potenziale associato a questa forzaaumenta. A causa di questa interazione, ad ogginon è mai stato osservato un quark isolato, ma so-lo confinato in stati legati non colorati: i mesoni edi barioni.

Negli urti tra due partoni possono essere emes-si nello stato finale un gran numero di gluoni e

coppie quark-antiquark; a causa del confinamento dei quark, però, que-ste particelle non possono rimanere isolate. Attraverso un processo chia-mato adronizzazione, queste particelle si ricombinano con altri quark e an-

Page 24: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

16 lhc, cms e fisica dei jet

tiquark creati dal vuoto in modo da formare adroni; viene chiamato jetun fascio di particelle approssimativamente collineari in impulso, prodottedall’adronizzazione dei partoni che hanno subito un processo di scattering.3

Un processo di grande interesse è quello di produzione di eventi conZ(+jets) nello stato finale; un esempio di questo tipo di processo è rappre-sentato in Figura 9: il bosone Z, in figura emesso dal quark u, decade poi inuna coppia muone-antimuone, e viene rivelato ricostruendo la sua massa in-variante a partire dall’energia misurata dei due muoni. In questo processo,inoltre, nello stato finale vengono formati anche due quark ed un gluone,ma essi subito dopo la loro formazione adronizzeranno e formeranno trejet.

3 Più formalmente, un jet viene definito come una certa regione circolare nello spazio eta-phi.

Page 25: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

3 VA L I DA Z I O N E E D A N A L I S I DAT I

3.1 descrizione dei datiLe distribuzioni che ci si appresta ad analizzare sono due:

• La molteplicità dei jet; in particolare, studieremo la distribuzione delnumero di eventi con Z + > N jet

• Il momento trasverso pt dei jet negli eventi in cui si produce ancheuna Z

Sono stati effettuati vari tagli sui dati di CMS per selezionare gli eventisopracitati con la minor quantità di fondo possibile; nello specifico, il datasetche analizzeremo è composto dagli eventi in cui la Z decade in e+ + e−.Per fare ciò, sono stati selezionati gli eventi in cui erano soddisfatti tutti iseguenti prerequisiti:

1. L’energia trasversa degli elettroni e positroni deve essere di almeno20GeV , per ottimizzare l’efficienza dell’algoritmo di ricostruzione de-gli eventi.

2. Si considerano solo regioni aventi pseudorapidità η tale che |η| < 2.4,escludendo inoltre la regione 1.4442 < |η| < 1.566 in cui si ha unasovrapposizione tra endcap e barrel.

3. Si deve osservare una coppia elettrone-positrone che abbia una massainvariante compresa tra 71 e 111 GeV , così si selezionano gli eventi incui si è formata una Z, ed in seguito è decaduta in e+ + e−.

3.2 operazioni preliminari all’unfoldingPer ciascuna delle due distribuzioni precedentemente elencate si è innan-zitutto generata una distribuzione chiamata Monte Carlo Truth, ottenutaeseguendo simulazioni a partire dalla teoria di cui si dispone riguardo ijet. In seguito, vengono simulate le interazioni tra gli adroni prodotti nel-le collisioni ed il rivelatore, e facendo ciò si costruiscono due importantioggetti:

• Una distribuzione detta Monte Carlo Reconstruction (spesso abbrevia-to in Reco), che rappresenta la distribuzione che si dovrebbe misurarecol rivelatore se il processo fisico che si sta misurando seguisse la di-stribuzione Monte Carlo Truth. La Monte Carlo Reco è in generalediversa dalla Monte Carlo Truth in quanto un generico rivelatore realeha accettanza limitata1 e risoluzione finita. In particolare, soprattuttonel caso della molteplicità dei jet, le cose sono ulteriormente compli-cate dal fatto che esistono errori associati al processo di ricostruzionedegli eventi, aggiungendo ulteriori effetti di migrazione di bin.

1 Un rivelatore, in generale, non riesce a rilevare tutti gli eventi che accadono, ma il numerototale di eventi osservati sarà inferiore al numero totale di eventi reale.

17

Page 26: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

18 validazione ed analisi dati

• Una matrice A il cui ij-esimo elemento è il numero di eventi che sonomigrati dal bin j della distribuzione Monte Carlo Truth all’i-esimo bindella distribuzione Monte Carlo Reco; questa matrice non è altro chequella introdotta nel primo capitolo; viene spesso chiamata ResponseMatrix.

Una volta che si hanno questi elementi, si può procedere con l’unfoldingdi un set di misure, che chiameremo genericamente Data; prima ancora,però, verificheremo che l’algoritmo sia ben funzionante.

3.3 test di validazioneAvendo a disposizione le distribuzioni Monte Carlo Reco e Monte CarloTruth, e disponendo della matrice A, si può verificare cosa succede quandosi applicano gli algoritmi di Unfolding per deconvolvere la distribuzioneMonte Carlo Reco dagli effetti del rivelatore. Quello che ci si aspetta è che lasoluzione data dall’algoritmo sia proprio la distribuzione Monte Carlo Truth.L’implementazione che è stata fatta dell’algoritmo che sfrutta il teorema diBayes, come si può vedere da Figura 11, riesce, se applicato al Monte CarloReco, a ritrovare il Monte Carlo Truth; in entrambi i grafici, il rapporto trala distribuzione Unfolded ed il Monte Carlo Truth è esattamente uno.

Lo stesso discorso si può fare per quanto riguarda l’algoritmo che sfruttala decomposizione ai valori singolari, come mostrato in Figura 12.

hrEntries 754428Mean 3.5RMS 1.708

1 2 3 4 5 6

Un

fold

ed/M

CT

ruth

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 754428Mean 3.5RMS 1.708

Rapporto Unfolded/Truth

hvEntries 754428Mean 1.247RMS 0.5404

1 2 3 4 5 6

Z +

(>=

N)

Jet

210

310

410

510

hvEntries 754428Mean 1.247RMS 0.5404

Monte Carlo Truth

Monte Carlo Reco

Unfolded Distribution

Distribuzioni Truth, Reco ed Unfolded

(a) Molteplicità

hrEntries 707308

Mean 8

RMS 4.32

2 4 6 8 10 12 14

Un

fold

ed/M

CT

ruth

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 707308

Mean 8

RMS 4.32

Rapporto Unfolded/Truth

Jet Pt (GeV/C)50 100 150 200 250 300

310

410

510

Monte Carlo Truth

Monte Carlo Reco

Unfolded Distribution

Distribuzioni Truth, Reco ed Unfolded

(b) Momento trasverso

Figura 11: Test di validazione per l’algoritmo bayesiano

Page 27: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

3.4 unfolding dei dati 19

hrEntries 754428

Mean 3.5

RMS 1.708

1 2 3 4 5 6

Un

fold

ing

/MC

Tru

th

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 754428

Mean 3.5

RMS 1.708

Rapporto Unfolded/Truth

hvEntries 754422Mean 1.247RMS 0.5404

1 2 3 4 5 6

Z +

(>=

N)

Jet

210

310

410

510

hvEntries 754422Mean 1.247RMS 0.5404

Monte Carlo Truth

Monte Carlo Reco

Unfolded Distribution

Spettro >= N: Truth, Reco, Unfolded e Data

(a) Molteplicità

hrEntries 707308

Mean 7.997

RMS 4.321

2 4 6 8 10 12 14

Un

fold

ed/M

CT

ruth

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 707308

Mean 7.997

RMS 4.321

Rapporto Unfolded/Truth

Jet Pt (GeV/c)50 100 150 200 250 300

310

410

510

Monte Carlo Truth

Monte Carlo Reco

Unfolded Distribution

Spettro pT: Truth, Reco, Unfolded e Data

(b) Momento trasverso

Figura 12: Test di validazione per l’algoritmo SVD

3.4 unfolding dei datiUna volta effettuata la validazione degli algoritmi, si è proceduto all’appli-carli ai dati di CMS.

Per l’algoritmo che sfrutta il teorema di Bayes, si è scelto un numero diiterazioni abbastanza grande da assicurare la convergenza dell’algoritmo,mentre per l’algoritmo SVD si è visto dal grafico delle componenti di dquale fosse il numero k di esse che fossero statisticamente significative, equindi sopprimendo i valori singolari dopo il k-esimo.

I risultati ottenuti con i due metodi sono mostrati in Figura 14; si puònotare che essi sono molto simili, ed entrambi tendono ad avere errori moltograndi nei canali dove si ha poca statistica (ad esempio, nel sesto canale delladistribuzione della molteplicità dei jet).

hrEntries 754428

Mean 3.585

RMS 1.792

1 2 3 4 5 6

Un

fold

ed/M

CT

ruth

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 754428

Mean 3.585

RMS 1.792

Rapporto Unfolded/Truth

hvEntries 754422Mean 1.247RMS 0.5404

1 2 3 4 5 6

Z +

(>=

N)

Jet

210

310

410

510

hvEntries 754422Mean 1.247RMS 0.5404

Monte Carlo Truth

Monte Carlo Reco

Data

Unfolded Distribution

Distribuzioni Truth, Reco ed Unfolded

(a) Molteplicità

hrEntries 707308

Mean 7.688

RMS 4.323

2 4 6 8 10 12 14

Un

fold

ed/M

CT

ruth

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 707308

Mean 7.688

RMS 4.323

Rapporto Unfolded/Truth

Jet Pt (GeV/c)50 100 150 200 250 300

310

410

510

Monte Carlo Truth

Monte Carlo Reco

Data

Unfolded Distribution

Distribuzioni Truth, Reco ed Unfolded

(b) Momento trasverso

Figura 13: Unfolding dei dati con l’algoritmo bayesiano

Page 28: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

20 validazione ed analisi dati

hrEntries 754428

Mean 3.56

RMS 1.805

1 2 3 4 5 6

Un

fold

ed/M

CT

ruth

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 754428

Mean 3.56

RMS 1.805

Rapporto Unfolded/Truth

hvEntries 754422Mean 1.247RMS 0.5404

1 2 3 4 5 6

Z +

(>=

N)

Jet

210

310

410

510

hvEntries 754422Mean 1.247RMS 0.5404

Monte Carlo Truth

Monte Carlo Reco

Data

Unfolded Distribution

Spettro >= N: Truth, Reco, Unfolded e Data

(a) Molteplicità

hrEntries 707308

Mean 7.792

RMS 4.399

2 4 6 8 10 12 14

Un

fold

ed/M

CT

ruth

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

hrEntries 707308

Mean 7.792

RMS 4.399

Rapporto Unfolded/Truth

Jet Pt (Gev/c)50 100 150 200 250 300

210

310

410

510

Monte Carlo Truth

Monte Carlo Reco

Data

Unfolded Distribution

Spettro pT: Truth, Reco, Unfolded e Data

(b) Momento trasverso

Figura 14: Unfolding dei dati con l’algoritmo SVD

Page 29: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

4 C O N C L U S I O N I

Il problema che si pone con l’Unfolding dei dati è, come tanti problemi inver-si, un problema malposto, dove si ha una forte dipendenza della soluzionedalle condizioni iniziali. Risulta difficile formulare condizioni sufficienti onecessarie per tante proprietà interessanti di queste soluzioni, dall’esistenzaall’unicità.

I metodi utilizzati per risolvere questo problema hanno portato a soluzio-ni simili, e la loro complessità è paragonabile. L’algoritmo SVD, in particola-re, è quello che fornisce una maggiore comprensione del fenomeno, perchéstudiando i valori singolari in gioco in questo problema si riescono a faremolte considerazioni sui dati che si hanno in possesso, in particolare si puòcapire se gli errori siano stati sovrastimati o sottostimati. L’algoritmo chesfrutta il teorema di Bayes, invece, fornisce meno informazioni sul sistemaoggetto di studio, ma comunque riesce a fornire una soluzione accettabile.

Le soluzioni ottenute con i due algoritmi risultano simili; l’algoritmo chesfrutta il teorema di Bayes sembra convergere, nei dati utilizzati per que-sta tesi, alla soluzione che si trova ”riducendo” il rango del sistema ogget-to di studio a k (numero di componenti statisticamente indipendenti del-la decomposizione in funzioni ortogonali del sistema). Per un confrontopiù esaustivo, sarebbe necessario studiare meglio la convergenza del primoalgoritmo.

Entrambi i metodi hanno portato a delle correzioni da applicare ai datidecisamente significative; l’Unfolding è quindi necessario per confrontarepredizioni teoriche e dati misurati, in luce del fatto che le distribuzioni chesi misurano possono essere distorte in maniera non trascurabile da effettidel rivelatore.

21

Page 30: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel
Page 31: Esempi di deconvoluzione di distribuzioni …...vista: esso è la soluzione di un problema di minimi quadrati XnE i=1 XnC j=1 A ijx j-b i 2= min (9) Questa soluzione è adeguata nel

B I B L I O G R A F I A

C.E.Lawson e R.J.Hanson1974 Solving Least Square Problems, Prentice-Hall Inc., Englewood Cliffs.

CMS Collaboration1994 “The Compact Muon Solenoid - Technical Proposal”, CERN/LHCC

94-38.1997a “The CMS electromagnetic calorimeter project: Technical Design

Report”, CMS-TDR-004.1997b “The CMS hadron calorimeter project : Technical Design Report”,

CMS-TDR-002.1997c “The CMS muon project : Technical Design Report”, CMS-TDR-

003.1997d “The CMS tracker system project: Technical Design Report”, CMS-

TDR-005.2000 “CMS TriDAS project : Technical Design Report; 1, the trigger sy-

stems”, CMS-TDR-006.

G.D’Agostini1994 “A Multidimensional Unfolding Method Based on Bayes’ Theo-

rem”, DESY 94-099.

Griffiths, David1987 Introduction to elementary particles, John Wiley and sons, Inc.

Höcker, Andreas e Vakhtang Kartvelishvili1995 “SVD Approach to Data Unfolding”, arch-ive/9509307.

LHC Study Group1995 “The Large Hadron Collider, Conceptual design”, CERN/AC/95-05.

23