TEST DI DISPOSITIVI ELETTRONICI PER IL SISTEMA LOCALE DI...

39
UNIVERSITA’ DEGLI STUDI DI BOLOGNA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di laurea in fisica Laurea triennale TEST DI DISPOSITIVI ELETTRONICI PER IL SISTEMA LOCALE DI TRIGGER DEL RIVELATORE DI MUONI DELL’ESPERIMENTO CMS Tesi di Daniele Fasanella Relatore: Prof. Antonio Maria Rossi Correlatore: Dott. Riccardo Travaglini Anno Accademico 2003-2004 1° Sessione

Transcript of TEST DI DISPOSITIVI ELETTRONICI PER IL SISTEMA LOCALE DI...

UNIVERSITA’ DEGLI STUDI DI BOLOGNA

Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di laurea in fisica Laurea triennale

TEST DI DISPOSITIVI ELETTRONICI PER IL SISTEMA

LOCALE DI TRIGGER DEL RIVELATORE DI MUONI

DELL’ESPERIMENTO CMS

Tesi di Daniele Fasanella

Relatore: Prof. Antonio Maria Rossi Correlatore: Dott. Riccardo Travaglini

Anno Accademico 2003-2004 1° Sessione

2

3

Indice Introduzione 5 1 L’esperimento CMS a LHC 7 1.1 Il Large Hadron Collider 7 1.2 L’esperimento CMS 8 1.3.1 I rivelatori di CMS 9 1.3.2 Le camere di tubi a deriva del Barrel 11 2 Elettronica per il sistema di trigger delle camere a deriva per i muoni 14 2.1 Introduzione 14 2.2 Il trigger locale per le camere di tubi a deriva (DTBX) 16 2.2.1 Il Bunch and Track Identifier 17 2.2.2 Il Track Correlator 17 2.2.3 Il sistema Trigger Server 18 2.3 Il sistema di trigger regionale per i tubi a deriva 20 2.4 La Server Board 21 2.4.1 Il Track Sorter Master (TSM) 21 2.4.2 Sistemi di controllo 22 2.4.3 Trasmissione del segnale al sistema di trigger regionale 23 3 Verifiche di qualità per la produzione in serie 24 3.1 Tipologia e finalità dei test 24 3.2 Test Statici 24 3.2.1 Apparato sperimentale 24 3.2.2 Svolgimento dei test 26 3.2.3 Risultati 28 3.3 Test dinamici 33 3.3.1 Descrizione dei test 33 3.3.2 Risultati 34 3.4 Burn-in 34 3.4.1 Set up sperimentale 35 3.4.2 Risultati 37 Conclusioni 38Bibliografia 39

4

5

Introduzione Il Large Hadron Collider, in fase di costruzione presso il CERN di Ginevra, è progettato per produrre collisioni protone-protone con energia nel centro di massa di 14 TeV. Le elevate energie disponibili e l’alta luminosità prevista consentiranno di studiare campi inesplorati della fisica delle particelle, quali la ricerca del bosone scalare, denominato Bosone di Higgs, la cui esistenza è richiesta dal modello standard delle interazioni elettrodeboli o la ricerca di nuova fisica oltre il modello standard, come le teorie Supersimmetriche. Il rivelatore CMS (Compact Muon Solenoid) è un rivelatore appositamente progettato per la ricerca di nuove particelle. Esso è composto da una serie di sottorivelatori in grado di ricostruire le tracce delle varie particelle (adroni, fotoni, ecc) prodotte in ogni evento. CMS è stato progettato per ottimizzare in particolare la rivelazione di muoni a alto impulso, firma caratteristica di processi derivanti da nuova fisica. Il sistema di trigger del rivelatore ha il compito di selezionare, tra tutti gli eventi prodotti, quelli interessanti per i successivi studi di fisica. Nel caso del rivelatore per i muoni il sistema di trigger è costituito da dispositivi elettronici appositamente progettati, che hanno ha il compito di identificare i muoni che attraversano le camere di tubi a deriva del rivelatore e di ricostruire la traccia associata al passaggio del muone. Parte di tali dispositivi verranno installati direttamente sul rivelatore e saranno quindi inaccessibili durante il periodo di funzionamento dell’esperimento. Per questa ragione essi dovranno essere particolarmente affidabili ed il loro funzionamento opportunamente verificato prima dell’installazione, al fine identificare difetti od anomalie che potrebbero comprometterne la funzionalità lungo la durata dell’esperimento. Il lavoro di tesi è consistito sia nella partecipazione alla fase di preparazione dell’apparato sperimentale per i test, sia nell’esecuzione dei test stessi per la verifica del dispositivo chiamato Server Board, realizzato in una scheda elettronica opportunamente disegnata per il sistema di trigger della parte centrale (barrel) del rivelatore per i muoni. Dei tre test effettuati il primo è stato un test di connettività statico dove, tramite il protocollo standard di controllo Jtag, è stata verificata la connettività di ogni singola linea di trasmissione di dati. In secondo luogo è stato effettuato un test dinamico volto a controllare il funzionamento e la stabilità della scheda Server Board nelle condizioni di funzionamento previste dal sistema di trigger. Infine è stato realizzato un test dedicato all’identificazione di dispositivi potenzialmente malfunzionanti chiamato “burn-in”. Tale test consiste nel far operare tali dispositivi ad alta temperatura per un dato periodo di tempo, controllando la loro funzionalità. I risultati ottenuti su un primo lotto di dispositivi costruiti hanno permesso di effettuare una stima sull’impatto dei possibili malfunzionamenti sull’intera produzione finale. La tesi è suddivisa in tre sezioni. Nel primo capitolo verrà brevemente illustrato il collisionatore LHC e i suoi principali obiettivi. Verrà inoltre data una panoramica del rivelatore CMS, analizzando nel dettaglio il sistema di rivelazione di muoni del barrel. Nel secondo capitolo verrà descritta la logica del sistema di trigger del rivelatore a muoni. Sarà descritta la parte locale di tale sistema, posta all’interno del rivelatore, di cui fa parte il dispositivo Server Board. Nel terzo capitolo saranno descritti nel dettaglio i tre test realizzati, descrivendo gli apparati sperimentali usati e i risultati ottenuti.

6

7

Capitolo 1

L’esperimento CMS a LHC

1.1 Il Large Hadron Collider La richiesta di energie sempre più elevate per poter ampliare gli orizzonti della fisica delle particelle, ha portato alla progettazione del Large Hadron Collider (LHC), attualmente in costruzione presso i laboratori del CERN, all’interno del tunnel di 27 Km che ospitava precedentemente il collisionatore LEP. LHC è progettato per produrre collisioni protone-protone con energia nel centro di massa di 14 TeV (più di 10 volte le energie raggiunte al Tevatron o al LEP). Per mantenere le particelle sulla loro orbita è necessario l’utilizzo di campi magnetici di 8.36 Tesla ottenuti tramite innovativi magneti superconduttori. La necessità di produrre un sufficiente numero di eventi anche per processi con piccola sezione d’urto, ha fatto sì che una delle principali caratteristiche dell’acceleratore LHC sia un’elevata luminosità. Infatti, mentre nei precedenti collisionatori la luminosità raggiungeva il valore L=1032cm-2s-1, LHC raggiungerà a regime il valore di L=1034 cm-2s-1, con un periodo iniziale in cui la luminosità sarà L=1033 cm-2s-1. Nell'acceleratore circoleranno 2808 pacchetti di ~1011 protoni ognuno, valori risultanti dal compromesso fra la luminosità richiesta e la dispersione dei fasci nei punti di collisione. Le collisioni avverranno ogni 25 ns, ovvero con una frequenza di 40 MHz, chiamata frequenza di “bunch crossing” (BX). Oltre alle collisioni protone-protone la macchina é stata progettata anche per produrre collisioni fra ioni pesanti, ad esempio Piombo-Piombo, ad un'energia nel centro di massa di 1150 TeV (≈2,76 Tev per nucleone) con una luminosità pari a 1027 cm-2s-1. I fasci di particelle di LHC viaggeranno in direzioni opposte in 2 condutture separate e collideranno in 3 punti di intersezione Numerosi sono i campi di indagine per gli esperimenti a LHC: Ricerca del bosone scalare previsto dal modello standard delle interazioni elettrodeboli

denominato bosone di Higgs (HMS)[1]. La sua esistenza è richiesta dalla teoria mediante il meccanismo di rottura spontanea di simmetria che permette ai bosoni vettori intermedi W± e Z0 di acquisire massa.

Misure di precisione del modello standard, quali la massa del quark top o studio della violazione della simmetria CP nei mesoni contenenti il quark bottom.

Ricerca di nuova fisica oltre il modello standard. Le energie raggiunte permetteranno di escludere l’esistenza di altre famiglie di quark o leptoni non previste dalla teoria, o di verificare altri modelli teorici come le teorie Supersimmetriche.

Sono previsti 4 rivelatori: CMS, ATLAS, ALICE ed LHCb, la cui disposizione è mostrata in Figura 1.1. ATLAS e CMS sono rivelatori appositamente progettati per la ricerca di nuove particelle nelle collisioni protone-protone, mentre ALICE e LHCb sono rispettivamente specializzati nella fisica degli ioni pesanti (plasma di quark e gluoni) e fisica del quark bottom (violazione di CP).

8

Figura 1.1 Rappresentazione schematica dell’LHC e dei 4 apparati sperimentali.

1.3 L’esperimento CMS Il rivelatore CMS (Compact Muon Solenoid)[2] sarà in grado di studiare molteplici processi fisici. E’ stato progettato in particolare per ottimizzare la rivelazione di muoni ed elettroni, firma caratteristica di processi derivanti da nuova fisica. Infatti se consideriamo la ricerca del bosone di Higgs, il primo obiettivo del progetto LHC, uno dei canali di decadimento più interessanti sarà H→ZZ(*)→4l (con l=leptone carico), caratterizzato dal caratteristico stato finale di 4 leptoni, da cui sarà possibile ricostruire la massa dell’Higgs. L’esperimento sarà installato in una caverna sotterranea e avrà l’aspetto di un cilindro di acciaio lungo 25 m, con un diametro di 16 m e del peso di 14000 tonnellate. Le sue principali caratteristiche sono: un campo magnetico di 4T realizzato con un solenoide superconduttore ; un sistema centrale di tracciatura di alta qualità (risoluzione di 10-20 µm) che permette una

identificazione delle tracce con alta risoluzione nella parte centrale del rivelatore; un calorimetro elettromagnetico, per un’accurata misura delle energie di elettroni e fotoni; un calorimetro adronico ermetico per la misura delle energie di tutti gli adroni prodotti

nell’evento; un sistema di rivelazione di muoni di alta qualità e ridondante, in grado di ricostruire le

tracce dei muoni e misurarne l’impulso nel piano trasversale (Pt). In figura 1.6 sono mostrate le sezioni longitudinali e trasversali del rivelatore, che illustrano il sistema di coordinate utilizzato. I fasci di protoni a LHC collideranno nel centro del rivelatore e la loro direzione definisce l’asse z. Nel piano trasversale sono utilizzare le coordinate polari r-φ. Invece, lungo il piano longitudinale è usata la pseudorapidità η,definita come:

2θtan-lnη =

dove θ è l’angolo rispetto all’asse z.

9

Figura 1.6: (a) Vista trasversale della regione del barrel del rivelatore CMS. (b) Vista longitudinale di un quarto dell’apparato. Il rivelatore CMS è suddiviso in una zona centrale cilindrica (barrel) segmentata in 5 anelli (wheels) lungo la direzione z, e due dischi alle estremità (endcaps). All’esterno del solenoide si trova il rivelatore di muoni, composto da più stazioni di rivelazione, poste nel giogo di ferro che contiene il flusso di ritorno del campo magnetico. Il resto dei rivelatori si trova all’interno del solenoide, a parte due calorimetri adronici (Very forward calorimeters) che sono posti all’esterno degli endcaps. La misura del momento delle particelle cariche è effettuata grazie alla curvatura della traiettoria nel piano r-φ, dovuta al campo magnetico. Nella sezione trasversale presentata in figura 1.6 è possibile vedere come questo campo influenza la traiettoria di un muone, la cui misura del momento traverso può avvenire in 3 modi indipendenti:

con il rivelatore di tracce in base alla curvatura all’interno del magnete con la misura dell’angolo di incidenza sulla stazione più interna del rivelatore di muoni. con la curvatura della traiettoria all’interno del rivelatore muonico.

1.3.1 I rivelatori in CMS Partendo dal punto di collisione dei fasci e procedendo verso l’esterno si incontrano diversi sottorivelatori (Figura 1.7): 1. Il rivelatore di tracce (Tracker)

Il suo scopo è individuare con alta efficienza e buona risoluzione particelle cariche dotate di elevato momento trasverso nel range 5.2<η . E’ basato su rivelatori di silicio a pixel e a strisce, ed otterrà una precisione di ∆Pt = 5% e ∆Pt = 1% rispettivamente per particelle con Pt = 1 TeV/c e Pt = 100 GeV/c.

2. Il calorimetro elettromagnetico (ECAL) Si tratta di un calorimetro omogeneo composto da ~105 cristalli scintillatori di PbWO4, caratterizzati da una veloce risposta temporale (10 ns) e piccolo tempo morto. Questi cristalli sono posizionati sia all’interno del barrel che sugli endcaps, nel qual caso sono preceduti da un rivelatore a strisce di silicio, chiamato “preshower”, il cui scopo è di migliorare la determinazione nei punti di impatto di fotoni e di distinguere fra le coppie di fotoni prodotte nelle prime fasi dell’interazione e quelle originatesi in fenomeni successivi, come il decadimento di π0. Questo è importante perché per la rivelazione del bosone di Higgs, nel caso abbia massa inferiore a 120 Gev, il canale di decadimento favorito per individuarlo è quello con

10

due fotoni don E∼50 Gev nello stato finale. Ogni cristallo del barrel è lungo 23 cm e ha una copertura angolare ∆η×∆φ =0.0175 × 0.0175 e la risoluzione energetica di ECAL risulta essere:

EEEE 2.0%55.0%2 ⊕⊕≈

σ

Figura 1.7: Spaccato dell’esperimento CMS

3. I calorimetri adronici (HCAL e Very Forward calorimeter)

HCAL è un calorimetro a campionamento realizzato con piani assorbenti di ottone (spessi 50 mm del barrel e 80 mm negli endcaps) intervallati da scintillatori plastici con spessore di 4mm. La segmentazione del rivelatore è ∆η×∆φ =0.087 × 0.087. La risoluzione energetica di HCAL nel barrel è

%5%65 ⊕≈EE

mentre negli endcaps è

%5%83 ⊕≈EE

Il Very Forward Calorimeter è localizzato oltre il rivelatore di muoni, a circa 12 metri dal punto di interazione, ed è realizzato con assorbitori di acciaio intervallati da fibre di quarzo poste parallelamente alla linea del fascio. La misura di energia è effettuata tramite la luce Čerenkov emessa al passaggio delle particelle cariche, raccolta da un sistema a fibre ottiche che la convoglia su dei fotomoltiplicatori posti in aree schermate. L’intero sistema di calorimetri adronici è fortemente ermetico in un’ampia regione (fino a

3.5=η ), quindi insieme alle informazioni date da ECAL permette la ricostruzione dell’energia totale di un evento.

4. Il sistema di rivelazione dei muoni Il rivelatore di muoni è il più esterno di CMS ed è installato nel giogo di ferro per il ritorno del campo magnetico. La sua efficienza complessiva nell’identificazioni di muoni sarà superiore al 99%. Il sistema di rivelazione di muoni consiste di 3 sottosistemi indipendenti, con diverse caratteristiche a seconda della diversa intensità del campo magnetico e del flusso di particelle presenti nelle diverse regioni in cui sono posti.

11

I tubi a deriva (Drift Tube - DT) sono installati all’esterno del magnete nella zona del barrel (η<1.2) dove il rumore di fondo e il campo magnetico residuo sono relativamente bassi. Verranno descritti in dettaglio nel paragrafo successivo. Le camere a strisce catodiche (Chatode Strips Chambers - CSC) sono camere

proporzionali a fili (anodi) con catodi segmentati a strisce, che permettono di effettuare misure sia temporali che spaziali. Una particella carica che attraversa uno strato di CSC produce una carica per ionizzazione che viene raccolta da diverse strisce catodiche. Poiché queste strisce sono disposte radialmente, una interpolazione della carica misurata permette una misura della coordinata φ con un’ottima risoluzione. La contemporanea misura del segnale sui fili permette di ricostruire la coordinata ortogonale r. Sono state scelte per la zona frontale degli endcaps (0.9< η<2.1) dove devono operare in regime di grande flusso di particelle (con una frequenza dell’ordine dei KHz/cm2, a differenza del barrel dove sarà di decine di Hz/cm2) e in un elevato campo magnetico residuo. Le camere a piani resistivi (Resistive Plate Chambers -RPC) sono rivelatori gassosi a piani

paralleli. Quelle utilizzate in CMS sono formate da 4 piani di bachelite che formano due intercapedini per il gas spesse 2mm. I piani sono ricoperti esternamente di grafite, e costituiscono i catodi ad alta tensione (9.5 KV). Delle strisce di alluminio isolate sono poste esternamente ai catodi di grafite, fra i due interstizi. Quando una particella carica attraversa una RPC produce una valanga che induce un segnale sulle strisce, che rivelano la somma dei segnali fra le due intercapedini. Queste camere sono poste sia nel barrel che negli endcaps in modo da dare affidabilità e ridondanza all’intero sistema. Nonostante abbiano una modesta risoluzione spaziale, sono caratterizzate da un’ottima risoluzione temporale e un tempo di risposta molto rapido; per questo motivo sono utilizzate principalmente dal sistema di trigger per l’identificazione della collisione in cui il muone è stato prodotto.

1.3.2 Le camere di tubi a deriva del Barrel Il sistema di camere di tubi a deriva è utilizzato nel rivelatore a muoni di CMS a causa della grande superficie che deve essere coperta. Il sistema è segmentato nei 5 wheels di CMS lungo la direzione z, ognuno largo circa 2.5 metri, e diviso in 12 settori azimutali, che coprono ognuno 30°. Le camere a deriva sono sistemate in 4 cilindri concentrici (le sezioni in azzurro MB/Z/1-2-3-4 in figura 1.6 A), chiamati stazioni, a differenti distanze dal punto di collisione dei fasci e separate dal giogo di ferro. Ogni stazione consiste di 12 camere, con l’eccezione della quarta dove i settori superiori ed inferiori sono equipaggiati con due camere ciascuno (anziché una), portando il numero totale a 14 camere per stazione. L’intero rivelatore CMS è quindi equipaggiato con un totale di 250 camere di tubi a deriva, le cui dimensione dipendono dalla stazione. Ogni camera è sfasata azimutalmente rispetto a quella precedente più interna, per massimizzare l’accettanza geometrica. L’elemento di base del sistema di rivelazione è il tubo a deriva, la cui sezione, chiamata cella è mostrata in figura 1.8.

Figura 1.8: Visione trasversale di una cella di un tubo a deriva, mostrate le linee di deriva per una tipica configurazione di voltaggio degli elettrodi

12

Ogni cella ha dimensioni trasverse 42 mm × 13 mm e contiene un anodo di acciaio inossidabile rivestito d’oro del diametro di 50 µm e lunghezza variante fra i 2 e i 4 metri. Uno strato di celle è ottenuto da due piani di alluminio paralleli, all’interno dei quali una serie di componenti di alluminio a forma di “I” (I-beams), spessi 1.2 mm e alti 9.6 mm, definiscono i bordi delle celle adiacenti. Le strisce di alluminio, depositate su entrambe le facce di ogni I-beam, e isolate da esso tramite un nastro di Mylar, servono da catodi. I fili anodici e i catodi sono posti rispettivamente a un voltaggio positivo e negativo e forniscono il campo elettrico all’interno della cella. La distanza fra il punto di passaggio della particella e il filo è misurata dal tempo di deriva degli elettroni di ionizzazione secondo la formula:

∫=t

tudttx

0

')(

Allo scopo che u risulti circa costante in ogni punto all’interno del volume della cella, il campo elettrico deve avere una forma particolare e a questo scopo sono state montate due strisce addizionali di alluminio caricate positivamente su entrambe le facce dei piani di alluminio (schermate con un isolatore) al centro della cella stessa, in corrispondenza del filo anodico. Le tensioni tipiche sono +3600 V, +1800 V, -1800 V rispettivamente per i fili, le strisce e i catodi. Molto importante per i rivelatori a ionizzazione è la scelta dei gas utilizzati. Per le camere a deriva posizionate nel barrel di CMS è stata scelta una miscela composta di Argon (80%) e CO2 (20%). L’argon è una scelta tipica per gli apparecchi a ionizzazione , in quanto caratterizzato da un’elevata ionizzazione specifica (numero medio di coppie ione-elettrone create al passaggio di una particella per unità di lunghezza), una bassa intensità del campo elettrico per la formazione di valanghe (il che permette di scegliere un punto di lavoro, determinato dalle tensioni sugli elettrodi, inferiore rispetto ad altri gas) e un basso costo. L’unico lato negativo è che l’Argon puro permette un guadagno limitato senza dare origine a scariche continue, in quanto durante il processo a valanga tende a emettere fotoni i quali possono estrarre fotoelettroni dal catodo e che possono dare origine ad ulteriori valanghe. Per evitare questo effetto, occorre introdurre gas che assorbano i fotoni (detti quenchers) e dissipino l’energia in forme diverse, quali stati dissociati o vibrazionali. A questo scopo è stato scelto un gas inorganico, che a differenza di quelli organici è meno efficiente ma mantiene le sue caratteristiche inalterate nel tempo e non dà problemi di manutenzione dello strumento anche dopo anni di utilizzo. La CO2 è una scelta comune a questo scopo tenendo anche conto che la sua miscela con l’Argon non è infiammabile. Il modulo fondamentale per la rivelazione e misura del Pt dei muoni è la camera di muoni, una cui visione trasversale è riportata in figura 1.9. Ogni stazione è munita di dispositivi di acquisizione sia nel piano r-φ (vista φ) e nel piano longitudinale θ-z (vista θ). I tubi a deriva sono assemblati in piani (layers), il numero delle celle dipende dalla dimensione della camera. Quattro layers sono assemblati assieme per formare un quadrupletto chiamato super-layer (SL) con i ripiani confinanti sfasati di mezzo tubo, permettendo di risolvere l’ambiguità destra-sinistra della singola cella. Ogni stazione DT è composta di 3 super-layers, due dei quali sono dedicati alle misure di posizione nel piano di curvatura r-φ (fili paralleli alla linea del fascio), e uno per la misura della coordinata z nel piano longitudinale θ-z (fili perpendicolari alla direzione z), con unica eccezione la stazione più esterna MB4 alla quale manca il SL per la visione θ. Inoltre, come mostrato in figura, all’interno di ogni camera si trova una intercapedine a nido d’ape (Honeycomb plate) che funge da spaziatore leggero ma rigido ed è posta fra il SL φ interno e quelli esterni. Il suo scopo è allontanare maggiormente i due superlayer che effettuano le misure sul piano di curvatura, in modo da migliorare la risoluzione angolare.

t0 t u x(t)

= tempo di arrivo della particella = tempo in cui l’impulso appare sull’anodo = velocità di deriva funzione del punto = distanza dall’anodo a cui è passata la particella

13

Figura 1.9: Sezione schematica di una camera a muoni del barrel.

La risoluzione finale ottenibile è di ~ 150-200 µm per il punto di impatto del muone per ogni camera, mentre per quanto riguarda la misura di Pt nel barrel la precisione sarà:

%6≈∆

t

t

PP

per Pt ~ 10 GeV

%7≈∆

t

t

PP

per Pt ~ 100 GeV

%15≈∆

t

t

PP

per Pt ~ 1 TeV

Utilizzando anche le informazioni del traker sarà possibile raggiungere le seguenti risoluzioni:

%5.0≈∆

t

t

PP

per Pt ~ 10 GeV

%1≈∆

t

t

PP

per Pt ~ 100 GeV

%5≈∆

t

t

PP

per Pt ~ 1 TeV

14

Capitolo 2 Elettronica per il sistema di trigger delle camere a deriva per i muoni 2.1 Introduzione Il compito del sistema di trigger in CMS è di selezionare gli eventi di interesse per l’analisi fisica. Non è infatti possibile tecnicamente acquisire i dati ad un rate di 40 MHz a cui avverranno le interazioni in LHC, è quindi necessario un sistema in grado di selezionare gli eventi fino ad ottenere un rate di acquisizione finale minore di 100 Hz per l’immagazzinamento dei dati e la successiva analisi off-line. Il sistema di trigger di CMS è sostanzialmente suddiviso in due fasi di elaborazione successive, come mostrato in figura 2.1.

Figura 2.1: Flusso dei dati nel sistema di trigger di CMS.

Livello-1

Il trigger di livello-1[3] è basato su dispositivi elettronici appositamente progettati ed elabora i dati ad ogni bunch crossing (BX) al fine di ridurre il tasso di eventi fino a un massimo di 100 KHz. Siccome nessuna decisione può essere presa in 25 ns tutti i dispositivi di trigger lavorano in serie, ovvero ogni elemento esegue il proprio compito in 25 ns e trasmette il risultato all’elemento successivo. Per questo motivo il sistema di trigger è costituito da dispositivi elettronici sincroni che operano a una frequenza di riferimento (data da un segnale di clock) di 40 Mhz. Il tempo totale di latenza per il livello-1 è limitato dalla necessità di mantenere tutte le informazioni del

15

rivelatore fino a quando non viene presa una decisione. A causa dei buffer utilizzati questo limite temporale è di 3.2 µs. Il trigger di livello 1 realizza la rapida ricostruzione di oggetti singoli (tracce di muoni, jet adronici) e misura le loro proprietà fisiche (ad esempio Pt). Inoltre è in grado di ricostruire variabili globali, come l’intera energia depositata in un calorimetro o il numero totale di elettroni e muoni. Tali informazioni sono chiamate trigger primitives, sulle quali poi vengono applicate soglie per la selezione. Questo è uno dei punti fondamentali nel sistema di trigger in quanto la scelta di opportune soglie deve essere studiata per ottenere la massima efficienza e purezza nella selezione dei processi fisici da studiare. La struttura del trigger di livello-1 per CMS è riportata in figura 1.2. Come si può notare i sottorivelatori di CMS hanno una elettronica di livello-1 indipendente fino allo stadio di selezione finale.

Figura 1.2: Schema del sistema di trigger di livello 1

Alto Livello

I trigger di alto livello sono implementati da gruppi di processori commerciali che eseguono algoritmi di selezione sui risultati del Livello-1. Anche in questo caso l’analisi avviene per stadi successivi, passando i dati attraverso diversi filtri di trigger. Lo scopo è selezionare gli eventi fino ad ottenere un rate massimo di 100 Hz in modo da permettere al sistema di acquisizione di CMS di immagazzinare i dati in maniera permanente.

Gli obiettivi del trigger di muoni di Livello-1 sono l’identificazione dei muoni con la massima efficienza, la misura di Pt e l’assegnazione del muone rivelato al BX in cui è stato prodotto. Inoltre molti eventi fisici di interesse producono coppie di muoni anche molto vicine nello spazio (come dal decadimento di J/ψ) ed è quindi importante una buona efficienza di rivelazioni per muoni che attraversino anche la stessa camera nello stesso BX. Allo stesso tempo dovrà essere ridotta al minimo la percentuale di falsi muoni generati dall’algoritmo di ricostruzione. La struttura del trigger per muoni è riportata in figura 2.3. Come si può notare per CSC e DT si possono distinguere essenzialmente due parti: trigger locale che ha lo scopo di ricostruire il passaggio dei muoni nella singola stazione e la

cui elettronica è posta all’interno del rivelatore CMS; trigger regionale che ricostruisce l’intero passaggio del muone all’interno del rilevatore ed

effettua la selezione degli eventi. La sua elettronica è situata in opportune stazioni all’esterno di CMS.

16

Figura 2.3: Schema del sistema di trigger dei muoni.

2.2 Il trigger locale per le camere di tubi a deriva (DTBX) Il DTBX è il sistema di trigger che effettua la ricostruzione locale dei segmenti della traccia di un muone che attraversa una camera a deriva. L’algoritmo è suddiviso in diversi stadi di elaborazione, organizzati in una struttura logica ad albero e implementati su dispositivi appositamente realizzati, posti in un mini-crate alloggiato in ciascuna camera di tubi a deriva (vedi figura 2.4).

Figura 2.4: Fotografia dell’assemblaggio di un Mini-crate.

Compito di questo sistema è di identificare i muoni che attraversano la camera, misurare la posizione di impatto, l’angolo di curvatura della loro traiettoria ed assegnarli al corretto BX in cui sono stati prodotti. I principali requisiti fisici per il trigger DTBX sono:

Alta efficienza globale nell’individuazione dei muoni (>90%); Alta efficienza per coppie di muoni ravvicinati (fino a pochi centimetri); Precisa misura di Pt; Assegnazione di ogni muone al BX di produzione.

Inoltre l’elettronica deve soddisfare precise limitazioni: Affidabilità, in quanto non sarà accessibile durante il funzionamento di CMS; Programmabilità al fine di mettere a punto gli algoritmi; Tolleranza ai livelli di radiazione presenti in CMS; Bassa dissipazione di potenza.

Tutte queste richieste pongono stringenti limiti agli algoritmi e alla progettazione dei dispositivi. Il sistema è composto di 3 unità logiche: BTI (Bunch and Track Identifier), TRACO (Track Correlator) e TS (Trigger Server).

17

2.2.1 Il Bunch and Track Identifier Il BTI associa un segmento di traccia a un muone che attraversa una camera DT in uno specifico SL. Tale segmento contiene informazioni sulla traiettoria e il BX di produzione della particella. Ogni BTI è connesso a 9 celle dello stesso SL (figura 2.4), con i tubi parzialmente sovrapposti a quelli del BTI adiacente.

Figura 2.4: Accettanza geometrica e parametri calcolati del BTI.

L’algoritmo controlla tutte le possibili combinazioni di 4 celle compatibili con l’attraversamento di un muone con una traiettoria rettilinea, cercando eventuali corrispondenze ogni 25 ns. Il passaggio di un muone genera una correlazione dopo un tempo fissato, uguale al massimo tempo di deriva all’interno della cella, identificando così il BX di produzione. Il BTI inoltre ricostruisce un segmento di traccia calcolando la coordinata x e il parametro k = tanψ associati alla traiettoria del muone (vedi figura 2.4). I segmenti sono classificati in due modi: Trigger di alta qualità (HTRG) se la traccia è stata individuata in 4 celle allineate Trigger di bassa qualità (LTRG) se la traccia è stata individuata solo in 3 celle allineate

Questo limita l’accettanza angolare dei BTI a ψmax = ± 45.7° per HTRG e ψmax = ± 56° per LTRG. Ciascun BTI spedisce al successivo dispositivo di trigger 16 bits per ogni BX: 6 per la coordinata x (che ha una precisione di 1.25 mm), 6 per il parametro k (con una precisione di 60 mrad) e 1 per la qualità. I BTI sono stati realizzati con chip di tipo ASIC (Application Specific Integrated Circuit), e il loro numero dipende dalla dimensione della camera, variando da 50 a 70 per SL. 2.2.2 Il Track Correlator Il TRACO ha lo scopo di correlare i segmenti di traccia ottenuti dai BTI di entrambi i SL per la rivelazione nel piano r-φ di una camera DT. Ogni TRACO è collegato a 4 BTIs nel SL interno (più vicino al punto di interazione di CMS) e 12 in quello più esterno (Figura 2.5).

Figura 2.5 : Accettanza geometrica di un TRACO e parametri del segmento ricostruito nel suo sistema di riferimento

18

L’algoritmo inizia convertendo i segmenti ricevuti dalle coordinate locali dei BTI al sistema di riferimento del TRACO e quindi selezionando il miglior segmento per ogni super-layer. A questo punto il TRACO verifica se i due segmenti siano correlati tramite un apposito algoritmo e ricalcola i parametri associati al nuovo segmento ottenuto combinando i due. I dati finali che trasmette in uscita sono l’angolo radiale Φ e l’angolo di curvatura Φb (mostrati in figura 2.6) nel sistema di riferimento di CMS,

Figura 2.6: Parametri calcolati dal Track Correlator.

I segmenti correlati hanno una risoluzione migliore di quella dei BTI: 10 mrad per l’angolo di curvatura e 1mm per la posizione di impatto. Il TRACO è realizzato con chip ASIC e sono presenti da 12 ai 24 TRACOs in ogni camera DT (in base alla geometria della camera), per un totale di circa 5000 dispositivi. I TRACOs sono alloggiati a gruppi di 4 sulla board chiamata Trigger Board φ insieme a 8 BTI e un chip ASIC chiamato Track Sorter Slave (vedi § 2.2.3). 2.2.3 Il sistema Trigger Server Il Trigger Server è il sistema che seleziona i due migliori segmenti di traccia fra quelli ricostruiti da tutti i TRACO in una camera per muoni e li invia al primo dispositivo del trigger regionale (il Server Collector). La sua struttura logica è mostrata in figura 2.7.

19

Figura 2.7: Struttura generale del sistema Trigger Server. Sono mostrati tutti i dispositivi e le connessioni, oltre alle board sui quali sono montati.

Innanzitutto il Trigger Server è composto da due sottosistemi, uno per la vista longitudinale (TST) e uno per la vista trasversale (TSφ). Il TST consiste in due unità identiche (poste nelle due Theta Trigger Board) che implementano una semplice logica sui BTI. Ogni BTI invia due bits, il primo che indica una condizione di trigger mentre il secondo segnala la qualità del trigger stesso. Le informazioni dei 64 BTIs nella vista θ-z sono raggruppati in gruppi di 8 in modo da ottenere un pattern di 16 bit per le informazioni sul trigger e un altro sempre di 16 bit per la qualità del trigger. Il TSφ è stato suddiviso in due processi logici in modo da minimizzare la latenza dell’intero sistema Trigger Server:

- Il Track Sorter Slave (TSS) realizzato con chip ASIC opportunamente realizzati di tipo CMOS. E’ posto un TSS in ogni trigger board φ ed è connesso con 4 TRACO.

- Il Track Sorter Master (TSM), implementato sulla Server Board (SB). Esso è realizzato da 3 chip FPGA con tecnologia ad antifusi (chiamati pASIC): un dispositivo di scelta (TSMS) e due che agiscono come multiplexer (TSMDup e TSMDdown) .

Vediamo nel dettaglio l’algoritmo implementato dal sistema Trigger Server. Ogni TRACO trasmette un’informazione ridotta dei due migliori segmenti di traccia che ha individuato (chiamata “preview”), opportunamente codificata. Ogni TSS seleziona i due migliori preview e li trasmette al TSMS e allo stesso tempo attiva una linea di selezione del TRACO corrispondente. Questo, nel frattempo, termina il calcolo completo dei parametri del segmento di traccia e li trasmette al TSMD a cui è collegato. Il TSMS effettua una seconda fase dell’algoritmo scegliendo i due migliori preview e segnalandoli ai TSMD, i quali trasmettono i dati completi corrispondenti al Sector Collector.

20

2.3 Il sistema di trigger regionale per i tubi a deriva Lo scopo del sistema di trigger regionale per i tubi a deriva è di individuare le tracce dei muoni nel barrel di CMS e di misurare il momento traverso e la loro localizzazione in φ e η. Tutti i dispositivi di questo sistema sono alloggiati in una opportuna camera schermata all’esterno del rivelatore CMS. La struttura del sistema è mostrata in figura 2.8.

Figura 2.8: Struttura logica del sistema regionale di trigger dei tubi a deriva nei Wedge azimutali di 30°, suddivisi in direzione z in 5 settori.

Per prima cosa i dati elaborati dal DTBX sono ricevuti da due processori chiamati Drift Tube Track Finder (DTTF), rispettivamente uno per la vista φ e una per quella η. Il loro scopo è di ricostruire le tracce all’ interno di un settore azimutale di 30° all’interno di una delle wheels del barrel. La precisione finale per il DTTF pel piano φ-r è di ± 2.5° su φ e per quanto riguarda Pt dipende dal range di energia come mostrato nella tabella 2.1.

Range di Pt [Gev] Precisione [GeV] 2 ÷ 4 0.5 4 ÷ 8 1

8 ÷ 14 2 14 ÷ 20 3 20 ÷ 40 5 40 ÷ 80 10 80 ÷ 140 20 140 ÷ ∞ -

Tabella 2.1: Precisione dell’output del DTTF per differenti intervalli di Pt. Il DTTF nella vista η raccoglie le informazioni su η delle varie stazioni, e ne ricerca l’allineamento. Quindi assegna un valore per la pseudorapidità con una risoluzione del 3%[4]. L’elemento successivo del trigger regionale è il Wedge Sorter, che deve selezionare le due migliori tracce di muoni in un spicchio (wedge) di CMS formato da 5 settori che coprono gli stessi 30° nelle

21

differenti wheels del barrel e le invia al Muon Sorter. Questo riceve 24 tracce dai Wedge Sorters e invia le 4 migliori al Global Muon Trigger. 2.4 La Server Board La Server Board (vedi figura 2.9) è realizzata utilizzando un circuito stampato (PCB) a 16 strati, di dimensioni 206 × 98 mm2, che ospita nella parte superiore i chip del Track Sorter Master e i trasmettitori di tipo LVDS (vedi §2.4.3) che trasmettono le informazioni del trigger al sistema regionale. La parte posteriore della Server Board (SB) contiene gran parte dell’elettronica per il controllo dei dispositivi del mini-crate, in particolare il microcontrollore, che effettua operazioni di controllo e monitoraggio, e le memorie dove è immagazzinato il relativo firmware.

Figura 2.9: Fotografia della Server Board. Sono messi in evidenza i principali dispositivi.

La posizione della Server Board e il flusso di dati all’interno del mini-crate sono mostrati in figura 2.9b.

Figura 2.9: Struttura dell’elettronica di trigger all’interno del mini-crate.

2.4.1 Il Track Sorter Master (TSM) Il sistema è stato realizzato con 3 ACTEL A54SX32 0.3 µm FPGA con tecnologia ad antifusi (pASIC): un dispositivo di selezione (TSMS) collegato a tutti i TSS e due che agiscono come multiplexer (TSMDup e TSMDdown), come mostrato in figura 3.7.

22

Figura 2.10: Architettura del sistema TSM.

E’ presente un sistema TSM in ogni camera DT, per un totale di 250 chip TSMS e 500 chip TSMD nell’intero rivelatore a muoni del barrel. Questo è un numero limitato per giustificare lo sviluppo di chip di tipo ASIC. Inoltre l’utilizzo di FPGA ha un vantaggio: lo stesso tipo di dispositivo può essere utilizzato sia per il TSMS che per i TSMD, dato che l’architettura scelta richiede un numero di pin comparabile per entrambi i circuiti integrati. Nonostante ciò la tecnologia FPGA (Field Programmable Gate Array) standard è sfavorita a causa della sua bassa tolleranza alle radiazioni, che può facilmente portare alla cancellazione o al deterioramento della logica programmata. Una soluzione è l’utilizzo di una nuova tecnologia, chiamata antifuse-FPGA o pASIC (ASIC programmabili). Sono basati su una tecnologia al silicio detta antifuse: i moduli di logica al silicio posti in una griglia ad alta densità sono collegati utilizzando da 3 a 4 strati di metallo, dove gli elementi di interconnessione fra metallo e metallo, realizzati con silicio amorfo (gli antifusi), sono posti fra gli strati di metallici. Gli antifusi sono normalmente circuiti aperti e, quando programmati, creano una connessione permanente con bassa impedenza. Una volta programmata, la configurazione del chip diventa permanente, trasformandolo in pratica in un ASIC. Visto che il TSM è il collo di bottiglia del sistema DTBX è stata particolarmente studiata la sua robustezza e affidabilità. Questo ha portato allo sviluppo di un sistema con 3 chip ognuno dei quali è alimentato e attivato dal microcontrollore separatamente. Quando uno di essi è spento, anche le linee di I/O del chip vengono disconnesse tramite circuiti integrati chiamati isolatori. Essi sono posti in funzione dal microcontrollore nel caso in cui individui un sovraccarico di corrente causato dal guasto di uno dei tre dispositivi pASIC. In questo caso è prevista una distinta modalità di funzionamento, detta di Back-Up, che entra in funzione in caso di guasto e successivo spegnimento di un chip. Se il malfunzionamento è avvenuto sul TSMS allora i due TSMD selezionano la traccia migliore in modo indipendente, ognuno nella propria metà della camera. Se anche un TSMD è disattivato allora la modalità di Back-Up continua a funzionare, con la perdita di informazioni di solo metà della camera. Inoltre il microcontrollore può cambiare la modalità di funzionamento in modo programmabile agendo sui segnali di alimentazione. 2.4.2 Sistemi di controllo L’accesso ai chip per il monitoraggio, la configurazione e il controllo è possibile in due modi indipendenti: tramite un protocollo standard chiamato Jtag[5] e uno realizzato ad-hoc chiamato Parallel Interface (PI). Il Jtag è un protocollo IEEE standard che rende possibili le operazioni di lettura e scrittura sui registri interni del sistema, il campionamento dei segnali di I/O durante il funzionamento e la

23

trasmissione di pattern opportuni sulle linee di uscita di un dispositivo. Per questa ragione il protocollo Jtag non è solamente un sistema di monitoraggio e configurazione, ma anche uno strumento in grado di verificare le connessioni fra i chip all’interno delle board. Il Jtag quattro linee seriali dedicate (2 di trasmissione e due di controllo), quindi si può accedere ai registri del chip anche mentre il sistema è in funzione. Il limite del Jtag è la frequenza con cui opera (∼100Hz) e il fatto che sia seriale: un’operazione tipica dura alcuni millisecondi. La figura 2.11 mostra la rete Jtag per i tre chip del TSM: la rete può essere configurata per funzionare solo sui chip alimentati, tramite l’utilizzo di interruttori isolatori poste sulle le linee di gestione delle alimentazioni. Il sistema PI (Parallel interface) è invece stato sviluppato appositamente per il sistema di trigger di CMS. Il suo principio di base è di utilizzare i bus di trasmissione dei dati di trigger (opportunamente realizzati in modo da essere bidirezionali), per la comunicazione fra i vari dispositivi. Questo implica che durante questo tipo di comunicazione il sistema di trigger deve essere off-line. Il protocollo PI opera tramite indirizzamento dei dispositivi; ogni dispositivo risponde solo se riconosce l’opportuno indirizzo interno, leggendo o scrivendo i registri indicati dai dati successivi presenti nella comunicazione. Il PI può essere usato per configurare i chip all’accensione del sistema o per controllo durante i periodi di pausa nel ciclo di funzionamento di LHC. Il sistema PI è più veloce del Jtag, infatti trasmette 8 bit di dati in parallelo a una frequenza di 1 MHz, ma il suo limite è il funzionamento esclusivamente off-line a differenza del Jtag. Quest’ultimo è quindi utilissimo per la verifica delle connessioni fra i chip e tra schede, rendendolo un potente sistema per la verifica dell’integrità dei dispositivi. 2.4.3 Trasmissione del segnale al sistema di trigger regionale La trasmissione fra la Server Board, posta all’interno del mini-crate, e il Sector Collector, che rappresenta la prima fase dell’elettronica del Trigger regionale, posto nelle strutture che circondano il rivelatore (vedi figura 2.13), è stata realizzata utilizzando la tecnologia di trasferimento LVDS[6] che è caratterizzata da un basso consumo di energia (in particolare nel confronto con i dispositivi ottici) e alta capacità di trasmissione. Il dispositivo posto sulla server board è in grado di serializzare 10 bit in input in parallelo alla frequenza di 40 MHz, a cui vengono aggiunti due bit che segnalano l’inizio e la fine del pacchetto di dati, per una frequenza totale di trasferimento di 480 MHz. I bit di riferimento sono utilizzati dal deserializzatore per ricostruire i dati. La distanza fra la Server Board e il Sector Collector, coperta da cavi Ethernet FTP, dipende dalla posizione della camera DT e sarà compresa fra 10 e 40 metri. Per il trasferimento dei dati sono necessari due cavi per ogni Server Board.

Figura 2.13: Struttura schematica del collegamento fra le 4 Server Board dello stesso settore azimutale e il Sector Collector posto in un crate VME all’esterno dell’esperimento

24

Capitolo 3

Verifiche di qualità della produzione in serie 3.1 Tipologia e finalità dei test Un requisito fondamentale per l’elettronica del sistema di trigger di CMS è l’affidabilità dei suoi componenti, poiché i dispositivi non sono accessibili durante il funzionamento di LHC e non sarà possibile riparare i loro eventuali guasti od effettuare sostituzioni. Per la server board questo problema diventa critico in quanto, essendo l’ultimo dispositivo della DBTX, funge da collo di bottiglia per l’intero flusso di dati e un suo malfunzionamento porterebbe alla perdita delle informazioni di trigger di un’intera camera di tubi a deriva. Come visto nel paragrafo 2.4.1 queste considerazioni hanno portato, in fase di progettazione, allo sviluppo di un dispositivo composito, in grado di funzionare anche in modalità di Back-Up in caso di guasto in una delle sue componenti. E’ però importante che al momento dell’istallazione del dispositivo si abbia la certezza del suo corretto funzionamento, e a questo fine sono stati sviluppati alcuni tipi di test da effettuare sulle board:

- Test statico, che serve a verificare le connessioni all’interno della board tramite il protocollo standard Jtag;

- Test Dinamico, per controllare il funzionamento e la stabilità della board a 40 MHz (frequenza a cui opererà in CMS);

- Burn-in il cui scopo è individuare ed eliminare le schede soggette a mortalità infantile dovuta a difetti dei componenti utilizzati.

3.2 Test Statici I test statici sono test di connettività effettuati tramite il Jtag. Il Jtag (come visto nel paragrafo 2.4.2) è un protocollo standard che permette di campionare i segnali di input e pilotare quelli di output di un chip tramite operazioni di lettura e scrittura di un opportuno registro interno (boundary scan register) opportunamente implementato. Il test è chiamato statico poiché il Jtag è basato su una comunicazione seriale a ~100 KHz, molto più lento in lettura e scrittura dei 40 MHz a cui opera la server board. Obiettivo di questo test è la verifica della connettività di ogni singola linea di trasmissione di dati e l’individuazione di eventuali cortocircuiti, problematici sia perché possono alterare il segnale sia perché possono portare ad un guasto definitivo della scheda. 3.2.1 Apparato Sperimentale In Figura 3.1 è mostrata una raffigurazione schematica dell’intero sistema di test. Il cuore del sistema è un crate VME, controllato da una board VME con una CPU. Al suo interno sono presenti 4 VME board appositamente progettate, chiamate pattern units[7], che permettono di inviare e ricevere dati (fino a 128 bit ciascuna) fino a 100 MHz. Tre sono utilizzate per l’invio di pattern e una funge da modulo di acquisizione in uscita. I pattern in ingresso sono trasmessi a una board opportunamente realizzata chiamata adapter board, che riproduce il set up dell’elettronica del mini-crate, simulando le schede che trasmetteranno dati alla server board sia nell’ordine dei segnali che nelle caratteristiche elettriche di trasmissione. L’output della SB viene trasmesso utilizzando segnali di tipo LVDS serializzati (12 bit a 40 MHz per un frequenza di trasmissione risultante di 480 MHz) attraverso due cavi lunghi fino a 40 metri (che corrisponde alla massima distanza fra il mini-crate e il dispositivo di trigger posto esternamente all’esperimento CMS). Questi dati vengono raccolti da una scheda chiamata Trigger Link che li deserializza a 40 Mhz e li trasmette alla pattern unit di

25

Figura 3.1: Rappresentazione schematica dell’apparato utilizzato per il test sulle Server Board, con indicati i percorsi e i tipi dei segnali. acquisizione da dove sono accessibili tramite PC. La scheda Trigger Link riproduce la funzionalità del Sector Collector in ricezione dei dati provenienti dalla SB, costituendone a tutti gli effetti un primo prototipo. Quindi da questo set up sperimentale viene ricostruito l’intero percorso dei dati a partire dalle uscite delle Trigger Board per arrivare all’ingresso del Sector Collector. In figura 3.2 è possibile vedere più in dettaglio una fotografia dell’apparato sperimentale con le diverse schede utilizzate.

Figura 3.2: Fotografia dell’apparato sperimentale per il test sulle Server Board.

26

3.2.2 Svolgimento dei test Prima dell’inizio del test su ogni scheda è stata effettuata un’ispezione visiva, alla ricerca di guasti evidenti come difetti di saldatura dei dispositivi o connettori rotti. Al fine di controllare tramite PC il microcontrollore è stato realizzato una scheda di interfaccia seriale che viene collegato nella parte inferiore della board e attraverso il quale viene anche inviato il segnale di clock a 40 MHz (figura 3.3).

Figura 3.3: Set Up sperimentale

Sul PC è disponibile un software automatico per il controllo della scheda e la gestione del test. Questo consiste nell’esecuzione di diverse procedure:

- Una verifica generale della funzionalità della scheda: viene visualizzato lo stato delle alimentazioni ai vari chip (On/Off) e controllati i sistemi di controllo Parallel Interface e Jtag, verificandone l’accesso ai chip e l’azzeramento dei registri. Un esempio del risultato del test, come riportato a video dal programma di gestione, è proposto in figura 3.4.

Figura 3.4: Esempio di riassunto del test di verifica delle alimentazioni e dei sistemi di controllo della ServerBoard.

- Un test per verificare la funzionalità delle resistenze di “pull-up” poste in diverse linee di

trasmissione. Queste servono a mantenere a un livello logico alto questi segnali quando non sono pilotati (ad esempio nel caso di schede non connesse o spente). Inoltre ad alcuni bits a livello logico alto corrisponde il cosiddetto pattern nullo, ovvero che viene ignorato dall’algoritmo eseguito dalla Server Board. Il risultato standard per questo test è visibile in figura 3.5. Nella finestra di output lo stato dei bit è riportato, così come sarà in tutti i successivi test, in notazione esadecimale. Questa

Scheda di interfaccia seriale

27

notazione è molto comoda in elettronica, in quanto permette di rappresentare ogni gruppo di quattro bit con una singola cifra. Se, ad esempio, prendiamo 1111 esso corrisponde a quattro bit successivi a livello logico alto (notazione binaria) e viene indicato in notazione decimale come 23+22+21+1= 15, ovvero F in esadecimale.

Figura 3.5: Esempio di riassunto del test di verifica di funzionalità delle resistenze di pull-up.

- Una serie di test di connessione della singola trigger board: l’idea è quella di controllare la

connettività di ogni singolo bit ed eventuali cortocircuiti con i bit adiacenti dello stesso bus di segnali. Per questo in ogni test vengono prima accesi tutti i bit dispari (che corrisponde in esadecimale a una serie di 5), e poi viene ripetuto accendendo i bit pari (ovvero una serie di A). Vengono effettuati sei test di questo tipo che differiscono nel fatto che in ognuno viene forzata in uscita alla scheda (impostando tramite il Jtag nei registri dei chip opportune opzioni dell’algoritmo) la selezione dei dati di una delle 6 Trigger Board in ingresso, in modo da verificare anche l’algoritmo e la funzionalità dei chip. Il risultato di un test su una Server Board è mostrato in Figura 3.6.

Figura 3.6 Esempi di riassunto del test di connettività della singola board.

- Una serie di test sempre di connessione come i precedenti ma effettuati con tipi di pattern

diversi. Questa procedura viene eseguita per meglio identificare i cortocircuiti sui connettori dato che l’ordine dei segnali dello stesso bus è diverso da quello sui chip. Un esempio di schermata contenente il riassunto del risultato del test è mostrato in figura 3.7.

28

Fig. 3.7: Esempio di riassunto del test di connettività effettuato con pattern adeguati a riscontrare cortocircuiti sui

connettori.

- Un’ultima serie di test che servono a controllare la trasmissione dei segnali dall’uscita dei chip ai dispositivi serializzatori. Per fare questo vengono pilotati tramite Jtag i segnali di uscita dei chip, con la solita alternanza pari-dispari, e letti in uscita dall’apposita pattern unit, dopo essere stati trasmessi su due cavi in uscita alla Server Board.

3.2.3 Risultati I risultati ottenuti dal test di connettività effettuato su un primo lotto di 50 Server Board sono riportati in figura 3.8. Essi riassumono la percentuale di schede funzionanti e di quelle in cui si sono invece individuati alcuni difetti.

Figura 3.8: risultati generali del test di connettività

Come si può notare il numero delle schede difettose è elevato, circa il 28%, il che implicherebbe o la costruzione di un numero eccessivo (circa 320) di Server Board per ottenere le 250 necessarie o l’effettuazione di un lungo lavoro di riparazione. Diventa quindi importante capire l’origine dei malfunzionamenti. Il passo successivo è stato quindi l’analisi dei vari guasti riscontrati. Per questo si utilizzano le informazioni date dal programma come riassunto conclusivo dei diversi test e che fornisce indicazioni su come localizzare il problema. L’individuazione del difetto avviene sia visivamente (con l’ausilio di lenti di ingrandimento e microscopi) sia con l’aiuto di un tester, per verificare la

29

connettività delle linee di dati e i cortocircuiti. In particolare, tramite il microscopio (vedi figura 3.9), è stato possibile individuare visivamente e fotografare gran parte dei malfunzionamenti.

Figura 3.9: Set up per l’individuazione e la documentazione dei problemi sulle Server Board.

Sulle 14 schede difettose sono stati individuati 16 problemi, che possono essere classificati in quattro categorie, la cui incidenza è mostrata in figura 3.10.

Figura 3.10: Incidenza dei problemi riscontati.

Possiamo ora esaminare in dettaglio i diversi tipi di difetti : 1) Cortocircuiti sui chip isolatori

I chip isolatori sono presenti sulla Server Board per rendere possibile la sconnessione di alcuni bit in caso di malfunzionamento di un chip per non compromettere l’intera board. Il piccolo passo dei piedini di questi chip ha fatto sì che fossero spesso soggetti a cortocircuiti, dovuti a microscopiche imperfezioni nella procedura di saldatura del componente. Il problema si

30

manifestava nel test di connettività con coppie adiacenti di segnali nello stesso bus che rimanevano allo stesso livello logico pur essendo pilotati a livelli diversi. In figura 3.11 sono proposte le fotografie scattate a componenti in cui sono stati individuati cortocircuiti. Appaiono evidenti gli eccessi di stagno che li provocano, creando una connessione tra pin adiacenti.

Figura 3.11 Esempi di cortocircuiti sui chip isolatori

2) Difetti nel montaggio di componenti resistivi, in particolare quelli dedicati al pull-up di alcuni

segnali. Come si è visto discutendo il secondo punto del test di connettività, alcuni segnali, se non pilotati dall’esterno, sono mantenuti in uno stato definito dalle resistenze di pull-up. Nel test si sono più volte trovati a livello logico basso segnali che dovevano essere a livello alto e il problema è stato sempre individuato nell’incorretto piazzamento delle resistenze di pull-up

31

stesse. In due casi il problema era legato a saldature difettose (Figura 3.12 A e B), invece in un altro era dovuto a un errato posizionamento delle resistenze (Figura 3.12 , immagine C).

Figura 3.12: Difetti sulle resistenze di pull-up. In A e B le resistenze non sono saldate a una estremità. In C le due resistenze cerchiate in rosso sono saldate in posizione errata, nel cerchio verde una resistenza correttamente posizionata.

3) Connettori parzialmente non saldati

Le Trigger Board trasmettono i dati alla Server Board utilizzando in totale 12 cavi. Si è notato che alcuni pin alla base dei connettori in cui essi sono inseriti sono risultati non saldati, difetto che nel test veniva identificato da segnali che apparivano non pilotabili. Si è potuto altresì notare come questo tipo di problemi potrebbe essere critico per il test da noi eseguito: spesso il problema infatti appariva solo su uno o due bit, ma poi si scopriva che i pin non saldati erano molto più numerosi. Questo è dovuto al fatto che a volte, nonostante l’assenza di saldatura, era ugualmente presente un falso contatto, ma una connessione di questo tipo a 40 MHz potrebbe non funzionare. Dato che, come si vedrà, ogni scheda che ha superato il test statico non ha dato problemi in quello dinamico (vedi 3.3.2), questo ci porta a concludere che, nonostante con questo test non abbiamo individuato tutti i singoli pin non saldati, abbiamo ugualmente trovato con alta efficienza i connettori con questo tipo di problema. In figura 3.13 sono mostrati alcuni connettori con l’assenza di saldature messa in evidenza.

4) Malfunzionamenti generali Per due schede non è stato possibile trovare specifici errori. Questo, in un caso, è dovuto al non funzionamento del sistema Jtag, che quindi ha impedito l’esecuzione del test, mentre nell’altro molto probabilmente vi sono malfunzionamenti sui chip del sistema di controllo della Server Board.

A B

C

32

Figura 3.13: Esempi di connettori con Pin parzialmente non saldati.

Caratteristica comune dei problemi delle prime 3 categorie è quello di ripresentarsi spesso sullo stesso elemento, ad esempio i sei problemi di connettori con pin parzialmente non saldati ricorrono sempre sugli stessi 3 connettori. E’ quindi possibile ottenere una “mappa” della scheda con in evidenza i punti più sensibili a difetti.

Figura 3.14: Zone della scheda dove sono stati riscontrati i malfunzionamenti

In conclusione, delle 14 schede malfunzionanti, per 12 si tratta solo di problemi localizzati nel processo di fabbricazione (che sono stati comunicati al costruttore al fine di minimizzare il numero di schede eventualmente da riparare nel lotto di produzione finale), mentre solo due, pari al 4% dell’intero lotto, hanno presentato un malfunzionamento generale. Questo dato è compatibile con l’affidabilità del 96% garantita dal produttore.

33

3.3 Test Dinamici Nei test dinamici la scheda viene fatta funzionare a 40 MHz (alle condizioni di lavoro previste in CMS). Quindi, mentre i test statici,come si è visto, sono strumenti per individuare difetti nel montaggio delle scheda, quelli dinamici permettono una verifica completa del dispositivo e della logica dei chip che lo costituiscono. 3.3.1 Descrizione dei test Per effettuare i test dinamici è stato utilizzato lo stesso apparato sperimentale descritto in 3.2.1. I due principali strumenti del programma per realizzare questo tipo di test sono:

- Un generatore random affidabile, con il quale generare i pattern da inviare alla SB tramite le patter unit;

- Un emulatore, ovvero un software in grado di riprodurre la risposta attesa della SB ai pattern inviati.

Fattore critico per la realizzazione di un test dinamico a 40 MHz è la sincronizzazione fra la fase dei segnali mandati dalle pattern unit di input e l’ingresso della scheda, e, simmetricamente, la fase fra i dati in uscita alla scheda e la pattern unit di output. Una sincronizzazione opportuna permette infatti ai dispositivi di campionare correttamente i segnali in ingresso. Allo scopo di determinare la fase adeguata, il programma effettua il test denominato delay scan. Questo test consiste nella generazione di un piccolo pacchetto di pattern (attorno alla ventina) che viene continuamente ripetuto variando via via la fase (mediante ritardi programmabili) dei segnali sulle pattern units di trasmissione e di acquisizione fino a ottenere una mappa di tutte le possibili combinazioni ed effettuando i confronti con i risultati previsti dall’emulatore. Il risultato è visualizzato graficamente come mostrato in figura 3.15.

Figura 3.15: Schermata di riassunto grafico dei risultati del test di delay scan.

34

Nel grafico i colori rappresentano simbolicamente il numero di errori dei dati reali rispetto alla risposta dell’emulatore (il verde chiaro rappresenta il perfetto accordo). Alla luce dei risultati del delay scan è quindi possibile individuare una regione di lavoro in cui i dispositivi sono opportunamente sincronizzati. In seguito è stato effettuato il test vero è proprio, costituito dalla trasmissione di pacchetti di 4000 pattern a 40 MHz, per un totale di circa 1·106 pattern random e dalla verifica dei dati elaborati dalla scheda con il risultato atteso fornito dall’emulatore. La prova è stata considerata superata se al suo termine non si era verificato nessun errore. 3.3.2 Risultati Tutte le schede risultate funzionanti al test di connettività che sono state sottoposte al test dinamico hanno superato il test senza nessun errore. Questo è un risultato molto interessante in quanto significa che una volta effettuato il test statico di connettività si ha già un’ottima indicazione del funzionamento generale della server board. Prima del lotto analizzato in questa tesi era stata realizzata una pre-produzione di 35 schede volta a convalidare il layout della Server Board. Anche queste schede erano state sottoposte a test intensivi sia di connettività sia di funzionamento a 40 MHz. I risultati dei test effettuati per i due lotti sono riassunti in tabella 3.1.

Lotto di prova 1° serie lotto finale Totale N° schede 35 50 85

N° schede utilizzabili dopo il test statico

27 48 75

N° schede sottoposte al test dinamico (esito

sempre positivo)

10 28 38

Tabella 3.1: Risultati dei test statici e dinamici sulle Server Board finora prodotte. Fra la serie di pre-produzione e il primo lotto della serie finale sono state sottoposte al test dinamico 38 schede, come visto tutte con esito positivo. Utilizzando la statistica binomiale si può calcolare (al 95% di livello di confidenza) la massima probabilità di avere schede non funzionanti al test dinamico in base ai dati osservati (ovvero 38 schede funzionanti su 38), che risulta del 7.5%. Applicando questo probabilità di fallimento al test dinamico alle schede per cui è stato effettuato solo quello statico (37) possiamo stimare che si possano al massimo trovare 3 schede che diano problemi quando testate alla frequenza di operatività di 40 MHz. Possiamo allora effettuare una stima sulla produzione massiva delle Server Board. Il lotto finale attualmente previsto e ancora da produrre comprenderà altre 200 schede, di queste ci aspettiamo, stimando un’affidabilità del 96% verificata nel test statico (§3.2.3) e garantita dal produttore, che ne rimangano nella condizione più sfavorevole 192 funzionanti. Di queste non più di 15 dovrebbero dare problemi durante un test dinamico. In conclusione sommando le stime di schede funzionanti (74 fra quelle già testate, 177 fra quelle del lotto finale) si ottiene al 95% di livello di confidenza 249 schede utilizzabili per l’esperimento. Dato che nell’esperimento ne serviranno 250, per avere un numero accettabile di dispositivi, inclusi quelli da utilizzare come riserva (“spares”), sarà necessario produrne un numero maggiore o procedere alla riparazione di quelle difettose. 3.4 Burn-in Il burn-in è una procedura standard in microelettronica che ha lo scopo di garantire l’affidabilità dei dispositivi utilizzati. L’affidabilità di un oggetto (elemento, circuito o sistema) rappresenta la sua probabilità di sopravvivenza funzionale in condizioni operative specificate (per esempio la

35

temperatura) dopo un tempo t da quando ha iniziato a funzionare. Una quantità legata all’affidabilità è la frequenza di guasti (failure rate) λ(t) per unità di tempo. In genere, per i componenti elettronici, l’andamento nel tempo di λ non è costante ma ha la caratteristica forma (bathtube) mostrata in figura 3.16.

Figura 3.16: Andamento della frequenza dei guasti λ(t) nel tempo.

La parte iniziale della curva (mortalità infantile) dipende da difetti di fabbricazione o di assemblaggio che si manifestano nel primo periodo di funzionamento (anche diversi anni). La parte successiva costituisce il ciclo di vita normale del componente (della durata di numerosi anni) ed è caratterizzata da un basso rate di guasti casuali (random failures). La parte finale, con una crescita lenta e graduale di λ, rappresenta l’invecchiamento o il deterioramento dei componenti. Per migliorare l’affidabilità di un dispositivo quali le nostre Server Board sarebbe quindi necessario eliminare quelle soggette a mortalità infantile. Dato però che, in condizioni standard, ciò è inattuabile in quanto implicherebbe far funzionare e monitorare le schede per anni, si utilizza in alternativa una procedura chiamata burn-in. Il burn-in è un test standard in microelettronica. Esso si basa sul fatto che si può dimostrare che i processi che portano al degrado di un dispositivo elettronico presentano una frequenza (R) che dipende dalla temperatura secondo la formula di Arrhenius:

KTEA

AeTR−

=)( Dove: − EA è l’energia di attivazione per i possibili guasti, che per un dispositivo CMOS è compresa fra

0.4-0.5 eV; − A è una costante ricavabile empiricamente; − T è la temperatura in gradi Kelvin; − K è la costante di Boltzmann (8.62 10-5 eV/K).

Tramite questa formula è possibile effettuare il rapporto fra i rate R a due temperature differenti ed individuare il fattore di scala temporale presente fra di loro:

== 12

2

111

2

1

)()( TTK

E

KTE

KTE

A

A

A

e

Ae

AeTRTR

3.4.1 Set up sperimentale Per effettuare il burn-in abbiamo utilizzato un’incubatrice in grado di mantenere una temperatura costante con una sensibilità di 0.1°C. Il set up sperimentale è mostrato in figura 3.17.

36

Figura 3.17: Set up sperimentale del burn-in

La temperatura e la durata del test vengono fissati tramite il timer posto sull’incubatrice stessa. Un PC esterno, tramite porta seriale, campiona la temperatura registrata dal sensore dell’incubatrice e, tramite un opportuno programma, crea il grafico dell’andamento della temperatura nel tempo (vedi figura 3.18), che permette di verificare che le condizioni del test rimangano invariate. All’interno dell’incubatrice sono poste 2 server board alimentate alle tensioni standard. Come nei test precedenti è possibile collegarsi al microcontrollore delle schede da un computer esterno tramite un cavo collegato una scheda di interfaccia seriale.

Figura 3.18: Grafico dell’andamento della temperatura all’interno dell’incubatrice nel tempo.

Timer

Alimentatore

PC per il campionamento della temperatura

PC per l’accesso al microcontrollore

Server Board

37

Il test è stato effettuato su un periodo di 160 ore alla temperatura di 60°C. Tenendo conto che la temperatura prevista di funzionamento del dispositivo all’interno del mini-crate raffreddato ad acqua di CMS è di ~30°C, utilizzando la formula di Arrhenius si ottiene un fattore:

7.4)303()333( 333

13031

==°°

KEA

eKRKR

Quindi alle nostre 160 ore corrispondono ~752 ore (circa un mese) in condizioni di lavoro standard. La scelta di simulare con il test solo un mese di funzionamento, rispetto ai tempi di oltre un anno caratteristici della mortalità infantile, è dovuta al fatto che i dispositivi posti sulla Server Board sono di tipo commerciale e sono quindi già stati testati separatamente, mentre ora viene cercata una stima di affidabilità dell’intero dispositivo. Inoltre come temperatura sono stati scelti 60°C perché i componenti, appunto di tipo commerciale, sono garantiti solo fino a una temperatura di funzionamento di 80°C. Durante il test, a intervalli regolari (2-3 volte al giorno), un operatore verificava lo stato di alimentazione dei chip della Server Board. Questo è sufficiente in quanto ci si aspettano solo guasti tali da portare ad una rottura definitiva di un componente, individuabile da una anormale variazione nella corrente assorbita dal dispositivo. 3.4.2 Risultati Sono state effettuate due settimane di test, per un totale di 4 schede Server Board sottoposte al burn-in. Tutte le quattro schede non hanno presentato alcun problema, continuando a operare normalmente durante l’intera durata della prova. Sebbene 4 schede siano ancora una statistica insufficiente, questa prima fase del test ci ha permesso di raggiungere alcuni risultati importanti. In particolare ci hanno permesso di verificare la funzionalità e l’affidabilità dell’intero apparato sperimentale durante l’intera durata del test, che verrà in seguito utilizzato per tutte le schede del lotto finale. Inoltre né durante l’intera durata del test, né in una verifica successiva effettuata su ogni singola scheda, si è notata alcuna variazione nella corrente assorbita. Questo mostra come il dispositivo non risenta apparentemente di nessun effetto durante il periodo del burn-in, indicando che per le schede non soggette a mortalità infantile il test non sembra alterare le proprietà di funzionamento.

38

Conclusioni Il lavoro presentato in questa tesi è basato sui test effettuati sul dispositivo elettronico chiamato Server Board al fine di valutarne l’affidabilità. Tale dispositivo fa parte del sistema locale di trigger del rivelatore di muoni dell’esperimento CMS, che entrerà in funzione presso il collisionatore LHC, attualmente in costruzione al CERN di Ginevra. Il sistema di trigger ha il compito di selezionare, tra tutti gli eventi prodotti, quelli interessanti per i successivi studi di fisica, in modo da ottenere una frequenza di eventi selezionati compatibile con la tecnologia corrente per l’acquisizione dei dati. L’affidabilità della Server Board è importante essendo un elemento del sistema locale di trigger collocato all’interno di CMS e quindi inaccessibile durante il funzionamento di LHC. In particolare, essa risulta essere un collo di bottiglia, visto che una singola Server Board elabora e trasmette le informazioni di trigger di un’intera camera di tubi a deriva, e quindi un suo malfunzionamento porterebbe alla perdita di una sezione non trascurabile del rivelatore. Sono stati effettuati tre tipi di test su un lotto della produzione finale composto da 50 schede. Il primo test è stata una verifica statica della connettività della scheda, effettuata tramite un protocollo di controllo chiamato Jtag, che è uno standard nella progettazione di circuiti integrati. Una prima fase del test ha messo in luce la presenza di 14 schede malfunzionanti, sulle quali sono stati individuati e documentati i singoli guasti. Questi si sono generalmente rivelati essere problemi localizzati nel processo di fabbricazione, essi sono stati comunicati al costruttore al fine di minimizzare il numero di schede eventualmente da riparare nel lotto di produzione finale. Alla fine del test le schede che presentavano danni gravi probabilmente non riparabili sono risultate essere il 4% del lotto, risultato in linea con l’affidabilità del 96% garantita dal produttore. Nel secondo test, di tipo dinamico, è stata verificata la funzionalità della Server Board alla frequenza di 40 MHz a cui dovrà operare all’interno del sistema di trigger di CMS. Il test consisteva nel trasmettere pattern casuali alla scheda e di confrontare i dati elaborati da essa con quelli attesi, ottenuti tramite un emulatore software appositamente disegnato così da riprodurre il corretto funzionamento del dispositivo. Sono state sottoposte a questo test 38 schede e tutte lo hanno superato, permettendoci di ottenere una stima sull’affidabilità dei risultati del test statico. In particolare,dai risultati di entrambi i test, è stato possibile effettuare una stima sul numero di dispositivi che si dovrà produrre al fine di ottenere quelle necessarie per l’esperimento. Si è concluso che il numero previsto di dispositivi da produrre non garantirebbe un adeguato numero di schede di riserva (“spares”), ottenendo così un’indicazione a prevedere la produzione di un numero maggiore (∼10%). Il terzo test, chiamato burn-in, è dedicato all’identificazione di dispositivi potenzialmente malfunzionanti nella prima parte del loro periodo operativo (mortalità infantile). Il test si basa sul fatto che i processi che portano al degrado di un dispositivo elettronico avvengono con una frequenza che varia con la temperatura di esercizio (legge di Arrhenius). Nel nostro caso è stato studiato il funzionamento delle Server Board per un periodo di 160 ore alla temperatura di 60°. La prima fase del test, effettuata su 4 schede, che hanno tutte dato esito positivo, ha principalmente permesso di verificare la stabilità e l’affidabilità del sistema di test che verrà utilizzato per tutte le Server Board.

39

BIBLIOGRAFIA: [1] Dean Bomeštar. SM Higgs Search at LHC. CMS TN/95-156. Novembre 1995. [2] CMS Coll, The Compact Muon Solenoid, Technical Proposal. CERN/LHCC 94-38, 15

Dicembre 1994. [3] CMS Coll., The Trigger and Dat Acquisition Project. Volume 1, The Level-1 Trigger,

Technical Design Report,.CERN/LHCC 2000-038, CMS TDR 6.1, 15 Dicembre 2000. [4] I. D’Antone et al. Track-Segment Sorting in the Trigger Server of a Barrel Muon-Station in

CMS, 1996. CMS Technical Note 1996/078. [5] IEEE Std 1149.1-1190. IEEE Standard Test Access Port and Boundary-Scan Architecture. [6] National Semiconductor, An overview of LVDS technology. Application Note 971, Luglio

1998 [7] G. M. Dallavalle et al. Pattern Unit for high throughput device testing. In Proocedings of the

Fourth Workshop on Electronics for LHC Experiments, CERN LHCC 93-36, page 291, 1998.