Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17...

14
Benigno Gobbo – INFN Trieste Benigno Gobbo – INFN Trieste 1 CSN 1 CSN 1 17 settembre 2002 17 settembre 2002 Stato della Farm di Trieste Stato della Farm di Trieste CSN 1 CSN 1 17 settembre 2002 17 settembre 2002 Benigno Gobbo Benigno Gobbo INFN Sezione di Trieste INFN Sezione di Trieste [email protected] [email protected]

Transcript of Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17...

Page 1: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

Benigno Gobbo – INFN Trieste Benigno Gobbo – INFN Trieste 11CSN 1CSN 117 settembre 200217 settembre 2002

Stato della Farm di TriesteStato della Farm di Trieste

CSN 1CSN 1

17 settembre 200217 settembre 2002Benigno GobboBenigno Gobbo

INFN Sezione di TriesteINFN Sezione di Trieste

[email protected]@cern.ch

Page 2: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 2217 settembre 200217 settembre 2002

HardwareHardware

11 Old clients:11 Old clients:MSI 694D ProMSI 694D Pro

Dual PIII 800 MhzDual PIII 800 Mhz2 x 20 GB ATA Disks2 x 20 GB ATA Disks

512 MB RAM512 MB RAM

11 Old clients:11 Old clients:MSI 694D ProMSI 694D Pro

Dual PIII 800 MhzDual PIII 800 Mhz2 x 20 GB ATA Disks2 x 20 GB ATA Disks

512 MB RAM512 MB RAM

19 New clients:19 New clients:Abit VP6Abit VP6

Dual PIII 1000 MhzDual PIII 1000 Mhz2 x 40 GB ATA Disks2 x 40 GB ATA Disks

512 MB RAM512 MB RAM

19 New clients:19 New clients:Abit VP6Abit VP6

Dual PIII 1000 MhzDual PIII 1000 Mhz2 x 40 GB ATA Disks2 x 40 GB ATA Disks

512 MB RAM512 MB RAM

3com 49003com 49003com 39003com 3900

Kvm switchKvm switch

Server SGE, DHCP, BServer SGE, DHCP, BB, …B, …Asus CUR-DLSAsus CUR-DLSDual PIII 800 MHzDual PIII 800 MHz2 x 30 GB ATA Disks2 x 30 GB ATA Disks512 MB RAM512 MB RAMGA620 G gigabitGA620 G gigabit

EIDE disk serverEIDE disk serverIntel L440 GX+Intel L440 GX+Dual PIII 700 MHzDual PIII 700 MHz2 x 15 GB ATA disks2 x 15 GB ATA disks14 x 75 GB ATA disks14 x 75 GB ATA disks6 x 80 GB ATA disks6 x 80 GB ATA disksGA620 G gigabit GA620 G gigabit

EIDE disk serverEIDE disk serverIntel STL2Intel STL2Dual PIII 866 MHzDual PIII 866 MHz2 x 20 GB ATA disks2 x 20 GB ATA disks20 x 80 GB ATA disks20 x 80 GB ATA disksGA620 G gigabit GA620 G gigabit

Tape LibraryTape LibrarySTK L40 20 slotSTK L40 20 slot2 x IBM Ultrium2 x IBM Ultrium

Tape/disk serverTape/disk serverDell PowerEdge 4400Dell PowerEdge 4400Dual Xeon 1 GHzDual Xeon 1 GHz2 x 36 GB SCSI RAID12 x 36 GB SCSI RAID16 x 73 GB SCSI RAID06 x 73 GB SCSI RAID0

SCSI disk serverSCSI disk serverSun Blade 1000Sun Blade 1000Dual SparcIII 750 MHzDual SparcIII 750 MHz18 GB SCSI FC disk18 GB SCSI FC disk8 x 73 GB SCSI RAID58 x 73 GB SCSI RAID5

CRD-5440CRD-5440

www.ts.infn.it/acid/www.ts.infn.it/acid/

[email protected]@ts.infn.it

Page 3: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 3317 settembre 200217 settembre 2002

Hardware Hardware (cont.)(cont.)

Problemi, rotture, etc… Problemi, rotture, etc… ACID01 (server SunGrid, DHCP, BigBrother, …)

Problemi con motherboard (CUR-DLS) che legge male la temperatura della seconda CPU. Risolto aumentando la ventilazione.

ACID02Problemi con scheda di rete Intel PRO/100 S.

ACID03 (disk server)Problemi su diversi dischi IBM DTLA-307075 (è un problema noto, ora…).

Client Vecchi (ACID06, 07, 09, 10, 12, 13)Problemi con le ventole delle CPU.

ACID05Rottura alimentatore.

ACID13Rottura disco ( ri-installazione del sistema).

ACID17 (disk server)Rottura di una 3ware Escalade 6800.

ACID36Rottura dell’alimentatore e della scheda video (probabilmente correlate).

Page 4: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 4417 settembre 200217 settembre 2002

Software installatoSoftware installato

Management della farmManagement della farmR. Birsa (Solaris), BG (Linux)

Componenti free softwareComponenti free softwareRedHat Linux 7.2 (kernel 2.4.9, glibc 2.2.4) oppure 7.3 (kernel 2.4.18, glibc 2.2.5).

A parte la Sun che ovviamente monta Solaris

Queuing system: Sun Grid Engine EE 5.3p1System/Network monitor: Big Brother 1.9CERN software

CERNLib, ANAPHE, ROOT, CASTOR, DATE

COMPASS softwareCOMGeant (simulazione), Coral (ricostruzione ed ad analisi)Tools locali (parallelizzazione dei processi, accesso a DB remoto)

Componenti commercialiComponenti commercialiBackup: CA Arcserve 7

1 licenza Linux server, 3 licenze Linux client, 1 licenza Unix client

ODBMS: Objectivity 6.1.3 CERN Contract

Page 5: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 5517 settembre 200217 settembre 2002

Software installato Software installato (cont.)(cont.)

Page 6: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 6617 settembre 200217 settembre 2002

Software installato Software installato (cont.)(cont.)

Page 7: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 7717 settembre 200217 settembre 2002

Software installato Software installato (cont.)(cont.)

Page 8: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 8817 settembre 200217 settembre 2002

Software installato Software installato (cont.)(cont.)

Mirroring/UpdateMirroring/UpdateGiornaliero di:

Distribuzione RedHat 7.2 e 7.3

Software/DataBase di COMPASSCOMGeant

CORAL

DataBase delle calibrazioni

Database di geometria, mappe ed allineamenti

Periodico dei patch su sistema od applicativiNon si usano auto-update tools

ASISASISNon viene usato

Sono installati solo i package che servono esplicitamente (CERNLib, CASTOR, …), localmente su ogni nodo, usando RPM.

Page 9: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 9917 settembre 200217 settembre 2002

Tools sviluppati ed attività in corsoTools sviluppati ed attività in corso

SparSpar: tool per la parallelizzazione della procedura di analisi di MC : tool per la parallelizzazione della procedura di analisi di MC via SunGrid (V.Duic)via SunGrid (V.Duic)

Input: l’utente specifica eseguibili e file di configurazione come se si trattasse di un unico job di generazione/produzione/analisi

spar provvede alla suddivisione in job paralleli alterando opportunamente i file di opzioni (il grado di parallelizzazione viene specificato dall’utente).

Output: spar alla fine raggruppa opportunamente i file di output

Supporta fino all’intero ciclo di processamento: generatori COMGeant CORAL, con possibilità di escludere alcuni passi

Può partire da passi intermedi (es. CORAL su output di COMGeant)

Una prima versione di spar è gia in utilizzo.

Parallelizzazione dell’analisi sui DST e raw data (V.Duic)Parallelizzazione dell’analisi sui DST e raw data (V.Duic)Concettualmente è analogo al tool precedente

Si basa sull’analogo tool in uso al CERN per la produzione (VD, M.Lamanna).

Page 10: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 101017 settembre 200217 settembre 2002

Tools sviluppati ed attività in corso Tools sviluppati ed attività in corso (cont.)(cont.)

Copia delle federazioni Objectivity di COMPASS (V.Duic)Copia delle federazioni Objectivity di COMPASS (V.Duic)Solo DST ed alcuni “raw data”.Trasferimento (va ftp su wacdr) di:

Federazione Database di header (di run ed eventi)Database di eventi (essenzialmente DST)

Come test sono stati trasferiti i DST relativi al 2001I DST dei dati con polarizzazione trasversa del 2002 sono importati man mano che vengono prodotti al CERN

Test di processatura di raw event e DSTTest di processatura di raw event e DSTProduzione MC per test sistema e sviluppo software (A.Martin)Produzione MC per test sistema e sviluppo software (A.Martin)

Per trasverso. 1M eventi su tutto range x e in diversi bin di xGenerazione eventi DIS con Lepto: singolo job per campione (è rapido)COMGeant: parallelizzato da spar su 10 e 20 nodi/generazione

1.4 s/evento, 5k eventi/CPU/generatore, 2 ore siu 10 CPU, zebra file 0.34 GB

CORAL: parallelizzato da spar su 10 e 20 nodi/generazioneOutput ROOT tree (1MB per 5k eventi), somma dei singoli file fatta automaticamente da spar

Ottimizzazione della ricostruzione del RICH1 (P.Schiavon) Ottimizzazione della ricostruzione del RICH1 (P.Schiavon) Run su file binari pre-prodotti al CERN per sviluppo ed ottimizzazione della ricostruzione degli anelli del RICH.

Page 11: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 111117 settembre 200217 settembre 2002

Attività prossima futuraAttività prossima futura

Il run ci ha tenuto molto occupati. A questo si aggiunge l’impegno Il run ci ha tenuto molto occupati. A questo si aggiunge l’impegno sull’offline generale di COMPASSsull’offline generale di COMPASS

Responsabilità: Coral (BG), CCF e gestione dati (M.Lamanna), software RICH1 (P.Schiavon). Attività: gestione dati e produzione DST (P.Pagano, V.Duic)

Ottimizzazione della Farm per l’analisi dei dati Ottimizzazione della Farm per l’analisi dei dati Test di accesso diretto alle federazioni CERN via WAN (da ottobre)

Verifica protezioni, sicurezza, etc.

Produzione selettiva di DST da DST con CoralProduzione selettiva di DST da DST con CoralRichiede modifiche del codice

GUI per i tool di parallelizzazioneGUI per i tool di parallelizzazioneIn test

Miglioramento dei tools di gestione e controllo della farmMiglioramento dei tools di gestione e controllo della farmPiù sono automatizzati meno lavoro c’è per me (credo…)

Page 12: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 121217 settembre 200217 settembre 2002

Attività prossima futura Attività prossima futura (cont.)(cont.)

Verifica della possibilità di utilizzo di HSMVerifica della possibilità di utilizzo di HSMStudio della possibilità di porting di CASTOR (ostico…)

HSM commerciali (poca roba per Linux: DiskXtender,…)

NOTA: dall’esperienza di analisi sui dati 2002 capiremo se ed eventualmente quanto storage aggiuntivo ci serve. È importante capire se si può puntare verso un HSM che potrebbe avere costi sensibilmente minori dell’allargamento dello spazio disco.

Adattamento e test del software per il nuovo DBMSAdattamento e test del software per il nuovo DBMS

Studio sistematico della prestazioni del RICH1Studio sistematico della prestazioni del RICH1

Analisi dei dati (già iniziata): misura di hAnalisi dei dati (già iniziata): misura di h11 da asimmetria dei da asimmetria dei “leading π” in DIS su bersaglio con polarizzazione trasversa“leading π” in DIS su bersaglio con polarizzazione trasversa

Page 13: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 131317 settembre 200217 settembre 2002

Analisi dati trasverso 2002Analisi dati trasverso 2002

È una misura complessa: l’asimmetria prevista è di pochi % con un È una misura complessa: l’asimmetria prevista è di pochi % con un apparato del tutto nuovo apparato del tutto nuovo DSTDST

Organizzati in due periodi corrispondenti a circa 270 run (più di mezzo miliardo di eventi) 26 TB di “raw data”, 2 TB di dati DSTInoltre è stato deciso di acquisire ulteriori dati per il trasverso in questi ultimi giorni di run: due periodi da cui ci aspettiamo almeno 100 run aggiuntivi. La produzione dei primi due periodi è stata iniziata al CERN a fine agosto

Il primo periodo è in avanzato stato di processato e trasferimento a TriesteLa produzione del secondo periodo è stata appena iniziata

AnalisiAnalisiStudi di stabilità su tutti gli eventi (2 TB) in collaborazione con Torino in base alle risorse hardware disponibiliCalcolo asimmetria all’inizio solo su eventi con Q2>1 GeV2 (20%). Software già testato sulla farm (P.Pagano)Studio di effetti sistematici dovuti ad accettanza e fondo

Richiede Produzione massiccia di MC Produzione iniziale 107 eventi DIS nel range di interesse1TB di eventi simulati (20 CPU per 8 giorni)Processatura: ogni analisi richiede lo stesso ordine di tempo della produzione

Page 14: Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste Benigno.Gobbo@cern.ch.

CSN 1CSN 1 Benigno GobboBenigno Gobbo – – INFNINFN Trieste Trieste 141417 settembre 200217 settembre 2002

Hardware, desiderata 2003Hardware, desiderata 2003

InventariabileInventariabileRimpiazzo RAID controller SCSI CRD-5440 con analogo Infotrend Sentinel 150 ( 3.5 k€ )

CMD si è orientata su mercato militare. Non c’è modo di mettere l’oggetto in manutenzione

Sostituzione ACID01 con server “di qualità” (con RAID…) ( 5.6 k€ )Fa servizi importanti: master SGE, server DHCP, master e display BigBrother,…È vecchio e usa dischi ATA non in RAID.

Upgrade della Tape Library a 40 slot (5.0 + IVA k€ )20 slot (= 2 TB). NOTA: prezzo farm con 20 slot 67 MITL

Inventariabile (seconda priorità)Inventariabile (seconda priorità)Inizio upgrade dei client vecchi (5/30 da fare a fine 2003) (28.0 k€ )

ConsumoConsumoVarie ( 3.0 k€ )Tape Ultrium ( 10.0 k€ )

ManutenzioniManutenzioniSwitch 3com 3900 (07/2002-12/2003) ( 0.7 k€ , possibilmente anticipati al 2002)Switch 3com 4900 (01/2003-12/2003) (0.6 k€ )Gruppo di continuità (50%: 0.6 k€ )