Relazione dei referee del calcolo LHC Gruppo di referaggio Forti (chair), Bossi, Menasce Morandin,...
-
Upload
lauro-gallo -
Category
Documents
-
view
217 -
download
0
Transcript of Relazione dei referee del calcolo LHC Gruppo di referaggio Forti (chair), Bossi, Menasce Morandin,...
Relazione dei referee del calcolo LHC
Gruppo di referaggioForti (chair), Bossi,
MenasceMorandin, Simone, Taiuti, Ferrari (LHCb),
MorandinBozzi(CMS), ZoccoliCarlin(Atlas)
17 maggio 2005 Referee Calcolco LHC 2
Outline Tier 1, 2, ..., N TDR MOU Finanziamento 2006
Ci siamo visti a gennaio, maggio e luglio.Faccio solo updates.
Nota: i documenti sono reperibili sul sito di referaggio:
http://www.infn.it/griddbuser/pass dipendente/INFNgrid
17 maggio 2005 Referee Calcolco LHC 3
Stato del Tier1
Gare 2005 concluse ed in fase di installazione 400 kSi2K, 200TB Totale 1700kSi2k, 460TB
Efficienza di funzionamento e di utilizzo molto migliorata nell’ultimo anno Si inizia ad avere un accounting
Problemi infrastrutturali ancora da risolvere Spazi e costi ancora non definiti
17 maggio 2005 Referee Calcolco LHC 4
Uso del Tier1 Il Tier1 viene usato ormai routinely sia dagli
esperimenti LHC sia da molti altri esperimenti
2000
4000
giallo: slot dichiarateblu: job runningverde: job queued
Statistics for all jobs from 24/04/2005 to 08/09/2005
Queue Jobs
Completed
Total CPU Time Used
(hours)
dteam 15561 9402.101
babar 58025 47625.875
atlas 39825 28170.951
lhcb 277409 867997.601
infngrid 174 0.044
cdf 227406 668050.691
alice 9073 20812.982
guest 38 0.003
cms 99632 124153.792
argo 13877 10041.606
babar_test 6187 4557.180
ams 5055 64060.316
virgo 358 1486.397
test 292 100.208
pamela 69 0.351
babar_objy 35791 56062.938
babar_build 192 3.413
quarto 139 1995.717
geant4 3 0.000
magic 186 1829.721
cms_align 2302 875.868
biomed 1435 21693.331
babar_xxl 22 1667.051
Totale 793051 1930588.14
17 maggio 2005 Referee Calcolco LHC 5
Accounting al Tier1
Ancora da perfezionare, ma esiste
CPU time totale wallclock time totale
http://tier1.cnaf.infn.it/monitor/LSF/plots/acct/
17 maggio 2005 Referee Calcolco LHC 6
Non sempre tutto va bene...
blindosbarra switch upgrade
17 maggio 2005 Referee Calcolco LHC 7
Infrastrutture al CNAF
Trasformatore Sostituito 11 agosto 800kVA1250kVA ed
installata ventilazione forzata. Senza interruzioni di servizio
Blindosbarre Scoperti (con il naso) problemi di fissaggio
meccanico e di masse. 36h fermo farm Primo fissaggio di emergenza. Necessaria una
completa revisione
17 maggio 2005 Referee Calcolco LHC 8
Infrastrutture al CNAF II
Gruppo Frigorifero Numerosi problemi e mancanza di ridondanza per
la centralina Progressivo miglioramento con l’esperienza Necessario ridondarlo al più presto
Per il 2006 Dopo gli interventi sul trasformatore (fatto), sulle
blindo e sul frigorifero (da fare), le infrastrutture attuali sono sufficienti a coprire le esigenze 2006.
17 maggio 2005 Referee Calcolco LHC 9
Infrastrutture - prospettiva Per i potenziamenti successivi (11.5 MSint2K e 6
PByte nel 2010) occorre programmare acquisto e messa in opera di: nuova potenza elettrica (altri 2 Trasformatori da 1250KVA) nuova potenza frigorifera (altri 2 Gruppi Frigoriferi) nuovo sistema di autogenerazione elettrica (altri 2 G.
Elettrogeni) nuovo UPS
Da reperire gli spazi (200m2: attuale magazzino ?) Progetto in corso di definizione, pronto per fine anno
Stima dei costi necessaria al più presto E’ l’ultimo ostacolo alla definizione ufficiale dell’impegno
italiano sul Tier1 da inserire nel MoU.
17 maggio 2005 Referee Calcolco LHC 10
Dobbiamo usare il Tier1
Funziona, e molti lo usano......però ci vuole tanta pazienza.
...e ci vuole aiuto da parte di fisici e tecnologi del calcolo delle sezioni
Non può essere considerato un servizio che “qualcun’altro” fornisce
17 maggio 2005 Referee Calcolco LHC 11
Tier 2 Progetto “tipo” di Tier2 disponibile da
lugliohttp://www.infn.it/cgi-bin/grid/cgi/ShowDocument?docid=23user/pass dipendente/INFNgrid
Le sedi stanno compilando, ci aspettiamo di avere i progetti entro fine settembre
3-4 ottobre workshop a PD sugli aspetti tecnico-infrastrutturali dei Tier2
Commissione calcolo coinvolta pienamente Dovrà referare/finanziare i potenziamenti
infrastrutturali delle sezioni
Bari
ALICE CMSCatania
ALICECNAF
LHCbLNF
ATLASLNL
ALICE CMSMilano
ATLASNapoli
ATLASPisa
CMSRoma1
ATLAS CMSTorino
ALICE
17 maggio 2005 Referee Calcolco LHC 12
Piano dei Tier2 Gli esperimenti hanno presentato un piano ragionevole Da approvare quando ci saranno i progetti, almeno in parte
compilati Ancora da ottimizzare il ramping up, in dipendenza dagli
aggiustamenti di schedule di LHC
Tier2: acquisti per anno (k€)Piani degli esperimenti
2006 2007 2008 2009 2010 TOTALEATLAS 232 381 1182 707 779 3281CMS 221 935 966 639 667 3428LHCb 199 134 118 57 44 551TOTALE CSN1 652 1450 2266 1403 1490 7260ALICE 351 590 819 944 304 3008TOTALE INFN 1003 2040 3085 2347 1794 10268
17 maggio 2005 Referee Calcolco LHC 13
Proposta finanziamento Tier2
La CSN3 ha riservato per Alice una tasca di 250 k€ per i Tier2, da assegnare dopo l’approvazione del piano
Proponiamo per la CSN1 un approccio simile. L’entità della tasca dovrebbe essere di 500K€ LHCb ha un picco ingiustificato
nel 2006 Nota: Roma1 ha inserito il Tier2 su C.A.,
erroneamente Suddivisione approssimativa, da rivedere
TIER2 (k€)Proposta referee
2006ATLAS 200CMS 200LHCb 100TOTALE CSN1 500ALICE 250TOTALE INFN 750
17 maggio 2005 Referee Calcolco LHC 14
Tier 3, ..., N
Nei TDR, i Tier3 hanno guadagnato un certo spazio, con però molte ambiguità Si dice che possono contribuire “significativamente” alle
risorse di calcolo dell’esperimento, ma si considera impossibile farne un accounting
Sono risorse fornite e rese disponibili “on best effort basis” Non sono chiare le dimensioni necessarie
Vorremmo che la comunità italiana elaborasse un ragionevole piano organico dei Tier3 Fino ad oggi finanziate quasi tutte le sezioni sulla base
delle attività locali e la potenza dello strillo.
17 maggio 2005 Referee Calcolco LHC 15
Un sommario dei finanziamentiCon beneficio di inventario... (escluso CNAF)Da aggiungere ALICE...
Inventariabile finanziato per anno per esperimentoSum of INV AnnoEsperimento 2000 2001 2002 2003 2004 2005 Grand TotalATLAS 48.5 158 99.5 33 339CMS 100.5 524 139.5 123 115 1002GRID 170 57.5 182 508.5 107 728.5 1753.5LHCb 127.5 24 151.5Grand Total 319 867 321.5 755 255 728.5 3246
17 maggio 2005 Referee Calcolco LHC 16
Inventariabile finanziato per anno per sezioneSum of INV AnnoSezione 2000 2001 2002 2003 2004 2005 Grand TotalBari 12 15 13.5 28.5 21.5 46 136.5Bologna 19 161 21 34 19 0 254Cagliari 7.5 7.5 4 6 25Catania 8.5 11.5 25 6.5 35.5 50.5 137.5Cosenza 6 6 12Ferrara 7.5 18 25.5Firenze 11 15 27 10 5 6 74Genova 6 35 5 0 46Lecce 47.5 5 7.5 2.5 0 62.5LNF 7.5 39 46.5LNL 12.5 300 29 210 23 12 586.5Milano 11 35 68 91.5 2 39 246.5Napoli 8 17.5 68 6 39 138.5Padova 73 43.5 39 73.5 52 72.5 353.5Parma 8 0 8Pavia 6 4 5.5 19 0 34.5Perugia 6.5 33 23 62.5Pisa 40.5 38.5 23 19.5 50 171.5Roma1 24.5 149 130 24 55.5 383Roma2 4 10.5 5 15 34.5Roma3 7.5 7.5 7 30 52Torino 12 5 99 3.5 197 316.5Trieste 7.5 1.5 30 39Grand Total 319 867 321.5 755 255 728.5 3246
17 maggio 2005 Referee Calcolco LHC 17
0
100
200
300
400
500
600
700
Bar
i
Bol
ogna
Cag
liari
Cat
ania
Cos
enza
Fer
rara
Fire
nze
Gen
ova
Lecc
e
LNF
LNL
Mila
no
Nap
oli
Pad
ova
Par
ma
Pav
ia
Per
ugia
Pis
a
Rom
a1
Rom
a2
Rom
a3
Tor
ino
Trie
ste
2005
2004
2003
2002
2001
2000
Esperimento (All)
Sum of INV
Sezione
Anno
17 maggio 2005 Referee Calcolco LHC 18
Richieste e proposte
Le richieste per Tier3 sono in totale 180K€ per Atlas e CMS Le giustificazioni variano
Il collegio dei referee propone di non finanziare nessuna di queste richieste al momento attuale Vorremmo vedere un piano dei Tier3 Disponibilità a discutere situazioni particolari, ma
dopo che abbiamo capito meglio i Tier2
17 maggio 2005 Referee Calcolco LHC 19
Riflessioni sui Tier3 Tutte le sezioni hanno avuto finanziamenti per calcolo LHC o per
Grid Chi più chi meno (e chi meno giustamente strilla)
Queste risorse devono essere utilizzate per iniziare lo sviluppo come Tier3 e precisare il modello di integrazione con T2 e T1. Integrazione in INFNGrid da un lato e accesso locale (User
Interface) dall’altro. ll modello di Tier3 rimane al momento indefinito
Farm locale con un po’ di dischi ? PC personali “vestiti” ?
Difficile da definire senza fare veramente dell’analisi nella configurazione d’uso finale
Vogliamo evitare che grazie alla disponibilità di risorse locali che risolvono i problemi più urgenti i gruppi si sottraggano alla responsabilità di aiutare a far funzionare i Tier2 e la Grid
17 maggio 2005 Referee Calcolco LHC 20
MoU
C’è una forte pressione del CERN per definire le cifre nel MoU per LCG fase II.
A noi (INFN) manca Una definizione dei costi infrastrutturali per il Tier1
e la revisione del piano temporale. Una prima bozza dei progetti dei Tier2 e la
valutazione dei costi infrastrutturali delle sedi Una approvazione da parte di CSN1/3 del piano
temporale dei Tier2
17 maggio 2005 Referee Calcolco LHC 21
Computing TDR LHCC non ha ancora fatto la review dei Computing
TDR Schedulata per il 7-8 ottobre. Referee esterni a LHCC:
D. Boutigny (Annecy; for ALICE C-TDR), T. Haas (DESY; for ATLAS C-TDR), C. Bozzi (INFN Ferrara; for CMS C-TDR), Alan Campbell (DESY; for LHCb)
Stiamo raccogliendo i commenti dei referee italiani Come avete visto non ci sono modifiche sostanziali rispetto
ai computing model. Mancano ancora molte verifiche al modello:
Attendiamo ansiosi i risultati dei Data Challenge e Service Challenge
17 maggio 2005 Referee Calcolco LHC 22
Grid Sono stati fatti notevoli passi avanti nella funzionalità e nell’uso
della Grid Fondamentale il contributo dell’INFN, anche se un po’ dispersivo in
certe occasioni Molti progetti, non sempre focalizzati (Ferroni li definì tra l’inutile ed il
dannoso) Però anche molti ottimi risultati
Convergenza sui “baseline services”, che però non sono quite enough Si sta convergendo anche sulle funzionalità più avanzate
In corso di definizione la struttura di EGEE-II (progetto europeo) Si cerca di garantire una maggiore interazione con gli esperimenti,
attraverso task force e struttura esplicita del management Problema del doppio ruolo di LCG (cioè CERN): deployment del
middleware EGEE ma anche garanzia di interoperabilità tra Grid (OSG, Nordugrid)
Molti interessi diversi tendono ad un pericoloso aumento di entropia
17 maggio 2005 Referee Calcolco LHC 23
INFNGrid Gruppo molto attivo
Struttura di INFNGrid di fatto funzionante e utilizzata Anche da VO (Virtual Organization) di provenienza non HEP
Monitoraggio online: http://infnforge.cnaf.infn.it/gridice/ Sempre più rilevante per sviluppo, deployment e certification del
MW
17 maggio 2005 Referee Calcolco LHC 24
INFNGrid Presentate richieste per 1.9MEuro a fronte di un
budget disponibile di 1MEuro (Ricordiamoci che INFNGrid porta all’INFN molti
soldi attraverso i progetti europei) Referaggio in corso
Necessario focalizzare sulle necessità più importanti Prioritizzare le richieste
1. Far funzionare il calcolo LHC2. Calcolo LHC3. Che funzioni il calcolo LHC4. Che poi si riesca a fare analisi per LHC5. Che gli esperimenti LHC possano calcolare efficacemente6. E poi c’e’ il resto.
17 maggio 2005 Referee Calcolco LHC 25
Conclusioni e prospettive
Nessuno si illude che il computing di LHC sia un problema semplice.
La soluzione scelta (GRID) non è provata, ma del resto nessuna altra soluzione lo era.
Si è visto una derivata decisamente positiva nella funzionalità e nell’uso della GRID.
E’ assolutamente necessario uno sforzo collettivo e coerente per avere successo (sia all’interno degli esperimenti che tra esperimenti)