Post on 01-Jan-2016
description
Gruppo di referaggio: Forti (chair), Bossi, Ferrari, Menasce, Morandin, Simone, Taiuti, Zoccoli
TIER2: Update
F. Bossi, CSN1 Trieste 7/7/05
Cosa e’ avvenuto dal 17/5:
Elaborato un “piano di attacco” per l’approvazione dei TIER2
Incontro referees-esperimenti a Roma il 22/6: utile per avere un primo scambio di idee sulla procedura e i costi previsti
Celebrati con buon successo alcuni test di sistema da parte degli esperimenti (particolarmente LHCb)
Rilasciati i computing TDR degli esperimenti e di LCG
Piano di approvazione per i TIER2:
Luglio
Documento che descriva i requirements per la realizzazione di 1 TIER1 (referees)
Piano TIER2 esperimenti (esperimenti)
Settembre
Progetto tecnico dei TIER2 (sezioni) in consultazione con la commissione calcolo
Discussione dei piani: numero e dimensioni TIER2 (CSN1-CSN3)
Documento integrato che descriva i TIER2
Ottobre
Approvazione per i TIER2
Bozza di documento (comprensivo della dichiarazione per i Direttori) preparato da M. Morandin, verra’ rilasciato a giorni
Ad oggi, solo ATLAS ha prodotto un draft di documento proprio, gli altri hanno fornito + o dettagliate presentazioni in riunioni di CSN o con i referees
1. Caratteristiche generali
2. Risorse di calcolo, incluso il profilo di acquisizione
3. Infrastrutture
4. Ruoli di responsabilita’ operative, tecniche, gestionali
5. Personale tecnico
6. Piano di sviluppo, milestones e profilo di finanziamento
Personale
Un primo esercizio di valutazione costi e’ stato fatto con risultati ‘interlocutori’:
Tutti gli esercizi si basano sulla legge di Moore che prevede un abbattimento dei costi a parita’ di prestazioni ad ¼ nel corso del periodo 2006-2010. Personalmente cercherei di valutare l’impatto sulla fisica di un eventuale breakdown dello scaling.
Globalmente le cifre ottenute sono ragionevoli, anche se possono essere ottimizzate
E’ importante la tempistica di acquisto che puo consentire notevoli risparmi se ben pensata
ALICE TIER2: PRIMA STIMA COSTI
( M. Masera Roma, 22/6/05)
•In questa tabella e’ presentata una valutazione dei costi a partire da un modello di “fair share” che prevede in Italia il 30% dei T2 di Alice fuori dal Cern
•Si e` tenuto conto che a Catania e a Torino a fine 2005 si avranno le seguenti dotazioni:
CPU (KSI2K) 300DISK (TB) 45
2005: resources in Ct and Torino at end 2005
2006 2007 2008 2009 2010CPU (KSI2K) 460 1070 2520 5000 6000DISK (TB) 160 379 894 1773 2128CPU/DISK 2.88 2.82 2.82 2.82 2.82
2006 2007 2008 2009 2010CPU (KSI2K) 160 610 1450 2480 1000DISK (TB) 115 219 514 879 355
2006 2007 2008 2009 2010CPU (KSI2K) 0 80 0 220 160DISK (TB) 0 15 0 30 115
2006 2007 2008 2009 2010CPU (KSI2K) 160 690 1450 2700 1160DISK (TB) 115 234 514 909 470
2006 2007 2008 2009 2010CPU (kEur) 92 261 369 446 144DISK (kEur) 258 329 450 498 160Tot (kEur) 351 590 819 944 304GrandTotal 3008 k€
TOTAL ACQUISITIONS (PER YEAR)
COSTS (P.Capiluppi & A. Masoni)
T2 - Present ramp up (year = acquisition)INTEGRATED ESTIMATES @ TIER-2
NEW RESOURCES (differential)
REPLACEMENTS
Disponibilita’ prevista: 2.7 M€
Tier2INFN 2006 2007 2008 2009 2010
Tot. K€
CPU
(kSI2K)
new 200
tot 450
350
880
1782
2532
1420
3832
2709
6261
K€ 116 133 446 241 325 1261
Dischi
(TB)
new 50
tot 80
177
368
836
1212
847
2039
1334
3194
K€ 113 248 736 466 454 2017
Tot. K€ 229 381 1182 707 779 3278
ATLAS VALUTAZIONE COSTI ( L.L. Roma, 22/6/05)
Disponibilita’ prevista: 2.3 M€
Strictly according to current LHCb Computing Model
2006 2007 2008 2009 2010 total
CPU [€/Si2k] 0.58 0.38 0.25 0.17 0.12
Disk [€/GB] 2.25 1.40 0.88 0.55 0.34
CPU running [MSi2k] 0.34 0.69 1.15 1.15 1.15
Disk running [TB] 1 2 3 3 3
CPU replacement [MSi2k] 0.34 0.35
Disk replacement [TB] 1 1
CPU to be acquired [MSi2k]
0.34 0.35 0.46 0.34 0.35
Disk to be acquired [TB] 1 1 1 1 1
CPU cost [k€] 196.5 132.4 117.1 56.1 43.3 545.5
Disk cost [k€] 2.2 1.4 0.9 0.5 0.3 5.4
Total cost [k€] 198.7 133.8 118.0 56.7 43.7 550.9
LHCb VALUTAZIONE COSTI ( D.G. Roma, 22/6/05)
Disponibilita’ prevista: 0.77 M€
CMSRisorse disponibili nell'anno citato (integrale)Bari 2005 2006 2007 2008 2009 2010
CPU (kSI2K) 20 50 300 770 1300 2200Disk (TB) 10 20 120 260 390 530Legnaro
CPU (kSI2K) 140 200 500 800 1350 2300Disk (TB) 30 45 120 340 470 600Pisa
CPU (kSI2K) 50 100 400 780 1300 2250Disk (TB) 15 30 160 310 460 610Roma1
CPU (kSI2K) 20 50 270 650 1100 1900Disk (TB) 10 25 100 250 400 550
CMS All INFN Tier2s 2005 2006 2007 2008 2009 2010
CPU (kSI2K) 230 400 1470 3000 5050 8650Disk (TB) 65 120 500 1160 1720 2290
CMS All INFN Tier2s 2005 2006 2007 2008 2009 2010 Total
CPU (kEuro) 94 388 374 325 448 1629Disk (kEuro) 127 547 592 314 219 1799Total (kEuro) 221 935 966 639 667 3428
Disponibilita’ prevista: 4.9 M€
( P.C. CSN1, 17/5/05)
La questione infrastrutture e’ delicata come dimostrato dal recente mini-breakdown del TIER1 avvenuto il 30/5
• Il 30 Maggio sono successi eventi che hanno messo in
evidenza alcuni limiti della infrastruttura Tier1. -E’ intervenuto il “differenziale” generale della sala T1 -Non rimaneva armato. Si è eliminato qualche carico e dopo
vari tentativi è rimasto ON -A causa di queste interruzioni la temperatura della sala è
aumenta rapidamente. Il Gruppo Frigorifero ha cominciato a funzionare al massimo con assorbimento in corrente di circa 1000 A, con punte di 1100 A
-Il trasformatore, da 800 KVA, ha cominciato a surriscaldarsi
-Alle 16.30 ha raggiunto la temperatura critica e si è messo OFF
-Si è acceso il Gruppo Elettrogeno; dopo 30’ la temperatura del TR è scesa sotto la soglia critica ed è stato reinserito
( M.M. Roma, 22/6/05)
Azioni
• Immediatamente: inserire un sistema di ventilazione forzata al Trasformatore (entro 15gg in funzione) Installato il 1 Luglio
• Indagini sulle “dispersioni”, sulla stabilità delle tensioni e sull’impianto di terra
• Studio sulla resa del sistema di raffreddamento per cercare di migliorarne la resa Questa settimana?
• Necessario iniziare subito a studiare un sistema di “potenziamento” della Sala T1
( M.M. Roma, 22/6/05)
…ma mentre scrivevo queste trasparenze…
Venerdi’ 1/7 verso le 24:00, nuovi problemi all’impianto frigorifero hanno costretto lo spegnimento delle Farm e dello Storage del TIER1 e le Farm di BaBar e CDF
Intervento tecnico richiesto per controllare il filtro dell’impianto idraulico
Lunedi’ 4/7 alle 19:26, intervento terminato, inizio riattivazione servizi
…to be continued…
Personale:
Sharing intelligente tra personale della sezione ( per lo piu’ gia’ esistente) e contributo attivo degli esperimenti (la GRID va pensata come un pezzo di detector a tutti gli effetti)
Piano di sviluppo e Milestones:
E’ pensabile una partenza scaglionata dei vari TIER2? Avrebbe il vantaggio di evitare di duplicare gli errori
E’ necessario definire una ‘metrica’ di giudizio, cioe’ le prescrizioni tecniche per stabilire se e quanto si sta progredendo ( vero in generale per tutto il progetto GRID)
Rilasciati i computing TDR degli esperimenti Ottima lettura da spiaggia per i referees
ATLAS : http://doc.cern.ch/archive/electronic/cern/preprints/lhcc/public/lhcc-2005-0.22.pdf
CMS : http://doc.cern.ch/archive/electronic/cern/preprints/lhcc/public/lhcc-2005-0.23.pdf
http://lhcb.web.cern.ch/lhcb/TDR/lhcb-comp-050613+authors.pdfLHCb :
ALICE :http://pcaliweb02.cern.ch/NewAlicePortal/en/Collaboration/Documents/TDR/Computing.html
LCG : http://doc.cern.ch/archive/electronic/cern/preprints/lhcc/public/lhcc-2005-0.24.pdf
Proposta di divisione lettura (F.F.):
ATLAS: Zoccoli, Carlin, Bossi, Taiuti
CMS: Morandin, Bozzi, Menasce, Simone
LHCb: Ferrari, Menasce, Simone
ALICE: Taiuti, Simone, Bossi
LCG: Taiuti, Bossi, Menasce
Obiettivo: lettura e discussione critica dei documenti entro Settembre-Ottobre
E’ prevista una review formale dei CTDR con referees esterni da parte di LHCC a Settembre
Proposta Sharing Risorse per il TIER1 05-06
Schema presentato in CSN1 il 17/5
Tenute in conto efficienza e sovrapposizioni. Assumiamo un uso non continuativo la potenza di picco richiesta e dello spazio disco. Da verificare sul campo
Il costo del materiale e’ stato calcolato con estrapolazione PASTAIII al momento della conclusione delle gare
Costs By Pasta III + Bernd-Jul042004 2005 2006 2007 2008 2009 2010
CPU (€/Si2K) 1.2 0.8 0.6 0.4 0.2 0.2 0.1Disk (€/GB) 5.9 3.7 2.3 1.4 0.9 0.6 0.3Tape (€/GB) 0.5 0.5 0.5 0.5 0.3 0.3 0.3
Dettaglio suddivisioni previste
CPU (KSI2K) Disk (TB) Tape CPU (KSI2K) Disk (TB) TapeALICE 220 30 330 132ATLAS 320 45 480 192CMS 350 110 525 210LHCb 110 50 165 66Totale LHC nudo 1000 235 1500 600Contingenza LHC 300 120Totale LHC con conting. 1000 235 1800 720
BABAR 375 60 650 187CDF 740 80 900 90AMS 32 2 32 3MAGIC 20 1 20 1ARGO 47 30 47 30ZEUS 40 0 120VIRGO 50 10 150 20Tot NON LHC 1304 183 1919 331
Totale generale 2304 418 3719 1051Overlap/efficiency factor 20% 0% 20% 10%Totale necessario 1843 418 2975 946
2005 2006
Contingenza nel 2006 considerato l’andamento dell’utilizzo
Capacita' complessive al Tier1
Cumulativo
Incrementale Costo
Cumulativo
Incrementale Costo
Data Item kEuro kEuro1-Jan-05 Capacita' installata 1443 26531-Jul-05 Conclusione gara 04/05 400 344 200 46031-Jul-05 Potenza 2005 1843 46531-Dec-05 Dismissione macchine obsolete -100 -2030-Jun-06 Conclusione gara 05/06 800 500 400 1000
30-Jun-06Contingenza 2006 (20% di LHC) - acquisto 2006 300 120
30-Jun-06 Potenza 2006 2843 965
KSI2K
CPU
TB
Disco
Le risorse disponibili e quelle da acquistare sono le seguenti
Pertanto ci sentiamo di autorizzare la partenza di due gare TIER1 su fondo CNAF
1. Gara per CPU 800 KSI2K, ammontare 500 K€
2. Gara per spazio disco 400 TB, ammontare 1000 K€
Appendice
Draft di documento per la definizione dei TIER2
M. Morandin, DRAFT
M. Morandin, DRAFT
M. Morandin, DRAFT
M. Morandin, DRAFT