Cluster di calcolo per CMS a Milano Bicoccadini/CCR/cmscluster2010-t3.pdf · 2010. 10. 7. ·...

16
 20/05/2010 - Paolo Dini - INFN MIB Cluster di calcolo per CMS a Cluster di calcolo per CMS a Milano Bicocca Milano Bicocca

Transcript of Cluster di calcolo per CMS a Milano Bicoccadini/CCR/cmscluster2010-t3.pdf · 2010. 10. 7. ·...

  •   20/05/2010  Paolo Dini  INFN MIB

    Cluster di calcolo per CMS a Cluster di calcolo per CMS a Milano BicoccaMilano Bicocca

  •   20/05/2010  Paolo Dini  INFN MIB

    INFN a Milano Bicocca (MiB):INFN a Milano Bicocca (MiB):

    La Sezione  sede distaccata della Sezione di Milano presso il Dip. Di Fisica dal 2000  sezione autonoma dal settembre 2007

    Servizio Calcolo dominio mib.infn.it attivo dal 2000 (3 classi C), link a 32 Mb/s Servizi di rete estesi a tutto il Dipartimento (~400 utenti)

    Attivita' di calcolo Gruppo I (CMS), gruppo II (AMS,CUORE,HARP/MICE), gruppo IV nuova sala macchine dal giugno 2009

    CMS a Milano Bicocca gruppo ECAL gruppo Pixel Milano (Forward Tracker) Tipologia delle analisi: Higgs/electroweak/BPhysics             ( N.Skim > 2)                                                     In totale ~20 tra ricercatori/tecnologi/assegnisti/dottorandi ecc.

  •   20/05/2010  Paolo Dini  INFN MIBEthernet Gigabit

    Fc to SATA RAID storage (32 TB)

    Ethernet switch  Gigabit

    LAN LAN mib.infn.itmib.infn.it  

    Server backup (1.6 TB PATA )Server batch/monitor/web

    SAN  storage area networkSAN  storage area network

    storm/dpm (2 SE)

    Login server Ethernet Gigabit

    Fibre channel switch  2 Gigabit

    Fibre channel switch  4 Gigabit

    32 Mb/s

  •   20/05/2010  Paolo Dini  INFN MIB

    Topologia del clusterTopologia del cluster

    Fibre Channel switched fabric

  •   20/05/2010  Paolo Dini  INFN MIB

    Nell'attuale configurazione:●15 server  biprocessori multicore:

    ● 1 server di login/interattivo (8 core/16 GB RAM, dischi e alimentatori ridondati) UI (glite3.2) slc5 x86_64● 10 nodi di calcolo (4/8 core)    60 slot di calcolo slc5 x86_64● 1 SE (dpm.mib.infn.it)   con DPM       (dpm 4.0) slc4● 1 SE (storm.mib.infn.it) con STORM  (storm 1.4) slc4● 1 file server per backup on line          (1.4 TB) slc5● 1 server per batch system, proxy, web monitor                                                        slc4

     (IP in classe nascosta, switch ethernet dedicato, connessione diretta al centro stella di rete) 

                         direttamente connessi via Fibre ChannelFibre Channel                       al pool di storage  file system GPFSGPFS                      (traffico dati separato da quello di rete)

    ●3 sistemi di storage ridondati per un totale di 56 slot dischi:                                                                           > 32 TB di spazio su disco > 32 TB di spazio su disco (RAID0 e RAID5,  dischi da 500 GB/1TB)

    Il cluster in pillole...

    (path ridondati  2 switch qlogic a 2/4 Gb/s x 24 porte)

    Throughpout (rw):200 MB/s per nodi a 2Gb400 MB/s per nodi a 4Gb

    X File da 1GB

  •   20/05/2010  Paolo Dini  INFN MIB

    Evoluzione del cluster...Evoluzione del cluster...

    Harp+CMS 2001

    Harp+CMS 2003

    CMSCLUSTER (2010)

  •   20/05/2010  Paolo Dini  INFN MIB

    Nuova sala macchine di MilanoBicocca (giugno 2009)

    ● ~ 40 m2●UPS 30 KVA (+15 KVA)●Potenza frigo 96 KW●8 rack  (4 cluster piu' svariati server)

  •   20/05/2010  Paolo Dini  INFN MIB

    15 server  biprocessori multicore:● 1 server di login/interattivo (8 core/16 GB RAM, dischi e alimentatori ridondati) UI (glite3.2) slc5 x86_64● 10 nodi di calcolo (4/8 core)    60 slot di calcolo slc5 x86_64● 1 SE (dpm.mib.infn.it)   con DPM       (dpm 4.0) slc4● 1 SE (storm.mib.infn.it) con STORM  (storm 1.4) slc4● 1 file server per backup on line          (1.4 TB) slc5● 1 server per batch system, proxy, web monitor

                        direttamente connessi via Fibre ChannelFibre Channel (path ridondati  2 switch qlogic a 2,4 Gb/s x 24 porte)                     al pool di storage  file system GPFSGPFS 

    ● 3 sistemi di storage ridondati per un totale di 56 slot dischi  > 32 TB di spazio su disco > 32 TB di spazio su disco                                                                                                                                                                                   (RAID0 e RAID5,  dischi da 500 GB/1TB)

    Il cluster in pillole...

    ● Batch system: PBS/torque – long/short queues● Software CMS: slc4_ia32_345 e slc5_ia32_gcc434● Monitor: ganglia (+ Jobarchive), munin, nagios● Frontier squid (registrato su http://frontier.cern.ch)● Repository CVS locale● Web server (https://cmscluster.mib.infn.it)● Virtualizzazione: server virtuale (KVM)  GPFS client

    GRID...

    ● User Interface: glite_3.2 per slc5 e glite_3.1 per slc4● CRAB client● Testati 2 Storage Element : DPM e STORM

    vantaggio di storm: accesso POSIX ai file su GPFSvantaggio di storm: accesso POSIX ai file su GPFS . ●Usando CRABCRAB sul cluster job su grid scrittura su SE locale accesso diretto ai file                                                                                                                          su filesystem GPFS!                                                         TESTATO CON SUCCESSO!TESTATO CON SUCCESSO!

    https://cmscluster.mib.infn.it/

  •   20/05/2010  Paolo Dini  INFN MIB

      MONITORING TOOLSMONITORING TOOLS

    NAGI

    OS

    NAGI

    OS

    JOBM

    ONAR

    CH

    JOBM

    ONAR

    CH

    GANG

    LIA

    GANG

    LIA

    MUNI

    N

    MUNI

    N

    WEB

     SITE

    WEB

     SITE

  •   20/05/2010  Paolo Dini  INFN MIB

    USE CASEUSE CASE

    storage

    GRIDGRID

    cmscluster

    SE  SE  (STORM)(STORM)

    CRAB

     JOB

    CRAB

     JOB

    UI/UI/LoginLogin

    Accesso POSIX ai file di output (rx)●Analisi sulle code di batch●Analisi interattiva

    Accesso  (rx) 

    Accesso  (rx) 

    OUTPUT

    OUTPUT

    Es: User SKIM

    OUTPUT

    OUTPUT

  •   20/05/2010  Paolo Dini  INFN MIB

    USE CASEUSE CASE

    UI/UI/LoginLogin

    storage

    GRIDGRID

    Srmcp

     Skim

     

    Srmcp

     Skim

     

    ●Analisi sulle code di batch●Analisi interattiva

    cmscluster

    SE  SE  (STORM)(STORM)

    Data Transfer

    Data Transfer

    Data Tra

    sfer

    Data Tra

    sfer

    PhEdex

  •   20/05/2010  Paolo Dini  INFN MIB

     Software installato sul cluster:● Batch system: PBS/torque – long/short queues● Software CMS: slc4_ia32_345 e slc5_ia32_gcc434● Monitor: ganglia (+ Jobarchive), munin, nagios● Frontier squid● Repository CVS locale● Web server (https://cmscluster.mib.infn.it)● Virtualizzazione: server virtuale (KVM)  GPFS client

    GRID... 

    ● User Interface: glite_3.2 per slc5 e glite_3.1 per slc4● CRAB client● Testati 2 Storage Element (entrambi non BDII): DPM e STORM

    vantaggio di storm: accesso POSIX ai file su GPFSvantaggio di storm: accesso POSIX ai file su GPFS . Usando CRABCRAB sul cluster job su grid scrittura su SE locale analisi dei file di output                                                                                                                con risorse locali                                                TESTATO CON SUCCESSO!TESTATO CON SUCCESSO!

    Osservazioni su cmscluster: 

    ● servizio “best effort”   (“one man show”)● Accesso diretto ai dischi via FC  un solo tipo di filesystem (GPFS).● Flessibile e scalabile● ~ 20 TB in RAID0 (suddivisi in 6 dischi logici per limitare l'eventuale perdita di dati)  ● Soluzioni semplificate

    ● Autenticazione unix passwd (no LDAP) solo sul server di login●  Nessun nameserver per la classe privata (risoluzione tramite /etc/hosts)● Gestione delle configurazione attraverso chiavi ssh● Installazione via rete di Linux (Kickstart/PXEBOOT)

    ● Numero di utenti limitato: ~20 utenti ● Modello di gestione “collaborativo” per GRID/CMSSW (L. Sala coadmin)● Interazione diretta con gli utenti del cluster (sviluppo collaborativo delle risorse di calcolo)

                        

    Il cluster in pillole...

    https://cmscluster.mib.infn.it/

  •   20/05/2010  Paolo Dini  INFN MIB

    Osservazioni: ● Autenticazione unix passwd (no LDAP) solo sul server di login● Niente BIND per la classe privata (/etc/hosts)● Nessuna dipendenza da license manager per il sistema di batch●~20 utenti (molti di meno quelli attivi )● Modello di gestione “collaborativo” (F.Ferri, L.Sala)● Interazione diretta con gli utenti del cluster (sviluppo collaborativo delle risorse di calcolo)

     

    Futuri sviluppi:Futuri sviluppi:

    Dipendono dal modello di analisi che si vuole seguire, es:● Produzioni MC locali (CPU+storage)● User Skim o subSkim  (storage, rete!)● Data replica                 (storage, rete!)● Condivisione di dati attraverso PhEdex (...)

    … e dalla tipologia degli utenti● Utenti locali● Utenti locali+utenti esterni

                      

     ● Connessione a 100 Mb/s (Giugno?)● Acquisto di 1 JBOD (16 slot)  + 32 TB ● Acquisto di un nuovo file server x backup on line● Nodi? ● PhEdex: da venerdi' T3_IT_MIB

                               

  •   20/05/2010  Paolo Dini  INFN MIB

    Futuro:

    ● Connessione a 100 Mb/s (Giugno?)● Acquisto di 1 JBOD (16 slot)  + 32 TB? ● Acquisto di 1 file server di backup● Altri nodi?● Phedex?

    “Ricaduta tecnologica” sui servizi:    Cluster per interattivo/mail/virtualizzazione

  •   20/05/2010  Paolo Dini  INFN MIB

    1024 2048 4096 8192 16384 32768 65536 131072 262144 5242880

    200000

    400000

    600000

    800000

    1000000

    1200000

    1400000

    1600000

    416

    32256

    10244096

    16384

    Write

    4816323264256512102420484096819216384

    dim. file (KB)

    KB

    /s

    record (KB)

    Cache CPU/buffer

    400 MB/s

  •   20/05/2010  Paolo Dini  INFN MIB

    1024 2048 4096 8192 16384 32768 65536 131072 262144 5242880

    500000

    1000000

    1500000

    2000000

    2500000

    3000000

    3500000

    4000000

    4500000

    5000000

    416

    64256

    10244096

    16384

    Read

    48163264128256512102420484096819216384

    dim. file (KB)

    KB

    / s

    record (KB)

    Cache CPU/buffer

    400 MB/s

    Slide 1Slide 2Slide 3Slide 4Slide 5Slide 6Slide 7Slide 8Slide 9Slide 10Slide 11Slide 12Slide 13Slide 14Slide 15Slide 16