G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione...

16
G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e flessibile: risorse multipiattaforma nella GRID di produzione G. Bracco, A. Santoro, C. Scio*, A. Rocchi, S. Migliori, A. Quintiliani, S. Podda ENEA FIM, C.R. ENEA Frascati Via. E. Fermi 45 00044 Frascati ROMA (Italy) [email protected] (*) Esse3Esse, Roma, Italy

Transcript of G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione...

Page 1: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione

Verso una infrastruttura di calcolo aperta e flessibile: risorse multipiattaforma nella GRID di

produzione

G. Bracco, A. Santoro, C. Scio*, A. Rocchi, S. Migliori, A. Quintiliani, S. Podda

ENEA FIM, C.R. ENEA FrascatiVia. E. Fermi 45 00044 Frascati ROMA (Italy)

[email protected]

(*) Esse3Esse, Roma, Italy

Page 2: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

• ENEA-GRID e l'interoperabilità con altre infrastrutture

• SPAGO: un metodo per implementare in modo semplice un gateway e alcuni esempi

• L'esperienza della partecipazione in EGEE

• Considerazioni su IGI

Contenuto

Page 3: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

• Si basa su:– OpenAFS (shared filesystem)

– LSF Multicluster (resource manager)

ENEA-GRID

Page 4: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Hardware

• sistema più rilevante: CRESCO HPC, Portici (NA) #125 in Top500 Giugno/2008 (#2 in Italia) 17.1 Tflops, 300 hosts, 2720 cores, InfiniBand 4xDDR

• altre risorse: ~100 hosts ~650 cpu

– AIX: IBM SP5 256 cpu (12 p575 1.5GHz, 16 cpu + 1 p595 1.9 Ghz, 64 cpu, 1.5 Tflops); SP4, 96 cpu, Frascati (Roma)

– SGI Altix 350 (IA64) 32 cpu Casaccia (Roma) & Onyx– Cray XD1 24 cpu Casaccia (Roma)– Linux clusters 32/x86_64; Apple cluster; Windows servers

Software

• Codici commerciali (fluent, ansys, abaqus, nastran,...)

• Codici di ricerca ed open source (CPMD, MCNP, OpenFoam,...)

• Ambienti di calcolo (Matlab, IDL, ...)

Risorse di calcolo ENEA-GRID

Page 5: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Le GRID sono tante e varie

Grid5000

[W.Gentzsch EGEE'07, Budapest]

Page 6: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Page 7: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Per l'interoperabilità: gatewayad es: ENEA-GRID/gLite

1) da ENEA-GRID a gLite2) da gLite a ENEA-GRID

Interface:LSF Multicluster

AFSAFS users

Interface: gLite

ENEA-GRID

http:www.afs.enea.it/project/eneaegee

Page 8: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

da ENEA-GRID a Glite

Gateway

Page 9: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

da gLite a ENEA-GRIDShared Proxy Approach for GRID Objects (SPAGO)

CE

WN/UNIX

gLite

WN/UNIX

Proxy

gLite

shared Filesystem(AFS, NFS, GPFS, ...)

I/OFiles

Resource manager(LSF/PBS)

• gLite non è installata localmente sui WN• CE + Proxy = Gateway

Prompt invocation(LSF, PBS or scripted SSH)

GRID (RB)

Firewall

DMZ

ENEA-GRID

Page 10: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Ridirezione dei comandi sul ProxyWN utilizzando wrappers installati sui WN

gLite Standard

SPAGO

• WN: JOBSCRIPT– Globus-url-copy input-file– JOB– Globus-url-copy output-file

• WN: JOBSCRIPT– Globus-url-copy input-file

lsrun -m proxy Globus-url-copy input-file– JOB– Globus-url-copy output-file

lsrun -m proxy Globus-url-copy output-file

lsrun: prompt jobexecution

Page 11: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Il sito ENEA-INFO di EGEE mette nella griglia di produzione risorse AIX usando il metodo SPAGO utilizzando AFS come file system condiviso e lsrun come comando di prompt execution

AIX

IRIXMacOSX

CRAY

Altix

Any Linux

3 Frame SP4: 96 cores AIX

Esempi di applicazione

A scopo di demo (Conferenza EGEE'08, Istanbul, sono state messe in GRID anche altre architetture UNIX

Page 12: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Interoperabilità PON/GRISU: CRESCO/PI2S2/Cybersar/SCOPE/SPACI

• 500 cores, RH 5.1 con SPAGO

AIX

IRIX

MacOSCRAY

Altix Any Linux

SISSA/Democritos: 200 cores/PBS della rete

regionale del Friuli condivisi con

EU-IndiaGRID tramite SPAGO

Page 13: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

• Variabili SPAGO nei profili di configurazione ig-WNx,CEx• Pacchetti software SPAGO-friendly: quali comandi ha senso

siano “wrappati”, un flag?• Aggiunta di informazioni nell'Information Service• Test SAM: solo Linux!

Difficoltà di implementazione

• L'amministratore dei WN dovrebbe poter fare l'override delle variabili d'ambiente (L'ambiente del CE e del WN dovrebbero essere disaccoppiati)

• Il software del WN dovrebbe essere rilocabile (anche nei riferimenti dal CE)

• Manutenzione all'evolvere di gLIte: transizione gLite 3.0 -> 3.1• Configurazione dei pool account

Come integrare meglio SPAGO in una griglia di produzione basata gLite

Page 14: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Esperienza come resource provider in una vera GRID di produzione.

Il minimo di macchine “dedicate” per mettere in GRID le risorse locali e permettere gli utenti locali di accedere alla GRID.

• CE (gLite 3.1, lcgCE) + BDII locale

• SE

• MON

• UI

• [Proxy Worker Node (SPAGO)]

una DMZ dedicata, una Registration Authority

Impegno risorse umane: 2 FTE

Esperienza ENEA in EGEE (1)

Page 15: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

Osservazioni architetturali

• gLite è un software complesso a “lasagna” frutto di processo di tipo “evolutivo” efficace ma poco “elegante”: porting difficile

• L'architettura è poco flessibile: 1 CE per ogni risorsa omogenea

• in generale non è chiaro perchè CE/SE/BDII/MON/.. debbano essere macchine distinte

• Mancanza di supporto MPI & HOME su file system condiviso.

• Accounting: problemi di riservatezza dei dati interni

• Firewall/DMZ

Il lato organizzativo:

• Difficoltà di interazione e feedback con gli sviluppatori

Esperienza ENEA in EGEE (2)

Page 16: G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma CASPUR,Roma, 26-27/3/2009 Riunione IGI-TF-Progettazione Verso una infrastruttura di calcolo aperta e.

G. Bracco 26-27/3/2009 IGI-TF-Progettazione, Roma

IGI deve giustificare la propria esistenza in base a considerazioni di ottimizzazione dell'utilizzo delle risorse investite in un paese fortemente arretrato nel campo delle risorse per il calcolo avanzato

– flessibilità di accesso e facilità di utilizzo di tutte le risorse– creazione di comunità per le applicazioni

•deve essere una struttura di produzione orientata sia al calcolo distribuito che quello ad alte prestazioni

•deve essere attraente per gli utenti ed i resource provider: semplicità e flessibilità del middleware

•deve essere il contesto dove le esperienze nazionali nel campo del GRID computing possano portare contributi sia di infrastruttura ma anche architetturali.

•deve analizzare/integrare i risultati l'evoluzione tecnologica in corso (CLOUDs?....)

Verso IGI