LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica...

39
Griglie computazionali - a.a. 2008-09 1 LEZIONE LEZIONE N. 12 SLA e definizioni Il Monitoraggio a livello Fabric Il Monitoraggio a livello Collective Grid Monitoring Esempi di Sistemi di Monitoraggio Il Monitoraggio a livello Applicativo : SAM Griglie Griglie computazionali computazionali Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica – I Anno

Transcript of LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica...

Page 1: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 1

LEZIONELEZIONE N. 12

• SLA e definizioni• Il Monitoraggio a livello Fabric• Il Monitoraggio a livello Collective• Grid Monitoring• Esempi di Sistemi di Monitoraggio• Il Monitoraggio a livello Applicativo : SAM

Griglie Griglie computazionalicomputazionali

Università degli Studi di Napoli Federico IICorso di Laurea Magistrale in Informatica – I Anno

Page 2: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 2

ServiceServiceLevelLevel AgreementAgreement

I Service Level Agreement (SLA) sono strumenti che possono far parte di un contratto, attraverso i quali si definiscono formalmente metriche di servizio che devono essere rispettate da un fornitore di servizi.

Le metriche contenute sono relative sia alla disponibilità di un servizio in ore sia, relativamente alle performance, alle capacità.

Es. Un SLA per un sito Grid: servizio attivo h24 365 giorni all’anno con un downtime massimo di 2 giorni lavorativi.

Es. SLA per la Rete: Connessione punto punto tra due Grid-sitescon banda garantita di 1Gbit/s.

Page 3: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 3

ServiceServiceLevelLevel AgreementAgreement

Nell’ambito di una Grid di produzione diamo le seguenti definizioni:

Scheduled Downtime: Arco di tempo, programmato, in cui un sito Grid non fornisce servizi, ad esempio per manutenzione della sala macchine o per aggiornamenti del sistema operativo.

Unscheduled Downtime: Tempo in cui un sito Grid si trova in uno stato di non raggiungibilità a causa di problemi inattesi. E’ un downtime non programmato.

Availability (Disponibilità): Misurata in ore, e rappresenta il tempo in cui un sito Grid risulta attivo e funzionante.

Reliability: E’ un indice di affidabilità si un sito ed èdefinito nel seguentemodo:Reliability = Availability /(Availability + Unscheduled Downtime)

Page 4: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 4

SLA in SLA in GridGrid

Le definizioni precedenti vengono utilizzate per definire dei livellidi SLA in ambito Grid, ad esempio:

– Un sito deve risultare Available (UP) almeno per il 70% del tempo nell’arco di un mese.

– La Site Reliability deve essere almeno 75% per mese.

Page 5: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 5

Controllo dellControllo dell ’’ infrastruttura (infrastruttura ( MonitoringMonitoring ))

Il “Monitoring” è un servizio di controllo implementabile a tutti i livelli di un infrastruttura IT, erogato su tutte le componenti di infrastruttura (“layertecnologici”) dichiarate all’interno del Service Level Agreement.

Questo servizio rappresenta la base di partenza per l’attivazione di un servizio di gestione e controllo completo.

Alcuni dei principali utilizzo dei servizi di Monitoring:� Supporto per garantire il necessario livello di SLA� Verificare lo stato delle risorse e dei servizi� Individuare Fault � Eseguire il Troubleshooting� Individuare colli di bottiglia� Effettuare statistiche

Page 6: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 6

Controllo dellControllo dell ’’ infrastruttura (infrastruttura ( MonitoringMonitoring ))

In ambito Grid i sistemi di Monitoring si basano su sensori e servizi che eseguono misure sulle risorse e sui servizi distribuiti.

Il Grid Monitoring è un’attività strettamente collegata ai sistemi informativi che permettono di propagare e rendere fruibili i dati ottenuti.

Page 7: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 7

MonitoringMonitoring su tutti i livelli della pila su tutti i livelli della pila GridGrid

Page 8: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 8

Monitoraggio di livello Monitoraggio di livello FabricFabric

E’ il monitoring a più basso livello, generalmente rivolto agliaddetti ai lavori e rappresenta la base per garantire qualsiasi altroservizio al di sopra della pila GRID.

Il monitoring di livello Fabric è una problematica comune a tutti i sistemi informatici, ivi compresi Datacenter per la pubblicaamministrazione, servizi di rete, telefonia.

Page 9: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 9

Monitoraggio di livello Monitoraggio di livello FabricFabric

Cosa si può controllare con servizi di monitoraggio di livelloFabric:

UPS (uninterruptable power supply)Tensione e consumo sulle prese di alimentazione dei serverImpianti e sistemi di condizionamento.Temperatura delle CPUStato delle ventole dei serverTemperatura ambientale e dei rackStato delle testine sul discoStato della Rete, congestioni, traffico e Fault

Page 10: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 10

Monitoraggio di livello Monitoraggio di livello FabricFabric

Uno degli strumenti più utilizzati per questo scopo è il protocollo SNMP.

L’SNMP (Simple Network Management Protocol ) è un protocollo di livello internet con architettura di tipo client/server descritto come protocollo di management. Esso nasce per consentire la gestione di intere reti geografiche e di tenere sotto controllo qualsiasi tipo di apparato. Il Draft che descrive il protocollo SNMP è l’ RFC 1157.

Nell'architettura SNMP, per ogni sottosistema è definita una base dati detta MIB (Management Information Base), gestita dal corrispondente subagent, che rappresenta lo stato del sottosistema gestito, o meglio, una proiezione di tale stato limitata agli aspetti di cui si vuole consentire la gestione.

Page 11: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 11

Chiamata SNMP Chiamata SNMP [root]# snmpwalk -m -c public -v2c pdu01.unina.it

SNMPv2-MIB::sysDescr.0 = STRING: APC Web/SNMP Management Card (MB:v3.8.6 PF:v3.5.6PN:apc_hw02_aos_356.bin AF1:v3.5.5 AN1:apc_hw02_rpdu_355.bin MN:AP7952 HR:B2 SN: ZA0748005993 MD:11/28/2007)SNMPv2-MIB::sysObjectID.0 = OID: SNMPv2-SMI::enterprises.318.1.3.4.5DISMAN-EVENT-MIB::sysUpTimeInstance = Timeticks: (93761780) 10 days, 20:26:57.80SNMPv2-MIB::sysContact.0 = STRING: UnknownSNMPv2-MIB::sysName.0 = STRING: apcpdu01SNMPv2-MIB::sysLocation.0 = STRING: UnknownSNMPv2-MIB::sysServices.0 = INTEGER: 72SNMPv2-MIB::sysORLastChange.0 = Timeticks: (0) 0:00:00.00SNMPv2-MIB::sysORID.1 = OID: SNMPv2-MIB::snmpMIBSNMPv2-MIB::sysORID.2 = OID: SNMP-FRAMEWORK-MIB::snmpFrameworkMIBComplianceSNMPv2-MIB::sysORID.3 = OID: SNMP-MPD-MIB::snmpMPDComplianceSNMPv2-MIB::sysORID.4 = OID: SNMP-USER-BASED-SM-MIB::usmMIBComplianceSNMPv2-MIB::sysORID.5 = OID: SNMP-VIEW-BASED-ACM-MIB::vacmMIBComplianceSNMPv2-MIB::sysORDescr.1 = STRING: The MIB Module from SNMPv2 entitiesSNMPv2-MIB::sysORDescr.2 = STRING: SNMP Management Architecture MIBSNMPv2-MIB::sysORDescr.3 = STRING: Message Processing and Dispatching MIBSNMPv2-MIB::sysORDescr.4 = STRING: USM User MIBSNMPv2-MIB::sysORDescr.5 = STRING: VACM MIB

Page 12: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 12

Il software Il software GangliaGanglia

Un altro sistema di monitoring molto diffuso di livello fabric è ilsoftware Ganglia, nato per controllare lo stato di occupazione e dicarico delle CPU, Memoria ed altri parametri per infrastrutture ditipo High Performance Computing.

E’ un sistema basato su architettura client/server con sensori localiai nodi da monitorare che estraggono le informazioni dal sistemaoperativo e le propagano verso un server.

Ganglia non fornisce informazioni sullo stato dei servizi Grid.

Page 13: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 13

GANGLIA di GANGLIA di SCoPESCoPEraggiungibile dallraggiungibile dall’’URLURL

http://nagios01.scope.unina.it/http://nagios01.scope.unina.it/

Page 14: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 14

MonitoringMonitoring di livello di livello CollectiveCollective

E’ il livello di monitoraggio che controlla lo stato dei serviziGrid, ed ha una doppia utenza: sia gli addetti sia gli utenti.

Esso viene utilizzato per verificare lo stato di sanità dei siti e dell’infrastruttura Grid. Presuppone una conoscenza dell’architettura Grid.

L’aumento del livello di astrazione aumenta la comunità diutenza a cui si rivolge il servizio di monitoraggio.

Page 15: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 15

GridGrid MonitoringMonitoring (1/5)(1/5)

definizione

• misurazione di parametri significativi relativi alle risorsepresenti in Grid

• attivita’ strategica per il calcolo distribuito- performance analysis- resources/services fault detection- problems spotting- statistics and capacity planning- auditing system

Page 16: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 16

GridGrid MonitoringMonitoring (2/5)(2/5)

metodologie di resource monitoring

• push

• pull

observer resource

observer resource1

2

Page 17: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 17

GridGrid MonitoringMonitoring (3/5)(3/5)

problemi da gestire

• scalabilita’il servizio di monitoring deve garantire la stessa qualita’ del servizioindipendentemente dal numero di risorse monitorate

• bassa intrusivita’le attivita’ di monitoring non devono compromettere le prestazioni offertetramite i servizi

• formato degli eventi di monitoringtradeoff tra semplicita’ di utilizzo e compattezza (es. documento XML)

• security(segue)

Page 18: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 18

GridGrid MonitoringMonitoring (4/5)(4/5)

problemi da gestire

• architettura distribuitaevitare il “single point of failure” e favorire delle architetture a componenti modulari

caratterizzazione degli eventi di monitoring

• short lifetime of utility• aggiornamenti frequenti

Page 19: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 19

GridGrid MonitoringMonitoring (5/5)(5/5)

LOW LEVEL measurements– CPU load– memory usage– disk usage (per partition)– network activity– number of processes– number of users (UI)– …

Computing Element Storage Element

Worker NodeWorker NodeWorker NodeWorker Node

Resource Broker

Information Index

Replica Manager

Replica Catalog

[…]

SERVICE checks– gatekeeper– gsiftp– gris– gdmp– RB/LB– …

“GRID” measurements– number of total CPUs– number of free CPUs– number of running jobs– number of waiting jobs– SE free disk space– …

Page 20: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 20

GridGrid MonitoringMonitoring ArchitectureArchitecture

Producer

Directory

Service

Consumer

1) Event publicationinformation

2) Lookup

3) Event producer & Event schemainformation

5) Eventdata

4) Query or

Subscribe

Page 21: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 21

NAGIOSNAGIOS

Nagios è un software open-source per il monitoraggio ed il controllo costante di Server e di Servizi molto usato nel mondo Linux.

E' in grado di eseguire controlli su un'ampia serie di servizi quali HTTP, FTP, SSH, Numero di Processi attivi, Carico del Server, Numero di Utenti collegati, Risposta del Server ai Ping, Controllo dei DNS, Controllo del Demone di MySql e molto altro ancora...

Page 22: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 22

Page 23: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 23

Page 24: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 24

GridICEGridICE (1/3)(1/3)

• scopo di GridICE e’ l’implementazione di un servizio di Gridmonitoring “VO-centric”

• prodotto integrato in LCG (CERN)

• iniziativa nata nell’ambito del progetto europeo DataTAG

• attualmente e’ un’attivita’ di development EGEE-SA1 / Grid.it

Page 25: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 25

GridICEGridICE (2/3)(2/3)

descrizione

• data pushper l’aggregazione dei dati di monitoring relativi ad un cluster

• data pullper la raccolta dati nel GridICE database

Page 26: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 26

GRIS (GLUE schema)

WP4 fmonserver

computing element

information providers farm monitoringarchive

runldif output

write

read WP4 monitoring agent

worker node

/procfilesystem

WP4 sensor

run

readmetric output

metric output

WP4 monitoring agent

worker node

/procfilesystem

WP4 sensor

run

readmetric output

metric output

information index

GIIS (GLUE schema)

monitoring server

discovery service

monitoring service

ldap query

ldap query

web interface

MonitoringDB

GridICEGridICE ArchitectureArchitecture

Page 27: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 27

GridICEGridICE DeploymentDeployment

...

worker nodes

computing elementaccess node

storage elementaccess node

LEMON ServerLEMON Client

GRIS

GRIS

LEMON Client

GRIS2136

SITE GIIS

replica locationservice

broker

storage elementaccess node

LEMON ServerLEMON Client

GRIS

LEMON Client

GRIS2136

SITE GIIS

REGIONGIIS

TOP-LEVELGIIS

REGIONGIIS

site INFN-CNAF

site CERN

GridICE Server

LEMON Client

LEMONClient

Page 28: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 28

Grid Monitoring ServiceGrid Information Service

Monitoring Tool

GridICEGridICE (3/3)(3/3)

sviluppi futuri

Page 29: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 29

http://gridice4.cnaf.infn.it:50080/gridice/site/site.php

Page 30: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 30

Page 31: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 31

Sistemi di Sistemi di MonitoringMonitoring BDII BDII BasedBased

In ambito Collective è possibile creare dei sistemi di monitoraggio basati sulle informazioni dei BDII senza l’ausilio di sensori locali alle risorse.

Tali sistemi presentano in maniera grafica ed aggregata le informazioni utilizzate dagli altri Grid Services per tutte le operazioni e per il funzionamento globale della Grid.

Tali sistemi sono i meno invasivi ma offrono inevitabilmente un set di informazioni limitate.

Page 32: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 32

http://gridportal.hep.ph.ic.ac.uk/rtm/

Page 33: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 33

http://goc.grid.sinica.edu.tw/gstat/grisu/

Page 34: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 34

http://scopeui01.dsf.unina.it

Page 35: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 35

MonitoringMonitoring di livello di livello ApplicationApplication

Esegue il monitoring dei servizi Grid dal punto di vista dell’utente e dell’applicazione.

E’ rivolto sia agli utenti finali, che per la preparazione di statisticheed il calcolo dei parametri di Reliability ed Availability.

E’ altresì utilizzato come strumento di allarme

Page 36: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 36

ServicesServicesAvailabilityAvailability MonitoringMonitoring (SAM) (SAM)

SAM (Service Availability Monitoring) è un framework per ilmonitoring dei siti Grid in ambiente di produzione e di pre-produzione.

Esso prevede un set di test che vengono sottomessi con intervalliregolari e di un database che conserva il risultato dei test. I datiottenuti vengono pubblicati con interfaccia web e presentati in maniera fruibile.

SAM effettua un monitoring dei servizi Grid dal punto divista dell’utente. La versione per gLite è basata su Nagios.

Page 37: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 37

ServicesServicesAvailabilityAvailability MonitoringMonitoring (SAM) (SAM)

Il SAM prevede due classi principali di test:

Test di base: Sono i plugin generali che verificano lo stato deiservizi basilari di ogni singolo ruolo Grid, ad esempio nel caso del logical file catalog, esegue dei comandi di scrittura, creazionedirectory e delete di file e cartelle, nel caso dei CE sottomette deijob e recupera l’output e così via.

Test Personalizzati: Sono i test aggiuntivi che riguardano ilfunzionamento di particolari applicativi o servizi specifici di unaVO, ad esempio test di funzionamento di Matlab o di Fluent o dialtri software di specifico interesse.

Page 38: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 38

Il Il MonitoringMonitoring

Page 39: LEZIONE N. 12LEZIONE - Istituto Nazionale di Fisica Nuclearepeople.na.infn.it/~merola/griglie/Lezione_12_aa_2008-09.pdf · 2009. 5. 4. · Monitoraggio di livello Fabric Uno degli

Griglie computazionali - a.a. 2008-09 39

http://www.grisu-org.it/

Sitemi di Monitoring