La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già...

30
Sommario - Nell’era dell’Industrial Internet of Things è in atto una mutua contaminazione tra l’ingegneria ferro- viaria e l’Information Technology, richiedendo sempre più spesso l’utilizzo di conoscenze verticalmente integrate ten- denti a superare i paradigmi dell’ingegneria classica. La disponibilità di nuove tecnologie e di ingenti quantitativi di dati sono alcuni tra i fattori abilitanti in grado di rivo- luzionare le strategie manutentive nel ventunesimo seco- lo. Grazie allo sviluppo verticalmente integrato di sensori intelligenti e connessi, di capacità di calcolo a basso costo, e di soluzioni per big data e analytics, il trasporto ferrovia- rio sta diventando più puntuale, più efficiente ed in grado di garantire standard di manutenibilità sempre più eleva- ti. L’articolo intende fornire alcune linee guida per l’imple- mentazione di una strategia di manutenzione predittiva in ambito ferroviario, enfatizzando elementi di ingegneria ferroviaria, aspetti inerenti l’Information Technology ed il data mining, e le implicazioni di business derivanti dal- l’applicazione di un innovativo framework manutentivo. 1. Introduzione L’articolo consta di tre macro parti che affrontano la multidisciplinarietà della manutenzione predittiva ferro- viaria fornendo una visione d’insieme. Nella prima parte, dopo una breve introduzione sui concetti della manutenzione predittiva, la stessa viene contestualizza nel settore ferroviario, identificando le pro- blematiche che hanno spinto alla digitalizzazione della manutenzione, la genesi e le evoluzioni delle soluzioni ap- plicate, descrivendo processi, e metodologie adoperate at- traverso un’analisi dello stato dell’arte. Successivamente, nella seconda parte, si enfatizza il ruolo dell’Internet of Things e delle tecnologie abilitanti la manutenzione predittiva ferroviaria; si propone, infatti, un flusso informativo volto a convertire i dati grezzi in infor- mazioni utili sfruttando strumenti predittivi, e descrivendo Summary - Within the era of the Industrial Internet of Things (IIoT) there is a cross fertilization between railway engineering and Information Technology, which requires the utilization of vertically integrated knowledge overtak- ing the paradigms of the classical engineering. The avail- ability of innovative technologies and huge amount of da- ta are the key factors able to revolutionize maintenance in the 21 st century. Thanks to the vertically integrated devel- opment of IP smart sensors, computational performances, Big Data and analytics frameworks, the rail transport is made more punctual, cost-efficient and safer. This paper provides a brief introduction to the predictive maintenance within the rail sector, emphasizing railway engineering ele- ments, Information Technology and data mining aspects, and business implications obtainable through this innova- tive framework. 1. Introduction The article consists of three macro parts that tackle the multidisciplinary nature of railway predictive mainte- nance providing an overview. In the first part, after a brief introduction on the con- cepts of predictive maintenance, the same is contextual- ized in the railway sector, identifying the problems that led to the digitization of maintenance, the genesis and evolution of applied solutions, describing processes, and methodologies used through an analysis of the state of the art. Subsequently, in the second part, the role of the Inter- net of Things and of the technologies enabling the railway predictive maintenance is emphasized; in fact, it is pro- posed an information flow aimed at converting raw data into useful information using predictive tools, and de- scribing the necessary IT infrastructures. An additional paragraph outlines the potential of the IoT Lumada frame- work, outlining some applications to the railway sector. OSSERVATORIO INGEGNERIA FERROVIARIA – 434 – 5/2018 La manutenzione predittiva ferroviaria ed il ruolo abilitante dell’“Internet of Things” The railway predictive maintenance and the enabling role of the “Internet of Things” Antonio LUGARÀ (*) (*) Hitachi Vantara, Assago (MI). (*) Hitachi Vantara, Assago (MI).

Transcript of La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già...

Page 1: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

Sommario - Nell’era dell’Industrial Internet of Things èin atto una mutua contaminazione tra l’ingegneria ferro-viaria e l’Information Technology, richiedendo sempre piùspesso l’utilizzo di conoscenze verticalmente integrate ten-denti a superare i paradigmi dell’ingegneria classica. Ladisponibilità di nuove tecnologie e di ingenti quantitatividi dati sono alcuni tra i fattori abilitanti in grado di rivo-luzionare le strategie manutentive nel ventunesimo seco-lo. Grazie allo sviluppo verticalmente integrato di sensoriintelligenti e connessi, di capacità di calcolo a basso costo,e di soluzioni per big data e analytics, il trasporto ferrovia-rio sta diventando più puntuale, più efficiente ed in gradodi garantire standard di manutenibilità sempre più eleva-ti. L’articolo intende fornire alcune linee guida per l’imple-mentazione di una strategia di manutenzione predittiva inambito ferroviario, enfatizzando elementi di ingegneriaferroviaria, aspetti inerenti l’Information Technology ed ildata mining, e le implicazioni di business derivanti dal-l’applicazione di un innovativo framework manutentivo.

1. Introduzione

L’articolo consta di tre macro parti che affrontano lamultidisciplinarietà della manutenzione predittiva ferro-viaria fornendo una visione d’insieme.

Nella prima parte, dopo una breve introduzione suiconcetti della manutenzione predittiva, la stessa vienecontestualizza nel settore ferroviario, identificando le pro-blematiche che hanno spinto alla digitalizzazione dellamanutenzione, la genesi e le evoluzioni delle soluzioni ap-plicate, descrivendo processi, e metodologie adoperate at-traverso un’analisi dello stato dell’arte.

Successivamente, nella seconda parte, si enfatizza ilruolo dell’Internet of Things e delle tecnologie abilitanti lamanutenzione predittiva ferroviaria; si propone, infatti, unflusso informativo volto a convertire i dati grezzi in infor-mazioni utili sfruttando strumenti predittivi, e descrivendo

Summary - Within the era of the Industrial Internet ofThings (IIoT) there is a cross fertilization between railwayengineering and Information Technology, which requiresthe utilization of vertically integrated knowledge overtak-ing the paradigms of the classical engineering. The avail-ability of innovative technologies and huge amount of da-ta are the key factors able to revolutionize maintenance inthe 21st century. Thanks to the vertically integrated devel-opment of IP smart sensors, computational performances,Big Data and analytics frameworks, the rail transport ismade more punctual, cost-efficient and safer. This paperprovides a brief introduction to the predictive maintenancewithin the rail sector, emphasizing railway engineering ele-ments, Information Technology and data mining aspects,and business implications obtainable through this innova-tive framework.

1. Introduction

The article consists of three macro parts that tackle themultidisciplinary nature of railway predictive mainte-nance providing an overview.

In the first part, after a brief introduction on the con-cepts of predictive maintenance, the same is contextual-ized in the railway sector, identifying the problems thatled to the digitization of maintenance, the genesis andevolution of applied solutions, describing processes, andmethodologies used through an analysis of the state ofthe art.

Subsequently, in the second part, the role of the Inter-net of Things and of the technologies enabling the railwaypredictive maintenance is emphasized; in fact, it is pro-posed an information flow aimed at converting raw datainto useful information using predictive tools, and de-scribing the necessary IT infrastructures. An additionalparagraph outlines the potential of the IoT Lumada frame-work, outlining some applications to the railway sector.

OSSERVATORIO

INGEGNERIA FERROVIARIA – 434 – 5/2018

La manutenzione predittiva ferroviariaed il ruolo abilitante dell’“Internet of Things”

The railway predictive maintenance and the enabling role of the “Internet of Things”

Antonio LUGARÀ(*)

(*) Hitachi Vantara, Assago (MI). (*) Hitachi Vantara, Assago (MI).

Page 2: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

le infrastrutture IT necessarie. Un ulteriore paragrafo deli-nea le potenzialità della framework IoT Lumada, tratteg-giando alcune applicazioni al settore ferroviario.

La terza parte dell’articolo, infine, descrive in che mo-do efficaci soluzioni di manutenzione predittiva, possanoavere un impatto positivo sul business ferroviario e, allostesso tempo, rivoluzionare gli approcci manutentivi.

2. Un’introduzione alla manutenzione predittiva

Al giorno d’oggi, con maggior frequenza rispetto alpassato, le imprese ferroviarie dedicano sempre più atten-zione ai propri processi operativi e a come ridurne i costi.Attualmente, infatti, esse operano in un contesto di supplychain globali, invecchiamento degli apparati e della forzalavoro, variabilità dei prezzi delle materie prime ed ulte-riori vincoli burocratici.

Una grande opportunità per massimizzare efficienza edefficacia è costituita dallo sviluppo e dall’applicazione diun sistema di Manutenzione Predittiva (MP) [1]. Questonuovo paradigma è incentivato dalla disponibilità di gran-di quantità di dati grazie ad apparati sempre più intelligen-ti ed interconnessi, dalla necessità di ottenere di più conminori risorse (ad esempio estendendo la vita utile degliapparati), dai costi ridotti dell’informatica inerenti alla ca-pacità di calcolo, alle reti e alla memorizzazione dei dati, e,infine, dalla fusione tra Information Technology (IT) e Ope-rational Technology (OT). La MP, intersecando IT e OT, puòinfatti fornire alle organizzazioni dettagli essenziali suimalfunzionamenti della componentistica e sulla qualitàdegli apparati, consentendo, così, ottimizzazioni di appara-ti, processi e risorse umane. La MP, quindi, potrebbe rap-presentare l’applicazione risolutiva per essere all’avanguar-dia all’interno di un mercato globale e competitivo, contri-buendo al raggiungimento di benefici sia operativi che re-lativi a strumenti e metodi. Tra quelli operativi si citano:

• ottimizzazione degli intervalli di manutenzione;

• riduzione sostanziale dei periodi di fermo macchinanon pianificati;

• ottimizzazione delle tempistiche e delle modalità diapprovvigionamento, riducendo i costi di magazzinoagendo solo all’occorrenza.

Mentre rispetto a metodi e strumenti, si segnalano:

• identificazione delle cause dei guasti attraverso analisiad hoc;

• perfezionamento degli strumenti e dei processi per ladiagnosi;

• determinazione di procedure manutentive ottimali.

3. La manutenzione predittiva nel settore ferro-viario

Una volta chiarite le potenzialità della MP, che ruolo po-trebbero avere i big data e gli analytics nell’abilitare l’utiliz-zo di un sistema di MP nel settore ferroviario? Il cosiddetto

Finally, the third part of the article describes how effec-tive predictive maintenance solutions can have a positiveimpact on the railway business and, at the same time, rev-olutionize maintenance approaches.

2. An introduction to the Predictive Maintenance

Nowadays, more frequently than ever, organizationsare looking at their operations and how to reduce costs.They are experiencing global supply chains, aging assets,raw material price volatility, increased compliance and ag-ing workforce. A big opportunity to achieve these results isconstituted by the development and application of a Pre-dictive Maintenance (PM) framework [1]. This new para-digm is pushed by the availability of large amounts of datathanks to more instrumented and connected assets, re-quirements to do more with less (e.g. stretching the usefullife of an asset), reduced costs of computing, network andstorage, convergence of Information Technology (IT) withOperational Technology (OT). The PM, intersecting IT andOT, helps to provide organizations with key insights re-garding asset failure and product quality, enabling them tooptimize their assets, processes, and employees. PM couldrepresent the killer application to compete within a global-ized and under pressure market place, contributing toreach benefits related to operative results and methodolo-gies. Among the operative improvements there are:

• optimize maintenance intervals;

• minimize unplanned downtime;

• predicting how much and when to order and makestock, reducing inventory costs.

With respect to methodologies and tools, it is possible toachieve the following results:

• uncover in-depth root cause analysis of failures;

• improvement of both equipment and process diagnos-tics capabilities;

• determination of optimal maintenance procedure.

3. The predictive maintenance in the railwaysector

Based on the potentialities of PM, which role couldhave Big Data and analytics to enable the application ofPM frameworks within the railway sector? The Internet ofThings (IoT), pushed by technological progress and costreductions, is starting to influence the public transport. Infact, based on millions of data points captured from sen-sors on critical train components, analytics can detect im-pending part failures, ensuring maintenance is only per-formed when required, but before the fault. If it is possibleto forecast which parts are likely to fail in the near future,this will lead to the possibility to achieve a value close tothe 100% of availability, because the faults are fixed ac-cording to an efficient planning when units are out of ser-vice, avoiding breakdowns.

OSSERVATORIO

INGEGNERIA FERROVIARIA – 435 – 5/2018

Page 3: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

Industrial Internet of Things (internet delle cose a livello in-dustriale), grazie anche al progresso tecnologico e alla ridu-zione dei costi, inizia ad avere un ruolo significativo nel set-tore del trasporto pubblico. Infatti, sulla base di milioni didati rilevati dai sensori su componenti critici dei treni, l’a-nalisi può identificare in anticipo prossime rotture di alcu-ne parti, assicurando che la manutenzione venga effettuatasolo quando necessario, ma sempre prima dell’effettivoguasto. Se fosse possibile prevedere quali parti andasseroincontro a degrado delle prestazioni nel prossimo futuro,questo potrebbe portare alla possibilità di ottenere un gra-do di disponibilità dei treni tendente al 100%, perché i gua-sti sarebbero sempre riparati secondo un efficiente pianomanutentivo quando i rotabili non sono in servizio, evitan-do così avarie in linea e/o indisponibilità dei mezzi.

All’aumentare della numerosità ed eterogeneità delparco rotabili, le aziende di trasporto ferroviario hannodovuto fronteggiare, nel corso degli anni, le disfunzionidovute ai limiti degli approcci tradizionali alla manuten-zione. È emersa quindi una tendenza alla digitalizzazionedei processi al fine di affrontare problematiche ricorrenti;tra queste si citano [2]:

• gestione non ottimale delle scorte di magazzino (in ter-mini di efficienza ed efficacia);

• mancanza di governance tra i vari interventi; mancan-za di replicabilità degli interventi;

• mancanza di una strategia di raccolta dati condivisa,al fine di ottenere database normalizzati e statistica-mente rappresentativi;

• mancanza di indicatori di performance (Key Perfor-mance Indicators, KPI) necessari a valutare in manieraunivoca la qualità delle prestazioni eseguite;

• mancanza di tracciabilità dei componenti.

L’esigenza di implementare strategie data-driven ha ini-ziato a palesarsi nella seconda metà degli anni ’90, quando idatabase relazionali erano già diffusi nel mercato dell’IT.SARNATARO [2] descrive i benefici ottenuti con l’applicazionedi un software relazionale al sistema informativo della manu-tenzione, consentendo di trasformare i dati da semplici liste ininformazioni significative ad indicatori della qualità del servi-zio prodotto. Si tratta di una delle prime implementazioninel settore ferroviario di strumenti informatici avanzati (perquel tempo) per la costruzione di un software di supportoalle decisioni (DSS). Tale strumento, definito Sistema Infor-mativo della Manutenzione (SIM), consentiva, in tempo rea-le, di verificare lo stato di funzionamento di ogni singolo im-pianto manutentivo, di conoscere lo stato di avanzamento diogni singolo intervento, di costruire database con lo storicodegli interventi realizzati in funzione della tipologia di inter-vento e dell’impianto, ed anche di ricavare dati statistici sul-le varie tipologie di operazioni effettuate, al fine di identifi-care potenziali scostamenti di performance dai valori attesie/o eventuali outlier. SIM, avendo dematerializzato la docu-mentazione cartacea ed abilitato funzioni di business intelli-gence, può essere considerato uno strumento precursore del-la manutenzione predittiva.

As the number and heterogeneity of the rolling stock in-creased, railway transport companies had to face, over theyears, the dysfunctions due to the limitations of traditionalapproaches to maintenance. Therefore, a trend towards thedigitalization of processes has emerged in order to tacklerecurrent problems; among these are cited [2]:

• non-optimal management of inventories (in terms ofefficiency and effectiveness);

• lack of governance among the various interventions;lack of replicability of the interventions;

• lack of a shared data collection strategy, in order to ob-tain standardized and statistically representative data-bases;

• lack of Key Performance Indicators necessary to unam-biguously evaluate the quality of the services per-formed;

• lack of traceability of the components.

The need to implement data-driven strategies began toemerge in the second half of the 1990s, when relationaldatabases were already widespread in the IT market. SAR-NATARO [2] describes the benefits obtained with the appli-cation of a relational software to the maintenance infor-mation system, enabling the possibility to transform da-ta from simple lists into meaningful information and in-dicators of the quality of the produced services. It is oneof the first implementations in the railway sector of ad-vanced IT tools (for that time) for the construction of deci-sion support software (DSS). This tool, called Mainte-nance Information System (MIS), allowed, in real time, tocheck the operating status of each individual maintenanceplant, to know the progress of each individual interven-tion, to build databases with the history of the interven-tions carried out according to the type of intervention andthe plant, and also to obtain statistical data on the varioustypes of operations carried out, in order to identify poten-tial performance deviations from expected values and/orpossible outliers. MIS dematerialized the paper documen-tation and enabled business intelligence functions, so itcan be considered a precursor tool for predictive mainte-nance.

In recent years the railway industry, thanks to theavailability of new computational technologies and wire-less communication systems, has added a further step tothe digitization of railway maintenance by introducing theconcept of “tele-diagnostics”, i.e. the ability to store anddisplay data inherent to anomalies and failures not onlyon board the train, but also sending them, almost in realtime, to a control room able to monitor the fleets in opera-tion. These systems are the watershed between the classicdiagnostic systems - of the spy type - and the most mod-ern systems of prognostics [3], helping to build a set ofuseful information related to anomalies, also dividing, foreach subsystem, the potential triggering causes, and anyadditional consequences.

OSSERVATORIO

INGEGNERIA FERROVIARIA – 436 – 5/2018

Page 4: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

Negli ultimi anni l’industria ferroviaria, grazie alla di-sponibilità di nuove tecnologie computazionali e di comu-nicazione senza fili, ha aggiunto un ulteriore tassello alladigitalizzazione della manutenzione ferroviaria introdu-cendo il concetto di “tele-diagnostica”, ovvero la possibi-lità di memorizzare e visualizzare i dati inerenti alle ano-malie ai guasti non solo a bordo treno, ma anche invian-doli, quasi in tempo reale, ad una control room in grado dimonitorare le flotte in esercizio. Questi sistemi si pongonocome spartiacque tra i più classici sistemi di diagnostica –del tipo a spie luminose – e i più moderni sistemi di progno-stica [3], contribuendo a costruire un insieme di informa-zioni utili inerenti alle anomalie, suddividendo inoltre, perogni sottosistema, le potenziali cause scatenanti, e leeventuali ulteriori conseguenze.

L’architettura di un apparato di tele-diagnostica con-sta, di norma, di due sottosistemi:

– sottosistema di bordo: contiene un elaboratore ad hocche, da un lato si interfaccia con il Train Control & Ma-nagement System (TCMS) per raccogliere i dati su undatabase locale ed analizzarli, dall’altro cura il trasferi-mento di segnali, contatori, ed eventi verso il sistemadi terra. Un ruolo fondamentale è ricoperto dalla logi-ca di veicolo che rappresenta la modellizzazione delrotabile in termini di sottosistemi, LRU, failure modes,eventi, segnali, contatori, etc. e relative relazioni. Ilsottosistema di bordo, in funzione delle regole diagno-stiche implementate e della configurazione della logicadi veicolo, invierà dati diagnostici verso terra attraver-so due distinti canali di comunicazione:

• comunicazione in near real time (quasi in temporeale): variabili inerenti al funzionamento di speci-fici apparati vengono costantemente inviati a terraattraverso protocolli ad hoc (per esempio XMPP),consentendo di monitorare le flotte in esercizio;

• comunicazione “batch”: tutti i segnali raccolti infunzione dei vari eventi, vengono conservati e spe-diti ad intervalli regolari utilizzando appositi proto-colli per il trasferimento di file di grosse dimensio-ni (per esempio FTP, file transfer protocol).

Entrambi i canali sfruttano una rete VPN (VirtualPrivate Network, rete privata virtuale) adottando protocolliche provvedano a cifrare il traffico transitante sulla retevirtuale preservando l’integrità dei dati trasmessi.

– Sottosistema di terra: è costituito da una soluzione ITconvergente (cioè integrante uno strato computaziona-le, un database relazionale per la memorizzazione deidati, spazio disco, e connettività), ridondata, ed utiliz-zabile anche in cloud. Tale soluzione, comunicandocon il sottosistema di bordo, riceve e immagazzina idati provenienti dai rotabili in linea, consente l’accessoai vari portatori di interesse attraverso delle interfacceweb sicure, invia avvisi di manutenzione ed abilita tut-te le fasi di analisi ed elaborazione dei segnali al finedi identificare guasti incipienti, consentendo anche lacalibrazione e validazione di algoritmi diagnostici.

The architecture of a tele-diagnostic apparatus usuallyconsists of two subsystems:

– on-board subsystem: it contains an ad hoc server that,on one side interfaces with the Train Control & Man-agement System (TCMS) to collect data on a localdatabase and analyze them, on the other hand, it takescare of the transfer of signals, counters, and events to-wards the on-ground subsystem. A fundamental role isplayed by the vehicle logic that represents the modelingof the rolling stock in terms of subsystems, LRUs, fail-ure modes, events, signals, counters, etc. and relatedinterrelations. The on-board subsystem, according tothe diagnostic rules implemented and the configura-tion of the vehicle logic, will send diagnostic data tothe ground through two different communicationchannels:

• communication in near real time: variables relatedto the operation of specific equipment are constant-ly sent to the ground through ad hoc protocols (forexample XMPP), allowing monitoring of the fleetsin operation;

• “batch” communication: all the signals collected ac-cording to the various events are stored and sent atregular intervals using special protocols for thetransfer of large files (for example FTP, file transferprotocol).

Both channels exploit a VPN (Virtual Private Net-work) using protocols that encrypt the traffic passingthrough the virtual network while preserving the integrityof the transmitted data;

– On-ground subsystem: consists of a convergent IT so-lution (i.e. integrating a computational layer, a rela-tional database for data storage, disk space, and con-nectivity), redundant, and usable even in the cloud.This solution, communicating with the on-board sub-system, receives and stores the data coming from therolling stock within the line, allows access to the vari-ous stakeholders through secure web interfaces, sendsmaintenance warnings and enables all phases of analy-sis and processing of the signals in order to identify in-cipient failures, also allowing the calibration and vali-dation of diagnostic algorithms.

A few years after the first implementations of the tele-diagnostics on rolling stock, several concrete improve-ments were identified in the areas of maintenance, moni-toring and assistance to the railway operation and engi-neering activities aimed at data collection and continu-ous improvement of rolling stock [4].

The railway operators and the producers are workingtogether to create the conditions for the potential con-stant functioning of the rolling stock throughout theiruseful life thanks to maintenance actions based on the ef-fective degradation of the train components according totheir use.

OSSERVATORIO

INGEGNERIA FERROVIARIA – 437 – 5/2018

Page 5: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

A distanza di alcuni anni dalle prime implementazionidella tele-diagnostica sui rotabili, sono stati identificati di-versi miglioramenti concreti ottenuti negli ambiti di ma-nutenzione, di monitoraggio e assistenza all’esercizio e nelleattività di ingegneria rivolte alla raccolta dati e al migliora-mento continuo dei rotabili [4].

Gli operatori ferroviari ed i produttori stanno lavoran-do sinergicamente per creare le condizioni affinché il fun-zionamento potenziale del parco rotabili sia costante du-rante tutta la vita utile degli stessi grazie ad azioni manu-tentive basate sull’effettivo degrado dei componenti deltreno in funzione dell’utilizzo. Attualmente, a causa dei ta-gli al budget, e quindi alla riduzione delle scorte di ma-gazzino e dei rotabili di riserva, gli operatori del settore ri-chiedono una disponibilità superiore al 99% all’industriaferroviaria al fine di evitare guasti che possano comporta-re costi diretti (ad esempio manutenzioni correttive) e in-diretti (richieste di rimborsi da parte dell’utenza, danni diimmagine, ecc.).

Per ottenere tali risultati, combinando le necessità at-tuali e future del sistema ferroviario, pertanto, è necessariopassare da un approccio di diagnosi basato in larga partesull’esperienza acquisita sul campo da manutentori e tec-nici, ad un nuovo paradigma incentrato sulla tracciabilitàe replicabilità dei risultati e sulla possibilità di documenta-re e trasferire la conoscenza, minimizzando gli inevitabilierrori umani e standardizzando metodi e procedure.

Tuttavia, al giorno d’oggi la strategia manutentiva piùcomune è quella preventiva, nonostante questo riduca lavita utile dei componenti perché sostituiti anticipatamentein base alla pianificazione del produttore, alle tempistiche,al chilometraggio e alle osservazioni basate sull’esperienza.

Tutte queste problematiche hanno condotto le strategiedi manutenzione verso la ricerca di un approccio volto aprevenire il guasto al fine di attuare le necessarie azionimanutentive con tempistiche tali da massimizzare l’utilizzodell’apparato, pur non compromettendone la funzionalità.Infatti, effettuare valutazioni e misurazioni dirette sulle rea-li condizioni delle parti in esercizio e sull’effettivo utilizzo(manutenzione basata su condizione sfruttando la tele-dia-gnostica) può aumentare le performance e ridurre i costi. Iltraguardo successivo e ancora più efficace è costruire fra-mework di manutenzione predittiva cercando di prevedereil momento in cui possa avvenire il guasto e, quindi, adatta-re gli interventi di manutenzione necessari di conseguenza.I recenti progressi in IT e nello sviluppo della sensoristicaintelligente hanno condotto alla costante raccolta di dati damolteplici sistemi e sottosistemi nei treni, rendendo cosìpossibile il monitoraggio delle condizioni meccaniche edelettriche, dell’efficienza operativa e di molti altri indicatoridi performance. Queste nuove capacità consentono non solola pianificazione delle attività di manutenzione con il mas-simo intervallo tra le riparazioni, ma anche la riduzione delnumero delle interruzioni del servizio causate da guasti airotabili. In questo modo saranno ridotti, quindi, i costi del-la manutenzione del treno, ma anche la perdita di ricavidovuta all’impossibilità di effettuare i servizi passeggeri (o

Due to budget cuts and consequently inventories andspare trains reduction, operators demand availability high-er than 99% from the rail industry, in order to avoiddowntimes that lead to both direct costs (e.g. correctivemaintenance) and indirect costs (e.g. compensationsclaims).

In order to achieve these results, matching the needs ofcurrent and future railway systems, it is fundamental toswitch from diagnostic tasks performed under supervisionof human long-term experience, to a new paradigm thatcan guarantee repeatability of results, possibility to recordand transfer knowledge, avoiding the human errors thatcould always happen, standardizing methods and proce-dures.

Nowadays, the most common solution is the plannedmaintenance, even though it reduces the useful life ofcomponents, due to early replacement, and often impliesunnecessary maintenance activities, as these are scheduledin advance according to manufacturers’ schedules, timeframes, mileage, and operational observations. All these is-sues pushed the maintenance strategies toward a revolu-tionary approach, aimed at preventing the fault from oc-curring by activating suitable measures in advance. Per-forming direct measurements and estimation about the re-al conditions of parts in function of the effective rate of us-age (condition-based maintenance through tele-diagnosticsystems) can increase the performance and reduce thecosts. The successive and more effective achievement is tobuild a predictive maintenance framework, trying to esti-mate the time when a fault is likely to occur and adaptmaintenance interventions accordingly. Recent advance-ments in smart sensors and IT have led to continuous da-ta collection from various systems and subsystems intrains, enabling monitoring of mechanical and electricalconditions, operational efficiency and multiple other per-formance indicators. These new capabilities enable plan-ning of maintenance activities with the maximum intervalbetween repairs, while minimizing the number and thecosts of unscheduled outages created by system failures. Inthis way will be minimized not just the maintenance costsof the train, but also the loss of revenues due to the impos-sibility to utilize it to run passengers (or freight) services.

Therefore, a predictive approach to maintenance, in ad-dition to guaranteeing operational and economic benefitsin relation to rolling stock already in operation, can alsohave implications on design. In fact, to minimize thedowntimes due to the usually more frequent checks, thesystem should be equipped with a series of accesses neces-sary for determining the level of efficiency of the compo-nents [3]. For this reason, constructing a valid predictivemaintenance strategy allows identifying recurring faults,potential variables useful for their tracking (but today notsubject to measurement due to lack of specific sensors),thus providing improving feedbacks to the product engi-neering team that can utilize in future projects, thus acti-vating a virtuous circle between after-sales services (main-tenance & value-added services) and production.

OSSERVATORIO

INGEGNERIA FERROVIARIA – 438 – 5/2018

Page 6: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

merci). Un approccio predittivo alla manutenzione, quindi,oltre a garantire benefici operativi ed economici relativa-mente ai rotabili già in esercizio, può avere implicazionianche sulla progettazione. Infatti, per ridurre al minimo itempi passivi dovuti ai controlli solitamente più frequenti, èopportuno che il sistema sia dotato di una serie di accessi ne-cessari alla determinazione dello stato di efficienza dei com-ponenti [3]. Per questo, costruire una valida strategia di ma-nutenzione predittiva consente di identificare guasti ricor-renti, potenziali grandezze utili alla loro tracciatura (ma adoggi non oggetto di misurazione per mancanza di specificasensoristica), fornendo così feedback migliorativi all’inge-gneria di prodotto che potrà implementarli nei progetti fu-turi, attivando quindi un circolo virtuoso tra servizi postvendita (maintenance & services) e produzione.

La manutenzione predittiva ferroviaria (MPF) può es-sere applicata utilizzando due approcci differenti:

– Knowledge-based: si basa sia sulle conoscenze acquisiteda progettisti e manutentori nell’esercizio delle loro ri-spettive funzioni, sia sull’utilizzo di analisi FMECA(Failure Mode, Effects, and Criticality Analysis - analisidei modi, degli effetti e della criticità dei guasti) eRAMS (Reliability, Availability, Maintainability and Sa-fety – analisi di affidabilità, disponibilità, manutenibi-lità e sicurezza). Grazie a tali studi e alle esperienzepregresse acquisite, è possibile identificare a priori icomportamenti dei sottosistemi del treno (e delle rela-tive variabili significative) a fronte di guasti incipienti.Effettuando i campionamenti dei valori con frequenzeopportune, note a priori le soglie di malfunzionamen-to, vengono inviati degli allarmi quando i valori sogliasono superati.

– Data-driven: grazie alla diffusione della digitalizzazio-ne degli apparati, l’ingegneria di manutenzione dispo-ne di una mole crescente di dati eterogenei e multi sor-gente. Sempre più spesso, tuttavia, tali dati risiedonosu database distinti, creando dei veri e propri “silos”che li rendono poco fruibili ai fini delle analisi compa-rative. Per superare tale problematica, sempre piùspesso si ricorrere all’utilizzo di file system distribuiti epiattaforme big data, creando così data lake eterogeneie statisticamente rappresentativi contenenti dati strut-turati, semi-strutturati e non strutturati, analizzabilinella loro interezza attraverso un approccio olistico,mediante tecniche di intelligenza artificiale, machinelearning, e metodi predittivi. Si sono create dunque lecondizioni per identificare delle relazioni tra dati ap-parentemente indipendenti e disgiunti, estraendo mo-delli causali e schemi ricorrenti precedentemente sco-nosciuti, e utilizzabili adesso per predire malfunziona-menti e cali di prestazioni.

Al fine di costruire un efficace sistema di MPF è fonda-mentale tenere in considerazione quattro passaggi distinti:

1) effettuare previsioni e valutarne l’efficacia: questafase è fondamentale al fine di effettuare un’adeguata sele-zione dei sottosistemi del treno che devono essere presi in

The railway predictive maintenance (RPM) can be per-formed following two different approaches:

– knowledge-based: it considers competencies andknow-how acquired by designers and maintainers, andit utilizes also Failure Mode, Effects, and CriticalityAnalysis (FMECA) and analysis of Reliability, Avail-ability, Maintainability and Safety (RAMS). Thanks tothose analyses and to the previous experiences ac-quired, it is possible to identify a priori the train’s ab-normal behaviors described by known thresholds of itsrelevant variables. Those data are sampled per specificfrequencies and compared with the thresholds; oncethe detected values overcome the expected ones, alarmsand triggers are sent to the appropriate stakeholders.

– Data-driven: thanks to the diffusion of assets’ digital-ization, the maintenance engineering has an increas-ing volume of multi-source and heterogeneous data.Often, however, those data are collected in differentDBs, creating silos that does not allow easy compara-tive analyses. To solve this problem, it is possible toutilize distributed file systems and big data platformsthat allow the creation of heterogeneous and statisti-cally representative data lakes containing structured,semi structured, and unstructured data, analyzable intheir entirety through a holistic approach, applying ar-tificial intelligence techniques, machine learning, andpredictive analytics. It has been created the conditionsto identify the relationships between apparently inde-pendent data, extracting insights, devices’ behavioralpatterns and dependencies previously unknown andnow usable to predict abnormal behaviors and reducesperformances.

To build an effective Railway Predictive Maintenance(RPM) is fundamental to take into account four differentsteps:

1) Predictions possibilities and related effectiveness: itis fundamental to perform an effective selection of thetrain’s subsystems that have to be considered within theRPM solution. It is crucial to define a narrow scope, se-lecting those critical events that leave enough digital foot-prints required to build a consistent predictive model. Try-ing to predict “everything” could lead to misleading resultsand wasting of resources. Firstly, it is important to identifywhat is possible to predict (which subsystem) and withwhich likelihood. In order to do that, it is required a map-ping process of the available systems to achieve not onlythe graphs of the areas in which are expected events whosefrequency of occurrence is high, and the respective conse-quences are impacting, but also additional graphs repre-senting the period in which the predictions are more effec-tive over the useful life of the subsystems (figure 1). Thegoal to achieve is to identify the prediction feasibility of themost critical subsystems of the train, paying attention thatoften such systems have the risk of leaving little data tobuild any consistent model. So, the prediction possibilityand viability zone is determined by the frequency of occur-rence of the damage and its criticality level. However, an-

OSSERVATORIO

INGEGNERIA FERROVIARIA – 439 – 5/2018

Page 7: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

considerazione all’interno della solu-zione di MPF. Cercare di prevedere“tutto”, infatti, potrebbe portare a ri-sultati fuorvianti con un conseguentespreco di risorse. In primo luogo,quindi, è importante identificare cosapossa essere previsto (quali sottosiste-mi del treno) e con quale probabilità.A tal fine è necessario un processo dimappatura dei sistemi disponibili perrealizzare non solo i grafici delle zonein cui le previsioni identifichino even-ti la cui frequenza di accadimento siaelevata e le rispettive conseguenze sia-no impattanti, ma anche ulteriori gra-fici che rappresentino il periodo in cuile predizioni risultino più efficacinell’arco della vita utile dei sottosiste-mi (figura 1). L’obiettivo è quello diriuscire a identificare la probabilità diprevisione nei sottosistemi più criticidel treno, facendo attenzione che que-sti forniscano abbastanza informazio-ni per costruire un modello consisten-te. Pertanto, la scelta degli apparati sucui effettuare le analisi predittive è funzione della fre-quenza con cui si riscontra il malfunzionamento e del ri-spettivo livello di criticità. Un altro aspetto da prendere inconsiderazione, tuttavia, è la corretta identificazione del-l’intervallo di tempo in cui la previsione possa essere piùefficace dal punto di vista della manutenzione. All’internodella figura 1 è riportata la distribuzione del tasso di falli-mento dei sistemi elettrici e meccanici. Se ne deduce che,al fine di ottenere un ROI (ritorno dell’investimento) con-sistente, ed un periodo di Payback sostenibile, i sistemi direcente ingegnerizzazione e quelli a fine vita utile risulti-no i più adatti ad essere investigati per sviluppare una so-luzione di MPF. Infatti, è fondamentale concentrare glisforzi su quelle aree che potenzialmente possano offrireampi margini di miglioramento in breve tempo, così da ri-pagare l’investimento effettuato, rendendo il progetto diMPF oltre che efficace ingegneristicamente, anche soste-nibile finanziariamente. Al giorno d’oggi le organizzazionieffettuano anche analisi di capital budgeting per identifica-re quali progetti siano più remunerativi.

Queste attività di pre-dimensionamento aiutano ad as-sicurare risultati realistici prima ancora di allocare risorseper lo sviluppo delle attività (identificazione dei dati ne-cessari, costruzione degli algoritmi, ecc.);

2) estrapolare i dati realmente necessari: per costruireinsiemi di dati efficaci contenenti informazioni utili a rea-lizzare previsioni, ci sono due fattori principali da tenerein considerazione: le variabili potenzialmente valutabili ele tecniche di misurazione.

Di seguito è riportato un elenco, a titolo esemplificativoma non esaustivo, dei potenziali componenti da monitorare:

other aspect to be taken into account is to identify inwhich time interval the prediction is more effective from amaintenance point of view. Within figure 1 is reported thedistribution of the failure rate of mechanical and electricalsystems; it typically follows a bathtub curve. According tothat, in order to achieve a considerable Return On Invest-ment (ROI), both infant and end-of-life systems appearmore appropriate for deploying RPM solutions. In fact, itis essential to concentrate efforts on those areas that canpotentially offer ample room for improvement in a shorttime, so as to repay the investment made, making the MPFproject as well as engineeringly efficient, even financiallysustainable. Nowadays, organizations also perform capitalbudgeting analyzes to identify which projects are moreprofitable.

This approach helps to ensure the outcomes are realis-tic before deploying resources to the development of activi-ties (identifying the required data sets, building algo-rithms, and so forth).

2) Extract the right data: to build effective data baseswith meaningful information useful to achieve predic-tions, there are two main factors to deal with: all the vari-ables potentially assessable and the measurement tech-niques. Below is reported a list, intended to be illustrativeand not limiting, of potential functions and componentsto be monitored:

– axles;

– bogies;

– brakes;

– door systems;

OSSERVATORIO

INGEGNERIA FERROVIARIA – 440 – 5/2018

Fig. 1 - Valutazione delle zone di efficacia di predizione: tasso di malfunziona-mento funzione della vita utile.

Fig. 1 - Evaluation of prediction effectiveness areas: malfunction rate functionof useful life.

Page 8: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

– assili;

– carrelli;

– freni;

– sistemi di apertura/chiusura porte;

– filtri;

– rilevamento ruote usurate;

– correnti e voltaggi dannosi;

– pantografi;

– parti rotanti;

– pressioni dell’aria e dell’acqua;

– cuscinetti e boccole.

Esistono diverse tecniche di misurazione che possonoessere applicate al fine di raccogliere i valori digitali dellevariabili precedentemente discusse. Le più diffuse sono:

– misurazione della velocità di rotazione: uno strobosco-pio o un contatore elettrico potrebbero ottenere questorisultato in modo efficace. Sensori in grado di rilevarela forza per unità di massa (accelerometri), applicati aisistemi di trasmissione, potrebbero essere altrettantofunzionali [1];

– misurazione delle temperature: un aumento degli sfrega-menti e delle frizioni comporta un aumento della tem-peratura dell’apparato monitorato. Termistori, o altri ri-levatori di temperatura, possono individuare le suddettevariazioni. Inoltre, un’altra tecnica semplice ed econo-mica per la misurazione della temperatura consiste nel-la verniciatura della parte con vernici sensibili al calore:così facendo la parte cambierà colore al superamentodel normale livello di temperatura. Svariati autori han-no già fornito il loro contributo sulla misurazione dellatemperatura nei sistemi ferroviari: GRUDÉN et al. [5] va-lutarono le temperature dei carrelli attraverso tre senso-ri, più un quarto per tenere in considerazione le condi-zioni al contorno evitando valori falsi positivi o falsi ne-gativi dovuti alla temperatura dell’aria. KIM et al. [6], di-versamente, montarono alcuni sensori infrarosso sullasuperficie dei carrelli dei treni al fine di identificarne ilsurriscaldamento di cuscinetti e boccole.

– misurazione delle vibrazioni e degli ultrasuoni: la vibra-zione, di per sé, è probabilmente uno dei parametri piùefficacemente monitorabili. Il metodo shock pulse, l’en-velop signal processing e le emissioni acustiche sono sol-tanto alcune delle diverse metodologie di misurazionedelle vibrazioni. Inoltre, svariate sollecitazioni subitedai vagoni possono essere analizzate attraverso l’utilizzodi accelerometri, in base a dove questi si trovino posi-zionati lungo il treno. Si riscontra in letteratura cheNEJIKOVSKY e KELLER [7] monitorarono il movimentodel corpo del vagone ferroviario montando accelerome-tri sulle carrozze di treni con assetto variabile; WOLF etal. [8], li installarono nei bordi delle carrozze ferrovia-rie, e GAO et al. [9] implementarono accelerometri sulpavimento delle locomotive e sul telaio delle carrozze.

– filters;

– flat wheel detection;

– harmful currents/voltages;

– pantograph;

– rotating parts;

– water and air pressure;

– wheel bearings.

There are different measurements techniques that canbe applied to collect digital values of the variables dis-cussed before. The most common techniques are:

– measurement of speed rotation: a stroboscope or elec-trical counters could be effective to achieve this result.Fixed to the machine shaft, sensors able to assess thetorque per unit of mass (accelerometers) could performthe same objective [1];

– measurement of temperature: an increased frictionwill lead to an increase of temperature of the monitoredasset. Thermistors or other temperature sensors can de-tect these variations. Moreover, an additional simpleand cheap technique of measuring temperature is tovarnish some heat sensitive paints to an asset; in thisway the color of the paints shifts when the temperatureexceeds the normal level. Several authors already pro-vided contributions about the measurement of temper-atures: GRUDÉN et al. [5] assessed the bogie tempera-tures through three sensors, plus an additional onethat takes into account the air temperature in order toconsider even the border conditions to avoid both falsepositive and negative values; KIM et al. [6], on the otherhand, mounted on the train’s bogies few surfaceacoustic wave sensors in order to identify overheatedwheel bearings;

– measurements of vibrations and ultrasounds: vibra-tion alone is probably one of the most effective parame-ters to monitor. Shock pulse measurement, envelopetechnique, acoustic emissions are just few differenttechniques to measure vibrations. Moreover, severalstresses of the wagon can be analyzed through the uti-lization of accelerometers, in function of where theseare installed along the train. In literature, NEJIKOVSKY

and KELLER [7] monitored the rail wagon body motionsby mounting the accelerometers on the body of car-riages of tilting trains; WOLF et al. [8] installed those atthe edge of rail carriages, and GAO et al. [9] implement-ed accelerators both on the floor of locomotive and tothe chassis of carriages. Nevertheless, even the bogiescan be object of vibrations measurement: ELIA et al.[10], for instance, mounted accelerometers on the bo-gies and on axles boxes to measure even the lateral ac-celeration. As well as for vibration monitoring, ultra-sounds also analyze acoustics. The only differences be-tween the two methods concern the range of frequen-cies monitored. In fact, vibrational analysis monitorfrequencies between 1 Hz and 30 kHz, while ultra-

OSSERVATORIO

INGEGNERIA FERROVIARIA – 441 – 5/2018

Page 9: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

Inoltre, anche i carrelli possono essere oggetto della rile-vazione delle vibrazioni: ELIA et al. [10], ad esempio,montarono accelerometri sui carrelli e sulle boccole permisurarne l’accelerazione trasversale. Così come per ilmonitoraggio delle vibrazioni, anche gli ultrasuoni ana-lizzano l’acustica. Le uniche differenze tra i due metodiriguardano il range delle frequenze monitorate. Infatti,le analisi vibrazionali monitorano frequenze tra 1Hz e30kHz, mentre gli ultrasuoni tutte le frequenze superio-ri ai 30kHz. Tali alte frequenze consentono di identifica-re fessurazioni ed orifizi che possono crearsi e che,quando vengono attraversati da aria o gas, emettono deirumori tracciabili dagli ultrasuoni [1]. Infatti, a frontedelle sollecitazioni a cui sono sottoposti i rotabili inesercizio, grazie al monitoraggio dell’emissione acusticaè possibile tenere sotto controllo l’evoluzione di specifi-che anomalie. Grazie ad apparati ad hoc posti a lato bi-nario e muniti di microfoni, è possibile registrare i suo-ni prodotti dai convogli in transito ed analizzarne glispettri acustici al fine di identificare la tipologia e la se-verità del guasto. Per esempio, la soluzione Rail-BAMTM

implementata nel West Sussex, effettua il monitoraggiodei cuscinetti analizzando la frequenza del rumore ori-ginatosi al passaggio dei rotabili [3].

– misurazione delle tensioni sugli assili: al fine di rilevarela tensione che subisce l’assile è importante quantifica-re il carico cui lo stesso risulti soggetto, la curvaturadel tragitto, la presenza di forze di massa molto fre-quenti, la massa frenata, l’alterazione nel profilo delleruote e altre irregolarità puntuali. I valori richiesti ven-gono raccolti attraverso l’utilizzo di estensimetri ad ul-trasuoni, sensori ottici ed elettromagnetici [11].

I guasti meccanici, se non riparati rapidamente, degra-dano al trascorrere del tempo e dell’utilizzo dell’apparato, aun ritmo direttamente proporzionale alla loro severità. Perquesta ragione, se il problema venisse individuato in antici-po, si potrebbero evitare operazioni di riparazione partico-larmente onerose in termini realizzativi ed economici.

Tutti i rilevatori impiegati in questi processi di misura-zione possono essere integrati attraverso la comunicazionesenza fili, realizzando una rete di nodi intelligenti distribui-ti. Un nodo non rappresenta solo il singolo rilevatore, maanche la sua alimentazione elettrica, il microcontrollore e iltrasmettitore dati che permette allo strumento di utilizzareil protocollo TCP/IP e quindi di dialogare tramite internet.

Al fine di evitare la misurazione di dati identici e repli-cati poiché raccolti da differenti rilevatori, ottenendo cosìun campione fuorviante, i nodi devono essere ubicati concriterio sui sottosistemi del treno oggetto di analisi, evi-tando la ridondanza delle letture da sensori distinti, oppu-re, ove necessario, utilizzando più sensori al fine di au-mentare la coerenza e veridicità delle informazioni estrat-te. Inoltre, a causa dei segnali radio utilizzati dai sensori,nel caso in cui due treni dovessero trovarsi a breve distan-za in linea o in stazione, è fondamentale utilizzare degliidentificatori per collegare ogni sensore al proprio treno,evitando così che le informazioni del treno X vengano ri-

sounds all frequencies above 30 kHz. Such high fre-quencies allow identifying cracks and orifices that canbe created and that, when they are crossed by air orgas, emit sounds traceable by ultrasounds [1]. In fact,considering the stresses to which the rolling stocks aresubjected during operation, thanks to the monitoringof the acoustic emissions, it is possible to track theevolution of specific anomalies. Thanks to ad hocequipment placed on the side of the track and equippedwith microphones, it is possible to record the soundsproduced by the trains in transit and to analyze theiracoustic spectra in order to identify the type and severi-ty of the fault. For example, the Rail-BAMTM solutionimplemented in West Sussex monitors the bearings byanalyzing the frequency of noise originating in the pas-sage of rolling stock [3].

– measurement of axles stress: to measure the stressthat will affect the axles, it is important to measureaxle load, curvature of route, high frequency dynamicforces, braking loads, changes in wheel profile and dis-crete irregularities (e.g.: wheel flats). The required at-tributes are collected using ultrasonic strain gauges,optical and electromagnetic sensors [11].

Normal mechanics failure modes degrade at a speed di-rectly proportional to their severity. For this reason, if theproblem is detected early, major repairs can usually be pre-vented.

All the sensors involved in these measurement process-es can be federated through wireless communicationsachieving networks of spatial distributed smart nodes. Anode represents not only the single sensor, but also in-cludes the power supply, the microcontroller and the IP da-ta transmitter that allows the device to use the TCP/IP pro-tocol. To avoid replication of measurements from differentsensors that will lead to misleading mensuration, thenodes need to be suitably located along the train’s subsys-tems, avoiding the redundancy of the readings from sepa-rate sensors, or, where necessary, using multiple sensors toincrease the consistency and veracity of the extracted infor-mation. Furthermore, due to the radio communicationsrange of the sensors, if two trains are close within the lineor at the station, it is fundamental to use identifiers toconnect each sensor with its own train, avoiding thatTrain X’s data will be collected by Train Y’s network. Theutilization of Internet Protocol allows the possibility toscale out the infrastructure adding further nodes and toextend the cover range thanks to different wireless tech-nologies derived even by other domains [12].

3) Let the rail expertise influence the data analytics:achieving a successful RPM solution is a team game wherethe railway domain expert plays the loading role. It is al-ways the domain expert who guides the data scientist inbuilding the right algorithm that will be deployed throughthe right IT infrastructure. A diagnostic algorithm is a sys-tematic method of calculation formed by two entities, logicand argument. The part of the logic defines the condi-

OSSERVATORIO

INGEGNERIA FERROVIARIA – 442 – 5/2018

Page 10: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

cevute dal sistema del treno Y. Grazie all’utilizzo dell’In-ternet Protocol è possibile espandere gli apparati di moni-toraggio aggiungendo ulteriori nodi ed estendendo il cam-po di copertura grazie alle differenti tecnologie senza filiderivanti da diversi domini [12].

3) Permettere alla conoscenza ferroviaria di guidare l’a-nalisi dei dati: la realizzazione di una efficace soluzione diMPF è un gioco di squadra in cui l’esperto del sistema fer-roviario riveste un ruolo essenziale. È la conoscenza di do-minio, infatti, a guidare i data scientist nella costruzione de-gli algoritmi corretti che verranno poi implementati sull’in-frastruttura IT. Un algoritmo diagnostico è un procedimen-to sistematico di calcolo formato da due entità, logica e ar-gomento. La parte di logica definisce le condizioni, i controllie le azioni da compiere al fine di verificare la presenza delguasto (anomalia) mentre la parte di argomento definiscequali siano le variabili su cui verificare le suddette condizio-ni, controlli e azioni [4]. Il successo di una soluzione di MPFconsiste quindi nella scelta oculata dei sistemi del treno daanalizzare, nella costruzione di un opportuno ecosistema didati, e nella giusta combinazione di esperti in campo ferro-viario e data scientist, prediligendo figure ibride con com-petenze IT e ferroviarie. Risulta fondamentale creare lecondizioni per l’individuazione della progressione tempora-le del guasto, ovvero modellizzare come la degradazione pro-gressivamente si propaghi e conduca al guasto [3]. Al fine diottenere tali risultati, è necessario identificare delle relazio-ni matematiche in grado di descrivere i fenomeni oggetto distudio prevedendone le evoluzioni al trascorrere del tempoe dell’esercizio. A tal proposito vengono costruiti specificialgoritmi aventi lo scopo di individuare la LRU sede di gua-sto o malfunzionamento e, conseguentemente fornire al per-sonale di manutenzione indicazioni precise e chiare circa l’in-tervento da eseguire attraverso l’emissione di avvisi di manu-tenzione [13]. Il processo che conduce alla costruzione ditali algoritmi può essere suddiviso in tre fasi distinte [13]:

– fase di apprendimento: si analizzano le serie storichedisponibili al fine di identificare regole generali e sche-mi ricorrenti. Questa fase viene espletata da un teameterogeneo formato da esperti RAMS, sistemisti di vei-colo, e manutentori.

– fase di formalizzazione: vengono create regole note eprecise al fine di codificare la conoscenza dei diversimodi di guasto, in un formalismo chiaro, esplicito, edeseguibile.

– fase di esecuzione: i modelli costruiti e calibrati duran-te le precedenti fasi vengono validati tramite applica-zione alle serie storiche al fine di saggiare la reale effi-cacia predittiva valutando, se necessario, un ulteriorefine tuning. Una volta terminato con successo il pro-cesso di validazione, l’algoritmo viene implementatonel sistema di diagnostica.

CORFIATI et al. [3] propongono la suddivisione degli al-goritmi prognostici in tre diverse categorie:

a. Algoritmi basati su un modello del sistema: questametodologia utilizza un modello dinamico capace

tions, the controls and the actions to be performed in or-der to verify the presence of the fault (anomaly) whilethe part of the subject defines which are the variableswhere to apply the above conditions, controls and ac-tions [4]. The success of a RPM solution consists in thecareful selection of the train systems to be analyzed, in theconstruction of an appropriate data ecosystem, and in theright combination of experts in the railway field and datascientists, preferring hybrid figures with IT and railwayskills. It is essential to create the conditions for identifyingthe evolution of the fault in function of time, or to modelhow the degradation progressively propagates and leadsto failure [3]. In order to obtain such results, it is neces-sary to identify mathematical relations able to describe thephenomena under study, foreseeing their evolutions infunction of time and operation. Consequently, specific al-gorithms are constructed to identify the malfunctioningLRUs, providing to the maintenance personnel preciseand clear indications about the interventions to performby issuing maintenance warnings [13]. The process lead-ing to the construction of these algorithms can be dividedinto three distinct phases [13]:

– learning phase: the available time series are analyzed toidentify general rules and recurring patterns. A hetero-geneous team made up of RAMS experts, vehicle sys-tems engineers and maintenance technicians carriesout this phase;

– formalization phase: known and precise rules are cre-ated to codify the knowledge of the different failuremodes, in a clear, explicit, and executable formalism;

– execution phase: the models constructed and calibratedduring the previous phases are validated through theapplication to the historical time series in order to testthe real predictive effectiveness and evaluating, if nec-essary, a further fine-tuning. Once the validationprocess has been successfully completed, the algorithmis implemented in the diagnostic system.

CORFIATI et al. [3] propose the classification of prognos-tic algorithms into three distinct categories:

a. algorithms based on a model of the system: thismethodology uses a dynamic model capable of repro-ducing the process characterizing the functioning ofthe subsystem. This model must be able to compute allthe border conditions, even the exogenous ones: for ex-ample, when describing the process characterizing aspecific rolling stock component, if it could be exposedto thermal changes that could affect its operation, itwould be necessary to consider the various externaltemperatures over time, and therefore simulate not on-ly the functioning of the component, but also the con-tributions deriving from the external environment. Dy-namic models can be obtained by following two differ-ent approaches, through the construction of a physicalmodel of the system once it has been studied, or byidentifying the system through the autoregressive-mov-ing-average.

OSSERVATORIO

INGEGNERIA FERROVIARIA – 443 – 5/2018

Page 11: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

di riprodurre il processo caratterizzante il funzio-namento del sottosistema. Tale modello deve esserein grado di computare tutte le condizioni al contor-no, anche quelle esogene: ad esempio nel descrive-re il processo caratterizzante uno specifico compo-nente di rotabile ferroviario, qualora lo stesso fossesoggetto a sbalzi termici in grado di influenzarne ilfunzionamento, bisognerebbe comunque conside-rare le varie temperature ambientali al trascorreredel tempo, e quindi simulare non solo il funziona-mento del componente, ma anche i contributi deri-vanti dall’ambiente esterno. I modelli dinamici pos-sono essere ottenuti seguendo due distinti approc-ci, attraverso la costruzione di un modello fisicodel sistema una volta studiato il suo funzionamen-to, oppure identificando il sistema attraverso lamedia mobile auto-regressiva.

b. Algoritmi basati sulla probabilità: questo approccionecessità di serie storiche relative ai guasti passati,valutando, tra l’altro, la funzione densità di proba-bilità della vita utile residua ed i limiti di confiden-za. Per ogni sottosistema oggetto di analisi si iden-tificano uno o più parametri caratteristici, e si ri-porta in un grafico l’andamento della vita utiledell’apparato al variare dei valori assunti dai para-metri caratteristici. In sostanza si possono rico-struire le potenziali correlazioni tra i parametri ca-ratteristici e la vita residua del sottosistema, sullascorta di un campione statisticamente rappresenta-tivo costruito mediante osservazioni passate. Es-sendo la vita residua un valore probabilistico, perottenere la previsione di vita sarà quindi necessariocalcolare la densità di probabilità della vita utile re-sidua.

c. Algoritmi basati sulle tecniche di intelligenza artifi-ciale: tali algoritmi possono considerarsi degli ibri-di capaci di integrare i pregi dei primi due approc-ci già discussi; essendo alla base delle più avanzatetecniche di predictive analytics ad oggi utilizzate, sirimanda ad una trattazione più esaustiva e comple-ta nel paragrafo “L’Internet of Things e la manuten-zione predittiva ferroviaria: dalla raccolta del datoall’estrazione dell’informazione”.

4) Individuare il valore aggiunto ottenibile: la quantitàdi informazioni che è possibile ottenere grazie all’impiegodi una efficace soluzione di MPF non riguarda soltanto laprevisione dei guasti, ma anche l’analisi delle cause alla ba-se di errori di progettazione dei componenti, il processo dicostruzione degli stessi, il ciclo di vita utile, e molto altro.L’impiego di una soluzione di MPF, infatti, può anche esse-re d’aiuto per identificare diverse opportunità commercialie per la costruzione di azioni prescrittive. Il valore aggiun-to ottenibile, pertanto, comprende la possibilità di:

• prevedere quando un componente, soggetto a spe-cifiche condizioni, cesserà di funzionare e qualiazioni di manutenzione saranno necessarie;

b. Probability-based algorithms: this approach requirestime series related to past failures, evaluating, amongother things, the probability density function of theresidual useful life and the confidence limits. For eachsubsystem being analyzed, one or more characteristicparameters are identified, and the trend in the usefullife of the asset is shown in a graph considering thatthe values assumed by the characteristic parametersvary. Basically, the potential correlations between thecharacteristic parameters and the residual life of thesubsystem can be reconstructed, based on a statistical-ly representative sample constructed through past ob-servations. Since residual life is a probabilistic value,in order to obtain life expectancy, it will be thereforenecessary to calculate the probability density functionof the residual useful life.

c. Algorithms based on artificial intelligence techniques:these algorithms can be considered hybrids capable ofintegrating the strengths of the first two approaches al-ready discussed; being the basis of the most advancedtechniques of predictive analytics used today, a moreexhaustive and complete discussion is provided in theparagraph “The Internet of Things and railway predic-tive maintenance: from data collection to informationextraction”.

4) Identify the achievable value-add: the amount ofinformation that is possible to obtain through an effec-tive RPM solution does not deal with just predicting fail-ures; in fact, it can rely on root-cause analysis related tothe design of the parts, the construction processes, thelife cycle and much more. RPM can be utilized to identifyvarious business scenarios and building appropriate pre-scriptive actions. The value-add obtainable implies thepossibility to:

• predicting when, subject to specific border conditions,a part will fail and which maintenance actions are re-quired;

• planning the maintenance actions in advance, allowinga just-in-time sourcing for replacement of parts, opti-mizing procurement and inventory;

• suggesting which systems are affected by potential de-signing problems due to their continued poor perfor-mance;

• identifying a track’s problem when a train goes througha specific point in line, considering the vehicle like asensor on movement.

Within the railway technical literature different effec-tive implementations of tele-diagnostic and predictivemaintenance systems have been already described.

In the first case, AGNOLI et al. [4] describe three situa-tions occurred in which the functions of the tele-diag-nostics system allowed to avoid severe faults within theline and the consequent request of spare trains. Specifi-cally, the first example describes a scenario in which,sending the “raw” data to the operations center via FTP

OSSERVATORIO

INGEGNERIA FERROVIARIA – 444 – 5/2018

Page 12: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

• pianificare in anticipo le azioni di manutenzione,consentendo il reperimento delle parti sostitutivesecondo il metodo just-in-time/in-case (solo all’oc-correnza), ottimizzando così le operazioni di acqui-sto e di mantenimento delle scorte di magazzino;

• suggerire quali sistemi possano essere affetti daproblemi di progettazione riscontrabili dal loroinadeguato funzionamento in condizioni di utilizzocontinuativo;

• identificare le problematiche dell’armamento alpassaggio del treno in uno specifico punto della li-nea, considerando il veicolo come un sensore inmovimento.

In letteratura si trovano diversi riscontri positivi sia perquanto concerne le implementazioni di sistemi di tele-dia-gnostica, sia per la sperimentazione di soluzioni più com-plesse di manutenzione predittiva. Nel primo caso, AGNOLI

et al. [4] descrivono tre situazioni realmente accadute in cuile funzioni del sistema di tele-diagnostica hanno permesso dievitare un guasto bloccante in linea e la conseguente richiestadi riserva. Nello specifico, il primo esempio descrive unoscenario in cui, a fronte dei dati “grezzi” inviati alla centraleoperativa tramite protocollo FTP (File Transfer Protocol,protocollo per il trasferimento dati), questi siano stati ela-borati ex post identificando una graduale perdita di liquidodal circuito di raffreddamento di una locomotiva in eserci-zio. Nel secondo esempio, invece, si sfruttano le capacitàdiagnostiche installate a bordo, inviando a terra un’infor-mazione pre-elaborata. Infatti, il sistema di tele-diagnosti-ca, con la sua componente di bordo, identifica un’avaria aicarica-batterie di un locomotore che si appresta ed effettua-re servizio in linea. Il macchinista non essendosi accorto insitu del problema, è stato allertato dalla centrale operativache, iterativamente, lo ha guidato nelle attività di verifica eripristino delle funzionalità, consigliando di resettare l’elet-tronica della locomotiva al fine di riattivare i carica batte-rie. L’ultimo esempio contempla un approccio ibrido tra ca-pacità diagnostiche a bordo treno e analisi di serie storichea terra. Infatti, quando il sottosistema della diagnostica dibordo identifica una temperatura anomala di un riduttoredi una locomotiva in esercizio, provvede ad inviare un trig-ger al sottosistema di terra. La centrale operativa ha richie-sto via radio al personale di condotta di ridurre la velocitàmantenendo la temperatura al di sotto del valore soglia,permettendo quindi al convoglio di espletare il servizio inlinea e rientrare in impianto senza la necessità di riserva.Tale circostanza rappresenta un esempio di come la tele-diagnostica permetta un aumento della vita utile del siste-ma: infatti grazie al collegamento bi-direzionale terra-tre-no, si è potuto variare il carico di lavoro del sistema in fun-zione delle effettive condizioni di salute degli apparati.

La manutenzione predittiva, come già descritto in pre-cedenza, rappresenta uno scenario evolutivo rispetto allatele-diagnostica, in quanto non verifica solo la condizionedi esercizio delle varie LRU, ma tende anche a prevederne ilcomportamento al trascorrere dell’esercizio. Un esempio ef-ficace a dimostrare quanto la MPF possa prevenire guasticon conseguenze negative sulla sicurezza a bordo, è la pre-

(File Transfer Protocol), these were processed ex postidentifying a gradual loss of liquid from the cooling cir-cuit of a locomotive operating within the line. In the sec-ond example, on the other hand, the diagnostic capabili-ties installed on board have been utilized, sending pre-processed information to the ground. In fact, the tele-di-agnostics system, with its on-board component, identifiesa fault in the battery chargers of a locomotive ready tostart its scheduled service. The driver did not realize theproblem in situ, but was alerted by the operations centerthat, iteratively, guided him in the activities of verificationand restoration of the functionality, advising to reset theelectronics of the locomotive in order to reactivate the bat-tery chargers. The last example includes a hybrid ap-proach between on-board diagnostic capabilities andground-based time series analysis. In fact, when the on-board diagnostic subsystem identifies an abnormal tem-perature of a gearbox of an operating locomotive, it sendsa trigger to the ground subsystem. The operations center,through wireless connection, has requested to the driverto reduce the running speed keeping the temperature be-low the threshold value, thus allowing the train to com-plete the scheduled service and return to the plant withoutthe need for an additional spare train. This circumstancerepresents an example of how the tele-diagnostics allowsan increase in the useful life of the system: in fact, thanksto the bi-directional ground-train connection, the train’sworkload could be changed according to the actual healthconditions of the equipment. Predictive maintenance, asalready described above, represents an evolutionary sce-nario with respect to the tele-diagnostic, in fact it does notonly verify the operating condition of the various LRUs inreal time, but also tends to predict their future behavior infunction of time and operation.

An effective example concerning how the RPM couldprevent failures that can negatively affect the safety on-board is the prediction of the door controller status [14].Doors failure is not just a safety issue, but above all for ur-ban services, it can lead also to the increase of waitingtime to access and egress from trains, contributing to delaythe services within the line.

Doors operations are managed by actuators that,through air pressure power, move a mechanical system ofjacks and levers. The train management system, throughelectrical signals, is able to action the actuators and to re-ceive the feedback concerning movement and status of thedoors (opened or closed). A simplified model of the pneu-matic door subsystem is reported in figure 2.

Based on that, the predictive diagnostic system shouldbe able to assess different border conditions such as airpressure, currents, velocity, voltages and so forth. For thisreason, a system of smart sensors directly and digitally con-nected with the Train Control & Management System(TCMS) is required. Each component and functionalitywithin the subsystem needs to be analyzed to identifydegradation of performance that can lead to failure. For in-stance, if the current of the door motor has not increased

OSSERVATORIO

INGEGNERIA FERROVIARIA – 445 – 5/2018

Page 13: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

visione delle condizioni degli apparati che regolano l’aper-tura e la chiusura delle porte [14]. Un guasto alle porte, in-fatti, non costituisce solo un problema di sicurezza, ma,specialmente per i servizi urbani, può portare anche a unaumento dei tempi di attesa per l’accesso e l’egresso dai tre-ni, contribuendo a generare ritardi sulla linea. I movimentidelle porte sono gestiti da attuatori che, attraverso la pres-sione dell’aria, muovono un sistema meccanico di martinet-ti e leve. Il sistema di gestione del treno, attraverso segnalielettrici, è in grado di azionare gli attuatori e ricevere un ri-scontro riguardo al movimento e allo stato delle porte (seaperte o chiuse). Una semplificazione del modello del sotto-sistema pneumatico delle porte è riportata nella figura 2.

Tutto ciò posto, il sistema di diagnosi predittiva dovreb-be riuscire ad analizzare differenti condizioni al contornocome la pressione dell’aria, la velocità, il voltaggio elettrico,ecc. Risulta quindi necessario un sistema di sensori intelli-genti collegati digitalmente al TCMS (Train Control & Ma-nagement System). Ogni componente ed ogni funzionalitàall’interno del sottosistema in esame deve essere analizzataal fine di identificare il decadimento delle performance chepotrà portare ad un successivo malfunzionamento.

Ad esempio, se la corrente del motore delle porte nonaumentasse 10 secondi dopo il comando di apertura/chiu-sura, questo potrebbe dimostrare la presenza di un guastoal circuito del motore; inoltre se l’interruttore di chiusuraporte è già stato attivato, ma la porta non si è chiusa, allo-ra è presente un guasto nel sottosistema delle porte. Attra-verso un confronto computazionale tra i valori acquisiti intempo reale e quelli attesi, è quindi possibile analizzare ledeviazioni e prevedere in modo attendibile quale parte delsottosistema subirà un guasto, stimandone contestual-mente le tempistiche di accadimento.

In questo modo si possono identificare condizionianomale che potrebbero portare a malfunzionamenti ri-correnti fornendo ulteriori informazioni esogene, come lacorrelazione tra guasto e posizione sulla linea. In una so-luzione di MPF, quando un allarme è generato perché ilnumero di eventi anomali nello stesso punto eccede la so-glia prevista, in aggiunta ai dati tecnici, verranno integra-te nel dominio delle analisi anche le informazioni del filedi log (altrimenti detto file di registro delle attività) conte-nenti il numero del treno, la linea ferroviaria, la posizionelungo essa, il chilometraggio del veicolo, ecc.

4. L’Internet of Things e la manutenzione predit-tiva ferroviaria: dalla raccolta del dato all’e-strazione dell’informazione

Come fino ad ora descritto, la digitalizzazione garanti-sce prognosi affidabili per la manutenzione predittiva ren-dendo così guasti e interruzioni di servizio altamente im-probabili. Grazie allo sviluppo verticalmente integrato disensori IP, performance computazionali, framework di bigdata e analytics, il trasporto ferroviario è reso più puntua-le, sicuro e redditizio. La contaminazione dell’OperationalTechnology con l’Information Technology, inoltre, ha creatole condizioni necessarie all’ascesa di un nuovo sistema in

10 seconds after open/close control, it could lead to the mo-tor circuit failure; moreover, if the door close switch hasbeen already activated and the door is not locked, it demon-strates a fail within the door subsystem. With a computa-tional-based comparison among real time values and ex-pected mean values, it is possible to analyze the deviationsand to predict with a reasonable effectiveness what part ofthe subsystem is going to fail and when. In this way it ispossible to identify anomalous conditions that will lead torecurrent faults providing additional external informationsuch as correlation between fault and position. When thealert is generated because the number of anomalous eventsin the same location exceeds the scheduled threshold, in ad-dition to the technical data, the log file will add informa-tion about the train number, the railway line, the positionalong the line, the train mileage and so forth.

4. The Internet of Things and railway predictivemaintenance: from data collection to infor-mation extraction

As described so far, digitalization ensures reliable prog-noses for predictive maintenance that make failures anddisruptions highly improbable. Thanks to the vertically in-tegrated development of IP smart sensors, computationalperformances, Big Data and analytics frameworks, the railtransport is made more punctual, cost-efficient and safer.The contamination of Operational Technology with the In-formation Technology created the conditions to arise anew framework where all data obtained as output fromoperational devices are collected, stored, normalized, andanalyzed.

Once the data is created by the sensors (exogenous likerelated to the weather or the line, and endogenous directlyconnected to the train’s subsystems), the flow required toconvert raw data into useful information consists of fourstages:

1) Data acquisition: is the process of gathering andmeasuring information from heterogeneous sources (e.g.:the different train’s subsystems, railway line, weather,etc.), and related to targeted variables in an establishedsystematic trend. In this way it is possible to capturequality evidence that then are translated into rich dataanalysis in order to build an effective and credible dataset, avoiding overfitting phenomena (excessive adaptationof models just to specific observed data). The acquisitionprocess requires a converged IT infrastructure per eachtrain (including software, networking, server and stor-age), in order to:

• collect and store the data produced by IP sensors andother external sources;

• perform a first data analysis in real time providing use-ful information to the driver about the route and thehealth of the systems;

• share, once arrived at the main station, through wire-less connection, all the data acquired during the trip

OSSERVATORIO

INGEGNERIA FERROVIARIA – 446 – 5/2018

Page 14: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

cui tutte le informazioni ottenute come output da stru-menti operativi vengono raccolte, registrate, normalizzateed analizzate.

Una volta che i dati sono letti dai sensori (esogeni co-me quelli relativi alle condizioni climatiche o della linea,ed endogeni direttamente riferibili ai sottosistemi del tre-no), il flusso informativo volto a convertire i dati grezzi ininformazioni utili consta di quattro fasi:

1) Acquisizione dei dati: è il processo di raccolta e misu-razione delle informazioni da diverse fonti (ad esempio di-versi sottosistemi del treno, linea ferroviaria, meteo, ecc.) erelativa a precise variabili acquisite secondo un trend siste-matico e automatizzato. In questo modo è possibile racco-gliere valori di grandezze efficaci che poi possano venir uti-lizzati in un’analisi dei dati volta a costruire un campionestatisticamente rappresentativo, evitando fenomeni di over-fitting (eccessivo adattamento dei modelli ai dati osservati).

Il processo di acquisizione richiede, per ogni treno, unainfrastruttura IT convergente (cioè comprensiva di softwa-re, infrastrutture di rete, server e spazio disco) al fine di:

• raccogliere e conservare le informazioni prodotte daisensori IP ed altre fonti esterne;

• condurre una prima analisi dei dati in tempo reale for-nendo informazioni utili al macchinista sul tragitto esullo stato dei sistemi;

• condividere una volta arrivati alla stazione principale,attraverso un sistema senza fili, tutti i dati acquisitidurante il viaggio che saranno poi consolidati e pro-cessati attraverso appositi strumenti di ETL (Extract,

that will be consolidated and processed through datatransformation tools (Extract, Transform, & Load –ETL);

To perform an effective data acquisition, it is funda-mental to develop specific connectors able to interface withbatch sources and real time flows, and to collect all thesedata into a data set that will be transferred to the normal-ized master data lake within the main Data Center (DC) ofthe railway service provider.

2) Data transformation: through visually interfaceddata integration tools, it is possible to move data frommany different sources, to aggregate and transform thoseto allow domain experts to analyze a heterogeneous set ofdata of any format, schema and type (data lake). In a gooddata integration tool, this mapping is depicted visually soit will be easy to follow the path of the data, and to under-stand precisely where each piece of data originates, howthe data is processed or transformed as it passes throughthe system, and exactly where the transformed data is go-ing. The data transformation and integration process pro-vides standardized data in a format and a place where it isconsumable from a maintenance life-cycle point of view.In this way, it is possible to build data lakes where, bycoding the right algorithms, it is possible to extract infor-mation from raw data. The biggest part of data involvedwithin the predictive maintenance processes are, nowa-days, predominantly structured, and specifically time se-ries, i.e. data sampled at specific frequency. Often this fre-quency is very high, and this leads to store huge amountof data, increasing difficulties to manage and analyze

OSSERVATORIO

INGEGNERIA FERROVIARIA – 447 – 5/2018

Fig. 2 - Modello semplificato del sottosistema porte.Fig. 2 - A simplified model of the door subsystem.

Page 15: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

Transform & Load- estrazione, trasformazione e carica-mento dei dati).

Al fine di effettuare un’acquisizione dati efficace, èquindi fondamentale sviluppare specifici connettori in gra-do di interfacciarsi sia con fonti di dati batch (già proces-sati) sia con flussi in tempo reale, e raccogliere tutte questeinformazioni all’interno di un data set che sarà poi trasferi-to nel master data lake normalizzato all’interno del DataCenter (DC) dell’operatore che eroga il servizio ferroviario.

2) Trasformazione dei dati: attraverso strumenti di inte-grazione dei dati con interfaccia grafica, è possibile trasferi-re misurazioni provenienti da diverse fonti per poi aggre-garle e trasformarle al fine di consentire agli esperti di set-tore di analizzare un insieme di dati eterogenei e di diversoformato, schema e tipo (data lake). Uno strumento efficacedi trasformazione dati utilizza un’interfaccia grafica intuiti-va, così da rendere più semplice le correlazioni tra gli ele-menti del flusso di dati analizzati e comprendere precisa-mente dove abbia origine ogni singola informazione, comevenga processata, e utilizzata in seguito alla sua trasforma-zione. La conversione delle informazioni ed il processo diintegrazione generano dati standardizzati in un formato ein una collocazione che li rendano sfruttabili dal punto divista della manutenzione. In questo modo è possibile co-struire data lake che, analizzati attraverso la codificazionedi opportuni algoritmi, consentano di estrarre le informa-zioni dai dati grezzi. Attualmente la maggior parte dei daticoinvolti nella manutenzione predittiva sono strutturati, especificatamente time series, ovvero dati campionati conuna frequenza definita. Spesso tale frequenza è molto ele-vata e questo conduce all’immagazzinamento d’ingentiquantità di dati, comportando difficoltà nella gestione enell’analisi degli stessi, con l’aggiunta che una quota parteconsiderevole di tali dati sia poco rappresentativa ai finistatistici in quanto sostituibile con trend e cicli ricorrenti.Risulta quindi efficace utilizzare opportuni metodi mate-matici per ottenerne la riduzione pur mantenendo le infor-mazioni intrinseche. Tra i metodi più efficaci si cita la tra-sformata discreta di Fourier (DFT) che è in grado di conver-tire una collezione finita di campioni di una funzione rac-colti con frequenza nota, in una collezione di coefficienti diuna combinazione lineare di sinusoidi complesse ordinate alcrescere della frequenza [17]. In sostanza è possibile sostitui-re alla serie originale una combinazione lineare di seno ecoseno mantenendo solo un numero ridotto di coefficientiiniziali. Un ulteriore aspetto da tenere in considerazioneanalizzando i time series riguarda l’identificazione di sche-mi ricorrenti e modelli predittivi. Tale identificazione puòessere effettuata all’interno di una singola serie al fine di ri-conoscere andamenti anomali rispetto ai valori attesi, op-pure computando diverse serie contemporaneamente perindividuare quella target che rappresenterà una buona ap-prossimazione dei valori di funzionamento previsti al tra-scorrere del tempo. Una volta identificata la serie target,utilizzando metodi dynamic time warping (DTW) è possibilemisurare la distanza δ(t) tra le sequenze allineate ricevutein input dal sistema (per esempio da n treni in esercizio diuna medesima flotta) rispetto alla serie target (figura 3).

those, with the additional concern that a big part of thosedata is not statistically representative and it could be re-placed with trends and recurrent cycles. It has beendemonstrated the effectiveness of opportune mathematicalmethods to reduce the dimension of those series, whilemaintaining the intrinsic information. Among the mosteffective methods, it will be cited the discrete Fouriertransformation (DFT) that is able to convert a given col-lection of samples’ function collected with known frequen-cy in a collection of coefficients of linear combination ofcomplex sinusoids sorted as frequency increases [17]. Inessence, it is possible to replace the original series with alinear combination of sin and cos keeping just a reducednumber of initial coefficient. An additional aspect to con-sider analyzing time series is the recognition of recurrentschemas and predictive models. This identification can beperformed within a single series to recognize anomalousbehaviors respect to the expected values, or as an alterna-tive, analyzing more time series at the same time to identi-fy the target time series that represent an effective approxi-mation of the optimal operation values. Once identifiedthe target time series, applying dynamic time warping(DTW) methods it is possible to measure the distance δ(t)between the aligned sequences received as input by thesystem (e.g.: from n trains in line belonging to the samefleet) with respect to the target time series that shows theexpected optimum behavior (figure 3).

Let Ψe(t) the expected value extracted by the target se-ries, it can be higher or lower respect to the value reallymeasured onboard in real time Ψr(t); let ϕ(t) the threshold,known a priori, that once overtaken certifies that the be-havior of the asset can be considered as anomalous. Pereach sampling time stamp, in order that the monitoredsubsystem runs with optimal operating conditions, it willbe required to be satisfied the following inequation:

δ(t)=|Ψe(t)-Ψr(t)|<φ(t)

Indeed, this phase addresses the problem of incomingand stored data in many different fragmented places andformats, standardizing them and creating “a common fac-tor” to enable the analysis.

3) Data evaluation: this phase deals with both “shortterm” and “long term” analysis. The “short term” analysisis performed onboard and provides real time informationto the driver about the running trip. On the other hand,the goal to achieve in the “long term” analysis is to pro-vide an end-to-end view of the maintenance framework tomake it more efficient, identify new patterns, and improvedecision making and new future planning. Data scientistscan analyze data and search for patterns that predict, forexample, the circumstances in which a traction drive, anelectronic door motor or a wheelset fails, and when wearor spontaneous error messages require attention. Toachieve these results, gaining insights from data, it is pos-

OSSERVATORIO

INGEGNERIA FERROVIARIA – 448 – 5/2018

Page 16: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

Posto che il valore previsto assunto dalla funzioneΨe(t) possa essere maggiore o minore rispetto a quellorealmente misurato sul campo Ψr(t), definito a priori ilvalore soglia φ(t) al superamento del quale il comporta-mento del sottosistema monitorato possa essere conside-rato anomalo, per ogni timestamp di campionamento, af-finché l’apparato operi in condizioni di esercizio ottimali,dovrà essere verificata la seguente disequazione:

δ(t)=|Ψe(t)-Ψr(t)|<φ(t)

Questa fase affronta quindi il problema dei dati ricevu-ti e immagazzinati in database distinti e con formati diffe-renti, uniformandoli e “portandoli a fattor comune” perpoterli analizzare efficacemente.

3) Valutazione dei dati: questa fase riguarda le analisi a“breve” e “lungo termine”. L’analisi a “breve termine” è ef-fettuata a bordo treno e fornisce informazioni in temporeale al conducente sul tragitto e sui parametri del moto.L’obiettivo di un’analisi “a medio-lungo termine”, invece, èfornire una visione a trecentosessanta gradi del frameworkdi manutenzione al fine di renderlo più efficace, identifica-re nuovi modelli predittivi, e ottimizzare le azioni manu-tentive da intraprendere proattivamente. I data scientistpossono analizzare le informazioni e cercare modelli cheprevedano, ad esempio, le circostanze per le quali un mo-tore elettrico di trazione, o il controller di una porta vadanoin fault, distinguendo, invece, segnali falsi positivi che inrealtà non richiederebbero attenzione. Per ottenere questirisultati è possibile avvalersi di svariate competenze e tec-nologie. Di seguito si riporta un elenco, a scopo prettamen-te illustrativo e non esaustivo, di potenziali tecniche utiliz-zabili per estrapolare informazioni dai dati:

• descriptive analytics (analisi descrit-tive): forniscono semplici analisi edosservazioni sui dati mediante l’uti-lizzo di statistica inferenziale;

• data mining (estrazione di informa-zioni a partire da dati grezzi): ana-lizza grandi quantità di dati etero-genei al fine di estrarre modelli edipendenze interessanti preceden-temente sconosciuti. Le più diffusetecniche di data mining sono:

o anomaly detection (rilevazionedi anomalie): riguarda la sco-perta di valori e grandezze chesi discostano dal valore attesoo dai trend previsti. Ad esem-pio, come riportato in prece-denza, se la corrente del moto-re delle porte non aumenta 10secondi dopo il comando diapertura/chiusura, questo po-trebbe segnalare un guasto alcircuito del motore;

sible to utilize several capabilities and technologies. Belowis reported a list, intended to be illustrative and not re-strictive, of potential techniques:

• descriptive analytics: provides simple summaries andobservations about the data;

• data mining: it analyzes large quantities of data in or-der to extract previously unknown interesting patternsand dependencies. The most common key data min-ing techniques are:

o anomaly detection: it deals with the discovery ofrecords and patterns that are outside the norm.E.g.: if the door motor current has not increased10 seconds after open/close control, it could leadto the motor circuit failure of the door system;

o association rules: this method searches and triesto identify dependencies, relationships, links or se-quences among variables in the data. E.g.: wheelbearings tend to fail under specific different condi-tions (external temperature, forces, wind speedand direction, hours of operations, mileage, singu-lar points (GPS positions) within the track, etc.);

o clustering: it groups together sets of objects thatsatisfy the same properties;

o classification: correlates the new data points col-lected with the most appropriate set, by identifyingthe level of affiliation. E.g.: a vehicle can be classi-fied as “old” or “new” according to the mileage;

o regression: assesses the relationships among vari-ables and calculates how much a variable changeswhen another variable is modified. E.g.: the brakesreduce their useful life faster in function of the

OSSERVATORIO

INGEGNERIA FERROVIARIA – 449 – 5/2018

Fig. 3 - Analisi differenziale tra valori reali campionati e valori previsti estrattidal modello predittivo.

Fig. 3 - Differential analyses between real values sampled and expected values ex-tracted by the predictive model.

Page 17: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

o association rules (regole di associazione): ricercanoe provano a identificare dipendenze, relazioni ocollegamenti tra più variabili indipendenti presentinella base dati. Ad esempio, i cuscinetti delle ruotetendono a subire danni in funzione di svariate con-dizioni specifiche (temperature esterne, forze iner-ziali, attriti, chilometraggio, punti specifici (posi-zioni GPS) lungo il tracciato, ecc.);

o clustering (raggruppamento): raggruppa diversi in-siemi di oggetti che soddisfino le medesime pro-prietà;

o classificazione: mette in relazione i nuovi dati rac-colti con il gruppo più affine identificandone il li-vello di correlazione. Ad esempio, un veicolo puòessere classificato come “nuovo” o “vecchio” a se-conda del chilometraggio;

o regressione: è una tecnica usata per analizzare unaserie di dati che consistono in una variabile dipen-dente e una o più variabili indipendenti. Lo scopo èstimare un’eventuale relazione funzionale esistentetra la variabile dipendente e le variabili indipen-denti. Ad esempio, la vita utile dei freni si riducepiù o meno velocemente al variare del tipo di tra-gitto e di come il macchinista conduca il treno.

• machine learning (metodi di auto-apprendimento):consentono al software di apprendere le informazionidai dati disponibili e da eventi passati, effettuando pre-visioni su tali basi. Ad esempio, quando iniziano a de-gradare le performance di un sottosistema del treno, sipalesano diversi fattori scatenanti. La volta seguente incui si presenteranno tali fattori, il software sarà già ingrado di predire il malfunzionamento incipiente;

• simulazione: abilita scenari what-if per specifici sotto-sistemi del treno e/o processi manutentivi. A titolo diesempio si cita la possibilità di valutare in che entità, afronte di un utilizzo generalmente continuo, determi-nati sottosistemi potranno essere più o meno soggettia malfunzionamenti;

• text mining (estrapolazione di informazioni dal testo):è un sottogruppo del data mining in cui i dati sonocomposti da testi scritti. Rende possibile la compren-sione e la conversione dal linguaggio umano a quellodel calcolatore. Ad esempio, dai registri di manuten-zione si potrebbe determinare se un operatore specifi-co avesse condotto determinate procedure tali daestendere o ridurre la vita utile del sottosistema ogget-to di manutenzione;

• predictive analytics (analisi predittive): al fine di preve-dere esiti futuri si utilizzano le tecniche di machine lear-ning e data mining. L’approccio olistico di sofisticatistrumenti di analisi è utilizzato per sviluppare modelli estime sul comportamento e la vita utile degli apparati.

• prescriptive analytics (analisi prescrittive): aggiungonoun sistema di gestione delle decisioni agli esiti dell’a-nalisi predittiva al fine di allineare ed ottimizzare leazioni da intraprendere secondo la conoscenza dei do-

route and of the driver (the way in which she/heleads the train).

• machine learning: enables the software to learn fromthe data and predict accordingly. E.g.: when a train’ssubsystem fails, there are several factors that come in-to play. The next time those factors are evident, thesoftware will predict the failure;

• simulation: enables what-if scenarios for specific as-sets and/or processes. E.g.: in which way running spe-cific components for a certain period of time will im-pact the likelihood of failure;

• text mining: it is a subset of data mining, where datais composed by natural language texts. It enables theunderstanding of and alignment between computerand human languages. E.g.: from maintenance logs itis possible to determine that a specific operator per-formed specific operations which led to extended/re-duced asset life;

• predictive analytics: to predict future outcomes, it uti-lizes machine learning and data mining techniques.The holistic approach of sophisticated analytics tool isapplied to develop models and estimations about thebehavior and the useful life of assets;

• prescriptive analytics: it adds a decision managementframework to the predictive analytics outcomes in or-der to align and optimize decisions according to ana-lytics and organizational domains knowledge. The goalto achieve is not just to identify when an asset fails,but also to suggest actions, and to show the implica-tions of each decision option.

The data analysis can lead to prove a precise forecastabout how long a component or a drive unit will continueto function under specific conditions. The analysis alsodetermines, with greatest accuracy, which actions must betaken when a behavioral pattern registered by the data,and based on past experience, indicates that an acute fail-ure can be expected in short time. To achieve these goals,it is fundamental to apply a holistic approach made bythe implementation of advanced algorithms, knowledge ofdomain expert, and best practices.

4) Data visualization: once the data have been corre-lated and analyzed and new patterns have been discoveredand validated, the visualization phase allows to the stake-holders to take actions accordingly. Within the data visu-alization types, the most common are the dashboards, in-fographics and balanced scorecards. Transforming datainto meaningful and easy to understand information viasome forms of visualization or reports can lead to the im-plementation of an effective Operational Intelligence (OI)strategy. To achieve these results, the data visualizationsystem has to meet the following traits:

• useful: all the stakeholders (management, dispatchers,maintenance engineers) although with different aims,have to use the information on a regular basis and can

OSSERVATORIO

INGEGNERIA FERROVIARIA – 450 – 5/2018

Page 18: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

mini tecnico e organizzativo. L’obbiettivo non è sola-mente identificare il malfunzionamento di un appara-to, ma anche suggerire le azioni da intraprendere, sop-pesando le implicazioni di ogni decisione.

L’analisi dei dati può portare ad effettuare previsioni diquanto a lungo un componente o un’unità continuerà afunzionare a fronte di specifiche condizioni. L’analisi de-termina anche, con ragionevole accuratezza, quali azionidovrebbero essere intraprese qualora un modello di predi-zione basato su misurazioni in tempo reale e su esperien-ze passate, indicasse la probabilità che si verifichi un gua-sto nel breve termine. Per raggiungere questo obbiettivo èfondamentale applicare un approccio olistico ottenibileimplementando algoritmi avanzati, il know-how propriodell’esperto di settore e l’impiego di metodologie manu-tentive basate sullo stato dell’arte.

4) Visualizzazione dei dati: una volta che i dati sonostati correlati ed analizzati e che nuovi modelli sono statiidentificati e validati, la fase di visualizzazione permettedi trasferire agli stakeholder (portatori di interesse) leinformazioni necessarie affinché possano intraprendere iprovvedimenti opportuni basandosi non solo sulla propriaesperienza personale, ma anche su uno strumento di sup-porto alle decisioni. Tra gli strumenti per la visualizzazio-ne dei dati vi sono le dashboard (cruscotti di dati), l’info-grafica e le balanced scorecard (schede di valutazione bi-lanciata). È importante notare che la trasformazione didati grezzi in informazioni significative e facili da com-prendere, attraverso l’impiego di report o forme grafiche,risulti fondamentale per l’implementazione di una strate-gia di Operations Intelligence (OI) efficace. Al fine di otte-nere questi risultati il sistema di visualizzazione dei datideve essere:

• utile: tutti gli stakeholder (il management, i manuten-tori e gli ingegneri), anche se con fini differenti, devo-no poter utilizzare regolarmente le informazioni e de-vono essere in grado di prendere decisioni rilevanti vi-sualizzando in un unico cruscotto tutti gli indicatorirappresentativi; infatti spesso le diverse informazionisono contenute in data silos differenti e memorizzatecon formati eterogenei. Risulta quindi fondamentalecostruire dei cruscotti capaci di integrare informazioniprovenienti da diverse fonti, integrando solo quegli in-dicatori realmente utili in funzione delle responsabi-lità dei vari stakeholder;

• di facile utilizzo e di impatto visivo: non solo deve es-sere facile da usare, ma anche piacevole;

• efficace: i soggetti che lo utilizzano devono ottenere leinformazioni che cercano velocemente e con facilità;

• scalabile: deve essere facile poterlo mantenere e modi-ficare in futuro a fronte di esigenze di crescita delle va-riabili analizzate.

Il flusso informativo completo per trasformare i datigrezzi in informazioni utili e modelli di manutenzione èriportato in figura 4.

make relevant decisions by viewing all the insightsthey need in one place; in fact, often the different infor-mation are contained in different data silos and storedin heterogeneous formats. It is therefore essential tobuild dashboards capable of integrating informationfrom different sources, integrating only those indica-tors that are really useful according to the responsibili-ties of the various stakeholders;

• user friendly and visually appealing: it has to be notonly easy to use, but also pleasurable to use;

• effective: stakeholders who use it should accomplishtheir goals quickly and easily;

• scalable: it has to be prone to accessibility and futuremaintenance and modifications.

The end-to-end flow to transform raw data into usefulinsights and maintenance patterns is reported in figure 4.

5. The enabling IT

To deploy an effective predictive maintenance frame-work, it is not enough to identify and collect the right da-ta, to calibrate the right models, and to build the appro-priate algorithms. In addition to those elements discussedabove, a robust IoT platform is required to collect andstore a big amount of input raw data to convert into use-ful insights and information. This massive volume of da-ta is rapidly growing and can be effectively administeredalso through relational databases and non-SQL databas-es. Only intensive parallel processing systems and In-Memory DBs are able to handle and analyze such hugevolumes of data with complex algorithms.

There are different solutions that enable the RailwayPredictive Maintenance from an IT infrastructure point ofview. These solutions are designed to collect, store, man-age, and analyze huge amount of heterogeneous data, andcan be interfaced with in-memory platforms to performreal-time analysis of structured data. The central ecosys-tem (figure 5) can be constituted by Apache Hadoop, anopen-source framework utilized to manage and processhuge amount of data through commodity hardware andboth distributed computational (Map Reduce) and storage(Hadoop Distributed File System) resources. Multiple da-ta types from many sources (engine variables, bogies sen-sors, GPS position within the line, atmospheric data, etc.)may be ingested into the data lake built over the infra-structure, satisfying the requirement to run Hadoop anddifferent other analytics suites across large, diverse datasets. Hadoop, thanks to its modular components, can per-form comprehensive analysis of structured, semi-struc-tured, and unstructured data, identifying predictive mod-els and dependencies among data apparently not correlat-ed, showing the results through highly customizable re-ports. In this way, it is possible to extract informationfrom different independent data, whose correlation could

OSSERVATORIO

INGEGNERIA FERROVIARIA – 451 – 5/2018

Page 19: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

5. Le tecnologie IT abilitanti

Al fine di rendere efficace un sistema di manutenzionepredittiva, però, non è sufficiente identificare e raccoglierei dati corretti per calibrare i giusti modelli e costruire glialgoritmi appropriati. In aggiunta a questi elementi è ne-cessaria una robusta piattaforma IoT che abiliti la raccol-ta, l’immagazzinamento e la conversione di una grandequantità di dati grezzi in informazioni utili. Il volume didati in ballo cresce rapidamente e deve essere gestito attra-verso database sia relazionali che No-SQL. Al fine di gover-nare ed analizzare un tale volume di dati con algoritmicomplessi, non si può prescindere dall’implementazione diun sistema computazionale con risorse distribuite e dall’u-tilizzo di database in-memory.

Esistono diverse soluzioni verticali abilitanti la manu-tenzione predittiva ferroviaria dalpunto di vista delle infrastrutture IT.Si tratta fondamentalmente di solu-zioni progettate per immagazzinare,gestire ed analizzare raccolte di datimolto estese in termini di volume, va-rietà e velocità (big data), ed in gradodi interfacciarsi con piattaforme in-memory per l’analisi in tempo realedei dati strutturati.

L’ecosistema centrale (figura 5) puòessere costituito da Apache Hadoop, unframework software open-source utiliz-zato per gestire e processare ingentiquantitativi di dati attraverso commo-dity hardware e risorse distribuite com-putazionali (Map Reduce) e di memo-rizzazione (Hadoop Distributed File Sy-stem). Svariati tipi di dati provenientida diverse fonti (variabili di stato delmotore, sensori dei carrelli, posizioniGPS, dati atmosferici ecc.) potrebberoessere inglobati nel data lake costruitosull’infrastruttura, soddisfacendo così irequisiti per utilizzare Hadoop e le va-rie suite di analytics, costruendo uncampione di dati eterogeno e rappre-sentativo. Hadoop, grazie ai suoi diver-si moduli, può svolgere analisi di datistrutturati e non, volte a identificaremodelli e dipendenze su grandezze ap-parentemente non correlate, garanten-do, inoltre, un’elevata personalizzazio-ne della reportistica ottenuta a valledelle analisi.

In questo modo è possibile estrarreinformazioni da dati indipendenti, lacui correlazione potrebbe fornire insi-ght (approfondimenti) sulla salute deidiversi sottosistemi del treno, in fun-zione di condizioni al contorno dina-miche ed esogeneità variabili.

provide insights about the health of the different trains’subsystems, in function of dynamic border conditionsand variable exogeneity. To maximize performance, data isautomatically spread and balanced across the cluster’snodes, to guarantee the required scalability. This ecosys-tem is designed to analyze both structured data derived byIP sensors and unstructured data (usually bigger) and ob-tained by external sources not directly related to the train’sdiagnostic.

It is fundamental to dispose of appropriate computa-tional capacity to deploy similarity analyses in real timeincluding, simultaneously, as much time series as possi-ble in order to obtain triggers and alarms during the phas-es of incipient malfunction of fleets along the lines. To be

OSSERVATORIO

INGEGNERIA FERROVIARIA – 452 – 5/2018

Fig. 4 - Il flusso di trasformazione dai dati grezzi alle informazioni utili.Fig. 4 - The transformation flow from raw data into useful insights;

Page 20: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

Per massimizzare le performance i dati vengono auto-maticamente spalmati e bilanciati tra gli elementi del clu-ster garantendo la scalabilità necessaria in funzione delleesigenze. Un ecosistema così progettato si presta ad analiz-zare sia dati strutturati provenienti da sensoristica IP, siadati non strutturati di più grosse dimensioni e provenientida fonti non direttamente legate alla diagnostica del treno.

Risulta fondamentale disporre di una capacità di calco-lo tale da effettuare analisi in tempo reale e computandoquante più sequenze di dati possibili simultaneamente, alfine di ottenere allarmi ed informazioni nelle fasi di mal-funzionamento incipiente. Per raggiungere tali obiettiviprestazionali non si può prescindere dall’utilizzo di soluzio-ni di analisi in-memory.

Esistono diverse piattaforme in grado di effettuare ana-lisi su basi di dati contenute su memoria RAM (memoriaad accesso casuale), tra queste una particolarmente effica-ce, ed interfacciabile con l’ecosistema Lumada, è la soluzio-ne HANA lanciata da SAP. Infatti, tale piattaforma consentedi costruire un database in-memory in grado di estrarreinformazioni in tempo reale da una vasta quantità di dati,anche provenienti da fonti eterogenee.

Contestualizzando, un intero treno, in funzione delladiagnostica a bordo, potrebbe produrre fino a 500 MB didati durante una giornata di servizio (25 GB se si conside-rasse anche il flusso dati della video sorveglianza a bordo).Nella figura 6 è riportato uno schema semplificato di solu-zione convergente per SAP HANA in configurazione ScaleOut. Al fine di semplificare la rappresentazione grafica, si èipotizzato che le connessioni ISL siano già previste tra i va-ri switch accoppiati, così come, per semplicità, si evitano diriportare i collegamenti ridondati tra ogni singolo switch edogni singolo apparato ad esso attestato.

6. Il framework IoT Lumada

Per far fronte a tutte le necessità hardware e softwaredescritte in precedenza, Hitachi ha sviluppato una architet-tura IoT componibile e verticalmente integrata, Lumada, ingrado di consolidare tutti i componenti attraverso un unicostack. Il framework Lumada, infatti, è stato progettato pergestire il completo ciclo di vita di dispositivi e apparati divaria natura, misurandone le performance in tempo reale,creando insiemi di dati storici statisticamente rappresenta-tivi utili ad effettuare previsioni e ottimizzazioni di naturatecnica e finanziaria. La sua architettura, flessibile e modu-lare, grazie al rilascio di interfacce di programmazionepubbliche (Application Programming Interfaces, API), con-sente di implementare soluzioni di terze parti (proprietarieed open source) anche già presenti presso il cliente, proteg-gendo quindi gli investimenti pregressi. Lumada si connettesia in real time che batch con dispositivi singoli, con flottedi apparati, anche se geograficamente distribuiti o in movi-mento. Grazie ai suoi tool di data ingestion è in grado di vi-sualizzare i dati provenienti dagli apparati, memorizzarli supiattaforme big data, analizzarli con strumenti di intelligen-za artificiale e machine learning, ed eseguire opportuniwork flow a seguito degli output ottenuti, anche integrando-si con i sistemi informativi aziendali.

compliant with those achievements in terms of perfor-mance, it is necessary to utilize in-memory platforms.

There are different platforms within the marketplaceable to perform analysis over random-access memory(RAM); one powerful option is represented by the HANAsolution provided by SAP. In fact, this platform allowsbuilding an in-memory database able to extract real-timeinformation from a huge amount of heterogeneous data.

To contextualize, an entire train, in function of thenumber of sensors installed, can produce up to 500 MBof data within one day of service (25 GB if are consideredalso the data flows coming from video surveillance sys-tems onboard). In figure 6 is reported a simplified exam-ple of convergent solution for SAP HANA in Scale-Outconfiguration. To simplify the graphical representation, ithas been considered that ISL connections are already pre-sent among the different couple of switches, and it is alsographically omitted the redundant links between eachsingle switch and its correspondent device.

6. The IoT framework Lumada

To satisfy the hardware and software exigencies de-scribed above, Hitachi developed a vertically integratedcomposable IoT framework, Lumada, able to consolidateall the required components within a unique stack.Lumada, in fact, is designed to manage the entire life-cy-cle of different types of assets and devices, measuring realtime performances, building statistically representativedata set along the useful life of the asset, performing tech-nical and financial forecasts and optimizations. Its mod-ular and flexible architecture, thanks to public applica-tion programming interfaces (API), allow the implemen-tation of third party solutions (both proprietary and opensource) even if already installed within the customer’sframework, allowing the preservation of previous invest-ments. Lumada can establish both real time and batchconnections with single devices, with fleet of assets, evenif geographically spread or in movement. Thanks to itsdata ingestion tools it is able to visualize data comingfrom assets, store those on big data platforms, and ana-lyze the entire data lake through AI and machine learningtools, acting specific workflow as response of achieved re-sults, also integrating with corporate IT systems. Themodular approach does not deal just with functionswhich are able to be integrated within the ecosystem, butalso the scalability in terms of types and amount of mon-itorable devices, allowing to add/remove assets withoutaffecting the global availability of the solution.

Lumada utilizes three basic concepts to interface andvirtualize the assets:

1. Gateway: it is a software that federates n devices thatwill be interfaced with Lumada. It is utilized when itis necessary to utilize a specific topology (spatial dis-tribution of assets) or when the single devices to be

OSSERVATORIO

INGEGNERIA FERROVIARIA – 453 – 5/2018

Page 21: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

L’approccio modulare non riguarda soltanto le funziona-lità integrabili nell’ecosistema, ma anche la scalabilità in ter-mini di tipologia e numero di apparati monitorabili, permet-tendo di aggiungere/rimuovere dispositivi senza incideresull’operatività complessiva della soluzione.

Lumada usa tre concetti di base per virtualizzare i dispo-sitivi al proprio interno:

1. Gateway: è un software che federa n dispositivi che poiverranno integrati in Lumada. Si utilizza o quando sivuole implementare una topologia particolare (distribu-zione spaziale degli apparati) o quando i singoli apparatida integrare usano bus/protocolli diversi da quelli stan-dard supportati. Per esempio, in ambito industriale, ilgateway consente di connettersi al PLC (Controllore aLogica Programmabile, elabora i segnali provenienti dasensori e diretti agli attuatori presenti in un impianto), aisistemi SCADA (rappresentano sistemi informatici di-stribuiti per il monitoraggio elettronico dei sistemi fisi-ci), ad architetture OPC (protocollo di comunicazionemachine-to-machine per l’automazione industriale), ecc.

2. Asset avatar type: rappresenta il blueprint che racchiudele caratteristiche digitali che verranno fornite da ogni ap-parato di quella specifica classe. L’asset avatar type co-struito per una flotta di treni ad alta velocità, ad esem-pio, fornirà, specifici segnali a Lumada, e tali segnali sa-ranno, in parte, diversi da quelli forniti dall’asset avatartype costruito per una flotta di metropolitane. Quindi

ingested utilize different bus/protocols from the stan-dard supported. E.g.: within the industrial sector, thegateway allows to connect to PLC (an industrial digi-tal computer which has been ruggedized and adaptedfor the control of manufacturing processes), to SCA-DA systems (is a control system architecture to in-

terface to the process plant or machinery), and toOPC architectures (machine-to-machine protocol forindustrial automation), etc.

2. Asset avatar type: it represents the blueprint thatcontains the digital features that will be provided byeach single asset. The asset avatar type built for afleet of high-speed trains, for instance, will providespecific signals to Lumada, and few of those will bedifferent from the ones provided by the asset avatar

type built for metro fleet. This element will teachLumada about which values will receive as inputfrom each type of asset and will allow performingcorrections over entire fleets, just modifying the asset

avatar type of that fleet.

3. Asset avatar: it represents the avatar of each device, isthe digital twin that digitally reproduce the real ma-chine that is necessary to map. Within the railway ex-ample, the asset avatar represents the single train thatbelongs to the specific fleet (asset avatar type). Each

OSSERVATORIO

INGEGNERIA FERROVIARIA – 454 – 5/2018

Fig. 5 - Ecosistema integrato Hadoop, piattaforma in-memory e data mining.Fig. 5 - Hadoop integrated ecosystem, in-memory platform, and data mining.

Page 22: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

questo elemento istruirà Lumada su quali valori riceveràin input da ogni tipologia di apparato e consentirà di ef-fettuare correzioni su intere flotte di veicoli, semplice-mente modificando l’asset avatar type di quella flotta.

3. Asset avatar: rappresenta l’avatar, il digital twin, che rico-

struisce digitalmente il dispositivo reale che si intende

mappare. Nell’esempio ferroviario, l’asset avatar rappre-

senta il singolo treno che appartiene alla specifica flotta

(asset avatar type). Ogni asset avatar fornisce indicazioni

sullo stato di funzionamento dell’apparato cui si riferi-

sce, è in grado di inizializzare algoritmi specifici a frontedel verificarsi di determinate soglie, e può mettere in re-

lazione le variabili monitorate con sistemi ERP (Enter-

prise Resource Planning, sistema di gestione che integratutti i processi di business rilevanti di un’azienda [15]).

L’ecosistema Lumada è costituito da quattro moduli di-stinti che, mutuamente vincolati, consentono di gestire l’in-tero flusso end-to-end dalla raccolta del dato all’attivazionedi azioni correttive (figura 7).

Di seguito si riporta una breve descrizione per ognimodulo:

asset avatar provides indications on the functioningstate of the apparatus to which it refers, it is able toinitialize specific algorithms against the occurrence ofcertain thresholds, and can relate the variables moni-tored with ERP systems (Enterprise Resource Plan-ning, management system that integrates all the rel-evant business processes of a company [15]).

The Lumada ecosystem can be described through fourdistinct modules that, mutually constrained, allow man-aging the entire end-to-end flow from data collection toactivation of corrective actions (figure 7). Below is re-ported a brief description for each module:

1. Edge: it is a tool that enable data collection from het-erogeneous sources and with different formats work-ing as an ETL gateway (Extract, Transform, & Load)that acquires, normalizes, and transfers data fromspatially distributed devices to the central database ofthe Core module. In addition, Edge is able to providecomputing resources at local level to filter and priori-tize received data, perform data streaming analysis re-ducing latency and optimizing network load for datatransfer from “periphery” to “center”. Being a scalable

OSSERVATORIO

INGEGNERIA FERROVIARIA – 455 – 5/2018

Fig. 6 - Schema semplificato di una soluzione convergente per SAP HANA in configurazione Scale-Out.Fig. 6 - Simplified schema of convergent solution for SAP HANA in Scale-Out configuration.

Page 23: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

1. Edge: si tratta di uno strumento in grado di abilitare laraccolta dati da sorgenti eterogenee e con formati diffe-renti lavorando a tutti gli effetti come un gateway ETL(Extract, Transform, & Load) che acquisisce, normalizza,e trasferisce i dati dagli apparati distribuiti nello spazioverso il database centrale del modulo Core. In aggiunta,Edge è in grado di fornire risorse di calcolo locali per fil-trare e priorizzare i dati ricevuti, effettuare analisi distreaming data riducendo la latenza e ottimizzando il ca-rico di rete per il trasferimento dati dalla “periferia” al“centro”. Essendo una soluzione scalabile in cluster, con-sente anche l’implementazione di Fog Computing, ovveroun'architettura orizzontale, a livello di sistema, utile a di-stribuire senza soluzione di continuità risorse e servizi dicalcolo, immagazzinamento di dati, controllo e funziona-lità di rete sull'infrastruttura che connette il Cloud all'Inter-net delle Cose (IoT) [16]. L’appliance Edge è in grado, gra-zie ai suoi strumenti per gli sviluppatori (Software Deve-lopments Kits, SDKs), di mettere a fattor comune diversisilos di dati ad oggi indipendenti e disgiunti, abilitandol’implementazione di analisi basate su intelligenza artifi-ciale e machine learning.

2. Core: rappresenta il nucleo centrale del framework, rice-ve i dati dai sensori o dagli Edge e li memorizza in appo-siti database al fine di abilitare la costruzione di campio-ni statisticamente rappresentativi che verranno poi ana-lizzati nel modulo Analytics. Inoltre, nel Core vengonoespletate tutte le attività di gestione delle identità e degliaccessi, conservando appositi registri per ogni apparatointerfacciato, garantendo quindi la sicurezza logica del-l’intero ecosistema. Il modulo Core si occupa anche dimemorizzare, visualizzare ed esportare attraverso appo-site API (connettori sviluppabili ad hoc) gli asset avatardegli apparati monitorati verso applicativi anche di terzeparti, rendendo così l’intero ecosistema “aperto” e nonvendor lock-in. Inoltre, riesce a comunicare con i vari di-spositivi monitorati, implementandone modifiche alleconfigurazioni in funzione delle analisi effettuate. Taliautomatismi espletati dal Core facilitano la gestione diflotte anche di grandi dimensioni, replicando simulta-neamente, in automatico, le nuove impostazioni evitan-do complesse e laboriose attività manuali.

3. Analytics: questo modulo del framework fornisce tutte lefunzionalità necessarie per fronteggiare le complessitàdovute all’analisi e alla gestione di ingenti quantitativi didati eterogenei e multi sorgente che arrivano costante-mente da sensori, macchine, ed altri apparati connessi aInternet. Per le attività di gestione dei dati, Lumada puòutilizzare, tra le varie soluzioni, anche Pentaho, suite dianalytics che fa da orchestrator per la parte di ETL, BigData ingestion, MapReduce management, data analytics edata visualization. Il modulo Data Integration (PDI), adesempio, consente di integrare, raffinare e correlare ti-pologie di dati differenti anche multi sorgente, utilizzan-do la consolle nativa oppure integrando modelli costrui-ti in R, Python o Weka. Grazie all’interfaccia grafica“drag&drop”, PDI elimina la necessità di scrivere codice,riducendo la complessità e aumentando la produttività

cluster solution, it also allows the implementation ofFog Computing that is a horizontal, system-level ar-chitecture that distributes computing, storage, controland networking functions closer to the users along acloud-to-thing continuum [16]. The Edge applianceis able, thanks to its tools for developers (SoftwareDevelopments Kits, SDKs), to bring together differentsilos of independent and disjointed data, enabling theimplementation of analysis based on artificial intelli-gence and machine learning.

2. Core: represents the kernel of the framework, receivesthe data from the sensors or the Edge and stores themin specific databases in order to enable the construc-tion of statistically representative samples that willthen be analyzed in the Analytics module. Moreover,all the identity and access management activities arecarried out in the Core, keeping special registers foreach interfaced device, thus ensuring the logical secu-rity of the entire ecosystem. The Core module alsotakes care of storing, displaying and exporting the as-set avatar of the devices monitored also to third-partyapplications, through special APIs (connectors thatcan be developed ad hoc), thus making the wholeecosystem “open” and not vendor lock-in. It alsomanages to communicate with the various monitoreddevices, implementing changes to the configurationsaccording to the analysis performed. These automa-tisms carried out by the Core facilitate the manage-ment of large fleets, simultaneously and automaticallyreplicating the new settings avoiding complex and la-borious manual tasks.

3. Analytics: this module of the framework provides allthe features necessary to face the complexities relatedto the analysis and management of large quantities ofheterogeneous and multi-sources data that constantlycome from sensors, machines, and other devices con-nected to the Internet. To perform all the activities re-lated to data management, Lumada can utilize,among the diverse solutions also Pentaho, suite of an-alytics that act as an orchestrator for ETL, big dataingestion, Map Reduce management, data analytics &visualization. Pentaho Data Integration (PDI) mod-ule, for instance, allows to integrate refine, and corre-late diverse types of data even multi source, utilizingits own native console, or integrating models built inR, Python, Weka, and so on. Thanks to the visual in-terface “drag&drop”, PDI removes the need to writecode, reducing complexity and increasing data scien-tists’ productivity during the ETL phases, within theactivities of analysis and results visualization, duringthe interfacing with Hadoop and Spark distributions,with SQL and NoSQL databases, and during the ex-port of data toward in-memory platforms. Based onopen source framework with a big community of de-velopers worldwide, Pentaho represents a continuousevolving solution constantly aligned to the new and

OSSERVATORIO

INGEGNERIA FERROVIARIA – 456 – 5/2018

Page 24: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

dei data scientist nelle fasi di ETL, nelle attività di analisie visualizzazione dei risultati, così come nelle operazionidi interfacciamento con distribuzioni Hadoop e Spark,con database relazionali e non, e verso piattaforme in-memory. Basato su un framework open source con unagrandissima comunità di sviluppatori alle spalle, rappre-senta una soluzione in continua evoluzione allineandosialle mutevoli esigenze del mercato. Pentaho garantiscegrande compatibilità con sorgenti di dati eterogenei econ gli applicativi proprietari più diffusi.

4. Studio: il modulo Studio può utilizzare diverse soluzio-ni in funzione delle esigenze del cliente, e garantisce lefunzionalità di front end inerenti alla visualizzazionedei risultati delle analisi e l’attivazione di specifici work-flow a fronte del raggiungimento delle soglie impostate.Studio, anche utilizzando Pentaho BA, consente dicreare diversi cruscotti informativi aggiornati in temporeale in funzione dei vari portatori di interesse: il topmanagement visualizzerà una serie di indicatori diversirispetto agli ingegneri che, a loro volta, avranno accessoad informazioni distinte rispetto a quelle degli operai inlinea, ecc. Oltre a visualizzare i vari cruscotti anche inmobilità, Studio è in grado di interfacciarsi sia in inputche in output con i sistemi gestionali aziendali, inte-grando ed indicizzando anche dati non strutturati.

Sottosistemi, dispositivi e apparati possono interagirecon Lumada utilizzando sia il protocollo HTTP (HyperTextTransfer Protocol, protocollo di trasferimento di un iperte-sto) attraverso l’architettura REST (REpresentation StateTransfer), sia altri protocolli “binari” che hanno un patterndiverso, noto come publish/subscribe; tra questi si citano:

• MQTT (Message Queue Telemetry Transport): nato persoddisfare esigenze telemetriche, molto leggero ed affi-

mutable marketplace’s exigencies. It guarantees deepcompatibility with sources of heterogeneous data andwith the most diffused proprietary applications.

4. Studio: this module, that can be deployed utilizingdifferent solutions in function of the customer’s exi-gencies, guarantees front-end functions related to thedisplay of analysis results and the activation of specif-ic workflows in function of exceeding thresholds. Stu-dio, also utilizing Pentaho BA, allows creating severaldashboards updated in real time according to the var-ious stakeholders: the top management will visualizea series of different indicators compared to the onesdedicated to the engineers who, consequently, willhave access to distinct information from those of theoperative workers, etc. In addition, Studio is able tointerface both in input and in output with the compa-ny management systems, integrating and indexingeven unstructured data, showing the various dash-boards even in cloud.

Subsystems, devices, and assets can interact withLumada utilizing both the HTTP protocol through theREST (REpresentation State Transfer) architecture, andother “binary” protocols with a different pattern, knownas publish/subscribe; among those, there are:

• MQTT (Message Queue Telemetry Transport): de-signed to satisfy telemetry exigencies, it is very lightand affordable (with three different levels of QoS),above all over networks with low connectivity perfor-mance and stability.

• AMQP (Advanced Message Queueing Protocol): de-veloped predominantly for “server to server” connec-

OSSERVATORIO

INGEGNERIA FERROVIARIA – 457 – 5/2018

Fig. 7 - L’architettura concettuale del framework Lumada.Fig. 7 - The Lumada's framework conceptual architecture.

Page 25: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

dabile (garantisce tre livelli differenti di qualità del ser-vizio) soprattutto su reti non perfette in termini di stabi-lità della connessione.

• AMQP (Advanced Message Queuing Protocol): sviluppatoprevalentemente per la connessione “server to server” equindi per sistemi enterprise, è più “pesante” di MQTTma supporta numerosissimi pattern differenti.

Grazie ad un modulo di cyber security ingegnerizzato adhoc, tutte le comunicazioni tra i vari layer del framework,tra questi e gli apparati distribuiti da monitorare, così co-me tutte le connessioni con gli utenti finali sono protetteda avanzati strumenti di crittografia. Il framework Lumadafornisce tutto il necessario per costruire la piattaforma IoTdisegnata su misura per indirizzare tutte le necessità delcliente, utilizzando tecnologia sia proprietaria Hitachi chedi terze parti, al fine di costruire una soluzione vertical-mente integrata e allineata alle esigenze di progetto.

Hitachi fornisce, quindi, anche le conoscenze di dominioper guidare gli stakeholder nella definizione delle specifichetecniche, nell’ottimizzazione dei processi industriali e nel ci-clo end-to-end della creazione del valore.

Tra le funzionalità globali erogabili, a titolo esemplifica-tivo ma non esaustivo, si citano:

– integrazione di applicativi anche terze parti;

– implementazione di diversi bus di comunicazione;

– costruzione del data lake;

– analytics;

– ETL;

– complex event processing;

– analisi dei flussi dati in tempo reale e batch;

– estrazione di algoritmi predittivi con possibilità di inter-facciarsi verso piattaforme in-memory;

– esecuzione di workflow a fronte di soglie o cicli iterativi;

– costruzione di avatar per digitalizzare gli apparati pro-duttivi reali;

– gestione di metadati aggiuntivi;

– gestione dell’intero ciclo di vita del dispositivo;

– predictive quality;

– implementazione di scenari what-if;

– charge back e ripartizione dei costi secondo Activity-Ba-sed Costing (ABC).

La customizzazione di Lumada abilita la realizzazioneun framework di manutenzione predittiva ferroviaria cheintegri le competenze di dominio con le tecnologie abilitan-ti i predictive analytics ed i sistemi automatizzati di suppor-to alle decisioni. Tale framework consente di interfacciarsiin tempo reale con le flotte dei treni in esercizio, memoriz-zando eventi, segnali diagnostici e contatori. In questo mo-do sarà possibile costruire un data set multi sorgente chesia statisticamente rappresentativo e abiliti l’estrazione dimodelli predittivi al fine di effettuare le operazioni manu-

tion for enterprise systems, it is heavier than MQTT,but it supports many different additional patterns.

Using a cyber-security module designed ad hoc, all thecommunications among the different framework’s layers,among those and the distributed assets to be monitored,and also all the connections with the end users are protect-ed by advanced encryption tools. The Lumada frameworkprovides everything needed to build a tailor-made IoT plat-form to address all customer needs, using both proprietaryHitachi and third-party technologies, to build a verticallyintegrated solution that aligns with project needs.

Hitachi does not provide just the technology, but alsothe domain knowledge to advise the involved stakehold-ers in defining technical specs, in industrial processes op-timization, and within the end-to-end cycle of value cre-ation.

Below is reported a list, intended to be illustrative andnot limiting, of global functionalities deployable:

– integration with third party applications;

– implementation of different communication buses;

– data lake creation;

– analytics;

– ETL;

– complex event processing;

– real time and batch analysis;

– extraction of predictive models (algorithms) with thepossibility to interface in-memory platforms;

– workflow execution in function of thresholds and iter-ative cycles;

– digital twin (avatar) construction to digitalize realassets;

– management of additional metadata;

– management of entire asset’s life-cycle;

– predictive quality;

– implementation of what-if scenarios;

– chargeback and cost splitting according to activity-based costing (ABC).

Through the Lumada customization, it is going for-ward the construction of a framework for railway predic-tive maintenance that integrates domain competencieswith technologies enabling predictive analytics and auto-mated decisions support systems. This framework is ableto interface in real time with the fleet of trains along thelines, collecting events, diagnostic signals, and counters.This will allow the construction of a multi-source andstatistically representative data lake that enables the ex-traction of predictive models to perform just-in-time/in-case maintenance operations, increasing the trains’availability reducing potential inefficiencies. In parallel

OSSERVATORIO

INGEGNERIA FERROVIARIA – 458 – 5/2018

Page 26: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

tentive in logica just-in-time/in-case, aumentando sensibil-mente la disponibilità dei treni in linea ed eliminandoeventuali “sacche” di inefficienza. In parallelo a questa pri-ma fase, a seguito di un importante progetto di digital tran-sformation delle linee produttive, Hitachi sta lavorando permappare i propri processi produttivi ed integrare al datalake della manutenzione predittiva anche i dati inerenti allaprogettazione, alla produzione, ed al collaudo dei vari as-set. In questo modo, grazie alla serializzazione degli appa-rati, sarà possibile ricostruire digitalmente tutto il flussoproduttivo end-to-end, abilitando root-cause analysis, rein-gegnerizzazione dei processi e/o dei prodotti, ribaltamentodei costi seguendo una metodologia activity-based, estraen-do quindi informazioni tecniche ed economiche atte ad in-crementare indicatori sia di efficienza che di efficacia.

Lumada rappresenta il denominatore comune abilitantei progetti inerenti alla manutenzione predittiva ferroviaria elo smart manufacturing (figura 8), mettendo in relazionesorgenti di dati differenti, anche in tempo reale, estraendoinformazioni e generando valore.

I vantaggi di tali soluzioni saranno usufruibili sia incloud che on-premises, e potranno anche essere proposti as-a-service per tutte quelle realtà che, non disponendo dellamassa critica necessaria ad ingegnerizzare una soluzionecosì complessa, potranno comunque trarne giovamento me-diante l’utilizzo a servizio.

7. Manutenzione predittiva ferroviaria: nuovi sce-nari di business

Efficaci soluzioni di manutenzione predittiva possonoavere un impatto positivo sul business ferroviario e, allostesso tempo, rivoluzionare gli approcci manutentivi.

Un sistema di MPF efficace può influenzare positiva-mente i ricavi e i costi, apportando miglioramenti sia intermini di efficienza che di efficacia. Dal punto di vista deicosti lungo il ciclo di vita, è possibile ottenere i seguenti ri-sultati:

• ridurre le esigenze di riserve operative e i relativi costi:tipicamente è richiesta una riserva operativa variabiledal 5% al 15% dell’intera flotta da impiegare come scortain caso di guasti. Attraverso una strategia di MPF è pos-sibile ottimizzare la manutenzione del parco veicoli pre-vedendo quando un componente potrebbe guastarsi. Leinterruzioni non pianificate al servizio vengono così ri-dotte drasticamente permettendo di ridurre il numero ditreni tenuti a disposizione per fronteggiare potenzialidisservizi. Questo si traduce in un duplice risparmio siasul Capital Expenditure (CAPEX, spese per il capitale) siasull’Operational Expenditure (OPEX, spese operative);

• estendere la vita utile degli apparati: la MPF consentedi programmare la sostituzione dei componenti quan-do sono prossimi al guasto e non solo quando suggeri-to convenzionalmente dai manuali tecnici, riducendole spese per l’acquisto di ricambi e ottimizzando i co-sti di utilizzo delle squadre manutentive.

with this first phase, proceeding with an important digi-tal transformation project within the production chains,Hitachi is working to map the production processes tointegrate to the predictive maintenance data lake also ad-ditional data related to design of subsystems, their pro-duction, and the tests performed to certify the compli-ance. Thanks to the asset serialization it will be possibleto build digital representation of all the processes withinthe entire lead cycle, enabling root-cause analysis,process and product re-engineering, charge back policies,extracting technical and economic information useful toincrease efficiency and effectiveness KPIs.

Lumada represents the common denominator to en-able the two projects (figure 8), blending different sourcesof data, also in real time, extracting information and gen-erating value.

Those solutions can be delivered both on cloud andon premises, and could be proposed also as-a-service toaddress the financial exigencies of small and medium en-terprises that can prefer an OPEX investment in functionof the real utilization of the resources.

7. Railway predictive maintenance: new scena-rios of business

Affordable Railway Predictive Maintenance solutionscan positively influence the rail business, while complete-ly transforming the maintenance landscape.

An effective RPM framework can positively influenceboth revenues and costs, achieving efficiency and effec-tiveness improvements. For what concerns the costs, it ispossible to obtain the following results:

• reducing the exigencies for operational reserves and re-lated costs: train fleets typically need an operational re-serve from 5% to 15% as back up in case of operationalfailure. Through a RPM framework it is possible to opti-mize the rolling stock maintenance by predicting whena component will fail. Unplanned outages of rollingstock are minimized, so fewer trains need to be kept onstandby. This leads savings on both Capital Expenditure(CAPEX) and Operational Expenditure (OPEX);

• extending the useful life of the assets: RPM allows toreplace the components when they are close to failureand not when the manual suggests. This means ex-pensive components are used optimally, reducing thespending on parts, and minimizing labor costs relatedto maintenance.

RPM can also increase the revenues related to the rail-way service operators, achieving the following objectives:

• moving trains from operational reserve to the line:mitigating the risk of serious outages, it is possible toutilize trains that before were kept as back up, to runnew services and consequently increasing the numberof tickets sellable per day without additional CAPEX;

OSSERVATORIO

INGEGNERIA FERROVIARIA – 459 – 5/2018

Page 27: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

La MPF può anche aumentare i ricavi degli operatoridi trasporto su ferro, ottenendo i seguenti risultati:

• impiegare i treni di scorta per erogare servizi operativi:una volta mitigato il rischio di interruzioni di guasti in li-nea, è possibile utilizzare i treni precedentemente tenuticome riserve per effettuare nuove corse, aumentando,così, il numero di biglietti giornalmente vendibili senzaulteriori costi CAPEX per l’acquisto di nuovi rotabili.

• attrarre domanda proveniente da altri modi di trasporto:un alto grado di affidabilità rende l’operatore ferroviariopiù attraente per il consumatore, permettendo quindi diattrarre passeggeri che avrebbero utilizzato altri modi ditrasporto; ad esempio il treno ad alta velocità risulta piùattrattivo rispetto all’aereo per tratte fino a 700km.

Investire in un sistema di MPF potrebbe essere inte-ressante sia per i produttori ferroviari che per gli opera-tori di trasporto. Trenitalia può arrivare a spendere inmedia 1,3 miliardi di Euro all’anno solamente per le ope-razioni di manutenzione di primo e secondo livello [18].Risulta quindi interessante quantificare il risparmio otte-nibile attraverso una efficace strategia di MP.

È possibile prendere in considerazione tre scenari (ta-bella 1): il caso migliore, il caso peggiore e quello più pro-babile. Nel primo scenario, il raggiungimento di un rispar-mio potenziale del 5% sull’intera spesa, consentirebbe dirisparmiare 65 milioni di Euro nell’intero anno fiscale.Nel caso peggiore, invece, con un risparmio del solo 1%rispetto allo scenario attuale, sarebbe possibile ottenereun risparmio di 13 milioni di Euro all’anno. In fine, qualo-

• attracting demand from other modes of transporta-tion: achieving a high degree of reliability allows therailway operators to be more attractive at customers’eyes, and to intercept new flows of passengers fromother modes (e.g.: airplane, for trips up to 700 km).

Investing in RPM could be interesting for both railwaymanufacturers and service operators. Trenitalia can spendan average of 1.3 billion Euros per year just for first andsecond level maintenance [18]. Therefore, it is interestingto assess which is the amount of savings achievablethrough an effective PM strategy. It is possible to considerthree scenarios (table 1): best, worst, and most likely. Inthe first case, achieving a potential saving of 5% of theentire spending, it will allow to keep 65 million Euroswithin an entire fiscal year. In the worst case, with a sav-ing of just 1% of the as-is scenario, it is possible toachieve 13 million Euros per year. Finally, a most likelyscenario, could lead to save up to 3% of actual spending,reaching a saving of 39 million Euros per year.

It goes without saying that in all the cases the initialinvestment can be amortized in few years, generatingpositive cash flow in terms of cost savings, optimiza-tions, and new demand attracted from others means oftransportation. The Payback Period (PP) has a key rolein order to let the RPM project feasible and attractive.

There are already different partnerships around theworld between IoT companies, railway manufacturers,and railway service operators that led to the implementa-

OSSERVATORIO

INGEGNERIA FERROVIARIA – 460 – 5/2018

Fig. 8 - Lumada come framework comune per i progetti di manutenzione predittiva e smart manufacturing.Fig. 8 - Lumada as common framework for both projects, predictive maintenance and smart manufacturing.

Page 28: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

ra si verificasse l’ipotesi più probabile, si potrebbe arriva-re a riduzioni del 3% della spesa effettiva, raggiungendocosì un risparmio di 39 milioni di Euro all’anno.

È evidente che in tutti gli scenari l’investimento inizialepotrebbe essere ammortizzato in pochi anni, generando cosìun flusso di cassa positivo in termini di risparmi di costo, otti-mizzazioni e ulteriore fatturato derivante da nuova clientelaproveniente da altri modi di trasporto. Il payback period (PP,periodo di recupero dell’investimento) ha un ruolo importan-te al fine di rendere il progetto di MPF attrattivo e sostenibile.

Nel settore ferroviario ci sono già diverse collaborazioniin atto tra società IT, produttori ferroviari e operatori diesercizio che hanno contribuito a implementare con succes-so scenari di MPF. Tra i casi di successo se ne cita uno diparticolare interesse perché include molti tra gli elementipositivi analizzati precedentemente. Lo scenario riguardadue grandi città a circa 700 km di distanza. Prima dell’im-plementazione di una linea ferroviaria ad alta velocità e delsistema di MPF, il tempo di percorrenza medio di un viaggiodi sola andata era di 5.5 ore, e il totale dei passeggeri ad usu-fruirne era di quasi 800.000 all’anno. Nello stesso periodo, lelinee aeree erano in grado di coprire la stessa rotta in 1.4 orepiù il tempo necessario per il check-in e i controlli di sicu-rezza, servendo l’80% del mercato, nonostante tale opzionefosse la più costosa. È importante sottolineare come la rottatra le due città rientrasse tra le più trafficate al mondo.

Una volta inaugurata la linea ad alta velocità, l’opera-tore ferroviario è stato in grado di ridurre sensibilmenteil tempo di percorrenza, riducendolo a 2.5 ore, rendendo-lo così comparabile al viaggio aereo, e quindi, dando aipasseggeri una reale possibilità di scelta. Al fine di punta-re ad attrarre la clientela aerea, l’operatore ferroviario hadeciso inoltre di offrire rimborsi completi per ogni viag-gio che avesse subito un ritardo superiore ai 15 minuti.Tale offerta è stata apprezzata dal mercato, sebbene espo-nesse l’operatore ferroviario a un rischio finanziario con-siderevole in caso di ritardo dei treni. Questo rischio,però, è stato mitigato grazie all’implementazione di un si-stema di MPF che garantisse un alto livello di affidabilità.

Una volta ridotti al minimo i guasti impattanti, la pro-babilità di subire ritardi superiori ai 15 minuti risulta mol-to contenuta. Grazie alle nuove performance ottenute intermini di durata del viaggio e affidabilità del servizio, l’o-peratore ferroviario ha potuto aumentare le proprie quotedi mercato dal 20% al 60%, riducendo i costi operativi dimanutenzione ed incrementando i ricavi grazie all’aumen-to della clientela. Da un punto di vista finanziario, invece,l’intero investimento è stato ripagato dai risparmi di costo,generando anche un flusso di cassa cumulato positivo.

Al netto dei ricavi extra derivanti dalla clientela attrattadal modo aereo, il periodo di payback di questo progetto èrisultato essere di 8 anni, il ROI pari al 130% calcolato su10 anni, il tutto considerando solo i risparmi ottenuti at-traverso l’implementazione del sistema di MPF. Conteg-giando anche il flusso di cassa aggiuntivo derivante dallanuova clientela, invece, il periodo di payback si riduce a so-li 3 anni. È importante notare che, inoltre, ci sono stati di-versi benefici aggiuntivi da un punto di vista trasportistico:

tion of RPM scenarios, and one of these is particularlyinteresting because shows all the positive topics dis-cussed above. The scenario consists of two big citieswhose distance is almost 700 km. Before the implementa-tion of high-speed railway line and the RPM framework,the time to perform a one-way trip was 5.5 hours, andthe total amount of passengers serviced was almost800.000 per year. At the same time, the airlines were ableto cover the same route in 1.4 hours plus the time forcheck-in and security checks; and they were servicing the80% of the market between the two cities, although beingthe most expensive option. It is important to highlightthat the air link between the two cities was part of the topbusiest air routes globally. Once the high-speed railwaysline was opened, the rail operator was able to reduce sig-nificantly the journey time, covering the distance in 2.5hours, making the plane and train trips comparable andgiving passengers a real choice. In order to target directlythe air routes passengers, the rail operator offered full re-funds for any journey that was delayed by more than 15minutes. This policy has been appreciated by the market-place of passengers, even though it exposed the rail oper-ator to a considerable financial risk in the case of delayedtrains. This serious risk has been mitigated through theimplementation of RPM framework that allowed to reacha high degree of reliability. With unplanned outages mini-mized, there is little chance of mechanical failure onroute or rolling stock availability delaying a train morethan 15 minutes. Thanks to these new performancesachieved in terms of time of journey and reliability of ser-vice, the rail operator increased its market share from20% to 60%, reducing maintenance OPEX and increas-ing revenues thanks to the quantity of demand attracted.From a financial point of view, the entire investment wasrepaid by savings, even generating positive cumulativecash flow. Without considering the extra revenues attract-ed by air routes, this project had a payback period of 8years and Return On Investment of 130% calculated over10 years, just considering the savings achievable through

OSSERVATORIO

INGEGNERIA FERROVIARIA – 461 – 5/2018

TABELLA 1 – TABLE 1

Ipotesi sui risparmi ottenibili implementando una solu-zione efficace di MPF

Hypothesis about the savings achievable by implementingan effective solution of MPF

Scenario

Percentuale di risparmio annuo

Yearly saving (percentage)

Valore risparmiatoannualmenteYearly saving

(value)

MiglioreBest

5% 65 x 106€

Più probabileMost likely

3% 39 x 106€

PeggioreWorst

1% 13 x 106€

Page 29: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

• il servizio ferroviario è diventato più affidabile, mi-gliorando la soddisfazione dell’utenza;

• l’aumentata soddisfazione della clientela ha fatto au-mentare la quota di mercato, grazie ad un’affidabilitàdel servizio del 99,98%;

• estendendo la vita utile degli apparati si sono ridottidrasticamente i costi di manutenzione;

• la riduzione dei costi operativi ha comportato una ri-duzione delle tariffe, ottenendo quindi un aumento ul-teriore dei passeggeri creando un circolo virtuoso;

• il passaggio della domanda dal trasporto aereo a quel-lo ferroviario ha permesso una cospicua riduzionedelle emissioni per passeggero trasportato.

8. Conclusioni

La disponibilità di nuove tecnologie e l’ingente volumedi dati disponibili sono i fattori chiave in grado di rivolu-zionare la manutenzione nel ventunesimo secolo. Graziead una profonda conoscenza ingegneristica e alle potenzia-lità degli analytics e delle tecniche di data mining, è possi-bile analizzare i dati disponibili per predire guasti e ridu-zioni di performance, identificando al tempo stesso le cau-se scatenanti, contribuendo quindi a perseguire una strate-gia atta a migliorare processi e metodi sia costruttivi chemanutentivi. Questo conduce all’implementazione di stra-tegie manutentive “su misura”, estendendo la vita utile deicomponenti, ottimizzando i costi della forza lavoro, ed evi-tando dispendiosi interventi di manutenzione correttiva.

CORFIATI et al. [3] riportano i risultati di diversi studiche dimostrano come la corretta implementazione di unastrategia di manutenzione predittiva ferroviaria sia ingrado, a parità di impiego del rotabile considerato, di ga-rantire un risparmio compreso tra l’8% ed il 12% rispettoad una manutenzione programmata a scadenze. Ulterioriindagini indipendenti dagli studi sopra citati [3] mostra-no i seguenti risultati indicativi industriali medi su diver-si tipi di macchinari e componenti:

• riduzione dei costi di manutenzione: dal 25 al 30%;

• eliminazione dei guasti: dal 70 al 75%;

• riduzione dei tempi di fermo: dal 35 al 45%.

Nell’era dell’Industrial Internet of Things sta prenden-do piede una cross fertilization tra l’ingegneria ferroviariae l’Information Technology, richiedendo l’utilizzo di cono-scenze verticalmente integrate che tendono a superare ilparadigma dell’ingegneria ferroviaria classica.

Va da sé che la MP possa essere applicata non solo almondo ferroviario ma, come avviene per un sistema diequazioni differenziali, possa anche essere scalata versoaltri settori semplicemente modificando le condizioni alcontorno. Infatti, la MP oltre ad essere già usata da de-cenni nel settore aerospaziale, inizia a trovare applicazio-ne anche su ambiti quali la sanità, l’automotive, l’energe-tico e le telecomunicazioni.

the implementation of the RPM framework. Consideringalso the additional cash flow derived by the attracted de-mand, the payback period was reduced to just 3 years.From a transportation engineering point of view, therewere several additional benefits:

• the rail services become more reliable, and customersatisfaction improved;

• greater customer satisfaction causes market share togrow, thanks to service reliability of 99,98%;

• with fewer unnecessary component upgrades, main-tenance costs fall down;

• reduced costs can be passed on to passengers in re-duced fares and improving ridership, enabling a vir-tuous circle;

• switching from plane to rail mode, there was a reduc-tion of emissions per transported person.

8. Conclusions

The availability of innovative technologies and thehuge amount of data are the key factors able to revolu-tionizing maintenance in the 21st century. Leveragingdeep engineering knowledge and data analytics capabili-ties, analysis of this data can be utilized to predict com-ponent failures and carry out root cause analysis whenfailures do occur, supporting continuous improvingstrategies and processes. This leads to tailored mainte-nance strategy, extending the useful life of components,reducing the labor costs related, and avoiding expensivecorrective maintenance.

CORFIATI et al. [3] report the results of several studiesthat show how the correct implementation of a railwaypredictive maintenance strategy is able to guarantee sav-ings of between 8% and 12% with respect to scheduledpreventive maintenance. Further surveys independentfrom the above studies [3] show the following averageindicative industrial results regarding diverse types ofmachineries and components:

• reduction of maintenance costs: from 25 to 30%;

• elimination of faults: from 70 to 75%;

• reduction in downtime: from 35 to 45%;

Within the era of the Industrial Internet of Thingsthere is a cross fertilization between railway engineeringand Information Technology, and it requires the utiliza-tion of vertically integrated knowledge that overtake theparadigms of the classical railway engineering.

It goes without saying that PM can be applied notjust to the rail world but, like a system of differentialequations, it can also be scaled to different industriesjust by changing the border conditions. In fact, it can al-so be applied to other branches, such as healthcare,aerospace and defense, automotive, energy and utilities,and Telco.

OSSERVATORIO

INGEGNERIA FERROVIARIA – 462 – 5/2018

Page 30: La manutenzione predittiva ferroviaria ed il ruolo ... .pdf · database relazionali erano già diffusi nel mercato dell’IT. S ARNATARO [2] descrive i benefici ottenuti con l’applicazione

OSSERVATORIO

INGEGNERIA FERROVIARIA – 463 – 5/2018

BIBLIOGRAFIA - REFERENCES

[1] LEVITT J., “Complete Guide to Predictive and Preventive Maintenance”, Connecticut, USA, 2011.

[2] SARNATARO A., “Applicazione di un software relazionale al Sistema informativo della manutenzione”, Ingegneria Fer-roviaria, 12/1996.

[3] CORFIATI M. et al., “Evolution lines in the maintenance of rolling stock”, Ingegneria Ferroviaria, 09/2011.

[4] AGNOLI A. et al., “The benefits of using Trenitalia’s Tele-diagnostic system while operating and during maintenance ofthe E464 fleet”, Ingegneria Ferroviaria, 05/2014.

[5] GRUDÉN M., WESTMAN A., PLATBARDIS J., HALLBJORNER P., RYDBERG A., “Reliability experiments for wireless sensornetworks in train environment”, in Proc. Eur. Wireless Technol. Conf., 2009, pp. 37-40.

[6] KIM J., LEE K.S., OH J., “A study on the wireless onboard monitoring system for railroad vehicle axle bearings usingthe SAW sensor”, Sens. Syst. Softw., vol. 57, pp. 52-58, 2011.

[7] NEJIKOVSKY B., KELLER E., “Wireless communications based system to monitor performance of rail vehicles”, inProc. IEEE/ASME Joint Railroad Conf., Newark, NJ, USA, 2000, pp. 111-124.

[8] WOLFS P., BLEAKLEY S., SENINI S.T., THOMAS P., “An autonomous, low cost, distributed method for observing vehicletrack interactions”, in Proc. IEEE/ASME Joint Rail Conf., Atlanta, GA, USA, 2006, pp. 279-286.

[9] GAO C. et al., “Design of train ride quality testing system based on wireless sensor network”, in Proc. Int. Conf. Elec-tron. Mech. Eng. Inf. Technol., Harbin, China, 2011, pp. 2636-2639.

[10] ELIA M. et al., “Condition monitoring of the railway line and overhead equipment through onboard train measure-ment-an Italian experience”, in Proc. IET Int. Conf. Railway Condition Monitor., Birmingham, U.K., 2006, pp.102-107.

[11] European Structural Integrity Society – Structural Integrity of railway components (pdf).

[12] HODGE V. et al. “Wireless Sensors Networks for Condition Monitoring in the Railway Industry: A Survey”, IEEETransactions on intelligent transportation systems, vol. 16, n° 3, June 2015.

[13] DEL GOBBO G. et al., “The Telediagnostica System for Trenitalia E646 and E405 fleets”, Ingegneria Ferroviaria,02/2012.

[14] UMILIACCHI P. et al., “Predictivem maintenance of railway subsystems using an Ontology based modelling approach”.

[15] Wylie L., “A Vision of Next Generation MRP II”, Scenario S-300-339, Gartner Group.

[16] OpenFog Reference Architecture for Fog Computing. Source: https://www.openfogconsortium.org.

[17] SMITH Steven W., Chapter 8, “The Discrete Fourier Transform”, in The Scientist and Engineer’s Guide to DigitalSignal Processing, Second, San Diego, Calif., California Technical Publishing, 1999, ISBN 0-9660176-3-3.

[18] http://www.fsnews.it/fsn/Gruppo-FS-Italiane/Trenitalia/Trenitalia-internet-of-things-e-big-data-per-la-manuten-zione-dei-treni