Strumenti ed Applicazioni di Business Intelligence per Dati...

63
POLITECNICO DI TORINO Tesi di Laurea Specialistica in Ingegneria Gestionale Strumenti ed Applicazioni di Business Intelligence per Dati Energetici: un caso di studio al Politecnico di Torino Relatori: prof. Fulvio Corno prof. Dario Bonino Candidato: Matteo Paracchino Dicembre 2013

Transcript of Strumenti ed Applicazioni di Business Intelligence per Dati...

Page 1: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

POLITECNICO DI TORINO

Tesi di Laurea Specialistica in IngegneriaGestionale

Strumenti ed Applicazioni diBusiness Intelligence per Dati

Energetici: un caso di studio alPolitecnico di Torino

Relatori:prof. Fulvio Cornoprof. Dario Bonino

Candidato:Matteo Paracchino

Dicembre 2013

Page 2: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Indice

1 Introduzione 1

2 Descrizione dello stato dell’arte in tema di sistemi di gestione ener-getica degli edifici 42.1 Energy Management ed Energy Managers . . . . . . . . . . . . . . . 42.2 Smart Buildings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.3 Submetering ed Energy Information Systems . . . . . . . . . . . . . . 8

3 Questioni aperte ed opportunita di lavoro 113.1 Gestione dei flussi di dati . . . . . . . . . . . . . . . . . . . . . . . . . 123.2 Qualita dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.3 Fruibilita e comunicazione dei dati . . . . . . . . . . . . . . . . . . . 14

4 Ricerca di una soluzione alle problematiche riscontrate 174.1 Obiettivi e scelte preliminari . . . . . . . . . . . . . . . . . . . . . . . 174.2 Metodologia di lavoro . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

5 Ricerca preliminare 205.1 Ricerca primaria: questionario esplorativo tra gli energy manger italiani 20

5.1.1 Progettazione del questionario . . . . . . . . . . . . . . . . . . 215.1.2 Analisi dei risultati . . . . . . . . . . . . . . . . . . . . . . . . 22

5.2 Ricerca secondaria: analisi della letteratura e delle soluzioni accessi-bili online . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355.2.1 Indagine sulle caratteristiche dei cruscotti di visualizzazione

online . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

6 Processo di definizione e sviluppo del prototipo 396.1 Requisiti di progettazione . . . . . . . . . . . . . . . . . . . . . . . . 396.2 Sviluppo del prototipo dimostratore . . . . . . . . . . . . . . . . . . . 41

6.2.1 Strumenti ed architettura selezionati . . . . . . . . . . . . . . 416.2.2 Progettazione dello schema dei dati . . . . . . . . . . . . . . . 43

ii

Page 3: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6.2.3 Implementazione processo ETL . . . . . . . . . . . . . . . . . 456.2.4 Progettazione e sviluppo delle componenti JSP . . . . . . . . 476.2.5 Progettazione e sviluppo delle dashboard dinamiche generate

dal server di BI . . . . . . . . . . . . . . . . . . . . . . . . . . 48

7 Conclusioni e spunti per la prosecuzione del lavoro 557.1 Punti deboli e punti di forza connessi allo sviluppo del cruscotto

interattivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567.2 Considerazioni generali sugli strumenti utilizzati . . . . . . . . . . . . 57

Bibliografia 60

iii

Page 4: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Capitolo 1

Introduzione

Nata negli anni settanta quando le societa occidentali hanno iniziato a confrontarsicon il tema della limitatezza delle risorse energetiche terrestri, e nonostante abbiadi conseguenza una storia piuttosto breve, la disciplina dell’energy management hasubito un processo di rapida e inesorabile evoluzione che l’ha portata a cambiare piuvolte faccia, fino ad assumere la connotazione strategico-gestionale che la caratterizzaoggi. Traducendo il titolo di una ricerca condotta nel 2012 da Acre Resources, “TheEvolution of the Energy Manager: From Boiler Room to Board Room” [1], si puocomprendere l’entita di questo percorso evolutivo, evidente se si confrontano gli skillsdi gestione e la visione strategica richiesti oggi per ricoprire efficacemente il ruolo dienergy manager, con le mansioni prettamente tecniche a cui era relegato alle origini.

Al tempo stesso, e sotto gli occhi di tutti la sempre maggiore pervasivita dellatecnologia, e in particolare degli strumenti e applicazioni di information and commu-nication technology, all’interno di qualsiasi aspetto delle nostre vite. Il paradigmasmart (smart-phone, smart-city, smart-grid...) sta diventando il punto di riferimentodi chiunque si occupi di innovazione, e le tematiche di gestione dell’energia, nelleloro varie forme ed implicazioni, si trovano ad essere inserite appieno in questo con-testo. In particolare, attraverso la qualita e la quantita di informazioni che hannoreso disponibili, le tecniche di smart metering stanno aprendo la strada a modalitadi indagine nuove e interessantissime all’interno delle dinamiche di consumo ener-getico, trovando un terreno di immediata applicazione nella componente dell’energymanagement costituita dalla gestione energetica di edifici o complessi di edifici. Ilpotenziale informativo reso disponibile dall’innovazione tecnologica e sotto gli occhidi tutti, ma per trasformarlo in decisioni piu efficaci, efficienti e consapevoli e neces-sario tenere ben presenti tre ordini di problematiche: quelle legate alla gestione deiflussi di dati generati, quelle legate alla qualita dei dati stessi e infine quelle legatealla loro fruibilita per il decisore umano.

Se i primi due aspetti appaiono strettamente connessi all’infrastruttura di raccol-ta e trasporto dei dati, richiedendo quindi investimenti e tempi di intervento di una

1

Page 5: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

1 – Introduzione

certa rilevanza, l’ultimo appare invece affrontabile anche con l’utilizzo di soluzionilow cost poco invasive dal punto di vista organizzativo ed operativo. Consideran-do solo l’aspetto della fruibilita, le tematiche da affrontare vengono infatti ristrettealla rielaborazione e presentazione delle informazioni estratte dalle sorgenti di da-ti disponibili, con uno sforzo non meno importante dal punto di vista concettualee metodologico, ma con lo possibilita di trovare soluzioni attraverso l’impiego distrumenti accessibili anche con risorse economiche e organizzative limitate.

Quest’ultima affermazione nasce dalla considerazione che sia possibile renderemaggiormente fruibili i dati energetici, raccolti da una qualsiasi infrastruttura dimetering, attraverso la realizzazione di un tool di visualizzazione dei dati di consumobasato su un motore di business intelligence e un’applicazione web. La verificasperimentale di questa idea si pone esattamente al centro della ricerca presentata inquesta monografia.

Tenuto conto dell’esistenza al Politecnico di Torino di una pur limitata infrastrut-tura di raccolta dei dati di consumo (principalmente riguardanti l’energia elettrica),si e cosı pensato di esaminare la validita di un’architettura software basata su com-ponenti freeware ed open source per la realizzazione del sopracitato strumento; nelfare cio si e deciso di utilizzare Pentaho come piattaforma di business intelligence,dal momento che e stato considerato la piu affidabile soluzione end-to-end in ambitoopen [2].

Punto di partenza nell’analisi e stata un’indagine condotta tra gli energy ma-nager certificati italiani, utile per sondarne le aspettative e le opinioni riguardo glistrumenti di visualizzazione e analisi dei consumi energetici. Allo stesso tempo, laricerca ha avuto anche lo scopo di consolidare ed integrare la ricerca secondariasvolta consultando la letteratura disponibile ed analizzando le soluzioni accessibilivia web in termini di cruscotti di analisi dei dati energetici. L’output di questoprocesso di ricerca preliminare sono state una serie di indicazioni circa le preferenzedi un gruppo di potenziali utenti, che hanno spaziato dalle misure aggregate rite-nute piu importanti, agli aspetti da considerare per calcolare questi aggregati e percontestualizzare le analisi, fino alle modalita di presentazione dei dati.

Dopo aver rielaborato e conciliato le informazioni provenienti dai vari canali uti-lizzati, si e proceduto a definire l’architettura generale dello strumento, individuatain un’applicazione Jsp attraverso la quale “incorniciare” e pubblicare le elaborazionisui consumi, a loro volta prodotte dal server di BI Pentaho usando i dati contenutiin un db relazionale. In seguito sono state progettate e realizzate le dashboard in-terattive di analisi dei dati da inserire nell’applicazione jsp, ed e stato configurato ilserver di business intelligence per fornire funzioni di drill down. In questa fase si eprovveduto a riesaminare di volta in volta le soluzioni implementate, rielaborandoin modo ricorsivo i vari componenti per adattarli alle problematiche via via riscon-trate, fino a ottenere un prototipo funzionante con performance ritenute adeguate aun utilizzo reale.

2

Page 6: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

1 – Introduzione

A valle del processo di progettazione e sviluppo si e infine proceduto a riesaminarein maniera critica il percorso seguito, facendo emergere vantaggi e svantaggi dellesoluzioni implementate e traendo conclusioni generali a proposito degli strumentiadottati. Questi ultimi, che come gia scritto rappresentavano uno dei focus principalidell’analisi svolta, hanno dimostrato buone performance in relazione agli obiettividel progetto, distinguendosi soprattutto per portabilita e adattabilita, ma denotandolimiti riguardo l’aspetto grafico, i tempi e le modalita di apprendimento, ed una certadifficolta nell’estrarne tutto il potenziale. In conclusione, si ritiene di aver dimostratola fattibilita, con il solo impiego degli accessibili strumenti adottati, di una soluzionedi business intelligence di dati energetici dal basso total cost of ownership e dalleprestazioni comparabili a quelle di piu celebri suite commerciali; senza dimenticarecome, nell’ottica di una sua effettiva implementazione in ambito non accademico,restino sicuramente questioni aperte e criticita da esaminare.

3

Page 7: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Capitolo 2

Descrizione dello stato dell’arte intema di sistemi di gestioneenergetica degli edifici

2.1 Energy Management ed Energy Managers

L’uso razionale delle varie fonti di energia e l’efficienza energetica sono da sempreal centro dell’attenzione per il mondo dell’industria e del commercio, cosı come perl’economia domestica di ogni famiglia. L’energy management pero e una disciplinache affonda le proprie radici nel passato abbastanza recente rappresentato dellecrisi petrolifere degli anni settanta, durante le quali per la prima volta le economieindustriali occidentali si sono trovate di fronte alla necessita di ripensare i proprimodelli di consumo energetico in risposta alle crisi causate dalle impennate dei prezzidel petrolio verificatesi nel 1973 e nel 1979.

Da allora numerose iniziative e programmi di stimolo ad un uso efficiente dell’e-nergia si sono susseguiti in tutto il mondo, con modalita piu o meno coordinate econ risultati piu o meno soddisfacenti, ma sicuramente con il merito aver diffuso unacoscienza critica e promosso il dibattito riguardo le fonti di energia, il loro impattosulle nostre vite e la loro gestione e conservazione. Ad esempio, proprio nel 1973,ebbe inizio negli Stati Uniti il Federal Energy Management Program (FEMP), che,dopo essere nato per interessi strategico/militari di riduzione della dipendenza dalpetrolio straniero attraverso attivita di sensibilizzazione alla riduzione dei consumie coordinamento tra le varie agenzie governative, si e via via evoluto passando adoccuparsi di promozione e finanziamento delle tecnologie green negli anni novan-ta e focalizzandosi nei primi anni duemila sul miglioramento delle performance diefficienza energetica, sulla sua misurazione e sulla sua promozione [3].

Il significato del termine energy management si e evoluto seguendo gli obiettivi

4

Page 8: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

2 – Descrizione dello stato dell’arte in tema di sistemi di gestione energetica degli edifici

che le societa in cui viviamo si sono poste nel corso degli anni, come si puo vedereosservando le trasformazioni subite dagli obiettivi del FEMP e come e stato sintetiz-zato da alcune parole chiave proposte all’inizio degli anni duemila [4] per delineare lasuccessione degli approcci alla gestione dell’energia che si sono susseguiti nel RegnoUnito:

• “save it” (dal 1973 al 1981): quando in risposta all’impennata dei prezzi delpetrolio ci fu la reazione piu semplice ed immediata, una massiccia sensibiliz-zazione delle persone a ridurre i consumi allo stretto necessario;

• “manage it” (dal 1981 al 1993): quando all’idea di conservazione e risparmiodell’energia si sostituı, per la prima volta, il concetto di gestione e monito-raggio delle fonti energetiche, reso possibile dalle nuove capacita di calcoloe trattamento dei dati fornite dalla prima ondata di diffusione dei personalcomputer, negli anni ottanta;

• “purchase it” (dal 1993 al 2000): quando un periodo abbastanza prolunga-to di stabilita del prezzo del petrolio e di espansione dell’economia globaleavevano spostato la competizione sul piano del prezzo dell’energia, spingendole grandi corporations alla ricerca dell’offerta energetica piu economicamentevantaggiosa mettendo in secondo piano le esigenze di risparmio energetico.

Non meno dinamica e stata la parallela evoluzione, subita nel corso degli ultimidecenni, della figura dell’energy manager, che e evoluta da un ruolo di nicchia, conun profilo prettamente tecnico basato sul procurement e la gestione dei macchinarie delle attrezzature, fino a richiedere competenze che vanno dalla finanza alla visio-ne strategica, con obiettivi di lungo periodo e responsabilita sempre piu ampie [1].Oggi le mansioni di un energy manager possono spaziare dal monitoraggio dei con-sumi tramite audit interni, report o telecontrollo, all’ottimizzazione dei consumistessi promuovendo le azioni correttive adeguate, alla contrattazione per l’acquistodell’energia nelle sue varie forme, allo studio di programmi di investimento volti almiglioramento delle performance energetiche [5], e dimostrano quanto possa esseredecisivo l’impatto di quello che in Italia viene definito “Responsabile per la conser-vazione e l’uso razionale dell’energia”, secondo la dicitura della legge 10/1991 chene ha istituzionalizzato la figura dopo che questa era stata introdotta per la primavolta con la legge 308/1982.

Un panorama cosı dinamico ha subito un nuovo cambiamento di prospettive apartire dai primi anni duemila, come conseguenza della crescente sensibilita versola sostenibilita ambientale e delle oscillazioni dei prezzi delle risorse energetiche chetutti abbiamo sperimentato. L’energy management come attivita di razionalizza-zione e gestione dei consumi e quindi diventato nuovamente (forse come mai prima

5

Page 9: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

2 – Descrizione dello stato dell’arte in tema di sistemi di gestione energetica degli edifici

d’ora) uno dei punti chiave sull’agenda programmatica di manager e amministratoripubblici.

La nuova parola d’ordine e diventata “smart”, ovvero intelligente e brillante, unaggettivo che e stato associato a quasi tutti componenti dei sistemi energetici: daimeter, alla rete di distribuzione, agli edifici e alle citta intere (qualcuno ha usatoanche il termine smart world). E innegabile che le politiche delle maggiori economiemondiali, insieme alla ricerca scientifica e alla proposta tecnologica presente sulmercato si stiano muovendo in questa direzione, e in qualsiasi documento che trattidegli ultimi ritrovati nel campo delle tecnologie energetiche o della loro prossimagenerazione questo aggettivo ricorre decine di volte.

E in corso una terza rivoluzione dell’industria della distribuzione di energia, chesta segnando in maniera definitiva il modo in cui potra essere declinato l’energymanagement nell’immediato futuro e si puo comparare, per portata, alla creazionedelle prime reti elettriche da parte di Thomas Edison ed all’invenzione della trasmis-sione di corrente alternata su lunghe distanze da parte di Tesla e Westinghouse [6].L’introduzione di tecnologie ICT all’interno della catena di trasporto dell’energiasta portando alla convergenza degli interessi e degli sforzi di coloro i quali si oc-cupano di utilities, telecomunicazioni, microelettronica, apparecchiature elettriche,software, sistemi di controllo ed automazione, sistemi di gestione degli edifici e moltialtri ancora. Attraverso l’infusione di information technology si sta infatti produ-cendo un sistema in grado di operare con modalita molto piu evolute e complesse diquello esistito fino a poco piu di un decennio fa, rendendo accessibile una minierasconfinata di informazioni e aprendo possibilita di interazione bidirezionale tra tuttigli attori in gioco.

In questo senso, il concetto di smart puo essere interpretato proprio come il pas-saggio da oggetti con un comportamento fisso e capacita di interazione pressochenulle, ad apparecchiature in grado di essere parte in qualche modo attiva del processodi distribuzione dell’energia, con l’evidente opportunita di ottenere numerose rica-dute positive. Ci si attende infatti di ottenere guadagni in termini di: gestione deiconsumi sia a livello privato che a livello pubblico, efficienza energetica, gestione deiprogrammi di manutenzione, affidabilita delle forniture e capacita di adattamento asituazioni critiche.

2.2 Smart Buildings

L’ambito di lavoro principale di un energy manager e spesso rappresentato dall’a-nalisi e dalla gestione dei consumi degli edifici piu o meno grandi e voraci di energiaall’interno dei quali i collaboratori di un’azienda, o di un ente di qualsiasi altro tipo,svolgono le mansioni richieste dal loro lavoro, un compito di una rilevanza spes-so sottovalutata. E stato infatti calcolato che gli edifici commerciali nelle nazioni

6

Page 10: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

2 – Descrizione dello stato dell’arte in tema di sistemi di gestione energetica degli edifici

sviluppate rappresentano il 20% della carbon footprint terrestre [7], pari alla metadell’impronta della totalita degli edifici che da da soli sono causa del 40% delle emis-sioni [8]. Tuttavia, identificare gli sprechi e le opportunita di risparmio puo esseremolto difficile all’interno di questi contesti, spesso complessi e molto articolati.

Gli edifici, a destinazione d’uso pubblica/industriale, appaiono di conseguen-za come uno degli ambiti piu adatti per mettere alla prova concetti e tecnologiesmart, dal momento che rappresentano il punto d’incontro tra gli interessi privatidei loro proprietari, sensibili alla rilevanza economica delle politiche di migliora-mento dell’efficienza energetica e a quella reputazionale delle dinamiche di corpo-rate social responsibility [9], e gli interessi pubblici di abbattimento dei consumi edell’inquinamento.

“Gli smart buildings impiegano una vasta gamma di tecnologie che miglioranol’efficienza e collegano edifici tra loro, cosı come con la rete di distribuzione, uti-lizzando dispositivi ICT e reti di comunicazione intelligenti. Molte delle tecnologienecessarie per la qualifica di smart building, come submeter e sistemi di riscalda-mento, ventilazione e condizionamento (HVAC) ad alta efficienza energetica, sonomaturi. Altri, come la costruzione di sistemi di gestione dell’energia (BEMS) e ilBuilding Information Modeling (BIM), sono in rapida evoluzione e offrono alcunedelle innovazioni di maggior impatto che il settore edile abbia visto negli ultimi an-ni. La sfida che gli integratori devono affrontare oggi, tuttavia, e connettere questisistemi in modo da massimizzare la redditivita e sfruttare i punti di forza che ognifornitore di servizi nell’ecosistema dello smart building porta al tavolo.”

In questo passo, tratto dalla ricerca Smart buildings: ten trends to watch in 2012and beyond [10], sono sintetizzati in modo molto molto efficace sia i concetti, che leprospettive collegati all’idea di smart building, ed e evidente come le sfide poste inessere da questo approccio al rapporto tra energia, edifici e persone che vi lavorano evivono dentro, siano quanto mai attuali e interessanti sia dal punto vista tecnologicoche da quello economico.

A testimonianza della maturita delle tecnologie di cui si sta parlando, bisognanotare come i sistemi smart siano anche piu vicini alla nostra esperienza direttadi quanto non pensino molte persone, dal momento che ormai da diversi anni inogni casa sono stati installati dai distributori italiani di energia degli smart meterin grado di comunicare i dati di consumo energetico in modo evoluto. La tecnologiae quindi disponibile, ma le sue potenzialita restano ancora poco sfruttate, e in molticasi, le persone che si occupano a livello professionale della gestione delle fornitureenergetiche per le aziende, hanno come unico strumento la lettura a posteriori del-le bollette, con possibilita di intervento sui consumi e capacita di analisi dei datipraticamente nulle.

7

Page 11: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

2 – Descrizione dello stato dell’arte in tema di sistemi di gestione energetica degli edifici

2.3 Submetering ed Energy Information Systems

La diffusione di sistemi di metering e submetering intelligenti sta andando di paripasso con l’assunzione da parte dell’information technology di un ruolo centraleall’interno del settore delle tecnologie per la gestione dell’energia. Gli strumentiper rilevare i consumi energetici stanno infatti raggiungendo prezzi accessibili1 e laloro penetrazione nel mercato appare in rapida ascesa, tanto che da oggi al 2020si prevede un tasso di crescita complessiva del settore del submetering e dei servizicollegati pari al 9,4% annuale [11].

Submeter e sistemi di analisi e gestione dei dati sono le due componenti recipro-camente imprescindibili di un’architettura di monitoraggio, nel contesto di un piuampio sistema di gestione integrata di un edificio. La rete di submeter, gli strumentidi rilevazione posti a valle dell’allacciamento di un’utenza alla rete di distribuzioneutilizzati per misurare i consumi sui vari rami di un impianto, non serve di per sea portare efficienza energetica, e allo stesso modo un building energy managementsystem per funzionare ha bisogno di conoscere cosa sta succedendo in tempo realeall’interno dell’edificio o degli edifici che gestisce, come si puo verificare attraversoil diagramma contenuto nella Figura 2.1 che chiarisce il rapporto tra la rete di di-stribuzione, i meter installati dalla compagnia di utility e i sistemi di submeteringche possono essere posti in essere dai proprietari degli edifici.

In questo contesto, si sta sempre piu diffondendo l’idea che una parte della stra-da che conduce alla riduzione dei consumi energetici globali, almeno nel settore delmanagement degli edifici, possa essere costituita da una soluzione software capacedi estrarre il potenziale informativo contenuto nei dati resi accessibili dalle tecnolo-gie di advanced metering e consegnarlo in maniera fruibile nelle mani degli energymanager e dei loro collaboratori, con costi di accesso e tempi di recupero degli inve-stimenti molto piu bassi rispetto alle ristrutturazioni green degli interi edifici. Nelcaso di strutture gia esistenti, la soluzione piu immediata ed efficace per otteneremiglioramenti sul piano dei consumi e delle emissioni appare infatti assicurarsi chel’infrastruttura gia esistente funzioni al massimo della sua efficienza, ed il raggun-gimento di questo obiettivo puo certamente essere facilitato dalla creazione di unsistema di analisi dei dati, che rappresenta una soluzione vantaggiosa sia dal puntodi vista dell’investimento upfront che dell’invasivita per gli edifici ed il lavoro deiloro occupanti.

In un primo momento, le tecnologie descritte finora venivano integrate all’internodi Building Management Systems (BMS) che potessero essere utilizzati per gestirele mansioni operative (manutenzione di impianti elettrici e meccanici, gestione delle

1Il dipartimento per l’energia degli Stati Uniti ha lanciato a maggio 2013 un challenge per lacostruzione di un meter wireless che costi meno di 100 dollari (fonte: www4.eere.energy.gov)

8

Page 12: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

2 – Descrizione dello stato dell’arte in tema di sistemi di gestione energetica degli edifici

Figura 2.1. Diagramma di un tipico sistema di submetring

lamentele degli occupanti... ) cosı come l’energia ed il funzionamento di singoli sot-tosistemi come il riscaldamento o il condizionamento. Negli ultimi anni pero e statariscontrata nell’offerta sul mercato una tendenza a concentrare l’attenzione dei BMSsulle funzioni di building management ed a separare le funzioni di gestione dell’e-nergia delegandole agli Energy Information Systems (EIS) [12]. Questa transizionepuo essere imputata ad una serie di comuni problematiche riscontrate nell’imple-mentazione dei sistemi piu complessi, come le carenze di budget, la difficolta diinstallazione e di utilizzo delle piene funzionalita (che risultano spesso sottoutilizza-te) e dalla parallela domanda di soluzioni centralizzate ed integrate, ma al contemposnelle ed efficaci, per effettuare analisi dei dati energetici rapide e soprattutto pregnedelle informazioni piu rilevanti.

Con il termine Energy Information System si intendono i sistemi costituiti dasoftware di monitoraggio della performance, hardware di acquisizione dati e sistemidi comunicazione, utilizzati per memorizzare, analizzare ed esporre i dati energeticidi un edificio o di un complesso di edifici [13]. Un EIS raccoglie continuamente i datiriferibili agli aspetti energetici con lo scopo di fornire feedback agli energy managered agli operatori che si occupano di mantenere elevate le performance energetiche

9

Page 13: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

2 – Descrizione dello stato dell’arte in tema di sistemi di gestione energetica degli edifici

attraverso la gestione degli impianti e la promozione dei necessari cambiamenti ope-razionali, secondo un’architettura che in prima approssimazione e quella presentenella Figura 2.2.

Figura 2.2. Tipica architettura di un EIS

Le funzioni per cui questi sistemi sono tipicamente utilizzati sono di tre tipi:rilevazione e diagnosi dei guasti, gestione degli allarmi ed energy management. Neitre ambiti, se implementati in modo corretto e cuciti su misura per l’organizzazioneche li utilizza, sono in grado di fornire un supporto molto importante accelerandole procedure di intervento in caso di guasti, focalizzando l’attenzione degli ingegnerisugli eventi piu critici che stanno avvenendo in tempo reale, integrando e conso-lidando flussi di dati provenienti da meter ambientali o energetici e presentando irisultati delle elaborazioni con modalita fruibili.

In conclusione, bisogna sottolineare come le tecnologie, anche in questo settore,siano in rapida evoluzione ed e lecito attendersi un significativo cambiamento anchenelle caratteristiche e nelle funzionalita offerte dagli EIS. In particolare, ci si attendeche le direttrici di sviluppo possano muoversi secondo i seguenti trend: crescenteofferta di servizi in mobilita, flessibilita e personalizzazione delle interfacce utente,supporto per il demand side energy management, maggiore affidabilita per quantoriguarda la sicurezza e l’integrita dei dati, capacita confrontare scenari alternativied in generale piu ampie funzionalita di previsione dei consumi [14].

10

Page 14: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Capitolo 3

Questioni aperte ed opportunita dilavoro

La descrizione del panorama tecnologico di riferimento contenuta nella sezione prece-dente, ha cercato di mettere in luce le caratteristiche dei fenomeni che riguardano ilmanagement dell’energia nella gestione degli edifici e i sistemi che sono stati studiatiper facilitarlo; si e cercato di evidenziare vantaggi e motivazioni che hanno spintostudiosi e professionisti a occuparsi di sistemi informatici di gestione dell’energia.

A questo proposito, merita particolare attenzione il potenziale di informazio-ne contenuto nei dati di consumo che la tecnologia oggi permette di raccogliere.Numerose indagini e ricerche condotte con esperti e professionisti della gestioneenergetica in tutto il mondo, mostrano come l’accesso e l’analisi ai dati sulla realesituazione energetica degli edifici sia uno dei punti chiave su cui lavorare per aumen-tare la consapevolezza con cui vengono prese ogni giorno le decisioni strategiche edoperative in tema di building energy management. La fruibilita delle informazionienergetiche puo infatti influenzare in modo decisivo sia le scelte di programmazionestrategica di lungo termine, che i comportamenti e le abitudini di tutte le perso-ne che usufruisco di un edificio e degli impianti che contiene, con impatti notevolisulla performance energetica complessiva (aumento dell’efficienza energetica ancheintorno al 5-10% [15]). Proprio in questo campo i sistemi informatici attualmentedisponibili mostrano alcune lacune.

Secondo l’indagine condotta dall’istituto di ricerca Aberdeen Group, di cui vie-ne riportato un estratto nella Figura 3.1, tra le quattro maggiori sfide per gestireefficacemente i programmi energetici due riguardano proprio la gestione dei dati:rispettivamente il 37% ed il 30% dei rispondenti, ha infatti citato come top challen-ge “la complessita ed eterogeneita dei data sets che bloccano il processo di decisionmaking” ed “i processi manuali che rendono difficile trovare le informazioni rilevantiper prendere decisioni”. Le organizzazioni sono quindi ben consce che ottenere idati energetici chiave sia quanto mai importante e sentono di avere la necessita di

11

Page 15: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

3 – Questioni aperte ed opportunita di lavoro

una fonte sicura per i loro dati energetici.

Figura 3.1. Top challenges per la gestione efficace di programmi energetici (fonte:Aberdeen Group, giugno 2011 [15])

Le questioni aperte in questo campo, che costituiscono opportunita di svilupparesoluzioni e funzionalita nuove sono raggruppabili in tre categorie: la gestione deiflussi di dati disponibili, la qualita dei dati stessi e la loro fruibilita.

3.1 Gestione dei flussi di dati

I dati che confluiscono all’interno di un energy information system sono caratteriz-zati da complessita di varia natura, cosa che li rende oggetti potenzialmente moltodifficili da gestire, ma che allo stesso tempo puo essere indice dell’elevato contenutoinformativo che portano con loro.

Innanzitutto bisogna considerare che i dati possono essere eterogenei perche pro-venienti da fonti molto diverse tra di loro o perche rappresentativi di grandezze efenomeni differenti (le fonti possono essere utility meter piuttosto che sensori cherilevano grandezze ambientali o fenomeni umani). Non sempre i sistemi attualmen-te disponibili sono in grado di gestire in modo adeguato le caratteristiche di questefonti di dati, e ad esempio l’integrazione dei dati di consumo elettrico con quelli dialtre fonti energetiche come i combustibili o l’acqua non sempre e ben supportata,cosı come esistono margini di sviluppo per quanto riguarda il supporto all’analisidella correlazione tra grandezze di consumo e variabili ambientali (molto importanteper normalizzare i dati e non imputare risparmi a condizioni esterne favorevoli).

In secondo luogo, dal momento che praticamente tutti i dati provengono da mi-surazioni sul campo e devono essere consolidati in un unica struttura dati, sorge il

12

Page 16: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

3 – Questioni aperte ed opportunita di lavoro

problema di gestirne il trasporto e garantirne l’integrita. Sorge anche il problemadelle moli di dati da trattare, dato che la maggior parte delle installazioni di EIS eeconomicamente vantaggiosa solo nel caso di edifici o complessi di edifici con consu-mi rilevanti e quindi di dimensioni medio-grandi. Il tema da affrontare e quello deicosiddetti big data nella loro piu compiuta declinazione, ovvero dati caratterizzatida un elevato volume, velocita e varieta (dove velocita fa riferimento alle elevateperformance di raccolta e processamento, e varieta all’ampia gamma di differentitipi di dato [16]). L’interoperabilita con database noSql (una delle ultime tendenzeper la gestione di grandi quantita di dati in modo efficiente), ad esempio, non euna caratteristica molto diffusa tra i sistemi di gestione dei dati energetici, anchese questa, come le altre tecnologie che permettono di lavorare con i big data, po-trebbe essere una risorsa molto importante per supportare elaborazioni in real time,garantendo capacita di analisi puntuale e tempestiva e rifornendo i decisori con leinformazioni piu recenti.

3.2 Qualita dei dati

La qualita dei dati resi accessibili da un energy information system e sicuramenteun altro dei settori di ricerca sui quali e importante riflettere. La qualita puo essereintesa dal punto di vista della correttezza ed integrita dei dati dalla fonte all’utente,ma anche dalla prospettiva dell’aderenza dei dati alle necessita dei decisori e dellaloro corretta contestualizzazione.

La prima parte del problema puo sembrare di semplice soluzione, dal momentoche fondamentalmente si tratta di una questione di ETL, ma tenendo conto dell’e-terogeneita delle fonti gia citata nella sezione 3.1 e dell’assenza di specifici modellidi riferimento, unita alla specificita dei dati raccolti in ciascun contesto applicativoreale, ci si rende conto che puo essere un processo piu complicato del previsto [17].Bisogna aggiungere che non sempre il trasporto dei dati energetici avviene in ma-niera ideale, dal momento che le reti di comunicazione costruite a questo scopo sonoin molti casi il frutto di compromessi dovuti alla necessita di farle convivere con lestrutture fisiche preesistenti degli edifici che sono oggetto dell’attivita di gestioneenergetica [18]. Uniformare i dati all’interno di una struttura coerente e funzionaleai bisogni dell’organizzazione che li dovra sfruttare, e altresı un requisito indispen-sabile per le persone e le strutture che basano le loro decisioni su questi dati ed unaquestione che dovra essere affrontata dai progettisti degli EIS.

La seconda parte del ragionamento sulla qualita dei dati ha invece a che faresia con la progettazione che con l’implementazione di questi sistemi. Il fatto che idati forniti da un EIS siano piu o meno adeguati ai processi decisionali che si pre-figgono di supportare, dipende infatti sia dalla capacita dello strumento di offrireprofondita e ampiezza di analisi, che dalle competenze di chi ne progetta il deploy

13

Page 17: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

3 – Questioni aperte ed opportunita di lavoro

in uno specifico contesto applicativo. Focalizzandosi sulla potenza di analisi deglistrumenti, la questione riguarda il minimo livello di granularita fornito, ed appareevidente come questo non possa che essere un trade-off tra la complessita del si-stema e la numerosita dei “punti di ascolto” (i meters e i sensori) di cui dispone.Si tratta inevitabilmente di una questione che coinvolge aspetti che riguardano lascalabilita dei sistemi, la complessita delle strutture dati necessarie e le prestazionidi elaborazione; l’identificazione del giusto compromesso tra queste tre dimensioni esicuramente una delle problematiche piu rilevanti da affrontare, e sara al tempo stes-so un equilibrio mobile influenzato dall’evoluzione delle tecnologie che compongonoi sistemi di gestione dell’energia.

3.3 Fruibilita e comunicazione dei dati

Facendo nuovamente riferimento all’indagine svolta da Aberdeen Group (Figura 3.1),si puo affermare che uno dei motivi per cui le aziende best-in-class ottengono perfor-mance migliori rispetto alle loro concorrenti (conseguendo in media consumi del 15%piu bassi) sia la capacita di estrapolare e visualizzare in modo efficace le informazio-ni contenute nei dati di consumo, in modo tempestivo e con possibilita di effettuaredrill down sui dati. L’importanza di questa abilita e rimarcata anche dall’accordoche si riscontra interrogando le aziende stesse a proposito delle azioni strategiche ne-cessarie per migliorare la performance energetica: come si puo verificare dal graficopresente in Figura 3.2, sia le aziende best-in-class che i competitors meno efficientisono concordi nel mettere al secondo posto per importanza nella scala delle azionistrategiche la “creazione/miglioramento della capacita di leggere i dati energeticiall’interno dell’impresa”.

A sostegno delle valutazioni espresse dai partecipanti al sondaggio sopracitato, cisono inoltre ricerche scientifiche che attestano l’importanza del feedback nell’influen-zare i comportamenti di consumo ed aumentare la consapevolezza energetica dellepersone. Come verificato da uno studio condotto dall’Universita di Oxford [20], cheha indagato lo specifico impatto della presentazione in varie forme delle informazionidi consumo energetico sui comportamenti degli utenti domestici, la conoscenza didati oggettivi e verificabili puo avere infatti un impatto molto rilevante sulla perfor-mance energetica. La presentazione regolare di dati di consumo rielaborati (feedbackindiretto) puo addirittura condurre a risparmi dell’ordine del 10% (dipendentementedalla qualita e quantita delle informazioni fornite), e spinge a considerare in manierapiu approfondita la questione della fruibilita dei dati di consumo energetico ad ognilivello di un’organizzazione, tenendo conto della natura intrinsecamente sociotecno-logica dei fenomeni di consumo energetico in cui tecnologia e comportamento umanointeragiscono ed evolvono l’uno con l’altro nel corso del tempo.

14

Page 18: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

3 – Questioni aperte ed opportunita di lavoro

Figura 3.2. Azioni strategiche per migliorare la performance energetica (fonte:Aberdeen Group, aprile 2009 [19])

Ad influenzare l’utilizzabilita dei dati ricavabili tramite gli attuali sistemi dienergy information, ci sono poi altre due caratteristiche negative che si riscontranonel panorama tecnologico attuale: la difficolta nell’esportazione di dati in formatinon standard e veramente personalizzabili, e le limitate possibilita di benchmar-king. Fornire informazioni il piu possibile personalizzate e uno degli stratagemmiper mettere in moto il fenomeno di feedback informativo appena descritto, mentrepoter verificare la bonta della performance energetica rispetto a target progettualio best-practices e non solo rispetto al proprio pattern di consumo abituale potrebberivelare a un energy manager le vere inefficienze del contesto che si trova a gestire.

In conclusione si puo affermare che in generale l’obiettivo da perseguire nellosviluppo di nuove tecnologie nell’ambito degli EIS sia la trasformazione dei datiche la tecnologia e oggi in grado di mettere a disposizione nelle azioni operative estrategiche piu corrette in relazione al contesto di lavoro ambientale e alle dinamichesociali che caratterizzano l’edificio o gli edifici che monitorano, come esemplificatoin Figura 3.3.

15

Page 19: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

3 – Questioni aperte ed opportunita di lavoro

Figura 3.3. Trasformazione dei dati in azioni operative

16

Page 20: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Capitolo 4

Ricerca di una soluzione alleproblematiche riscontrate

Considerate le opportunita collegate agli Energy Information System esposte nelcapitolo precedente (gestione dei flussi di dati, qualita dei dati, fruibilita dei dati), lapresente ricerca ha voluto verificare se ci fosse possibilita di fornire risposte concretealle problematiche riscontrate.

In particolare e stata presa in esame l’ultima delle questioni poste, quella riguar-dante la fruibilita dei dati, dal momento che le prime due sono parse strettamentecollegate al processo di raccolta dei dati, su cui sarebbe stato difficile poter lavorarein maniera diretta. Concentrandosi su questo sotto-ambito infatti, e stato possibilesperimentare con dati storici di consumo reali del Politecnico di Torino1, mentresarebbe stato molto piu difficile poter lavorare in maniera cosı diretta sui processi diraccolta delle informazioni nella stessa istituzione; l’ambito di lavoro e quindi statoristretto alla definizione e validazione di un’architettura di visualizzazione ed analisidei dati di consumo energetico degli edifici.

4.1 Obiettivi e scelte preliminari

Dopo aver circoscritto il perimetro entro cui svolgere la ricerca e tenuto conto delcontesto di lavoro, si e passati alla definizione dell’obiettivo generale, ovvero lo svi-luppo di uno strumento capace di fornire funzionalita di business intelligence con untrade-off tra costi e prestazioni ragionevole. I target prestazionali preliminarmenteindividuati per il propotipo da sviluppare erano costituiti dall’interattivita ed ac-cessibilita remota secondo i paradigmi a cui tutti sono stati abituati dalle tecnologie

1In particolare con i dati raccolti dall’infrastruttura di meter del Politecnico tra il 1 gennaio2009 ed il 17 luglio 2013

17

Page 21: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

4 – Ricerca di una soluzione alle problematiche riscontrate

web, unite alla capacita di esplorazione dei dati dati tipiche dei sistemi di businessintelligence. Se infatti le metodologie di business intelligence nascono proprio perrispondere alla questione della trasformazione dei dati in decisioni piu efficaci edefficienti2 esposta nel capitolo precedente, le modalita di interazione tipiche delletecnologie web sono quelle a cui gli utenti di ogni tipo di servizio sono piu avvezzie con i quali c’e una diffusa dimestichezza. Il connubio di questi due paradigmi eapparso come una combinazione adatta a elevare il livello di fruibilita dei dati diconsumo in possesso alle organizzazioni.

Sempre a monte del processo di sviluppo vero e proprio, si e inoltre scelto diaffidarsi completamente a software open source, in modo da avere a disposizionestrumenti aggiornati e flessibili ad un costo molto basso. In particolare si e deciso diadottare per la parte di BI i tool del pacchetto Pentaho, una delle poche soluzionicompletamente open-source citate all’interno del cosiddetto “magic-quadrant” diGartner3 [2] ed indicato nella stessa ricerca come uno strumento flessibile e dallafootprint limitata, scelto dai suoi utenti per il basso TCO4, le ottime performancedi data access e data integration, e la capacita di connettersi a svariate tipologie difonti di dati.

Infine e da sottolineare come si sia scelto di mantenere fuori dallo scopo di questaricerca l’implementazione di tecnologie di data mining, per le quali appaiono neces-sarie tecnologie e competenze ad hoc non del tutto compatibili con le modalita dilavoro scelte.

4.2 Metodologia di lavoro

Con queste scelte e questi obiettivi in mente, si e proceduto a svolgere un lavoro diricerca articolato in cinque macrofasi, logicamente e temporalmente consequenziali.

Punto di partenza sono state la ricerca primaria e secondaria: la prima condot-ta tramite la somministrazione di un questionario esplorativo agli energy managercertificati italiani, e la seconda tramite l’analisi dell’as-is tecnologico attraverso levarie fonti indirette a disposizione (articoli, ricerche di mercato, cruscotti accessibilionline).

2Business Intelligence (BI) can be defined as the process of turning data into information andthen into knowledge. [...] BI was born within the industrial world in the early 90’s, to satisfy themanagers’ request for efficiently and effectively analyzing the enterprise data in order to betterunderstand the situation of their business and improving the decision process. [21]

3Il magic quadrant e un metodo di ricerca utilizzato da Gartner per mappare tecnologie emercati, fornendo sinteticamente dati qualitativi sulla loro evoluzione

4Total Cost of Ownership

18

Page 22: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

4 – Ricerca di una soluzione alle problematiche riscontrate

In seguito, ed in parte parallelamente alle prime due attivita di ricerca, e statonecessario prendere confidenza con le tecnologie scelte come base tecnologica per ilprototipo, in particolare con il server e gli altri tool di business intelligence. Si etrattato di una fase di lavoro rilevante: oltre ad effettuarne l’istallazione, e statoanche necessario comprenderne il funzionamento, cosa non sempre immediata datala natura frammentaria della documentazione disponibile (nota dolente che in molticasi caratterizza i prodotti di tipo open source).

Il passo successivo e stato la progettazione ed implementazione del processo diETL5 necessario a far confluire i dati raccolti sul campo dall’infrastruttura di meterdel Politecnico di Torino in una struttura dati coerente con il tipo di analisi che cisi accingeva ad implementare tramite lo strumento in fase di sviluppo.

L’ultimo step dal punto di vista operativo e stato ovviamente la progettazionee sviluppo del tool di visualizzazione grafica dei dati oggetto della ricerca; per farquesto e stato necessario tradurre per quanto possibile le indicazioni emerse dallefasi di ricerca preliminare in funzionalita pratiche, tenendo in considerazione gliobiettivi generali di realizzazione di uno strumento interattivo, accessibile online,con interfaccia grafica, capace di mostrare i dati con livelli di granularita variabili.A conclusione di questo passo si e cercato di analizzare criticamente il percorsoseguito ed i risultati ottenuti, allo scopo di trarre considerazioni utili ad un eventualesviluppo futuro del lavoro.

In conclusione bisogna precisare come, dato l’intento principalmente esplorativodella ricerca svolta, si sia scelto di non implementare metodologie volte a ottimizzareil processo di sviluppo quali ad esempio IDEF0 o Quality Function Deployment. Gliindubbi vantaggi dal punto di vista della qualita del risultato finale sarebbero statiinfatti fuori dal contesto di analisi, ed avrebbero potuto comportare un maggiordispendio di tempo e risorse incompatibile con le modalita di ricerca scelte.

5Extract, Transform, Load (ETL) e un’espressione che si riferisce al processo di estrazione,trasformazione e caricamento dei dati in un sistema di sintesi (data warehouse, data mart...).

19

Page 23: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Capitolo 5

Ricerca preliminare

Come anticipato, prima di iniziare il processo di sviluppo del tool di visualizzazionegrafica dei dati di consumo energetico, si e ritenuto necessario chiarire quali fosserole caratteristiche e le performance attese per il prototipo di cui ci si apprestava averificare la fattibilita. Si e trattato di indagare da un lato le aspettative dei po-tenziali utenti finali dello strumento, e dall’altro di documentarsi sullo stato attualedelle tecnologie a disposizione di chi si trova a dover interagire operativamente construmenti di analisi dei dati di consumo energetico degli edifici. L’obiettivo finaledella ricerca era infatti verificare la compatibilita degli strumenti presi in esame conla realizzazione di un tool capace di soddisfare le necessita degli operatori del setto-re. L’allineamento della prospettiva di indagine con la loro, e in qualche misura conl’as is tecnologico, e sembrato quindi il primo passo da compiere in questa direzione.

Per soddisfare le necessita appena esposte ci si e mossi lungo due direttrici princi-pali: la ricerca primaria condotta invitando a partecipare ad un questionario onlinegli energy manager certificati dalla FIRE in Italia, e parallelamente la ricerca se-condaria condotta attingendo alla letteratura ed agli strumenti accessibili via webin materia.

5.1 Ricerca primaria: questionario esplorativo tra

gli energy manger italiani

Le motivazioni per svolgere un sondaggio o una ricerca di mercato possono esseremolteplici, ma in questo caso quelle che hanno spinto alla redazione del questiona-rio sono state la verifica empirica delle supposizioni riguardo le informazioni che gliutenti desiderino ricevere sui dati di consumo energetico e la definizione di alcunirequisiti progettuali. In particolare, l’obiettivo primario che si e cercato di raggiun-gere fin dalla fase di redazione delle domande e stata l’esplorazione dei requisitidegli utenti potenziali riguardo granularita, frequenza di campionamento, modalita

20

Page 24: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

e dimensioni di analisi ed aggregazione dei dati. L’output di questa fase di confrontodiretto e stato considerato infatti come punto di partenza per la costruzione delloschema concettuale dei dati a livello di database e di conseguenza come base dilavoro per la definizione delle caratteristiche del prototipo.

Per quel che riguarda la popolazione da intervistare, si e scelto di prenderecome target della ricerca la popolazione degli energy manager certificati italiani.Le motivazioni dietro alla scelta sono state molteplici: a partire dalla familiaritadi questi soggetti con contesti strutturati e di dimensioni sufficientemente grandida rendere rilevanti le questioni legate al building management1, proseguendo conil fatto che il loro lavoro li porti a confrontarsi ogni giorno con le tematiche legateall’analisi dei dati di consumo energetico e con il fatto che si tratta di potenzialiutenti finali o comunque stakeholder dello strumento in via di validazione.

5.1.1 Progettazione del questionario

A partire dagli obiettivi e dalle finalita appena esposti e stato redatto il questionarioda sottoporre agli energy manager, la cui realizzazione ha avuto come punto di inizioil reperimento dei contatti a cui inoltrare l’invito a partecipare al survey online.Questa operazione e stata possibile grazie all’elenco degli energy manager certificatiin Italia dalla FIRE2, pubblicato dall’ente stesso sul proprio sito internet, che e statousato per reperire via web gli indirizzi di posta elettronica a cui contattare molti diloro3.

Il passo successivo e stato redigere il questionario vero e proprio, realizzato tra-mite la piattaforma online LimeSurvey, capace di fornire un’elevata flessibilita sianella costruzione della struttura del sondaggio, che nella scelta delle tipologie di do-mande e nell’analisi delle risposte alle stesse. E stata scelta una conformazione delsondaggio a sezioni successive, ciascuna specificamente mirata ad un argomento sucui si ritenesse importante ottenere delle informazioni dagli intervistati. Ne e quindirisultata una struttura di questo tipo:

1La presenza di un energy manager e obbligatoria in tutte le aziende e gli enti dell’industriacaratterizzati da consumi superiori ai 10.000 tep/anno e nelle realta del settore civile, terziario epubblica amministrazione con una soglia di consumo di 1.000 tep/anno

2La FIRE gestisce dal 1992, su incarico a titolo non oneroso del Ministero dello SviluppoEconomico, la rete degli energy manager individuati ai sensi della Legge 10/91, recependone lenomine e promuovendone il ruolo attraverso varie iniziative.

3Questa modalita di reperimento dei contatti ha fatto sı che sia stato possibile coinvolgere pochimanager dal settore privato in rapporto a quelli dal settore pubblico, i cui indirizzi email sono moltopiu spesso disponibili online.

21

Page 25: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

• Prima sezione costituita da domande di tipo anagrafico volte a raccogliereinformazioni sul profilo dei partecipanti al sondaggio. Conteneva domandesull’eta, settore di lavoro, esperienza e formazione.

• Seconda sezione contenente domande preliminari su campionamento e granu-larita dei dati. Lo scopo di questa sezione era separare il percorso all’internodelle sezioni successive tra chi ritenesse di dover differenziare i parametri dicampionamento e granularita in base alla grandezza in esame o meno.

• Terza e quarta sezione contenenti domande riguardo i livelli di granularita efrequenza minima di campionamento ritenuti ideali.

• Quinta sezione volta ad indagare le caratteristiche degli strumenti attualmen-te a disposizione dei rispondenti in termini di modalita di visualizzazione etipologie di dati ottenibili.

• Sesta sezione incentrata invece sugli aspetti di analisi, sulle misure aggregatee sulle dimensioni di aggregazione ritenute piu adeguate dai partecipanti alsondaggio, insieme ad alcune domande riguardo le correlazioni eventualmenteprese in considerazione.

La maggior parte delle domande incluse era a risposta chiusa, in modo da poteravere indicazioni il piu possibile confrontabili tra di loro, e si e scelto di ricorrerea domande aperte solo per chiedere ai partecipanti opinioni circa temi non espli-citamente compresi nel questionario. In un paio di casi e stato anche richiesto diordinare un set di alternative, allo scopo di indagare all’interno di un gruppo dialternative le preferenze relative.

Le varie domande sono state redatte con la collaborazione dei ricercatori delgruppo e-Lite, ed inoltrate in una prima fase ad alcuni contatti interni al Politec-nico per procedere ad una eventuale riscrittura di quelle ambigue o poco efficaciprecedentemente all’inizio del sondaggio vero e proprio. Successivamente si e pro-ceduto all’invio di mail individuali di invito a partecipare al sondaggio a ciascunodei soggetti precedentemente individuati, seguito da un remind (utile a far crescereleggermente il tasso di partecipazione) a distanza di circa quindici giorni dal primoinvio.

5.1.2 Analisi dei risultati

Per prima cosa bisogna considerare che su un totale di 200 email di sollecito apartecipare inviate, si sono contate 33 risposte complete al questionario (sono giuntecirca altre 30 risposte incomplete), con un tasso di partecipazione che si e attestato diconseguenza al 16,5%. Tutte le considerazioni che seguiranno sono state ovviamente

22

Page 26: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

tratte sulla base di queste risposte complete, il cui valore statistico non apparerilevante, ma che, data la somiglianza rilevata tra le caratteristiche dei rispondentie quelle dei soggetti contattati, possono costituire una fonte informativa credibile.

L’affermazione precedente riguardo la somiglianza tra partecipanti e contattati,risulta di difficile verifica, dal momento che i questionari sono stati compilati informa anonima, ma puo essere supportata dalle considerazioni riguardo le unichedue caratteristiche note per tutti e due gli insiemi di individui: il sesso ed il ma-crosettore economico di appartenenza (privato o pubblico). A questo proposito, dalconfronto tra i destinatari delle mail di invito a partecipare alla ricerca, partecipantial sondaggio e soggetti che hanno risposto a tutte le domande del questionario, nonemergono sostanziali differenze, come evidente dai dati riportati nelle Tabelle 5.1 e5.2.

Tabella 5.1. Comparazione tra soggetti contattati, rispondenti e risposte completeper quanto riguarda l’appartenza al settore pubblico o privato

pubblico privato

destinatari 168 (84%) 32 (16%)

rispondenti 35 (87,5% di chi ha dato unarisposta a questa domanda)

5 (12,5% di chi ha dato unarisposta a questa domanda)

risposte complete 29 (87,9% di chi ha dato unarisposta a tutte le domande)

4 (12,1% di chi ha dato unarisposta a tutte le domande)

Tabella 5.2. Comparazione tra soggetti contattati, rispondenti e risposte completeper quanto riguarda il sesso

maschi femmine

destinatari 186 (93%) 14 (7%)

rispondenti 38 (90,5% di chi ha dato unarisposta a questa domanda)

4 (9,5% di chi ha dato unarisposta a questa domanda)

risposte complete 30 (90,9% di chi ha dato unarisposta a tutte le domande)

3 (9,1% di chi ha dato unarisposta a tutte le domande)

Passando all’analisi dei restanti dati anagrafici, e risultato che chi ha risposto inmaniera completa al sondaggio ha un eta equamente suddivisa nelle fasce 36-45, 46-55 e 56-65, ed un’esperienza media nell’ambito del settore della gestione energeticadi 11,64 anni. Il 73% ha una formazione di tipo ingegneristico, ma e presente unaquota significativa (15%) di persone non laureate in possesso di diplomi tecnici. Il

23

Page 27: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

90% lavora in aziende medio grandi (con piu di 100 dipendenti) e, anche a causadello sbilanciamento verso il settore pubblico che caratterizza la popolazione che si eriuscita a contattare, i settori economici maggiormente rappresentati sono pubblicaamministrazione, ricerca/universita e sanita (insieme costituiscono il 75%).

La grande maggioranza dei rispondenti ritiene che il campionamento dei datidebba essere effettuato con frequenze differenti e specifiche per ciascuna delle tregrandezze che si e deciso di esaminare (acqua, gas ed elettricita), ed altrettanto sipuo dire riguardo la granularita spaziale. Si osserva una tendenza a considerare idea-le un monitoraggio piu dettagliato dell’energia elettrica, sia in termini di frequenzadi campionamento che di granularita spaziale. Per quanto riguarda il campionamen-to, emerge come range di intervalli ritenuto piu adeguato l’alternativa “< di 1 ora”,anche se per quanto riguarda il monitoraggio dei consumi di elettricita vi e un inte-resse significativo anche per intervalli di campionamento piu brevi (20,83% per “< di30 minuti” e 12,50% per “< di 10 minuti”). I livelli di granularita spaziale ritenutipiu interessanti sono stati invece il “singolo edificio” e il “reparto/dipartimento”,con una prevalenza del primo livello per acqua e gas e una prevalenza del secondoper l’elettricita, anche se per quest’ultima il 36% dei rispondenti ritiene interessanteanche aver a disposizione dati relativi ai singoli locali o uffici.

Per quanto riguarda modalita di visualizzazione dei dati e funzionalita di alertingemergono delle tendenze ben definite. La modalita di visualizzazione dei dati piudiffusa e quella per mezzo di tabelle: la maggior parte dei rispondenti (57,6%) hadichiarato di aver a disposizione solo questa, e se si considerano anche i casi in cuiviene affiancata dalle altre il 70% dei 33 rispondenti la utilizza. Solo il 12% deirispondenti ha dichiarato di aver a disposizione cruscotti di analisi. Il 75% ha adisposizione solo dati aggregati sui consumi, e all’interno di questi solo la meta circaha strumenti che permettono di personalizzare le aggregazioni. Inoltre l’84,9% deirispondenti ritiene che sarebbe utile aver a disposizione dati puntuali, ed il 48,5%definisce questa caratteristica “molto utile”. Il 90,9% dei rispondenti ha definito inqualche modo utile un sistema che segnali in modo autonomo le anomalie di consumoed il 93,9% desidererebbe poter definire allarmi personalizzati.

Infine, riguardo le dimensioni di aggregazione, le misure aggregate e l’analisi dicorrelazione, si puo notare come l’interesse dei rispondenti appaia rivolto principal-mente verso l’associazione tra consumi, locali alimentati e utilizzo che se ne fa. Intesta agli aspetti che vengono considerati nello svolgere analisi dei consumi ci sonoinfatti la destinazione d’uso di energia e locali, la dimensione e l’utilizzo di questiultimi (in termini di occupazione, frequenza d’uso e calendario lavorativo), citatida piu del 60% dei rispondenti. Le misure ritenute piu importanti sono nell’ordinemedia, somma e valori massimi e minimi; aggregate preferibilmente lungo la dimen-sione temporale, spaziale o di destinazione d’uso. In ultima analisi, e da notare comeil 39,4% dei rispondenti dichiari di non effettuare analisi di correlazione tra i datidi consumo e gli aspetti che potrebbero averli causati, ma di questi la quasi totalita

24

Page 28: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

non lo fa perche non dispone di dati o strumenti che glielo permettano.

Nei paragrafi che seguono, vengono prese dettagliatamente in esame tutte le vociprecedentemente riassunte.

Dati anagrafici

La sezione anagrafica, oltre a fornire indicazioni per il confronto tra il totale dei sog-getti contattati ed il sottoinsieme di coloro i quali hanno risposto a tutte le domandedel questionario, e servita ad avere un’idea sulle caratteristiche degli intervistati (edi conseguenza del gruppo di potenziali utenti dello strumento in fase di sviluppo).Tre caratteristiche sono emerse in maniera netta:

• l’eta dei partecipanti al sondaggio (Figura 5.1) appare distribuita uniforme-mente tra le fasce di eta 36-45, 46-55 e 56-65, indicando che quella di energymanager e una posizione ricoperta solo da personale con un livello di senioritymedio-alto;

Figura 5.1. Eta dei partecipanti al sondaggio

• la formazione (Figura 5.2 e Figura 5.3) e di livello universitario in piu dell’80%dei casi, con una decisa prevalenza per persorsi formativi di tipo tecnico (il72% vanta una laurea in ingegneria ed il 15% pur non essendo in possesso diuna laurea ha frequentato scuole superiori ad indirizzo tecnico), a sottolinearecome le competenze di questo tipo siano ancora considerate importanti per laprofessione di energy manager;

25

Page 29: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Figura 5.2. Titolo di studio dei partecipanti al sondaggio

Figura 5.3. Titolo di studio dei partecipanti al sondaggio (aggregato)

• come ci si attendeva, le dimensioni delle aziende o enti publici in cui lavoranosono medio-grandi, se raffrontate al contesto socio-economico italiano. Cioconferma la bonta della scelta del target del sondaggio, con il quale si e potutoin questo modo esplorare realta economico-gestionali all’interno delle quali lescelte di gestione energetica possiedono una significativa rilevanza economica(Figura 5.4).

Per quanto riguarda il settore economico in cui operano i partecipanti al son-daggio e la loro esperienza nell’ambito della gestione energetica non sono viceversaemerse indicazioni univoche. Il primo aspetto e stato infatti fortemene influenzato

26

Page 30: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Figura 5.4. Dimensioni dell’azienda/ente in cui lei ricopre attualmente il ruolo diresponsabile per l’uso dell’energia (n. approssimativo di dipendenti)?

dallo sbilanciamento verso il settore pubblico dell’insieme dei contattati, che ha por-tato i settori di amministrazione pubblica, ricerca/universita e sanita a costituireda soli il 75% dei rispondenti (Figura 5.5). Dalle risposte riguardo l’esperienza none invece emersa una tendenza a causa della forte variabilita delle risposte, che haportato ad osservare un valor medio di 11,61 anni di esperienza caratterizzato dauna deviazione standard di 7,84 anni (Figura 5.6).

Figura 5.5. In quale settore economico opera l’azienda/ente in cui lei ricopreattualmente il ruolo di responsabile per l’uso dell’energia?

27

Page 31: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Figura 5.6. Esperienza nell’ambito della gestione energetica da parte dei rispondenti

Campionamento e granularita dei dati

Una delle questioni piu importanti da indagare attraverso il sondaggio e stato, comegia anticipato, il livello minimo di granularita spaziale e frequenza di campiona-mento ritenuto adeguato dai rispondenti. Si tratta infatti di due fattori chiave nelladefinizione del design delle strutture dati e dall’impatto potenzialmente elevato sulleprestazioni del prototipo. Le domande del questionario erano di conseguenza miratea chiarire in primo luogo se i rispondenti ritenessero necessario avere a disposizionelivelli diversi di granularita e di frequenza di campionamento per le tre grandezze diconsumo considerate. In seconda battuta e stato ovviamente richiesto di specifica-re i valori ritenuti piu adeguati per le due dimensioni, separatamente per ciascunagrandezza nel caso si avesse dichiarato di preferire una differenziazione tra le variegrandezze o in maniera unica nel caso opposto. Infine e stato richiesto di sugge-rire altre grandezze di consumo ritenute rilevanti oltre o alternativamente alle treesplicitamente considerate (elettricita, gas o altri combustibili, acqua potabile).

Le risposte raccolte indicano in maniera decisa (intorno al 75%) la preferenzaper un diverso trattamento dei dati a secondo della grandezza a cui sono riferiti, siain termini di frequenza di campionamento che di granularita spaziale (cfr. Tabelle5.3 e 5.4).

In particolare, i rispondenti ritengono che l’energia elettrica possa essere campio-nata a frequenze piu alte e con maggiore granularita, come si puo evincere dai datipresenti nelle tabelle seguenti. Per quanto riguarda l’elettricita vi e infatti interesseanche per gli intervalli di campionamento sotto la mezz’ora (20,83%) e sotto i dieciminuti (12,50%), mentre per acqua e gas ripettivamente l’87,5% e l’85,71% ritie-ne che un intervallo di campionamento adeguato possa essere inferiore all’ora. Legranularita spaziali minime presentano tendenze meno nette: anche in questo caso

28

Page 32: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Tabella 5.3. Ritiene che i dati riferiti a diverse tipologie di consumo (elettrico,acqua, gas) debbano essere campionati a frequenze diverse?

sı no

conteggio 24 9

percentuale 72,7% 27,3%

Tabella 5.4. Ritiene che il sistema di monitoraggio dovrebbe visualizzare i dati adun livello di granularita spaziale differente per ciascuna tipologia di consumo?

sı no

conteggio 25 8

percentuale 75,8% 24,2%

viene ritenuto molto interessante un livello di dettaglio piu elevato per l’elettricita(reparto/dipartimento), mentre per acqua e gas un dato a livello di edificio vieneconsiderato sufficienemente specifico, ma le indicazioni appaiono piu sfumate.

Chi ritiene che i dati possano essere campionati tutti alla stessa frequenza harisposto come segue:

Tabella 5.5. Quale tra i seguenti intervalli di campionamento si avvicina di piu aquello che lei ritiene ideale per il monitoraggio dei consumi energetici?

conteggio percentuale

< 30 0 0,0%

< 1’ 0 0,0%

< 10’ 0 0,0%

< 30’ 1 11,1%

< 1h 8 88,9%

Chi invece ritiene che i dati debbano essere campionati a frequenze diverse harisposto in questo modo:

29

Page 33: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Tabella 5.6. Quale tra i seguenti intervalli di campionamento si avvicina di piu aquello che lei ritiene ideale per il monitoraggio dei consumi energetici?

elettricita gas o altri combustibili acqua

conteggio perc. conteggio perc. conteggio perc.

< 30” 2 8,33% 1 4,17% 1 4,17%

< 1’ 1 4,17% 0 0,00% 0 0,00%

< 10’ 3 12,50% 1 4,17% 1 4,17%

< 30’ 5 20,83% 2 8,33% 1 4,17%

< 1h 13 54,17% 20 85,71% 21 87,50%

Chi ritiene che i dati possano essere campionati con un livello di granularitaunico, ha risposto come segue:

Tabella 5.7. Quale tra i seguenti intervalli di campionamento si avvicina di piu aquello che lei ritiene ideale per il monitoraggio dei consumi energetici?

conteggio percentuale

gruppo di edifici 0 0,00%

singolo edificio 4 50,00%

reparto/dipartimento 5 62,50%

singolo locale/ufficio 0 0,00%

altro 0 0,00%

Chi invece ritiene che i dati debbano essere campionati a granularita diverse harisposto in questo modo4:

4I dati della Tabella 5.8, come quelli della Tabella 5.7, non sommano al 100% perche le per-centuali sono calcolate con riferimento al numero di persone che hanno risposto alle rispettivedomande, dal momento che entrambe prevedevano la possibilita di risposta multipla.

30

Page 34: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Tabella 5.8. Quale tra i seguenti intervalli di campionamento si avvicina di piu aquello che lei ritiene ideale per il monitoraggio dei consumi energetici?

elettricita gas o altri combustibili acqua

conteggio perc. conteggio perc. conteggio perc.

gruppo di edifici 1 4,00% 1 4,00% 1 4,00%

singolo edificio 8 32,00% 17 68,00% 15 60,00%

reparto/dipartimento 15 60,00% 10 40,00% 12 48,00%

singolo locale/ufficio 9 36,00% 3 12,00% 2 8,00%

altro 1 4,00% 0 0,00% 0 0,00%

Strumenti di visualizzazione dei dati di consumo attualmente a disposi-zione

Con questa sezione si e voluto raccogliere informazioni riguardo le caratteristichedegli strumenti utilizzati dai partecipanti al sondaggio, con l’obiettivo di identificarepossibili aspettative latenti dei partecipanti al sondaggio in merito alle modalita divisualizzazione dei dati disponibili.

Pertanto sono state poste domande riguardanti le modalita di visualizzazione deidati attualmente utilizzate, ottenendo una fotografia in cui gli intervistati dichiara-no in grande maggioranza di aver a disposizione dati accessibili solamente tramitetabelle ed in rari casi tramite cruscotti (Tabella 5.9). E stato poi evidenziato come,nonostante la maggior parte di loro avrebbe interesse per la possibilita di avere ac-cesso anche ai dati puntuali cosı come vengono campionati (l’84,9% dei partecipantidefinisce questa funzionalita “utile” o “molto utile”, come evidente dai dati in Ta-bella 5.11), pochi abbiano a disposizione questa opportunita, potendo contare solosu dati aggregati (Tabella 5.10). Inoltre si e potuto riscontrare un certo interesseverso la possibilita di avere a disposizione strumenti in grado di offrire funzioni dialerting tarate su eventuali anomalie dei dati.

Per quel che riguarda lo sviluppo di uno strumento di visualizzazione, e di conse-guenza emersa l’opportunita di fornire dati disaggregati insieme a quelli aggregati,in un ambiente grafico piu attraente ed interattivo di una tabella (solo il 15% haaffermato di avere a disposizione cruscotti di visualizzazione).

31

Page 35: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Tabella 5.9. Quali modalita di visualizzazione dei dati utilizza abitualmente?

conteggio percentuale

Solo cruscotti 1 3,0%

Solo report 5 15,2%

Solo tabelle 19 57,6%

Cruscotti e report 0 0,0%

Cruscotti e tabelle 1 3,0%

Report e tabelle 4 12,1%

Cruscotti, report e tabelle 3 9,1%

Altro 0 0,0%

Tabella 5.10. Utilizzando gli strumenti indicati nella domanda precedente,di che tipo di dati dispone?

conteggio percentuale

Solo aggregati personalizzabili 13 39,4%

Solo aggregati non personalizzabili 12 36,4%

Solo dati puntuali 4 12,1%

Aggregati personalizzabili e dati puntuali 3 9,1%

Aggregati personalizzabili e non 0 0,0%

Aggregati non personalizzabili e dati puntuali 0 0,0%

Aggregati personalizzabili, non personalizzabili e dati puntuali 1 3,0%

Altro 0 0,0%

Tabella 5.11. “Quanto riterrebbe utile per il suo lavoro avere a disposizionedegli strumenti in grado di mostrare le singole misure di consumo cosı comevengono campionate?”

conteggio percentuale

1 (inutile) 1 3,0%

2 1 3,0%

3 3 9,1%

4 12 36,4%

5 (molto utile) 16 48,5%

32

Page 36: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Misure aggregate e dimensioni di analisi

Nella sesta ed ultima sezione del questionario si richiedeva ai partecipanti all’inda-gine di esplicitare preferenze e opinioni riguardo le dimensioni di analisi utilizzate edesiderate.

La prima domanda chiedeva di scegliere all’interno di un set di alternative gliaspetti ritenuti rilevanti ai fini dell’analisi dei dati di consumo, mentre le due suc-cessive richiedevano di ordinare, secondo le proprie preferenze, misure aggregate edimensioni di aggregazione. Le risposte a queste tre domande sono mostrate nelgrafico e nelle tabelle che seguono (Figura 5.7 e Tabelle 5.12 5.13), ed evidenzianocome destinazione d’uso dei locali e dell’energia siano indicati come aspetti chiave,insieme all’occupazione e alla dimensione spazio temporale, mentre tra le misureaggregate media, somma e valori minimi e massimi sono ritenute le piu importan-ti. Altre misure aggregate come mediana o moda hanno ricevuto basso interesse,mentre non sono state proposte uleteriori alternative oltre a quelle proposte.

Figura 5.7. “Nell’impostare un’analisi dei dati di consumo, o un monitoraggioenergetico, quali dei seguenti aspetti riterrebbe utile analizzare/considerare?”

33

Page 37: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Tabella 5.12. “Quali sono le misure aggregate piu significative per le analisi chesvolge nell’ambito del suo lavoro? Ordini le seguenti tipologie di misure aggregatedalla piu importante alla meno importante.”

somma media max min moda mediana

1° 10 8 8 3 1 3

2° 3 10 6 5 3 3

3° 4 4 10 6 3 1

4° 0 3 3 8 0 1

5° 1 0 1 2 1 6

6° 2 1 0 0 5 1

n. risposte 20 26 28 24 13 15

posizione media 2,25 2,23 2,39 3,04 3,92 3,47

Tabella 5.13. “Nel valutare le misure aggregate, quale ritiene che siano le dimen-sioni di aggregazione dei dati piu importanti da considerare? Ordini dalla piuimportante alla meno importante le alternative proposte di seguito.”

spazio tempo dest.d’uso

energia

meteo occupaz.locali

produz.energia

1° 4 11 10 0 5 3

2° 7 7 7 2 4 2

3° 3 6 8 3 2 3

4° 5 1 1 2 5 2

5° 2 1 0 4 2 1

6° 0 0 0 2 3 3

n. risposte 21 26 26 13 21 14

posizione media 2,71 2 2 4,08 3,19 3,36

Per quanto riguarda la correlazione tra dati (indagata tramite una domandaaperta), si puo notare come i dati meteorologici, poco citati nelle risposte alle pre-cedenti domande, abbiano ricevuto un certo interesse. Bisogna altresı sottolinearecome solo il 60% di coloro i quali hanno risposto completamente al questionario ab-bia dichiarato di effettuare analisi riguardo la correlazione dei dati di consumo conaltri fenomeni, mentre all’interno di coloro che non la svolgono, la stragrande mag-gioranza (92%) ha dichiarato di non farlo perche non in possesso di dati o strumentiadatti.

34

Page 38: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Figura 5.8. “Tra quali dati di consumo e quali grandezze/aspetti verifical’eventuale correlazione?”

Misure aggregate, dimensioni di analisi e grandezze di consumo da con-siderare oltre a quelle previste all’interno del questionario

In tre casi inoltre e stato esplicitamente richiesto ai partecipanti all’indagine di elen-care alternative ulteriori oltre a quelle coperte dal questionario. Per quanto riguardamisure aggregate e dimensioni di analisi, non sono emerse indicazioni significative,mentre relativamente alle grandezze di consumo da considerare, il 48,5% dei ri-spondenti ha suggerito grandezze aggiuntive. Tra queste le piu citate sono risultateessere i carburanti, la quantita di energia autoprodotta e l’energia trasportata e con-sumata tramite varie forme di vettori termici (acqua surriscaldata, vapore, acquarefrigerata).

5.2 Ricerca secondaria: analisi della letteratura e

delle soluzioni accessibili online

La ricerca secondaria svolta e stata finalizzata alla verifica sul campo delle osser-vazioni tratte dall’analisi delle risposte giunte al questionario rivolto agli energymanager. Si e cercato in questo modo di mitigare gli effetti di eventuali imprecisionidovute alla limitatezza del campione esaminato ed allo stesso tempo di ampliare loscopo della ricrca, consultando fonti non specifiche del contesto italiano.

Oltre alla consultazione di svariati articoli accademici, che sono stati di supportoanche nella redazione dei capitoli precedenti al presente, e stata svolta una ricercaonline tra i cruscotti di visualizzazione dei dati di consumo energetico resi disponibililiberamente sia da alcune compagnie ed universita internazionali che da realta piu

35

Page 39: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

piccole. Questi sono stati confrontati sulla base delle informazioni fornite e dellemodalita di visualizzazione ed interazione con le stesse. Il risultato di questa analisie stata una griglia di confronto che tiene in considerazione aspetti quali le tipologie digrafici utilizzati, le grandezze di consumo considerate, i livelli di granularita spazialee temporale disponibili. Ovviamente la valenza statistica di un’analisi del generee decisamente limitata, e non permette di inferire praticamente nulla riguardo lecaratteristiche generali di questi tool, ma ha consentito di effettuare una panoramicaconoscitiva e di verificare se i concetti emersi dall’indagine precedentemente svoltatrovino riscontro nella pratica piu immediatamente accessibile.

5.2.1 Indagine sulle caratteristiche dei cruscotti di visualiz-zazione online

Sono stati presi in esame 55 cruscotti, pubblicati da enti di svariate tipologie, chevanno dal pubblico al privato, dalle universita alle aziende multinazionali. A que-sto proposito la loro distribuzione all’interno delle tre macro-aree scuola ed univer-sita, aziende private ed enti istituzionali e quella mostrata nel grafico presente inFigura 5.95.

Figura 5.9. Settori di appartenza degli enti a cui fanno riferimento ledashboard considerate

Per quanto riguarda le grandezze di consumo prese in esame (Figura 5.10), leinformazioni tratte dal questionario tra gli energy manager vengono confermate: almomento, oltre ai dati sul consumo di energia elettrica6, le grandezze prese mag-giormente in analisi sono infatti l’acqua, considerata esplicitamente dal questiona-rio, e l’energia tramite vettori termici, emersa tra le raccomandazioni su grandezzeagguntive da considerare (oltre alle tre gia presenti).

Passando a parlare di granularita spazio-temporale dei dati bisogna sottolinearecome non si sia proceduto a separare le considerazioni in base alle diverse grandezzedi consumo, in modo da non frammentare in maniera eccessiva le informazioni rac-colte. All’interno del campione esaminato e emerso che per la dimensione spaziale il

5scuole ed universita rappresentano la fetta maggiore probabilmente perche tendenzialmentemeno restie ad esporre dati sulla loro performance

6probabilmente anche per la piu facile raccolta di questi dati

36

Page 40: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

Figura 5.10. Grandezze prese in esame dalle dashboard considerate

massimo livello di dettaglio piu frequentemente fornito sia il dipartimento, mentreper la dimensione temporale si tratti dell’ora. Anche in questo caso l’osservazionesembra confermare le informazioni raccolte attraverso i questionari.

Figura 5.11. Minima granularita spaziale dei dati presente nelle dashboard considerate

Figura 5.12. Minima granularita temporale dei dati presente nelle da-shboard considerate

A proposito di dimensione temporale, sono stati analizzati anche i livelli di ag-gregazione dei dati disponibili, da cui e emerso che nel 70% dei casi sia possibile

37

Page 41: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

5 – Ricerca preliminare

visualizzare i dati sull’orizzonte di una settimana, un mese o un giorno.

Figura 5.13. Possibilita di aggregazione temporale dei dati presente nelledashboard considerate

Infine sono state prese in esame due caratteristiche dei cruscotti funzionali allaprogettazione grafica del prototipo, ovvero le tipologie di grafici disponibili e lefunzionalita aggiuntive disponibili oltre alla semplice visualizzazione grafica dei dati.Le tipologie di grafici maggiormente presenti sono risultate essere i bar chart (conorientamento prettamente verticale) ed i line chart o area line chart, secondo lepercentuali esposte nel grafico in Figura 5.14.

Figura 5.14. Tipologie di grafici presenti nelle dashboard considerate

Viceversa, per quanto riguarda le funzionalita aggiuntive presenti, e stato riscon-trato che:

• nell’ 89% dei casi e possibile effettuare qualche tipo di confronto tra dati;

• nell’ 83% dei casi vengono presentati dati sul meteo in tempo reale;

• nel 78% dei casi e possibile effettuare una sorta di contestualizzazione dei datiesprimendoli in unita di misura equivalenti.

38

Page 42: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Capitolo 6

Processo di definizione e sviluppodel prototipo

Una volta ottenute preziose indicazioni dal lavoro di ricerca esposto nel capitoloprecedente, si e proceduto a tradurle in requisiti di progettazione, cercando di con-ciliarle con le possibilita offerte dai dati a disposizione e mediando tra le varie istanzeemerse. Dopo aver formalizzato gli obiettivi in termini di funzionalita potenzialmen-te realizzabili, si e e proceduto a svilupparle con gli strumenti scelti, creando unoschema dei dati adeguato, implementando un prototipo di cruscotto e mettendonea punto le prestazioni. Nel capitolo che segue si vuole delineare il percorso seguito,focalizzandosi sulle problematiche affrontate e sulle soluzioni individuate.

6.1 Requisiti di progettazione

La definizione dei requisiti e stata la sintesi degli output di tutte le attivita di ricercapreliminare svolte a monte dello sviluppo del prototipo dimostratore. A partiredalle informazioni tratte dall’analisi delle risposte al questionario e dallo studiodelle caratteristiche dei cruscotti disponibili online, si e proceduto a selezionare leprincipali tendenze emerse, nel contesto dell’inquadramento generale fornito dallaletteratura consultata e dalle scelte preliminari descritte nella Sezione 4.1.

In particolare, dall’analisi delle risposte ai questionari si e registrato l’interesseda parte degli energy manager per:

• la visualizzazione dei dati puntuali con granularita identica alla frequenza dicampionamento;

• la possibilita di analizzare i dati secondo granularita differenti anche al variaredella grandezza di consumo in esame;

39

Page 43: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

• la possibilita di confrontare i dati di consumo tra diverse destinazioni d’uso,diversi locali, diversi periodi e anche con grandezze esterne come le condizionimeteorologiche;

• l’insieme di misure aggregate costituito da media aritmetica, somma, valoremassimo e valore minimo (in questo ordine di preferenza).

Inoltre e emerso come molti dei rispondenti basino le loro decisioni su tabelle oreport statici (solo una piccola minoranza ha a disposizione cruscotti di analisi deidati); mentre per quanto riguarda le grandezze da prendere in esame, appare esserciaccordo tra l’attenzione mostrata dai partecipanti al sondaggio per elettricita, ac-qua ed energia termica trasportata sotto varie forme1, e l’evidenza empirica dellegrandezze presenti nelle dashboard online esaminate.

Aggiungendo a queste considerazioni l’osservazione che la maggior parte dellesoluzioni online esaminate presenti i dati sotto forma di bar chart orientati vertical-mente o line chart, e che spesso vengano mostrati i dati sul meteo real time (unodei confronti tra dati di consumo e fattori esterni maggiormente indicato dai rispon-denti al sondaggio e stato proprio quello con i dati meteo) si e proceduto a definirei seguenti requisiti di progettazione2:

• granularita spazio-temporale variabile per l’analisi dei dati;

• possibilita di visualizzare le singole misure;

• aggregazione dei dati tramite le misure aggregate di somma, media, valoremax e min, secondo la dimensione temporale e spaziale;

• possibilita di effettuare confronti tra dati riferiti a differenti periodi (dimen-sione temporale);

• possibilita di effettuare confronti tra dati riferiti a differenti meter (dimensionespaziale - destinazione d’uso);

• presenza di dati meteorologici, con possibilita di metterli a confronto con i datidi consumo riferiti al medesimo tempo e spazio.

1vapore o acqua calda, acqua refrigerata...2La possibilita di fornire analisi dei dati sulla base della dimensione e dell’occupazione dei locali

e stata esclusa dai requisiti, nonostante fosse stata indicata come importante da una larga fettadei partecipanti al sondaggio, per l’impossibilita di estrarre informazioni affidabili su questo puntotramite i dati a disposizione. Per lo stesso motivo l’analisi per destinazione d’uso potra essereimplementata solo sommariamente, come verra esposto nella Sezione 6.2.2.

40

Page 44: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

In sintesi, quale obiettivo delle varie fasi di progettazione e sviluppo, e statoindividuata la creazione di un tool di visualizzazione di dati energetici capace ditrasformare i dati grezzi di consumo in informazioni fruibili nelle sopracitate moda-lita3, soprattutto grazie al fatto di essere costruito attorno ad una piattaforma dibusiness intelligence.

6.2 Sviluppo del prototipo dimostratore

6.2.1 Strumenti ed architettura selezionati

Anche se in parte si e trattato di decisioni prese a monte del processo di progetta-zione e sviluppo vero e proprio (cfr. Sezione 4.1), si puo certamente affermare chel’effettiva realizzazione del prototipo sia iniziata con la selezione dell’architettura daimplementare e degli strumenti software da utilizzare. Nel far questo, si e ovviamen-te dovuto tener conto dell’interdipendenza bidirezionale tra le scelte architetturalie la selezione di paradigmi e tool di sviluppo, con l’obiettivo finale di definire unasoluzione quanto piu coerente possibile.

Come anticipato nella Sezione 4.1, una delle scelte cardine iniziali e stata l’ado-zione della suite Pentaho per la realizzazione delle funzionalita legate a vario titoloalle tecniche di business intelligence (dall’etl al drill-down sui dati). Si tratta di unpacchetto software integralmente basato su tecnologia Java, che integra una serie disotto-tool per le funzionalita avanzate di ETL, OLAP, reporting, dashboard interat-tive, data mining e predictive analysis intorno ad un BI server centrale che gestiscele funzionalita base di autenticazione ed analisi dei dati; tra i punti di forza di que-sto prodotto vi sono le ottime performance di data access and integration, per lequali si e classificato al secondo posto assoluto all’interno dell’indagine comparativasvolta nel 2012 da Gartner tra i piu popolari software di business intelligence [2].Nello specifico, oltre al server di business intelligence (componente indispensabile delsistema), sono stati installati il componente per l’integrazione dei dati denominatoSpoon, il componente per la preparazione degli schemi di dati a supporto dell’esplo-razione OLAP denominato Schema Workbench ed il componente per la creazioneguidata di tabelle aggregate denominato Aggregate Designer. Sono stati inoltre in-stallati i plugin per il server centrale sviluppati da Webdetails4 per il supporto allacreazione di dashboard interattive integrate nella piattaforma Pentaho, denominati

3Implementando in questo modo la meta superiore, e piu vicina all’utente, del paradigma EISesposto in Figura 2.2

4Webdetails e un’azienda nata con lo scopo di creare soluzioni di Business Analytics apposi-tamente studiate per integrarsi con la piattaforma Pentaho, da qualche mese e stata acquisitadirettamente da Pentaho. http://www.webdetails.pt/

41

Page 45: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

Community Dashboard Editor5, Community Dashboard Framework6, CommunityData Access7 e Community Charting Components8.

Una volta selezionati gli strumenti della suite Pentaho per svolgere i compiti diBI server e data integration, si e trattato di definire quali tecnologie e quali strumentiimpiegare a monte per lo storage dei dati ed a valle per creare un ambiente dinamicoin cui presentare all’utente finale le dashboard gestite dal server BI:

• per quanto riguarda la selezione del database di riferimento, si e optato perMySQL, corredato dell’interfaccia grafica MySQL Workbench, il database re-lazionale libero piu diffuso nell’ambiente dello sviluppo web (ad esempio Wi-kipedia utilizza un database basato su MySQL [22]), che dal 2010 fa parte deiprodotti della multinazionale leader del settore dei database Oracle;

• in secondo luogo si e deciso di integrare le dashboard interattive risultato delleelaborazioni svolte dal server di BI all’interno di un’applicazione dinamicain JSP9, implementando il paradigma model view controller che permette didisaccoppiare l’accesso ai dati e le logiche di business dalla presentazione deidati ed interazione con l’utente;

• si e infine deciso di ospitare la suddetta applicazione, da realizzarsi con ilsupporto del tool di sviluppo Eclipse, sul popolare web server Apache Tomcat,che insieme a MySQL costituisce uno dei pilastri della diffusissima architetturaper il web LAMP10.

In questo modo, dall’unione delle componenti descritte finora, si e delineataun’architettura come quella illustrata in Figura 6.1, completamente basata su tec-nologie aperte (in gran parte Java) e in grado di separare le logiche di elaborazione

5Il Community Dashboard Editor (CDE), integrato nella Pentaho User Console, e uno strumentografico per la creazione, l’editing e la visualizzazione in anteprima di dashboard di Pentaho.

6Il Pentaho Community Dashboard Framework e stato creato per integrare saldamente ledashboard nl solution repository del server BI.

7Il plugin Community Data Access (CDA) e stato sviluppato come strumento di astrazione trale connessioni al database e CDF (Community Dashboard Framework). Consente ai dati di essererecuperati da piu sorgenti e combinati in un singolo output che puo essere facilmente trasmesso aicomponenti delle dashboard.

8Community Charting Components (CCC) e una libreria per la generazione di grafici costruitasu Protovis un potente kit di strumenti di visualizzazione gratuito e open-source. Consente aglisviluppatori di inserire in maniera immediata nelle dashboard i piu comuni tipi di grafico

9JavaServer Pages e una tecnologia di programmazione Web in Java per lo sviluppo diapplicazioni Web che forniscono contenuti dinamici in formato HTML o XML.

10LAMP e l’acronimo che indica una piattaforma software per lo sviluppo di applicazioni webche prende il nome dalle iniziali dei componenti software con cui e realizzata: sistema operativoLinux, web server Apache, database MySQL, linguaggi di scripting PHP,Perl o Phyton

42

Page 46: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

dei dati da quelle di presentazione degli stessi: il data warehouse che contiene idati necessari a tutte le elaborazioni e ospitato sul server MySQL, che, dopo esse-re stato alimentato dal tool di data integration Spoon, rende disponibili i dati diconsumo al server BI di Pentaho, il quale soddisfa le richieste dell’utente generandouna dashboard interattiva contenuta in un’applicazione jsp ospitata sul server webTomcat.

Figura 6.1. Schema architetturale del prototipo da sviluppare

6.2.2 Progettazione dello schema dei dati

Le tecniche applicate in questa fase della ricerca sono riconducibili alla teoria del Di-mensional Fact Model (DFM) [23], sviluppato per superare le limitazioni dei modellientity-relationship nel caso delle applicazioni di data warehousing.

In sintesi, si tratta di una tecnica che, sfruttando la denormalizzazione delle ta-belle generate, semplifica il design dei data warehouse e crea un ambiente in cuile query degli utenti possono essere definite in maniera piu intuitiva. I concettichiave attorno a cui ruota sono quelli di fatto, che modella gli eventi di interesse,dimensione, che definisce attraverso un set di attributi le coordinate di analisi diun fatto, misura, che descrive una proprieta numerica di un fatto, e gerarchia, cheesprime le relazioni di dipendenza funzionale tra gli attributi di una dimensione.

43

Page 47: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

Sfruttando questi quattro elementi concettuali, e possibile esprimere in maniera im-mediatamente comprensibile gli eventi centrali per le analisi di business intelligence,articolandone le caratteristiche gerarchicamente e numericamente.

Nel descrivere il processo di integrazione dei dati grezzi di consumo all’internodel data warehouse bisogna pero necessariamente partire dalla descrizione delle ca-ratteristiche di questi dati grezzi. Si e trattato di lavorare con tre tabelle denominatetab connessioni, albero connessioni e dati consumo, contenenti rispettivamente:

• l’elenco completo dei meter appartenenti alla rete del Politecnico, corredati diinformazioni sul tipo di dato raccolto da ciascuno;

• una parziale rappresentazione gerarchica dei suddetti meter11;

• le letture dei meter dal 1 gennaio 2009 al 17 luglio 2013 con intervallo dicampionamento di 15 minuti, corredate di informazioni sui relativi meter etimestamp.

Bisogna precisare a questo punto, che la rete tramite la quale sono stati raccolti idati di consumo elettrico presenta una struttura gerarchica a tre livelli caratterizzatada un meter che misura i consumi totali della sede centrale, un meter che misurai consumi in uscita dalle sotto-cabine di distribuzione ed una serie di meter chemisurano i consumi di porzioni piu o meno estese della rete a cui si connettono leapparecchiature di singoli utenti o strutture. Viceversa il consumo di acqua potabilee misurato solo a livello centralizzato per tutta la sede di corso Duca degli Abruzzi.

Purtroppo, rispetto ai requisiti emersi nella fase di ricerca sul campo, alcunefunzionalita sono quindi state rese irrealizzabili nella loro interezza dalle caratteri-stiche di questi dati. Se infatti per i dati meteorologici e stato possibile ricorrere afonti esterne, per i dati su occupazione, dimensione e destinazione d’uso dei loca-li monitorati dai vari meter non e stato ovviamente possibile fare altrettanto. Diconseguenza le funzionalita che si sarebbero potute realizzare avendo a disposizionequeste informazioni non sono state implementate, con l’eccezione della destinazioned’uso dell’energia, analizzabile in alcuni casi sfruttando il fatto che ci siano meterdedicati per alcuni degli impianti chiave della struttura del Politecnico, quali adesempio le pompe di calore o la galleria del vento.

11La gerarchizzazione dei meter contenuta nei dati di cui e stato possibile entrare in possessoera stata realizzata in maniera lacunosa a causa delle difficolta nell’identificare in maniera univocale relazioni tra meter diversi e per le imprecisioni introdotte dall’evoluzione “topografica” dellestrutture del Politecnico asincrona rispetto alla creazione della rete di meter.

44

Page 48: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

Con questi dati a disposizione, e con la necessita di implementare fondamental-mente due prospettive di analisi dei dati, ovvero quella temporale e quella logico-spaziale, si e quindi proceduto a definire lo star schema12 relativo agli eventi diconsumo energetico. Il fatto di interesse e stato ovviamente individuato nell’eventodi rilevazione del consumo, con unica misura costituita dall’entita della rilevazione;le dimensioni di analisi definite sono state invece tre: una per il momento dellagiornata, una per la data di rilevazione ed una riguardante il meter autore dellarilevazione. Come si puo verificare dall’analisi della Figura 6.2, le due dimensionitemporali sono le tipiche ed intuitive declinazioni del tempo su scala giornaliera oannuale, mentre risulta piu complessa e ramificata la dimensione che ha come radi-ce i singoli meter, che presenta come ramo principale la gerarchizzazione dei meterattraverso le cabine di trasformazione a cui fanno riferimento, e come attributi se-condari il tipo di meter ed il sottosistema logico a cui puo far riferimento all’internodella struttura del Politecnico.

Figura 6.2. Star schema del data warehouse

6.2.3 Implementazione processo ETL

A partire da questa struttura concettuale, e stato quindi necessario creare e riempirecon i dati corretti la relativa struttura di tabelle all’interno del server di MySQL in-stallato per ospitare i dati e renderli disponibili per le analisi di business intelligence.Nello schema presente in Figura 6.3 si puo vedere il risultato della transizione da

12E stato scelto lo star schema e non lo snowflake schema perche non appariva necessario ottenererisparmi nelle dimensioni del db e per evitare le problematiche legate al numero maggiore di joinche si sarebbero potuti rendere necessari.

45

Page 49: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

schema concettuale a tabelle sql, dove gli attributi con a sinistra la chiavetta giallasono le chiavi primarie, mentre quelle con il rombo rosso sono le chiavi esterne.

Figura 6.3. Struttura delle tabelle del data warehouse

Per riempire questo schema con i dati ripuliti da duplicati, valori nulli ed altritipi di imprecisioni in maniera efficace e veloce, ci si e serviti dello strumento perl’ETL della piattaforma Pentaho precedentemente installato. Con il supporto diquesto strumento si e proceduto a generare da zero le dimensioni temporali con lecaratteristiche richieste dallo schema concettuale, a trasportare i dati sui meter daldataset di partenza al data warehouse, ed infine a travasare anche i dati di consumocorretti. Tre le principali difficolta incontrate nello svolgimento di questa attivitavanno citate:

• la ricostruzione delle informazioni da inserire nella tabella rappresentativa delladimensione di analisi riguardante i meter, svolta “manualmente” a monte della

46

Page 50: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

programmazione del software Spoon confrontando i dati presenti nelle duetabelle tab connessioni ed albero connessioni con la topografia del Politecnico;

• la progettazione del trasferimento dei dati garantendo il mantenimento deicorretti riferimenti tra le tabelle, realizzata tramite la definizione della correttastruttura di chiavi per i dati;

• l’individuazione delle “difettosita” presenti nel dataset di partenza, emersetramite un lento processo di analisi fatto di esplorazione dei dati e provepreliminari di trasformazione con l’aiuto del tool ETL.

L’output di questa fase e stato dunque il data warehouse riempito con i da-ti di consumo del Politecnico organizzati secondo lo schema a stella necessario asupportare le analisi per il prototipo del cruscotto di visualizzazione dei dati.

6.2.4 Progettazione e sviluppo delle componenti JSP

Parallelamente allo studio della struttura dati necessaria, si e iniziato a definire lastruttura web in cui incapsulare le elaborazioni fornite dal server di BI.

La scelta e stata quella di implementare il classico pattern logico-grafico che sitrova all’interno delle pagine web, dividendo logicamente la pagina (e quindi l’in-terfaccia) in quattro aree: una superiore dedicata all’header che come la testata diun giornale renda riconoscibile l’applicazione, una inferiore dedicata ad informazio-ni di servizio come i riferimenti su autore e proprietario, un menu di navigazionelaterale che permetta di muoversi all’interno delle varie sezioni ed un grosso spaziocentrale dinamico, all’interno del quale far comparire di volta in volta il contenutocorrispondente alle scelte dell’utente. In linea con le soluzioni online analizzate e conle indicazioni fornite dai partecipanti al questionario, si e pensato di far corrispon-dere le sezioni e quindi le voci del menu di navigazione alle grandezze di consumoanalizzabili, mentre ad integrazione delle informazioni delle varie sezioni si e decisodi aggiungere anche un widget di visualizzazione dei dati meteorologici real time.

Considerando le funzionalita da realizzare e le possibilita offerte dagli strumentiselezionati, si e inoltre pensato di sfruttare il menu per implementare una soluzionea due livelli di analisi: un primo livello, con caratteristica principale l’immediatez-za, realizzabile attraverso una serie di dashboard interattive sviluppate con i pluginper Pentaho di Webdetails, ed un secondo livello, con possiblita di effettuare vero eproprio drill-down sui dati, realizzato includendo nel prototipo la possibilita di acce-dere direttamente a tutte le funzionalita del server di Pentaho. La prima parte dellasoluzione sarebbe in questo modo pensata per offrire un accesso quanto piu ampiopossibile ai dati senza necessita di autenticazione, anche ad esempio nel contesto diaumentare l’awareness sui consumi tra gli utenti di un edificio, mentre la secondarichiederebbe autenticazione da parte di personale preposto al monitoraggio delle

47

Page 51: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

performance degli edifici, nel contesto di effettuare richieste piu specifiche e quindipiu onerose dal punto di vista dell’elaborazione.

La struttura dell’applicazione e quindi risultata essere composta preliminarmenteda quattro sezioni13: una introduttiva di presentazione, una relativa ai consumi elet-trici, una relativa ai consumi idrici ed una contenente l’interfaccia grafica del serverdi BI. Navigando all’interno delle sezioni, l’utente potrebbe cosı passare dall’intro-duzione alle funzionalita disponibili, all’analisi veloce dei dati di consumo tramitedashboard pubbliche in grado di fornire una visione di insieme delle caratteristichedei dati, per proseguire infine, dopo l’autenticazione, all’analisi di dettaglio tramiteil drill su specifici aspetti di interesse.

Dopo aver definito la struttura generale dell’applicazione Jsp, si e trattato diriempirla con le componenti necessarie a generare il contenuto richiesto dall’utente.Secondo il model view controller, dopo che le pagine controller hanno selezionatola view in grado di implemetare le funzionalita corrette, sono le view a doversioccupare della generazione del contenuto e quindi e qui che ci si e trovati ad inserirele chiamate per includere il contenuto generato dal server di bi. L’operazione e statarealizzata inserendo degli iframe14 contenenti il riferimento alle url a cui vengonoesposte da Pentaho le dashboard realizzate con Community Dashboard Editor el’interfaccia operativa della piattaforma denominata Pentaho User Console; in questomodo e stato possibile inserire l’output delle elaborazioni del server in un contestoomogeneo generato tramite la tecnologia jsp, preservandone tutte le funzionalitaanche in termine di interazione con l’utente.

6.2.5 Progettazione e sviluppo delle dashboard dinamichegenerate dal server di BI

Una volta definito il perimetro dell’applicazione Jsp, e iniziata la fase di sviluppodelle dashboard necessarie ad implementare le funzionalita emerse dalla ricerca pre-liminare, realizzate tramite i sopracitati plugin sviluppati da Webdetails ed installatiinsieme al server di BI della piattaforma Pentaho.

Attraverso l’interfaccia grafica di lavoro di questi strumenti, e stato possibilecreare e modificare le dashboard senza dover scrivere direttamente codice, dal mo-mento che e l’editor CDE ad occuparsi di tradurre il design e le funzioni definitedallo sviluppatore nei file con estensione .cdfde .wcdf e .cda necessari al server diPentaho per rendere le dashboard. Si tratta di tre file per ciascuna dashboard redattiin una sorta di linguaggio .xml con cui il framework CDF definisce rispettivamen-te: la struttura ed i componenti, le proprieta generali e le funzionalita di accesso

13Si e potuto avere accesso solamente ai dati relativi al consumo di acqua potabile ed elettricita14Iframe e un tag ideato proprio per integrare un documento html all’interno di un altro

48

Page 52: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

ai dati di cui necessita una dashboard, la cui creazione viene in questo modo resamolto piu immediata e rapida, anche grazie alla possibilita di vedere in anteprima icambiamenti man mano che li si apportano. Di conseguenza, le uniche parti di veroe proprio codice scritto manualmente hanno riguardato lo stile di visualizzazione,definito attraverso una serie di definizioni .css, le query di accesso ai dati, scritteovviamente in SQL, ed il comportamento dinamico di alcuni componenti, specificatoattraverso script in Javascript.

Prima di iniziare il processo di sviluppo vero e proprio, e parso pero importantepassare attraverso una fase di familiarizzazione con gli strumenti di sviluppo sceltie di esplorazione delle potenzialita espressive degli stessi. Per fare cio, si e decisodi procedere alla realizzazione di alcuni abbozzi dell’interfaccia finale, in una sortadi brainstorming utile anche a verificare la fattibilita e le performance delle varieopzioni di sviluppo disponibili. Da un lato sono stati realizzati degli sketch graficiutili a valutare diverse alternative di impaginazione dei contenuti ed a testare ipattern di interazione offerti all’utente, e dall’altro si e iniziato ad esplorare qualifossero i limiti in termini di accesso ai dati oltre i quali la navigazione risultassedifficoltosa.

In seguito alle criticita emerse durante questa analisi preliminare sia in terminidi performance che di usabilita delle bozze realizzate, e parso evidente che la stradamigliore nello sviluppo fosse la separazione delle funzionalita da implementare al-l’interno di un sistema di dashboard, piuttosto che l’unione di tutte le funzioni inuna singola dashboard per ogni grandezza in esame (e quindi per ogni view Jsp).In questo modo sarebbe stato possibile delegare a ciascuna dashboard uno o piucompiti in un ambito ristretto, garantendo di volta in volta all’utente una diversaprofondita di analisi su aspetti complementari e fornendo nel complesso una pano-ramica piu ampia. Per ciascuna grandezza si e quindi pensato di definire, sulla basedelle caratteristiche della struttura dei dati, un sistema di tre dashboard (selezio-nabili tramite un apposita sezione di navigazione da aggiungere all’interno di ogniview):

• una per l’analisi dei dati all’interno di diversi periodi temporali, con la possibi-lita di scegliere sia l’orizzonte di dati da visualizzare (giorno, settimana, mese,anno) che la granularita temporale degli stessi all’interno della selezione, finoalla visualizzazione dei singoli campioni;

• una per l’analisi dei dati su base giornaliera, con la possibilita di visualizzarel’andamento dei consumi aggregati di un certo periodo all’interno dei varimomenti del giorno e di filtrare i dati sulla base del calendario lavorativo o delgiorno della settimana;

49

Page 53: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

• una per il confronto di una selezione di dati con quelli relativi ad un altroperiodo, ad un altro meter o ai dati meteo15.

(ovviamente in ciascuna sezione e stata prevista la possibilita di filtrare i dati inbase al meter autore delle rilevazioni, potendo scegliere di visualizzare i dati secondociascun livello della rispettiva dimensione)

Per garantire continuita tra le tre modalita di esplorazione dei dati sono statedefinite delle sezioni comuni in cui suddividere lo spazio a disposizione, dando quantopiu risalto possibile ai dati e separando logicamente i blocchi di filtraggio dei dati trala dimensione temporale e quella logico-spaziale. Ne e scaturita la scelta di disporrenella zona centrale i line chart con cui visualizzare l’andamento dei consumi16 enella parte inferiore le due aree affiancate di filtraggio dei dati come nel disegno diFigura 6.4.

Figura 6.4. Bozza della disposizione grafica degli elementi nelle sezioni divisualizzazione dei dati

A partire da questa struttura logica, e non solo grafica, per ogni dashboard sonostate definite le funzionalita di filtraggio dei dati disponibili (e di conseguenza le

15Per dati meterologici si intendono le temperture massime, medie e minime16E stato scelto quest tipo di grafici in luogo dei bar chart per la maggior capacita di veicolare

le informazioni sull’andamento dei valori nel corso del tempo

50

Page 54: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

componenti da inserire nei form appositi) insieme con le modalita di generazionedelle misure aggregate. In tutte e tre sono stati inseriti i selettori per la scelta deltipo di periodo di tempo (anno, mese, settimana, giorno), del singolo periodo daesaminare, del tipo di centro di consumo (totale, sottosistema, cabina, meter) e delsingolo centro di consumo, indispensabili per restringere il campo di lavoro in ognunodei tipi di analisi supportato. Per l’analisi per periodo e stato aggiunto il selettoreper la scelta del livello di granularita temporale, con opzioni disponibili generatedinamicamente in base al tipo di periodo scelto, in modo da non dover renderegrafici con un numero di punti troppo elevato17. Per l’analisi nei vari momenti dellagiornata, invece, sono stati aggiunti i selettori per restringere l’analisi ad un sologiorno della settimana e per filtrare tra giorni festivi o lavorativi. Infine, per ilconfronto tra dati, si e pensato di inserire un radio-button per la scelta del tipo diraffronto da effettuare, con possibilita di scegliere alternativamente se confrontrare idati relativi ad un periodo e ad un centro di consumo, con quelli relativi ad un altroperiodo, ad un altro centro di consumo o alle temperature medie, massime e minimegiornaliere registrate nello stesso periodo. In quest’ultimo caso si e provveduto anchea gestire la comparsa e scomparsa in modo dinamico delle sezioni per la definizionedelle caratteristiche dei dati con cui raffrontare quelli della selezione principale.

Per quanto riguarda il secondo punto, invece, si e pensato di sfruttare la possi-bilita di rendere cliccabili i grafici offerta dal tool Pentaho Community Chart Com-ponents, per inserire, nelle due dashboard prettamente di analisi dei dati, un eventhandler che generi un popup contenente le misure aggregate calcolate sulla base deidati presenti nel punto in cui l’utente abbia cliccato. Inoltre, per fornire contestualiz-zazione ai dati mostrati nei grafici realizzati tramite le dashboard appena descritte,si e deciso a posteriori di modificarne leggermente il layout grafico inserendo accantoai due blocchi per il filtraggio dei dati un box contenente le caratteristiche dei dativisualizzati, aggiornate dinamicamente in base alle scelte dell’utente.

Dopo aver sviluppato le componenti delle dashboard, si e trattato di completarela configurazione dei componenti accessibili tramite l’applicazione Jsp, rendendopossibile il drill-down sul data warehouse contenente i dati di consumo del Politecnicoall’interno della Pentaho User Console18. Per fare cio e stato necessario pubblicarelo schema del cubo di analisi dei dati sul server, dopo averlo descritto in formato.xml attraverso l’interfaccia grafica del tool Schema Workbench19.

17Ad esempio nel caso si fosse lasciata la possibilita di visualizzare i dati con granularita ai 15minuti e orizzonte temporale di un mese si sarebbe dovuto generare un grafico con circa 2900 valori

18La Pentaho User Console (PUC) e l’interfaccia Web per il Pentaho BI Server. Essa consentedi interagire in modo semplice e diretto con le funzioni base di reporting e analisi di Pentaho

19Schema Workbench e un’interfaccia di design che permette di creare e testare schemi di cubiOLAP visivamente. Permette di generare in maniera grafica gli schemi di metadati xml utilizzati

51

Page 55: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

A una prima esplorazione dei dati tramite le componenti per l’analitica com-prese nella Pentaho User Console, svolta in prima istanza per verificarne il correttofunzionamento in seguito alla pubblicazione degli schema files, e pero emersa conprepotenza la questione delle performance: l’elaborazione richiesta per l’analisi drill-down sui circa 15 milioni di record contenuti nel data warehouse rendeva impossibileuna user experience soddisfacente. Al contrario di molti server OLAP, Mondrian20

infatti non memorizza dati sul disco, ma lavora solo con i dati del database relazio-nale e dopo averne letto una certa quantita li memorizza in cache. Questo garantiscesemplificazioni nel processo di installazione di Mondrian, ma ne limita le prestazioniquando viene utilizzato con grandi moli di dati, costringendo all’utilizzo di tabelledi aggregati da posizionare accanto alla fact-table principale nel DW e registrarenegli schema files sul server [24].

Fortunatamente tutte queste operazioni sono state semplificate dall’utilizzo deltool grafico Aggregate Designer, che, a partire dallo schema file gia pubblicato sulserver, permette di creare, poopolare e registrare gli aggregati necessari, che sarannopero utilizzabili solo dopo aver modificato le impostazioni del server di Pentaho chedi default non sfrutta queste strutture dati. Al fine di valutarne le prestazioni sie inoltre scelto di affidarsi, per la definizione degli aggregati necessari, alla funzio-nalita di autocreazione degli stessi presente in Aggregate Designer21, che permettedi svolgere tutte le operazioni senza dover interagire direttamente con il database.In questo modo le performance generali in esplorazione dei dati sono sensibilmentemigliorate, anche se, come ovvia conseguenza dell’approccio seguito, permangonodifficolta nell’effettuare drill-down su determinate areee del data warehouse nonspecificamente supportate dalla struttura dati creata.

Affrontata la questione delle performance della funzione di analytics della Penta-ho User Console, restava pero aperta quella riguardante le performance delle querynecessarie a fornire i dati alle dashboard, in grado di costituire potenzialmente unblocco alla qualita della user experience da queste offerta. Al momento della pri-ma definizione delle query per il fetch dei dati necessari al funzionamento delledashboard, non ci si era infatti posti direttamente questo problema, convinti dellabonta della soluzione di “spacchettamento” delle funzionalita tra le diverse dash-board accessibili per ogni grandezza di consumo. L’analisi empirica della soluzione

da Mondrian, il motore OLAP interno a Pentaho, per elaborare le richieste ROLAP. In particolare imodelli di metadati prodotti sono un’emulazione di un cubo basato sulle tabelle di fatti e dimensionipresenti nel RDBMS, che permette di evitare la costruzione e manutenzone di veri e propri cubifisici.

20Il server OLAP presente all’interno della piattaforma Pentaho.21Il software analizza la struttura e la cardinalita delle dimensioni del data warehouse e, in

funzione del massimo tempo di elaborazione e massimo numero di aggregati impostato dall’utente,suggerisce un set di tabelle aggregate ottimale.

52

Page 56: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

6 – Processo di definizione e sviluppo del prototipo

sviluppata a quel punto, ha pero messo in evidenza le criticita connesse alle queryper il recupero delle informazioni necessarie per la generazione dei grafici e per ilcalcolo delle misure aggregate, in prima analisi derivanti dalla necessita di effettuarenumerosi join tra tabelle a cardinalita elevata. Scartata l’opzione di modificare letabelle aggregate per questo scopo, dal momento che la combinazione della sintassiaccettata da mysql e delle modalita di gestione delle query sql all’interno di PentahoCDE non lo permetteva22, si e proceduto all’analisi delle singole query con l’aiutodi MySQL workbench alla ricerca di soluzioni alternative. Dalla verifica condotta eemersa come la soluzione piu efficace fosse lo sfruttamento dell’indicizzazione dellechiavi primarie ed esterne, implementata di default da mysql, utilizzando quantopiu possibile le suddette chiavi all’interno dei campi WHERE delle query. I vantag-gi piu grossi derivanti da questo approccio si sono avuti nel trattare la dimensionerelativa alle date, che data l’elevata cardinalita comportava le difficolta maggiori.Aiutati anche grazie al fatto di aver definito gli id dei record della corrispondentetabella in maniera leggibile (si utilizzato un intero in formato aaaammgg), e statoinfatti possibile selezionare il periodo di interesse all’interno delle query utilizzandointervalli di key anziche gli attributi relativi ai vari livelli della gerarchia.

L’ultima questione aperta ha riguardato la gestione dell’autenticazione, da im-plementare solo su una porzione dello strumento, ovvero quella che permette diaccedere alla Pentaho User Console. Con Pentaho CDE e possibile definire i privi-legi dei vari utenti riguardo una dashboard, in modo che questa, dopo essere statapubblicata sul server di BI, possa essere accessibile tramite una url e di conseguenzaanche inclusa all’interno di un’altro documento html tramite il tag iframe, come nelcaso dello strumento oggetto di questa ricerca. Non e pero nativamente possibileaprire porzioni dei contenuti pubblicati sul server di bi ad utenti anonimi. Dal mo-mento che l’intera piattaforma Pentaho viene distribuita con codice aperto, e statopero possibile intervenire direttamente sui file di configurazione di base del server,modificando le componenti che si occupano della sicurezza e rendendo possibile laconcessione del privilegio di esecutore anche ad un utente anonimo. Si e potuto inquesto modo separare l’accesso pubblico alle dashboard di analisi “veloce” dei datiche richiedono un carico di elaborazione piu basso, da quello riservato agli utentiregistrati alle funzionalita analitiche della PUC potenzialmente molto piu pesantiper il server.

22La sintassi di MySQL non permette la definizione di strutture di controllo iterative all’internodel campo FROM, mentre i meccanismi di gestione delle query e di prevenzione della sql-injectionin CDE non consentono il necessario livello di dinamismo nella definizione della query associata adun componente.

53

Page 57: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Capitolo 7

Conclusioni e spunti per laprosecuzione del lavoro

A conclusione del percorso di sviluppo descritto nel capitolo precedente, si e prov-veduto ad analizzarne criticamente i risultati, cercando di far emergere punti debolie punti di forza dell’architettura, ma soprattutto degli strumenti utilizzati; dal mo-mento che l’obiettivo principale della ricerca era costituito proprio da un’analisiragionata delle caratteristiche di questi ultimi. Per fare cio, sono state messe sottola lente di ingrandimento tutte le componenti del processo di sviluppo del prototipo,a vario titolo connesse all’utilizzo dei software prescelti, in modo da individuarnele criticita ed evidenziarne pregi e potenzialita sulla base dell’esperienza direttaaccumulata.

Analizzando la soluzione sviluppata, si puo affermare che i requisiti di progetta-zione definiti in via preliminare siano stati in buona parte soddisfatti, dal momentoche attraverso l’impiego degli strumenti adottati e stato possibile realizzare, compa-tibilmente con i dati a disposizione, la maggior parte delle funzionalita identificatetramite la ricerca preliminare; a questo proposito bisogna notare come, contraria-mente alle potenziali tecnologie disponibili e a quello che ci si puo aspettare dallatrasposizione del lavoro svolto all’interno di un contesto di lavoro reale, uno degliostacoli principali allo sviluppo delle funzionalita analitiche mancanti sia stato costi-tuito dall’assenza dei dati necessari a costruirle (es. dati su occupazione dei locali,dimensione locali, associazione univoca tra meter e locali...).

Per quanto riguarda gli strumenti software di lavoro (in particolare la piattaformaPentaho, che costituiva il principale punto interrogativo) si puo viceversa sottolinearecome abbiano dimostrato notevole flessibilita nell’adattamento allo specifico contestodi lavoro in cui sono stati impiegati, seppur evidenziando alcune lacune specialmentein merito alla facilita d’uso.

Ovviamente, per una valutazione piu accurata del grado di soddisfazione dei re-quisiti impliciti ed espliciti, che resta al di fuori del perimetro dell’analisi contenuta

54

Page 58: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

7 – Conclusioni e spunti per la prosecuzione del lavoro

in questo documento, sarebbe opportuno procedere ad una fase di test del prototipocon potenziali utenti, gli unici in grado di esaminare in un contesto realmente ope-rativo la bonta delle soluzioni adottate. Nell’ottica di una prosecuzione del lavorosvolto, e quindi della realizzazione compiuta di un tool di analisi dei dati, questo po-trebbe essere sicuramente uno dei primi passi da intraprendere, seguito da revisionedelle scelte progettuali che si rivelassero eventualmente inadeguate.

In questo capitolo si procedera invece a esporre dapprima punti di forza e criticitadell’architettura software utilizzata emersi come conseguenza diretta del percorso disviluppo seguito, per poi passare ad enunciare una serie di considerazioni piu generalisui tool utilizzati, frutto di riflessioni nate durante lo sviluppo e di documentazionetramite la letteratura disponibile.

7.1 Punti deboli e punti di forza connessi allo

sviluppo del cruscotto interattivo

In prima istanza, sono stati presi in esame gli aspetti negativi e positivi dell’ar-chitettura software emersi in maniera piu evidente durante lo sviluppo delle variecomponenti del cruscotto, e quindi ritenuti maggiormente correlati con le dinamichee le problematiche con cui ci si e dovuti misurare nel corso della realizzazione dellostesso. La definizione dei due elenchi puntati che seguono e stata infatti il puntod’arrivo dell’analisi delle varie problematiche di sviluppo registrate, ed in misura piuo meno soddisfacente superate.

Gli aspetti critici con cui fare i conti sono stati sostanzialmente cinque:

• la limitata flessibilita del componente di sviluppo ed esecuzione delle dashboardnella gestione dinamica dell’accesso ai dati necessari per la generazione deigrafici di consumo, che, come esposto nella parte conclusiva della Sezione 6.2.5,ha comportato la scrittura di complicate query SQL e imposto limitazioni allemodalita di interazione con l’utente implementabili;

• il mancato supporto nativo per l’esposizione dei contenuti pubblicati sul serveranche a vantaggio di utenti anonimi;

• le difficolta nell’implementazione di funzionalita di esportazione delle analisisvolte tramite le dashboard in formati statici quali ad esempio file .pdf o simili;

• il basso livello di supporto offerto dai tool di sviluppo integrati nel serverbi per quanto riguarda la cura degli aspetti grafico/estetici delle dashboardrealizzate;

55

Page 59: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

7 – Conclusioni e spunti per la prosecuzione del lavoro

• la necessita di generare, e di conseguenza mantenere aggiornate, una serie ditabelle aggregate indispensabili per innalzare le performance del drill-downofferto dal motore OLAP interno a Pentaho.

Parallelamente si sono pero potuti apprezzare almeno altrettanti punti di forza,anch’essi intrinsecamente connessi allo specifico processo di progettazione e sviluppocondotto:

• l’elevata portabilita dell’architettura software sviluppata, che dopo essere statasviluppata in ambiente windows si e dimostrata pienamente funzionante anchein fase di test in ambiente linux, con la necessita di apportare solo piccoliaggiustamenti;

• la flessibilita degli strumenti nell’adattarsi a contesti di lavoro specifici, eviden-ziata dalla possibilita di intervenire direttamente sul codice personalizzando ledinamiche di autenticazione del server BI Pentaho e soddisfacendo in questomodo specifiche necessita di sviluppo;

• la possibilita di accedere al patrimonio di risorse online costituito dalla docu-mentazione e dagli spazi di confronto tipici della comunita open source, spessoin grado di fornire soluzioni immediate a problemi non altrettanto banali;

• la possibilita di sfruttare l’interfaccia web e le funzionalita di pubblicazionediretta dei contenuti offerti dal server Pentaho, che ha consentito di includerein maniera immediata l’output generato dal server stesso all’interno di un’ap-plicazione Jsp, creando uno strumento che richiede un bassissimo carico dielaborazione per le macchine client da cui gli utenti possono fruirne;

• infine la possibilita di delegare integralmente le funzioni di autenticazione ne-cessarie al server bi, che tramite alcune piccole modifiche si e dimostrato ingrado di poter gestire in maniera completa le dinamiche di autenticazionenecessarie.

7.2 Considerazioni generali sugli strumenti utiliz-

zati

Come anticipato, si e voluto dare spazio in questo capitolo anche ad alcune con-siderazioni di carattere maggiormente generale in merito alle impressioni suscitatedall’insieme di tool di sviluppo utilizzati (sempre con focus principale sulla piatta-forma di Business Intelligence Pentaho). Oltre a estenderne la valutazione al di ladei confini dell’esperienza diretta maturata, vogliono fungere da base di lavoro invista di un’eventuale prosecuzione ed approfondimento delle tematiche trattate.

56

Page 60: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

7 – Conclusioni e spunti per la prosecuzione del lavoro

Una delle piu evidenti e significative caratteristiche emerse, analizzata ancheall’interno di una ricerca condotta dalla Delft University of Technology [25], e co-stituita dalla necessita di disporre di un livello minimo di conoscenze in terminidi business intelligence e linguaggi di programmazione per poter utilizzare profi-cuamente la piattaforma Pentaho, cosa che la differenzia notevolmente da moltistrumenti commerciali che spesso fanno della semplificazione operativa uno dei lorovanti. E importante precisare che cio non significa che sia indispensabile essere inpossesso di un bagaglio di conoscenze specialistiche sugli argomenti indicati, anziappare piu che sufficiente avere dimistichezza con alcuni concetti tecnici di base,ma questa peculiarita risulta sufficiente ad indurre due effetti secondari di oppo-sto tenore: lo svantaggio di una curva di apprendimento relativa all’utilizzo dellapiattaforma dall’andamento piuttosto lento, affiancato dalla stimolo per l’utente arimanere focalizzato sugli aspetti chiave e sugli scopi delle proprie analisi, evitan-do di divagare dietro inutili fronzoli. Appare inoltre molto importante, a questoproposito, evidenziare il fatto che la piattaforma software appaia dotata del giustocompromesso di “trasparenza” riguardo i meccanismi che ne consentono il funzio-namento agli occhi dell’utente [25]: si distingue per essere in grado di semplificareil compito di analisi dei dati senza tenere l’utente all’oscuro dei meccanismi che lopermettono, rendendolo immediatamente consapevole dei punti di forza e debolezzadel lavoro che sta svolgendo e delle potenzialita eventulmente disponibili.

Viceversa, la struttura modulare di Pentaho, all’interno della quale si puo sceglie-re di utilizzare una parte o tutti gli strumenti disponibili implementando in manierapiu o meno ampia lo spettro delle funzionalita di Business Intelligence, appare piudisorientante che non efficace. Pur trattandosi di un risvolto dell’ampio spazio ope-rativo potenzialmente supportato dalla piattaforma (attraverso la quale e possibilecoprire funzioni che vanno dall’ETL al data mining), prevale infatti la sensazionedi difficolta nel far dialogare ed interagire in maniera fluida le varie componenti,con un conseguente vincolo sulla capacita per l’utente di sfruttarne fino in fondo lecaratteristiche e potenzialita tecniche.

Tra quest’ultime appare comunque necessario ricordare ancora una volta l’ele-vato livello di connettivita out-of-the-box verso le piu disparate fonti di dati, checontraddistingue la piattaforma e le permette di adattarsi proficuamente a contestidi lavoro molto ampi, spaziando dai dati quasi grezzi presenti in file .csv, ai variformati proprietari di Microsoft, proseguendo i piu comuni database relazionali econcludendo con gli attualissimi database noSQL1.

1Nel corso della ricerca e stata positivamente testata la capacita di interagire con il databaseApache Cassandra, sviluppato e utilizzato in ambito big data da Facebook per migliorare le per-formance della ricerca all’interno della casella di posta disponibile all’interno del social networkstesso [26].

57

Page 61: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

7 – Conclusioni e spunti per la prosecuzione del lavoro

In conclusione bisogna considerare le limitazioni poste in essere dalle piccoledimensioni dell’azienda che sviluppa l’intera piattaforma Pentaho2. Il processo dicrescita che sta subendo, tramite acquisizioni di societa affini al suo business e rounddi finanziamento3, non ha ancora permesso di uscire dal ruolo di player di nicchiaall’interno di un mercato dove competono realta molto piu affermate quali IBM, Mi-crosoft, SAS o Microstrategy, nonostante le relazioni con la comunita open sourcele permettano di accedere a risorse molto ampie per un’azienda delle sue dimensio-ni [2]. Resta ancora qualche dubbio circa le azioni di consolidamento ed innovazionedella piattaforma di BI che l’azienda Pentaho potra mettere in campo, cosı comesulla possibilita che riesca a continuare a sostenere la strategia di differenziazionetecnologica rispetto ai competitors tramite l’integrazione con tecnologie Big Data. Aparziale sostegno delle ipotesi piu ottimistiche, mentre si sta ultimando la redazionedi questa monografia4 e imminente il lancio della nuova versione della piattaforma,che promette di essere caratterizzata da una rinnovata e piu curata veste grafica, dauna maggior immediatezza d’uso e da un forte accento proprio sulla compatibilitacon i trend tecnologici del momento in tema di databases.

2L’azienda, con sede a Orlando in Florida, e stata fondata solo nel 2004 e contava a fine 2011circa 100 dipendenti [27].

3Secondo dati di Gartner la societa avrebbe ricevuto nel corso del 2012 circa 23 milioni di dollaridi capitali tramite venture funding.

4La versione 5.0 Enterprise Edition (con funzionalita piu ampie e a pagamento) e stata rilasciataall’inizio di settembre 2013, mentre la versione Community Edition dovrebbe vedere la luce nelcorso del mese di novembre (era prevista per ottobre-novembre).

58

Page 62: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Bibliografia

[1] Acre. The evolution of the energy manager from boiler room to board room.Technical report, Acre Resources, febbraio 2012.

[2] Kurt Schlegel, Rita L. Sallam, Daniel Yuen, and Joao Tapadinhas. Magicquadrant for business intelligence and analytics platforms, febbraio 2013.

[3] Jeffrey Harris and Elizabeth Shearer. Evaluation of the market-transformingeffects of the us federal energy management program. aprile 2006.

[4] Steven Fawkes. http://www.vesma.com/thefivep.htm, agosto 2001.

[5] Francesco Belcastro and Dario Di Santo. Dall’energy manager alla certificazionedell’esperto in gestione dell’energia. Technical report, FIRE Italia, 2012.

[6] Patrick Mazza. The smart energy network: Electricity’s third great revolution.Technical report, Climate Solutions, 2002.

[7] EPA. Energy star and other climate protection partnerships 2009 report.Technical report, Environmental Protection Agency, dicembre 2010.

[8] Bill Sisson, Constant van Aerschot, and Roger Cowe. Energy efficiency in buil-dings. Technical report, World business council for sustainable development,agosto 2009.

[9] Deloitte. resources 2012 study. Technical report, Deloitte, 2012.

[10] Eric Bloom and Bob Gohn. Smart buildings: Top trends to watch in 2012 andbeyond. Technical report, Pike research, 2012.

[11] Eric Bloom and Bob Gohn. Basic and advanced submeter hardware, submeterenergy management software, and submetering services: Market analysis andforecasts. Technical report, Pike Research, 2012.

[12] Tom Webster. Trends in energy management technologies - part 5: Effective-ness of energy management systems: What the experts say and case studiesreveal. Technical report, Lawrence Berkeley National Laboratory, novembre2005.

[13] Jessica Granderson. Building energy information systems: User case studies.Technical report, Lawrence Berkeley National Laboratory, agosto 2010.

[14] S. Aman, Y. Simmhan, and V.K. Prasanna. Energy management systems: stateof the art and emerging trends. Communications Magazine, IEEE, 55(1):114–119, gennaio 2013.

59

Page 63: Strumenti ed Applicazioni di Business Intelligence per Dati …elite.polito.it/files/thesis/fulltext/ParacchinoMatteo.pdf · 2014. 10. 6. · POLITECNICO DI TORINO Tesi di Laurea

Bibliografia

[15] Nuris Ismail and Matthew Littlefield. Energy intelligence: Driving optimizationwith visibility. Technical report, Aberdeen Group, luglio 2011.

[16] Casey Hogan and Rick Nicholson. Big data and analytics for smart buildings.Technical report, IDC Energy Insights, settembre 2011.

[17] Luıs Luciano and Paulo Carreira. Integrating energy data with etl. In Pro-ceedings of the First International Workshop on Information Technology forEnergy Applications, settembre 2012.

[18] Ict opportunities abound as smart metering data concerns persist, says frost &sullivan, novembre 2012.

[19] Mehul Shah and Matthew Littlefield. Energy management, driving value inindustrial environments. Technical report, Aberdeen Research, aprile 2009.

[20] Sarah Darby. The effectiveness of feedback on energy consumption a reviewfor defra of the literature on metering, billing and direct displays. Technicalreport, Oxford University Environmental Change Institute, aprile 2006.

[21] Matteo Golfarelli, Stefano Rizzi, and Iuris Cella. Beyond data warehou-sing: what’s next in business intelligence? In Proceedings of the 7th ACMinternational workshop on Data warehousing and OLAP, pages 1–6. ACM,2004.

[22] Asher Feldman. Wikipedia adopts mariadb, aprile 2013.[23] Matteo Golfarelli, Dario Maio, and Stefano Rizzi. The dimensional fact model:

A conceptual model for data warehouses. International Journal of CooperativeInformation Systems, 7(02n03):215–247, 1998.

[24] Richard Emberson. Mondrian documentation, marzo 2008.[25] Orhan Tuncer and Jan van den Berg. Implementing bi concepts with pentaho,

an evaluation. Delft University of Technology, 2010.[26] Avinash Lakshman and Prashant Malik. Cassandra: a decentralized structured

storage system. ACM SIGOPS Operating Systems Review, 44(2):35–40, 2010.[27] Steven E.F. Brown. Florida’s pentaho hires quentin gallivan as ceo in san

francisco, ottobre 2011.

60