Modellistica e analisi dei consumi energetici in ambito...

87
UNIVERSITÀ DEGLI STUDI LA SAPIENZA DI ROMA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA INFORMATICA Modellistica e analisi dei consumi energetici in ambito domestico per l’identificazione dell’utenza e la rivelazione di anomalie Relatore: Laureanda: Ch. mo Prof. Roberto Cusani Manuela Marzotti Anno Accademico 2007/2008

Transcript of Modellistica e analisi dei consumi energetici in ambito...

UNIVERSITÀ DEGLI STUDI LA SAPIENZA DI ROMA

FACOLTÀ DI INGEGNERIA

CORSO DI LAUREA IN INGEGNERIA INFORMATICA

Modellistica e analisi dei consumi energetici

in ambito domestico per l’identificazione

dell’utenza e la rivelazione di anomalie

Relatore: Laureanda:

Ch. mo Prof. Roberto Cusani Manuela Marzotti

Anno Accademico 2007/2008

2

INDICE 1 PREFAZIONE ..........................................................................................................................4

2 L ‘ENERGIA ELETTRICA ....................................................................................................5

2.1 FORME E FONTI DI ENERGIA.................................................................................................5

2.2 EFFICIENZA ENERGETICA....................................................................................................6

2.3 IL CONSUMO DI ENERGIA ELETTRICA...................................................................................8

2.4 ALCUNE SOLUZIONI PER TUTELARE IL CLIMA DEL PIANETA...............................................11

2.5 LA RIVELAZIONE DI ANOMALIE NEI CONSUMI DI ENERGIA ELETTRICA...............................13

3 MODELLISTICA E SIMULAZIONE DEI CONSUMI ENERGETICI NELL’AMBITO DOMESTICO.....................................................................................................15

3.1 INTRODUZIONE..................................................................................................................15

3.2 CARATTERISTICHE DI CONSUMO DEI PRINCIPALI ELETTRODOMESTICI...............................16

3.3 MODELLI PER LA SIMULAZIONE DI CONSUMO ELETTRICO..................................................18 3.3.1 Tipologie di famiglie............................................................................................................. 18 3.3.2 Modello semplice.................................................................................................................. 19 3.3.3 Modello di Markov per i consumi domestici ........................................................................ 23

4 ANALISI STATISTICA DEI CONSUMI DOMESTICI........... .........................................35

4.1 MEDIE E VARIANZE DELLA CURVA DI CONSUMO...............................................................35

4.2 STATISTICHE DI CONSUMO................................................................................................36 4.2.1 Giorni singoli........................................................................................................................ 36 4.2.2 Giorni multipli ...................................................................................................................... 38

4.3 RIVELAZIONE DI ANOMALIE NEI CONSUMI BASATA SUI PARAMETRI STATISTICI ................40

5 IDENTIFICAZIONE PROFILI UTENTE ..................... .....................................................41

5.1 STRATEGIE PER L’ IDENTIFICAZIONE DI PROFILI UTENTE....................................................41

5.2 APPLICAZIONE DELLA METODOLOGIA SVILUPPATA...........................................................47 5.2.1 Prima prova: famiglia-campione senza profili..................................................................... 47 5.2.2 Seconda prova: famiglia-campione con profili .................................................................... 49

5.3 LA SOLUZIONE PROPOSTA.................................................................................................51 5.3.1 Matlab................................................................................................................................... 51 5.3.2 Identificazione profili utente................................................................................................. 53

5.4 RISULTATI .........................................................................................................................53

6 RIVELAZIONE DI ANOMALIE NEL CONSUMO DOMESTICO ...... ..........................58

6.1 STRATEGIA PER LA RIVELAZIONE DI ANOMALIE ................................................................58

6.2 I RISULTATI .......................................................................................................................59

7 CONCLUSIONI......................................................................................................................62

APPENDICE A: RIVELAZIONE DI ANOMALIE NEL TRAFFICO SU INTERNET... ....64

3

APPENDICE B: SOFTWARE MATLAB PER LA MODELLISTICA E L’ANALISI DEI CONSUMI DOMESTICI ........................................................................................................73

APPENDICE C: SOFTWARE MATLAB PER LA IDENTIFICAZIONE E LA RIVELAZIONE DI ANOMALIE NEI CONSUMI DOMESTICI...... ........................................79

BIBLIOGRAFIA..............................................................................................................................83

INDICE DELLE FIGURE ..............................................................................................................85

RINGRAZIAMENTI .......................................................................................................................87

4

1 PREFAZIONE

Il lavoro di Tesi ha riguardato lo sviluppo di un software per ottenere la rivelazione di

anomalie nel consumo di energia elettrica in ambito domestico. Al fine di formulare degli scenari

di consumo energetico, sono state raccolte informazioni riguardanti alcune famiglie tipo ed

elaborate in relazione a varie fasce orarie. Successivamente sono stati creati dei grafici in cui

sono riportati i dati relativi ai consumi, monitorati in un determinato periodo, in modo da

permettere l’individuare di eventuali anomalie nel “sistema energia” e favorire la gestione dei

consumi, ottimizzandone l’utilizzo. Di seguito sono descritte le metodologie adottate per

produrre delle analisi sulle principali fonti energetiche ed i risultati ottenuti. La tesi ha la

seguente struttura:

il capitolo 1 comprende una premessa sul contesto della tesi di laurea e una breve sintesi

degli obiettivi preposti.

il capitolo 2 tratta dell’energia elettrica soprattutto in ambito domestico, dell’importanza

del risparmio energetico e delle normative che la riguardano.

il capitolo 3 descrive i modelli sviluppati per la simulazione dei consumi energetici in

ambito domestico.

il capitolo 4 analizza i consumi simulati con i modelli descritti nel capitolo precedente

per mezzo di parametri statistici.

il capitolo 5 descrive le soluzioni proposte per l’identificazione di profili di utenze nel

consumo energetico in ambito domestico e riporta i risultati ottenuti.

il capitolo 6 descrive le soluzioni proposte per la rivelazione di anomalie di consumo

energetico in ambito domestico e riporta i risultati ottenuti.

5

2 L ‘ENERGIA ELETTRICA

La società attuale è molto sensibile al tema dell’energia elettrica in quanto la sua disponibilità

ed il suo consumo costituiscono aspetti fondamentali per indicare il livello di sviluppo

economico ed industriale di un paese; è però anche di grande importanza il suo monitoraggio e

l’ottimizzazione dei consumi per ottenere un vero e proprio risparmio di energia, simbolo di

un’adeguata organizzazione energetica, che interessa sia l’utente finale, che pagherà una bolletta

meno cara, sia la comunità perché vuol dire ridurre il consumo di combustibili fossili e quindi

l’inquinamento globale.

2.1 Forme e fonti di energia La parola energia deriva dal tardo latino energīa, a sua volta dal greco energheia, parola usata

da Aristotele nel senso di azione efficace, composta da en, particella intensiva, ed ergon,

capacità di agire. Fu durante l'epoca del Rinascimento che, ispirandosi alla poesia aristotelica, il

termine fu associato all'idea di forza espressiva. Ma fu solo nel 1619 che Keplero usò il termine

nell'accezione moderna di energia fisica [12.], che indica un sistema o un corpo che compie

lavoro e per cui l’unità di misura è quella del lavoro (joule): 1 joule esprime l'energia usata (o il

lavoro effettuato) per esercitare una forza di un newton per una distanza di un metro.

Vi sono varie forme, o modi di manifestarsi, di energia in natura. Per esempio l’energia

meccanica per cui si intende la somma di energia cinetica, cioè quella che un corpo possiede in

virtù del suo movimento, e di energia potenziale, cioè quella che un corpo possiede in virtù della

sua posizione all'interno di un campo di forze conservative, attinenti allo stesso sistema. Oppure

l’energia chimica, che varia a causa della formazione o rottura di legami chimici di qualsiasi

tipo, immagazzinata dai combustibili fossili che poi sono bruciati producendo energia termica,

un’altra forma di energia posseduta da qualsiasi corpo che abbia una temperatura superiore allo

zero assoluto.

Nell’art.1 comma 3 della legge 10/91, che titola “Norme per l’attuazione del Piano energetico

nazionale in materia di uso razionale dell’energia, di risparmio energetico e di sviluppo delle

fonti rinnovabili” si classificano le fonti di energia nel seguente modo:

6

• fonti di energia rinnovabili il sole (che per esempio viene trasformato in energia

termica e fotovoltaica), il vento, l’energia idraulica, l’energia geotermica (prodotta dal

calore accumulato all’interno della terra), le maree (causate dall’attrazione lunare sulle

acque degli oceani), il moto ondoso e la trasformazione dei rifiuti organici ed

inorganici o di prodotti vegetali; hanno la peculiarità di non avere limiti temporali al

loro sfruttamento.

• fonti di energia assimilate a quelle rinnovabili la cogenerazione, intesa come

produzione combinata di energia elettrica e calore, se soddisfa la condizione tecnica

per l’assimilabilità definita nel CIP n.6/92; il calore di risulta, fumi di scarico ed altre

forme di energia recuperabile in processi ed impianti; gli scarti di lavorazione e/o di

processi; le fonti fossili prodotte esclusivamente da giacimenti minerari isolati.

• fonti di energia esauribili, definite anche fonti convenzionali, combustibili fossili

commerciali ed altri non rientranti nelle definizioni precedenti; sono denominati fossili

perché sono stati generati da materiale biologico di natura vegetale e/o animale che,

decomponendosi nel tempo, ha dato loro vita, come per esempio il carbone ed il

petrolio, risorse che prima o poi sono destinate ad esaurirsi.

Per l’energia elettrica, una forma di energia legata a forze e campi di origine elettrica e quindi

che coinvolge il movimento di cariche elettriche, si può fare un discorso a parte in quanto

perché, pur non essendo una forma primaria di energia, è generata da tutte le fonti energetiche in

quanto in essa vengono trasformate molte fonti di energia [13.]: combustibili fossili, nucleare,

idroelettrico, geotermico ed altre rinnovabili. “L’energia elettrica, cioè la forma di energia sotto

la cui azione si muovono cariche elettriche, non è disponibile direttamente in natura. Viene

ottenuta prevalentemente per conversione dell’energia potenziale (chimica o cinetica) di fonti

fossili o rinnovabili in energia meccanica, a sua volta trasformata in energia elettrica mediante

gruppi turbo-generativi. Si tratta dunque di una forma di energia “secondaria”, che ha però

l’enorme pregio di poter essere con facilità distribuita capillarmente, nonché trasformata in

altre forme di energia. Attualmente la maggior parte dell’energia elettrica utilizzata nel mondo

viene generata a partire da fonti primarie di origine fossile (petrolio, gas naturale, carbone)”

[2.].

2.2 Efficienza energetica “Conseguire la massima efficienza nella produzione, conversione, trasporto, distribuzione e

impiego dell’energia, per accrescere la sicurezza e ridurre al minimo i problemi dell’ambiente” è

7

uno degli obiettivi primari della Carta Europea dell’Energia adottata nel 1991 dai rappresentanti

dei governi degli Stati e dai rappresentanti della Comunità Europea. L'efficienza e il risparmio

energetico hanno un ruolo fondamentale nella lotta alla protezione dell’ambiente ed ai

cambiamenti climatici ed è questo il motivo per cui risulta necessario investire

significativamente, anche e soprattutto per l'educazione delle nuove generazioni e per la

costruzione di un futuro migliore. Il Bilancio Energetico Regionale (B.E.R.) è lo strumento che

consente di ottenere una visione globale del sistema energetico di una regione; esso svolge

un'importante funzione conoscitiva esprimendo, in un quadro riepilogativo, quanta e che tipo di

energia è stata consumata in un dato periodo di tempo, ad esempio un anno, e come essa è stata

prodotta, reperita sui mercati, trasformata e consumata all'interno della regione, offrendo

un'immagine immediata e sintetica del settore energetico dell'area considerata. All’aumento

costante della popolazione è legato l’aumento del fabbisogno energetico mondiale e per cercare

di contenere le emissioni in atmosfera di sostanze inquinanti e di gas ad effetto serra, si cerca di

emanare normative per i grandi impianti termoelettrici, promuovendo l’efficienza energetica e la

conservazione di energia nell’uso del calore, dell’elettricità e dei mezzi di trasporto, tramite

l’adozione di nuove tecnologie ad alto rendimento per la generazione di energia elettrica [11.].

Al fine di prevenire gravi ed irreversibili mutamenti climatici, nel giugno del 1992 è stata

stipulata e sottoscritta da 166 Paesi, tra cui l’Italia, la Dichiarazione di Rio per tentare di

contenere le emissioni di CO2 anche grazie alla riduzione dei consumi di carburante e

combustibili fossili tramite il miglioramento dell’efficienza nelle attività di produzione,

distribuzione e consumo dell’energia. Con i decreti ministeriali 24 aprile 2001, successivamente

sostituiti dai decreti ministeriali 20 luglio 2004, è stato introdotto nel nostro Paese il meccanismo

dei “titoli commercializzabili di efficienza energetica” (o “certificati bianchi”). Ai sensi

dell’articolo 7, comma 3, dei decreti ministeriali 20 luglio 2004, l'Autorità per l'energia elettrica

e il gas predispone e pubblica annualmente un rapporto sull'attività eseguita in attuazione dei

decreti stessi e sui progetti che sono stati realizzati nel loro ambito includendo eventuali proposte

sulle modalità di conseguimento degli obiettivi, di realizzazione ed esecuzione dei progetti per

gli anni successivi [10.].

Il protocollo di Kyoto, sottoscritto nella città giapponese di Kyoto l'11 dicembre 1997 da più

di 160 paesi ma entrato in vigore il 16 febbraio 2005 dopo la ratifica anche da parte della Russia,

è lo strumento più importante per combattere i cambiamenti climatici. Per l’ambiente è

necessario un ridimensionamento delle emissioni di gas serra, non solo per far fronte all’aumento

termico globale ma anche per offrire una migliore vivibilità alle città di tutto il mondo. Il trattato

riguarda il riscaldamento globale e, premesso che l'atmosfera terrestre contiene 3 milioni di

8

megatonnellate (Mt) di CO2, prevede che i paesi industrializzati riducano del 5% le proprie

emissioni di elementi inquinanti (biossido di carbonio ed altri cinque gas serra, ovvero metano,

ossido di diazoto, idrofluorocarburi, perfluorocarburi ed esafluoruro di zolfo) rispetto alle

emissioni registrate nel 1990, considerato come anno base, nel periodo 2008-2012. Il mondo

immette 6.000 Mt di CO2, di cui 3.000 dai paesi industrializzati e 3.000 da quelli in via di

sviluppo; per cui, con il protocollo di Kyoto, se ne dovrebbero immettere 5.850 anziché 6.000, su

un totale di 3 milioni. Ad oggi, gli obiettivi del Protocollo di Kyoto sono sempre più distanti per

l'Italia [16.]. Il nostro Paese prende voti scarsi nella lotta al surriscaldamento globale e, quel che

è peggio, la soglia della sufficienza si allontana di anno in anno. A dare un giudizio negativo

sulla performance italiana in quanto a misure per la riduzione dei gas serra è il rapporto

internazionale Climate change performance index del German Watch, che mette l'Italia al

44esimo posto nella classifica dei 57 Stati a maggiori emissioni di CO2, cioè quelli che

producono il 90% dei gas serra a livello mondiale [15.].

Efficienza energetica vuol dire risparmiare energia nei processi produttivi e negli usi finali e

sfruttare le fonti energetiche rinnovabili, migliorando la sicurezza energetica del Paese anche in

un'ottica di sostenibilità ambientale. E’ questo l’obiettivo del bando Efficienza energetica di

Industria 2015, nome sintetico del disegno di legge sulla nuova politica industriale varato dal

governo italiano il 22 settembre 2006 le cui previsioni sono state recepite dalla Legge

Finanziaria 2007, che mostra un’Italia che non si arrende alle difficoltà del momento, ma anzi

vuole utilizzare questa fase per creare nuove opportunità di sviluppo e di crescita, per far fare un

salto di qualità al nostro sistema produttivo in aree cruciali come quelle legate all’energia,

all’ambiente, alla lotta al cambiamento climatico. Lunedì 21 gennaio 2009 sono stati definiti i 30

progetti di ricerca e innovazione nel settore dell’Efficienza energetica ammessi ai 200 milioni di

euro di incentivi che coinvolgeranno 234 imprese e 160 enti di ricerca e riguarderanno la

bioenergia e la produzione di energia da rifiuti, il fotovoltaico, il solare termico e termodinamico,

l’eolico, gli elettrodomestici ad elevata efficienza energetica, i materiali per l’edilizia e la

bioarchitettura, le tecniche avanzate per l’illuminazione, motori industriali elettrici a basso

consumo. Iniziative di questo tipo sono strategiche per accrescere la competitività nazionale su

mercati in espansione come quelli dell’efficienza energetica e delle rinnovabili.

2.3 Il consumo di energia elettrica Secondo il Protocollo di Kyoto, L’Italia dovrebbe ridurre entro il 2010 le emissioni del 6,5%

rispetto ai valori registrati nel 1990 poiché ogni anno si consumano complessivamente circa 180

9

milioni di tonnellate equivalenti di petrolio (tep), cioè ciascun italiano, in termini energetici,

costa circa 10 litri di petrolio al giorno.

Fig.1: Emissioni di CO2 (milioni di tonnellate) [17.]

Dalla ricerca svolta dal WWF insieme al Politecnico di Milano emerge che per il superamento

delle barriere più ostiche nella penetrazione dell'efficienza energetica è necessario intervenire

anche nelle singole abitazioni. La stessa Eni ha lanciato una campagna nazionale per l’efficienza

energetica, dando consigli per ridurre gli sprechi ed individuando una serie di misure a costo

zero facilmente adottabili dalle famiglie italiane, sia in casa che durante il lavoro. I suggerimenti

riguardano le piccole azioni quotidiane (come usare le lampadine a basso consumo, non tenere

gli elettrodomestici in stand-by, usare le lavatrici a temperature basse e le lavastoviglie solo a

pieno carico), l’acquisto di elettrodomestici efficienti (come sostituire gli apparecchi vecchi, o

cambiare lo scaldabagno elettrico con uno a gas), la regolazione della temperatura nelle

abitazioni (d’inverso tenere in casa una temperatura di 20° C, d’estate ridurre l’uso del

condizionatore), l’utilizzo intelligente dell’autovettura (mantenere una velocità moderata in

autostrada ed un’andatura regolare in città, usare le marce alte, controllare la pressione dei

pneumatici almeno una volta al mese, evitare di riscaldare il motore a veicolo fermo).

Le possibilità di risparmiare energia, sono tante e spesso sono sotto gli occhi di tutti. Ridurre i

consumi irrazionali sin da oggi significa pensare al futuro. Il consumo casalingo di un solo

chilowattora (kWh), corrispondente a circa mezz’ora d’accensione di uno scaldabagno o di una

stufetta elettrici, richiede, nelle centrali dell’ENEL, la combustione di circa 250 g d’olio

combustibile (un quarto di chilo di petrolio!) e l’immissione in atmosfera di 750 g di anidride

carbonica. Ma di chilowattora, nelle famiglie, se ne consumiamo, in media, circa 7 al giorno,

10

bruciando quasi 2 kg di petrolio e scaricando 5 kg di CO2. Nel primo trimestre del 2008 la

domanda complessiva di energia è aumentata del 2,8% in termini tendenziali, avendo avuto

temperature mediamente più rigide rispetto al mite inverno registrato a inizio 2007 che hanno

influenzato pesantemente i consumi, in particolare di gas naturale.

Fig.2: Consumi di energia in fonti primarie (gennaio-marzo) [17.]

Gli interventi per un risparmio energetico in ambito domestico sono numerosi ed a volte è

sufficiente fare un po’di attenzione perché oltre a prevenire l’inquinamento globale evitando lo

spreco di energia, si può ottenere un vero e proprio vantaggio economico; sono sempre di più le

famiglie che si accorgono che, ad incidere sul bilancio non è solo il costo dell’affitto o del

mutuo, ma la spesa per il riscaldamento d’inverno ed il raffreddamento d’estate. Tutti gli edifici

dovrebbero rispettare la normativa sul risparmio energetico (legge 10/91 e DPR 412/93) e quella

sulla sicurezza (legge 46/90 – norme UNI-CIG) verificando ad esempio i limiti previsti per

l’isolamento delle pareti esterne, per le distanze dei camini da finestre, balconi, tetti, per il

rendimento degli impianti termici, le emissioni d’inquinanti, la termoregolazione degli ambienti.

Per ottenere però dei veri e propri risultati si deve esercitare un efficace lavoro di informazione

dei cittadini e formazione di tecnici, nonché una seria attività di monitoraggio e verifica degli

standard richiesti, a partire da semplici prescrizioni; prevedere la presenza di energy manager nei

condomini più grandi, ricostruire il ruolo dell'Amministratore di condominio, ed in modo

particolare dell'amministratore professionista, introducendo un meccanismo che premi i

miglioramenti nell'efficienza. Va spezzato il nesso tra la convenienza dei fornitori a vendere più

combustibile, l'indifferenza dell'amministrazione, la difficoltà di intervento dei condomini che

pagano la bolletta [9.]. E’ per questo che sta nascendo la figura del Certificatore Energetico, il

cui intervento è rivolto al risparmio per i lavori di ristrutturazione in senso energetico, che dovrà

11

preoccuparsi di rilasciare la documentazione per la produzione della certificazione energetica

degli edifici. Tale documentazione, in seguito alle detrazioni del 55% sul Reddito Irpef, per

cambiare gli infissi, installare doppi vetri, pannelli solari e caldaie ad alto rendimento, implica

l’inserimento degli edifici in una classificazione che premia gli immobili più efficienti

innalzando il loro valore sul mercato immobiliare: meno energia consuma la casa e più vale nel

caso la si voglia vendere oppure affittare.

2.4 Alcune soluzioni per tutelare il clima del pianeta Ridurre il consumo energetico per migliorare la qualità della vita è l’obiettivo comune.

Durante la conferenza internazionale sul clima, nel dicembre del 2008, “grandi della Terra” si

sono riuniti a Poznan ed il ministro dell'Ambiente polacco Maciej Nowicki ha presentato “la più

grande mostra di tecnologie per salvare il clima realizzata finora”, la cosiddetta “Disneyland del

cambiamento climatico” ed ha detto: “con questa mostra vogliamo avvicinare la gente a

tecnologie sostenibili che sono già alla portata di tutti. Far capire che non sono solo i grandi

decisori politici che devono impegnarsi con scelte per promuovere risparmio e efficienza

energetica, ma tutti, ciascuno secondo le proprie possibilità”. Sono stati presentati 120

installazioni che mostrano tutte le possibili soluzioni per risparmiare come per esempio: mp3

alimentati da zollette di zucchero attraverso la scissione del glucosio da parte di enzimi organici,

asse da stiro realizzato con un sottile strato di granito che consente di risparmiare il 50% di

energia, contenitori che trasformano l'umidità in acqua, scaldabagno solare a specchio concavo

che permette di riscaldare l’acqua senza utilizzare energia elettrica, pompa di calore in grado di

estrarre grandi quantità di acqua dall’aria funzionando come un mulino a vento, auto ad idrogeno

e generatori di biogas da prodotti di scarto [33.]. Un paesino arroccato sui monti del Cilento,

Torraca, è divenuto sede di un corso di laurea sul rapporto tra ambiente ed energia e si è

trasformato in un laboratorio per i progetti avanzati. E’ stato il primo paese al mondo a sostituire

le vecchie lampadine ad incandescenza di tutti i lampioni con i led, light emitting diode che

rappresentano la tecnologia più avanzata nel campo dell’illuminazione ad alta efficienza, per

fornire luce con meno emissioni serra, meno inquinamento luminoso e risparmiando anche sulla

bolletta; sta per costruire la più lunga monorotaia elettrica, un binario di 5,5 chilometri che

ridurrà al minimo l’impatto ambientale del trasporto sia dal punto di vista delle emissioni

inquinanti che da quello della realizzazione dell’opera; a breve inaugurerà a breve una fabbrica

per produrre pannelli fotovoltaici, che forniscono cioè energia pulita dal sole; ha la prima piscina

autosufficiente dal punto di vista energetico che utilizza i led per l’illuminazione, i pannelli

fotovoltaici per l’alimentazione elettrica, un impianto solare termico per scaldare l’acqua e un

12

telo isotermico per ridurre la dispersione termica [34.]. Sono molte le capitali europee e non solo

sempre alla ricerca di nuove soluzioni a basso impatto ambientale. Friburgo tenta di ridurre del

25% entro il 2010 la quantità di biossido di azoto immessa nell'atmosfera puntando molto sulla

bioenergia prodotta dal vento, dall'acqua e soprattutto dal sole, con pannelli fotovoltaici e a

biomassa. Sostenibilità ambientale e risparmio energetico sono presi molto sul serio in Svezia;

qui si ha infatti come obiettivo quello di diventare entro il 2020 il primo paese al mondo basato

su un sistema economico petrol free. Malmo, definita “città del futuro”, è un’altra eco city nota

per il suo quartiere Porto Ovest, che produce il 100% della propria energia da fonti rinnovabili e

alimenta i veicoli con biogas provenienti dai rifiuti urbani; sotto ciascun edificio è stata creata

una sorta di intercapedine ad acqua per mantenere il calore d’inverno e rinfrescare d’estate; i tetti

delle case sono coperti da manto erboso con funzione isolante e pannelli fotovoltaici. Un po’ più

a nord Stoccolma, altra città modello per l’alta qualità della vita, risponde con un immenso

giardino cittadino, l’Ecoparken. A Barcellona il Consiglio Comunale e l’Agenzia energetica

cittadina hanno stilato il “Plan de mejora energética de Barcelona”: si punta al 20% di emissioni

nocive in meno entro il 2010 e meno 4,2% di consumi energetici. A Los Angeles esiste una

stazione di servizio ecologica chiamata Helios House costituita da 1653 pannelli riciclabili di

acciaio inossidabile e 90 pannelli solari per produrre energia rinnovabile. Copenaghen è la prima

città ciclabile d’Europa: viene infatti utilizzata dal 36% degli abitanti, numero destinato in tempi

brevi ad incrementarsi fino al 50%. E l’Italia? Le statistiche evidenziano che il bel Paese

produce il 20% del totale energetico nazionale da fonte rinnovabile. Basta percorrere l'autostrada

A4 in prossimità di Brescia per vedere uno dei più grandi termovalorizzatori europei.

Fig.3: Termovalorizzatore di Brescia (vista dalla A4)

13

Imponente e colorato è simbolo di un impegno costante contro gli sprechi energetici e il

surriscaldamento terrestre.

2.5 La rivelazione di anomalie nei consumi di energia elettrica

Dalle considerazione fatte nei paragrafi precedenti si deduce l’importanza di avere un

consumo di energia elettrica razionale cercando di evitare inutili sprechi sia per limitare il

surriscaldamento globale sia per veri e proprio motivi economici. Uno studio americano ha

rivelato che in Canada ogni anno si hanno furti di energia elettrica per un costo di 500 milioni di

dollari causati principalmente da coltivazioni illecite di marijuana. In Italia si hanno molteplici

casi di furti e frodi di energia elettrica; sono stati arrestati nomadi che avevano allacciato

numerosi cavi di fortuna ad alcune centraline della società “Acea”, utilizzando illecitamente

l’energia elettrica per l’illuminazione dei campi abusivi. Dopo vari controlli a campione sulle

utenze di fornitura elettrica, sono state scoperte situazioni di illegalità, connesse a furti o frodi di

energia elettrica mediante allacci abusivi ai fili dell’illuminazione pubblica o modifiche del

sistema di lettura del contatore con interruttori nascosti che consentono di regolare il consumo di

energia elettrica. Il furto di energia, oltre ad essere dispendioso, è molto più grave e pericoloso di

quello che sembra, può causare incendi o scosse elettriche; i criminali sono molto furbi e le

tecniche usate a tal fine molto difficili da individuare.

Nel diritto penale italiano il furto è un reato previsto dall'art. 624 ai sensi del quale: “chiunque

si impossessa della cosa mobile altrui, sottraendola a chi la detiene, al fine di trarne profitto per

sé e per altri, è punito con la reclusione da sei mesi a tre anni e con la multa da euro 154 a 526.

Agli effetti della legge penale, si considera cosa mobile anche l'energia elettrica e ogni altra

energia che abbia un valore economico. (art. 624 comma 2 c.p.)”. Il reato di furto di energia

elettrica ha spedito in carcere molte persone che con allacciamenti abusivi alla rete dell'Enel o

mediante manomissioni dei contatori, tali da consentire l'alterazione della normale registrazione

dei consumi, garantivano in maniera gratuita ad abitazioni ed ai negozi la fornitura di energia

elettrica.

Da qui nasce l’esigenza di uno strumento che riconosca e rilevi situazioni di anomalie nei

sistemi elettrici che possono essere causate da malfunzionamenti o manomissioni dei contatori;

solo utilizzando apparecchiature specifiche si può identificare chi, quanto, e quando ha

contribuito a superare la potenza di energia elettrica standard appropriandosene illegalmente. Per

poter rivelare i vari casi di anomalie si inizia con la costruzione di un profilo utente

14

rappresentante il normale uso di energia elettrica per poi passare all’identificazione di deviazioni

da tale profilo come possibili situazioni anomale. Le anomalie in tale ambito sono infatti definite

come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica appartenenti

ad uno specifico profilo utente.

15

3 MODELLISTICA E SIMULAZIONE DEI

CONSUMI ENERGETICI NELL’AMBITO

DOMESTICO

3.1 Introduzione La prima fase di questo lavoro consiste nel generare un consumo energetico in ambito

domestico per diverse tipologie di famiglie. I modelli sviluppati per tale scopo consentono di

produrre vari grafici per rappresentare i livelli di consumo di energia elettrica e di analizzare i

dati monitorati in un determinato periodo. A tale scopo si è cercato di simulare il consumo di

energia elettrica per tre differenti esemplari di nuclei familiari composti da 2, 3 e 4 persone.

Utilizzando un misuratore di consumo elettrico, il quale applicato alla presa della corrente

calcola il consumo di ogni elettrodomestico presente in casa e con le bollette degli anni 2006 e

2007, è stato possibile avere dei dati veritieri riguardanti il consumo di corrente di una famiglia-

campione, composta da 3 persone.

Bimestre kWh/2006 euro/2006 kWh/2007 euro/2007

I° (½ dic - ½ feb) 502,00 80,76 573,00 107,88

II° (½ feb - ½ apr) 516,00 84,92 555,00 103,83

III° (½ apr - ½giu) 539,00 90,59 699,00 149,44

IV° (½ giu - ½ ago) 671,00 139,89 562,00 110,30

V° (½ ago - ½ ott) 592,00 112,73 608,00 118,54

VI° (½ ott - ½ dic) 519,00 98,04 599,00 116,61

Totali 3339,00 606,93 3596,00 706,60

Fig.4: Consumo energetico 2006/2007 in una famiglia-campione

Con l’aiuto di tabelle presenti in Internet [1.], è stato possibile risalire al consumo medio

annuo delle altre due tipologie di famiglie. Tale procedura è stata messa a punto riportando i

consumi stimati in un file di lavoro Excel per simulare il comportamento di diverse utenze

caratterizzanti alcune famiglie prese in esame. I dati ottenuti sono stati poi lavorati permettendo

16

così di individuare eventuali anomalie o malfunzionamenti allo scopo di ottimizzare l’utilizzo e

la gestione dei consumi.

3.2 Caratteristiche di consumo dei principali elettrodomestici

Ogni elettrodomestico conforme alle norme europee è dotato di un’etichetta indicante il

consumo diviso in classi che vanno dalla lettera A alla lettera G; quelli di classe A consumano

meno. Su ogni targhetta è riportata la tensione (220v per l’Italia) e la corrente assorbita indicata

in Ampere; per ottenere il consumo in watt (unità di misura della potenza), è sufficiente

moltiplicare i volt (unità di misura della tensione) per gli ampere (unità di misura della corrente),

per avere i kWh si divide ulteriormente per mille. Inoltre sono indicati i kWh/anno che

l’elettrodomestico consuma, stimati in base a prove di laboratorio standard.

Con l’invecchiamento di un elettrodomestico il consumo può aumentare e non rientrare più

negli standard; è però possibile utilizzare un misuratore di consumo elettrico che, inserito tra la

presa e la spina dell’oggetto che si desidera monitorare, permette di visualizzare informazioni

come: la potenza in ampere, il consumo di corrente elettrica in watt, i tempi di misurazione in

minuti e ore, i kWh del consumo complessivo di corrente durante il tempo misurato, la tariffa

locale precedentemente impostata per ogni kWh, i costi complessivi del consumo, la tensione

presente. L'energia richiesta da un apparecchio acceso 24 ore al giorno per 365 giorni l'anno ed il

costo necessario per tale energia si possono calcolare facilmente tramite la formula:

Nelle famiglie prese in considerazione, è stato ipotizzato l’uso di alcuni elettrodomestici e

calcolata una media di consumo per ognuno di essi. Si è preferito supporre l’utilizzo di un

microonde invece del forno tradizionale per semplicità di calcolo e per poterne prevedere un

impiego più frequente; il suo consumo è stato stabilito essere di 1000 watt. Come computer si è

ipotizzato un notebook il cui consumo dipende da diversi fattori come il disco fisso, il chip

17

grafico, il processore, e soprattutto dalle dimensioni del display, un pannello LCD

retroilluminato da lampade, che più è grande e più avrà lampade estese, che di conseguenza

consumeranno di più. Per sapere quanto consumano i componenti interni di un portatile è

sufficiente l’etichetta sull’alimentatore: in genere si va da un minimo di 12 volt a un massimo di

19 volt in uscita e da 3,5 a 7 ampere. E’ stata calcolata una media e stabilito un consumo pari a

65 watt, 18,5 volt e 3,5 ampere. I nuovi modelli di lavastoviglie consumano, per il ciclo più

lungo, tra 1,4 e 1,8 kWh rispetto ai 2,5 kWh delle lavastoviglie tradizionali. Infatti le nuove

tecnologie permettono di diminuire l’acqua per un ciclo di lavaggio, riducendo l’energia

necessaria per portarla alla giusta temperatura, dando la possibilità di effettuare cicli ridotti o

“rapidi” [4.]. La lavatrice, da sola, è responsabile di una quota cospicua dei consumi elettrici

delle nostre abitazioni; questo consumo è dovuto soprattutto al riscaldamento dell’acqua per il

lavaggio, mentre solo una piccola percentuale serve ad azionare il motore [4.]. I nuovi modelli di

lavatrici consumano tra i 1,5 e 2,1 kWh rispetto ai 2,8 kWh delle lavatrici tradizionali. Per la luce

sono state prese in considerazioni lampadine da 60 watt, e ipotizzata la presenza di una

lampadina in ogni stanza; quindi i consumi sono stati calcolati in base al numero di stanze

presenti in un appartamento. Lo scaldabagno (o boiler) è stato ipotizzato di circa 5 litri quindi di

piccole dimensioni. I consumi della televisione cambiano in base al modello: se è un LCD il

consumo è 100, se è un plasma consuma 150, se è a tubo catodico (CRT) 50 ed è quest’ultimo

quello preso in considerazione per la simulazione. Esistono diversi modelli di ferri da stiro, a

vapore e non, il cui consumo dipende dalla temperatura di funzionamento che nei modelli più

tecnologici può essere variata grazie ad un termostato e la potenza è generalmente compresa tra

700 e 1500 W. Il consumo dell’asciugacapelli e dell’aspirapolvere sono stati calcolati in base al

modello considerato: il primo è un Severin HH 6320, un phon con cuffia asciugacapelli, con 2

livelli di temperatura e colpo d’aria fredda, il secondo un IMETEC 8601, una scopa elettrica con

sacchetto, senza potenza variabile. Il consumo della radio è stato preso dalle tabelle trovate in

Internet [1.]. Il frigorifero per cui è stato preso in considerazione solo il consumo medio annuo,

essendo un apparecchio acceso tutto il giorno, è di tipo A+.

Elettrodomestico potenza ON

(watt)

Microonde 1000

PC 65

Lavastoviglie 1400

Lavatrice A 1500

Boiler 2000

Luce 60

18

TV CRT 50

Ferro da stiro 700

Asciugacapelli 400

Aspirapolvere 700

Radio 20

Fig.5: Consumo in watt degli elettrodomestici

3.3 Modelli per la simulazione di consumo elettrico Per determinare il consumo di energia elettrica in ambito domestico sono stati considerati due

diversi tipi di modelli. Entrambi si basano sulla stima di accensione degli elettrodomestici sopra

elencati in diversi momenti di una giornata tipo. Per avere un’analisi più dettagliata dei consumi,

è stato deciso di usare un intervallo di campionamento di 30 minuti, per un totale di 48 valori

nell’arco delle 24 ore. In questo modo si ottiene un grafico rappresentante l’andamento medio

giornaliero della richiesta di potenza nel tempo, dalle ore 0:00 alle 23:30, di tutti gli apparecchi

monitorati. Il consumo giornaliero espresso in kWh rappresenta il consumo registrato nell’arco

delle 24 ore prese in considerazione; il consumo giornaliero medio è la media dei consumi

giornalieri misurati nell’arco dell’anno.

I modelli costruiti sono:

⇒ semplice: prevede l’uso delle probabilità di accensione degli elettrodomestici,

indipendenti tra di loro;

⇒ di Markov: prevede l’uso dei processi di Markov ed ogni stato genera un evento con

una certa distribuzione di probabilità che dipende solo dallo stato di sistema

immediatamente precedente.

3.3.1 Tipologie di famiglie

Per poter generare un consumo di energia elettrica il più possibile simili alla realtà, sono state

prese in considerazione diverse tipologie di famiglie-campione tenendo presente i diversi stili di

vita e abitudini di ciascuna di esse. La rivelazione di anomalie è stata effettuata in due prove

distinte, che però hanno un denominatore comune: le tipologie di famiglie studiate. Infatti in

entrambi i casi, le famiglie-campione sono divise innanzitutto in base ai componenti delle stesse

che possono essere 2, 3 o 4 persone. La seconda prova fa però un’ulteriore distinzione all’interno

delle famiglie-campione, cioè per ognuna di esse crea due differenti profili con consumi simili

ma diverse abitudini giornaliere.

19

3.3.1.1 Prima prova

Nella prima prova sono state prese in considerazione le tre famiglie-campione di cui sopra

composte nel seguente modo:

1. due persone: un ragazzo ed una ragazza entrambi lavoratori, che vivono in un

appartamento con un bagno, una cucina, una camera ed una sala da pranzo.

2. tre persone: una madre casalinga, un padre impiegato ed un figlio studente.

L’appartamento ha 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una

sala da pranzo.

3. quattro persone: una madre casalinga, un padre impiegato e 2 figli studenti che vivono in

un appartamento con 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una

sala da pranzo.

3.3.1.2 Seconda prova

Per la seconda prova è stato necessario determinare due diversi profili per ciascun nucleo

familiare in base al loro stile di vita. La famiglia di 2 persone che vive in un appartamento con

un bagno, una cucina, una camera ed una sala da pranzo è stato differenziato in:

⇒ profilo 1: un lavoratore ed una casalinga;

⇒ profilo 2: due studenti in affitto.

La famiglia di 3 persone che vive in un appartamento di 2 bagni, una cucina, una camera, una

cameretta, un ingresso ed una sala da pranzo è stato differenziato in:

⇒ profilo 1: un lavoratore, una casalinga ed uno studente;

⇒ profilo 2: due studenti ed un lavoratore.

La famiglia di 4 persone che vive in un appartamento con 2 bagni, una cucina, una camera,

una cameretta, un ingresso ed una sala da pranzo è stato differenziato in:

⇒ profilo 1: un lavoratore, una casalinga e due studenti;

⇒ profilo 2: due studenti e due lavoratore.

3.3.2 Modello semplice

Il modello semplice è usato solo durante la prima prova per la rivelazione di anomalie e

consiste nel decidere le probabilità di accensione dei vari elettrodomestici presenti nelle tabelle

sopra, durante un qualsiasi giorno feriale di primavera, in cui il sole sorge alle 6 e tramonta

20

intorno alle 20. Sono state usate 48 mezze ore e 365 giorni. Le probabilità cambiano in base alla

famiglia presa in considerazione e allo stile di vita.

Consumi di una famiglia-campione di 2 persone

Le probabilità definite per la famiglia di due persone, composta da due ragazzi entrambi

lavoratori, sono state ipotizzate considerando al massimo 4 lampadine accese

contemporaneamente ma solo tra le 20:00 e le 22:30, momento della giornata in cui entrambi i

componenti si trovano a casa. Infatti si è pensato di far uscire i componenti della famiglia in orari

di ufficio. Tra le 8:00 e le 17:00 è stata data la massima probabilità (cioè 10) al caso in cui tutte

le lampadine siano spente perché a casa non si trova nessuno in quell’orario; la stessa cosa

accade durante la notte che si suppone un consumo quasi nullo. E’ stato considerata la presenza

di un solo notebook usato da entrambi, anche questo acceso prevalentemente nel tardo

pomeriggio e durante la sera; stessa ipotesi fatta anche per gli altri elettrodomestici come la

lavatrice, la lavastoviglie, il ferro, il microonde, il boiler e l’aspirapolvere. L’asciugacapelli si

pensa possa essere usato al mattina prima di uscire, o la sera una volta rientrati. Sono state

ipotizzate due televisioni CRT, una in camera da letto e l’altra nella sala da pranzo, usate

prevalentemente di sera.

Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono riportati

nella seguente tabella:

Elettrodomestico

consumo

annuo (kwh)

2 persone

kwh al

giorno

Microonde 400 1,10

PC 100 0,27

Lavastoviglie 350 0,96

Lavatrice A 200 0,55

Boiler 900 2,47

Luce 270 0,74

TV CRT 150 0,41

Ferro da stiro 80 0,22

Frigorifero A+ 303 0,83

Asciugacapelli 50 0,14

Aspirapolvere 80 0,22

Radio 10 0,03

totale kwh 2893 7,93

Fig.6: Tabella di consumo medio giornaliero e annuo 2 persone

21

La Fig.7: mostra il grafico del consumo medio giornaliero tipico per alcuni giornate (sinistra)

e per i 365 giorni dell’intero anno (destra) per una famiglia-campione di 2 persone:

Fig.7: Consumo medio 2 persone con modello semplice

Consumi di una famiglia-campione di 3 persone

La famiglia di tre persone, composta da madre casalinga, padre lavoratore e figlio studente, è

stata pensata in una casa di sei stanze con al massimo 6 lampadine accese contemporaneamente.

Si è ipotizzata l’uscita del padre e del figlio verso le 8:00, mentre quella della madre dalle 9:30

alle 11:30, con il rientro da scuola del ragazzo per l’ora di pranzo. Il notebook è usato

prevalentemente dal figlio durante il pomeriggio e dopo cena. Sono state considerate due

televisioni, accese durante il pranzo e durante la sera. L’uso di quasi tutti gli elettrodomestici è

stato ipotizzato nella mattinata o nel primo pomeriggio, ad esclusione del microonde usato sia a

pranzo che a cena e dello scaldabagno acceso durante la notte.

Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono riportati

nella seguente tabella:

Elettrodomestico

consumo

annuo (kwh)

3 persone

kwh al

giorno

Microonde 500 1,37

PC 120 0,33

Lavastoviglie 460 1,26

Lavatrice A 240 0,66

Boiler 1200 3,29

Luce 300 0,82

TV CRT 250 0,68

22

Ferro da stiro 120 0,33

Frigorifero A+ 303 0,83

Asciugacapelli 60 0,16

Aspirapolvere 100 0,27

Radio 15 0,04

totale kwh 3668 10,05

Fig.8: Tabella di consumo medio giornaliero e annuo 3 persone

La Fig.9: mostra il grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i

365 giorni dell’intero anno (destra) per una famiglia-campione di 3 persone:

Fig.9: Consumo medio 3 persone con modello semplice

Consumi di una famiglia-campione di 4 persone

La famiglia di quattro persone vive in un appartamento di sei stanze, ognuna dotata di una

lampadina da 60 watt, ed è composta da madre casalinga, padre impiegato e due figli che vanno

a scuola. Si è ipotizzato che i figli con il padre escano la mattina intorno alle 8:00 e la madre per

le 9:30 rientrando verso le 11:30. Quindi l’uso degli elettrodomestici è concentrato nella tarda

mattinata o nel primo pomeriggio. Il notebook è usato dai figli, quindi sarà acceso in un orario

successivo al loro rientro previsto per l’ora di pranzo. Le due televisioni sono usate in prevalenza

durante i pasti, e la sera così come la lavastoviglie ed il microonde. Lo scaldabagno viene acceso

sia durante la notte sia nel primo pomeriggio perché nel caso di quattro persone si consumerà più

acqua calda. Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono

riportati nella seguente tabella:

23

Elettrodomestico

consumo

annuo (Kwh)

4 persone

kwh al

giorno

Microonde 600 1,64

PC 140 0,38

Lavastoviglie 580 1,59

Lavatrice A 320 0,88

Boiler 1700 4,66

Luce 350 0,96

TV CRT x 2 300 0,82

Ferro da stiro 160 0,44

Frigorifero A+ 303 0,83

Asciugacapelli 80 0,22

Aspirapolvere 130 0,36

Radio 15 0,04

totale kwh 4678 12,82

Fig.10: Tabella di consumo medio giornaliero e annuo 4 persone

La Fig.11: mostra il grafico del consumo medio giornaliero tipico per alcuni giornate

(sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-campione di 4 persone:

Fig.11: Consumo medio 4 persone con modello semplice

3.3.3 Modello di Markov per i consumi domestici

Il modello di Markov è usato sia nella prima sia nella seconda prova per la rivelazione di

anomalie ed è un processo stocastico nel quale la probabilità di transizione che determina il

passaggio ad uno stato di sistema dipende unicamente dallo stato di sistema immediatamente

precedente e non dal come si è giunti a tale stato, né da tutto ciò che è successo nel passato;

24

questa è detta proprietà di Markov, o condizione di “assenza di memoria”. I processi stocastici

sono modelli matematici probabilistici utilizzati nella descrizione di fenomeni casuali

rappresentabili come funzioni di un parametro, che di solito ha il significato di tempo. Una

catena di Markov è un processo di Markov a stati discreti, ovvero è un processo stocastico

discreto per cui ad ogni istante t si estrae dal processo una variabile casuale discreta [5.].

Per questo modello i consumi relativi alla luce, al notebook e alla televisione sono stati

calcolati come nel modello semplice, utilizzando cioè una distribuzione di probabilità di

accensione; questa scelta è stata fatta perché se ne è ipotizzato un uso quotidiano. Il motivo per

cui è stato sviluppato un secondo modello con Markov, è che per rendere la simulazione di

consumo più realistica, è stato necessario considerare che in ambito domestico l’accensione di

alcuni elettrodomestici non avviene tutti i giorni ma solo alcune volte a settimana. Quindi per

questa tipologia di elettrodomestici, come il microonde, la lavastoviglie, la lavatrice, lo

scaldabagno, il ferro da stiro, l’aspirapolvere e il phon, sono stati usati i processi di Markov per

determinare i consumi delle famiglie, che modellano sistemi fisici che possono trovarsi ad ogni

istante in uno tra n possibili stati e possono modificare il loro stato solo agli istanti t1, t2,..... Con

questi processi è possibile determinare una distribuzione uniforme per decidere il momento della

giornata (mattino, pomeriggio, sera, notte) e il giorno della settimana in cui parte

l’elettrodomestico, in base alla probabilità di transizione tra uno stato e l’altro. E’ quindi

possibile simulare l’accensione degli apparecchi in maniera random. Infatti si è ragionato in

modo da non prevedere l’uso, per esempio, della lavatrice tutti i giorni e neanche il giorno

seguente a quello in cui è stata fatta. Questo per simulare al meglio la vita quotidiana. Infatti si

parte dal presupposto che se in una famiglia in media si fanno per esempio tre lavatrici a

settimana, se si fa il lunedì, sarà poco probabile che si rifaccia il martedì, mentre sarà un po’ più

probabile che sia fatta il mercoledì; è invece quasi sicuro, quindi molto probabile, che si accenda

la lavatrice il giovedì, e così via.

Lo stato iniziale è scelto a caso e viene poi moltiplicato per la matrice delle probabilità di

transizione. Gli elettrodomestici potrebbero essere utilizzati contemporaneamente e per questo si

è fissata una soglia di 3,0 kw come potenza contrattuale, oltre la quale “scatta” la corrente. Si

sono decisi per ogni nucleo familiare, il numero di stati della catena di Markov necessari, le

probabilità di transizione tra gli stati e le matrici di transizione i cui elementi rappresentano delle

probabilità di transizione tra diversi stati. Più precisamente pij è la probabilità condizionata che il

sistema si trovi “domani” nello stato j essendo “oggi” nello stato i. Tale matrice ha la proprietà

che la somma degli elementi di ogni riga deve essere pari a 1, in quanto se il sistema si trova in

uno stato, al passo successivo deve necessariamente evolvere in uno degli altri n-1 stati.

25

Una volta determinato il vettore 0 rappresentante la distribuzione iniziale di probabilità degli

n stati possibili e la matrice di transizione, siamo in grado di prevedere, in termini probabilistici,

l'evoluzione del sistema. Infatti, il vettore 1 è calcolato applicando la matrice di transizione al

vettore iniziale 0; la distribuzione di probabilità del sistema al passo 2 è calcolata applicando la

matrice al vettore 1 e così via fino all’istante di tempo desiderato. Il numero di stati della catena

di Markov dipende dall’uso settimanale dell’elettrodomestico, considerando che questo può

essere acceso di mattina, di pomeriggio o di sera. Lo stato iniziale, come già detto scelto a caso,

è quello in cui viene usato l’elettrodomestico; rappresenta quindi la mattina, il pomeriggio o la

sera di un giorno qualsiasi della settimana. Più ci si allontana dallo stato iniziale, più sarà alta la

probabilità di tornarvi e quindi di accendere di nuovo l’elettrodomestico.

3.3.3.1 Prima prova

Consumi di una famiglia-campione di 2 persone

Nella famiglia composta da un ragazzo e da una ragazza entrambi lavoratori, l’accensione di

quasi tutti gli elettrodomestici in un giorno feriale è stata ipotizzata dalle ore 17:00 in poi ad

esclusione della radio e dell’asciugacapelli usati al mattino prima delle 8:00 e dello scaldabagno

acceso prevalentemente durante la notte. L’uso settimanale di ciascun elettrodomestico è

riportato nella tabella seguente:

Elettrodomestico Impiego Num. stati

Lavatrice 2 volte a sett. 7

Aspirapolvere 3 volte a sett. 5

Asciugacapelli 2 volte a sett. 7

Ferro da stiro 2 volte a sett. 7

Microonde 4 volte a sett. 4

Lavastoviglie 3 volte a sett. 5

Scaldabagno 4 volte a sett. 4

Fig.12: Markov famiglia-campione 2 persone

I consumi giornalieri sono gli stessi riportati in Fig.6: , e il grafico del consumo giornaliero

tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-

campione di 2 persone risulta essere il seguente:

26

Fig.13: Consumo medio 2 persone con modello di Markov

Consumi di una famiglia-campione di 3 persone

Nella famiglia composta da 3 persone, essendo la mamma una casalinga, l’accensione degli

elettrodomestici in un giorno feriale è stata ipotizzata sia di mattina che di pomeriggio. La radio

e l’asciugacapelli sono usati al mattino prima delle 8:00; lo scaldabagno è acceso sia durante la

notte sia durante il pomeriggio. Il notebook viene usato nel pomeriggio dal figlio dopo l’ora di

pranzo. L’uso settimanale di ciascun elettrodomestico è riportato nella tabella seguente:

Elettrodomestico Impiego Num. stati

Lavatrice 3 volte a sett. 5

Aspirapolvere 4 volte a sett. 4

Asciugacapelli 3 volte a sett. 5

Ferro da stiro 3 volte a sett. 5

Microonde 5 volte a sett. 3

Lavastoviglie 4 volte a sett. 4

Scaldabagno 5 volte a sett. 3

Fig.14: Markov famiglia-campione 3 persone

I consumi giornalieri sono gli stessi riportati in Fig.8: , e il grafico del consumo giornaliero

tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-

campione di 3 persone risulta essere il seguente:

27

Fig.15: Consumo medio 3 persone con modello di Markov

Consumi di una famiglia-campione di 4 persone

Anche nella famiglia di 4 persone, la mamma è una casalinga e quindi l’accensione degli

elettrodomestici in un giorno feriale è stata ipotizzata sia di mattina che di pomeriggio. La radio

e l’asciugacapelli sono usati al mattino prima delle 8:00; la televisione usata soprattutto a pranzo

e a cena. Lo scaldabagno è acceso sia durante la notte sia durante il pomeriggio. Il notebook

viene usato nel pomeriggio e durante la sera dai figli. L’uso settimanale di ciascun

elettrodomestico è riportato nella tabella seguente:

Elettrodomestico Impiego Num. stati

Lavatrice 4 volte a sett. 4

Aspirapolvere 5 volte a sett. 3

Asciugacapelli 4 volte a sett. 4

Ferro da stiro 4 volte a sett. 4

Microonde 6 volte a sett. 2

Lavastoviglie 5 volte a sett. 3

Scaldabagno 6 volte a sett. 2

Fig.16: Markov famiglia-campione 4 persone

I consumi giornalieri sono gli stessi riportati in Fig.10: , e il grafico del consumo giornaliero

tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-

campione di 4 persone risulta essere il seguente:

28

Fig.17: Consumo medio 4 persone con modello di Markov

3.3.3.2 Seconda prova

Tenendo presente tutte le considerazioni fatte in precedenza per l’uso degli elettrodomestici in

ciascuna famiglia, nella seconda prova sono state distinti per ciascuna famiglia-campione due

profili utente ognuno con diversi tipi di componenti familiari e di conseguenza con differenti

abitudini nell’uso dell’energia elettrica. I due profili sono stati creati mantenendo valori di

consumi medi annui e giornalieri simili a quelli delle famiglie-campione a cui fanno riferimento

calcolati nella prima prova.

Consumi dei due profili di una famiglia-campione di 2 persone

I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il

profilo 1 di una famiglia-campione di 2 persone, composta da un lavoratore ed una casalinga,

sono riportati nella tabella seguente:

Elettrodomestico potenza

ON (watt)

consumo

annuo

(kwh)

profilo 1

Impiego kwh al

giorno

Microonde 1000 400 4 volte a sett. 1,10

PC 65 100 5 ore al dì 0,27

Lavastoviglie 1400 300 3 volte a sett. 0,82

Lavatrice A 1500 150 2 volte a sett. 0,41

Boiler 2000 800 4 volte a sett. 2,19

Luce 60 290 5 ore al dì 0,79

TV CRT x 2 50 170 5 ore al dì 0,47

Ferro da stiro 700 80 3 volte a sett. 0,22

Frigorifero A+ 303 continuo 0,83

29

Asciugacapelli 400 40 2 volte a sett. 0,11

Aspirapolvere 700 90 3 volte a sett. 0,25

Radio 20 13 1 volte al dì 0,04

totale kwh 2736 7,50

Fig.18: Profilo 1 famiglia-campione 2 persone

Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli

elettrodomestici per il profilo 1 di una famiglia-campione di 2 persone presenta il seguente

grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero

anno (destra):

Fig.19: Consumo medio profilo 1 per 2 persone

I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il

profilo 2 di una famiglia-campione di 2 persone, composta da due studenti in affitto, sono

riportati nella tabella seguente:

Elettrodomestico potenza

ON (watt)

consumo

annuo

(kwh)

profilo 2

Impiego kwh al

giorno

Microonde 1000 300 3 volte a sett. 0,82

PC 65 150 8 ore al dì 0,41

Lavastoviglie 1400 280 3 volte a sett. 0,77

Lavatrice A 1500 170 2 volte a sett. 0,47

Boiler 2000 1000 4 volte a sett. 2,74

Luce 60 310 5 ore al dì 0,85

TV CRT x 2 50 180 5 ore al dì 0,49

Ferro da stiro 700 50 2 volte a sett. 0,14

30

Frigorifero A+ 303 continuo 0,83

Asciugacapelli 400 50 2 volte a sett. 0,14

Aspirapolvere 700 50 2 volte a sett. 0,14

Radio 20 13 1 volte al dì 0,04

totale kwh 2856 7,82

Fig.20: Profilo 2 famiglia-campione 2 persone

Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli

elettrodomestici per il profilo 2 di una famiglia-campione di 2 persone presenta il seguente

grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero

anno (destra):

Fig.21: Consumo medio profilo 2 per 2 persone

Consumi dei due profili di una famiglia-campione di 3 persone

Lo stesso procedimento è stato eseguito per la famiglia-campione di 3 persone. I consumi

medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 1 di una

famiglia-campione di 3 persone, composta da un lavoratore, una casalinga ed uno studente, sono

riportati nella tabella seguente:

Elettrodomestico potenza

ON (watt)

consumo

annuo

(kwh)

profilo 1

Impiego kwh al

giorno

Microonde 1000 500 5 volte a sett. 1,37

PC 65 120 6 ore al dì 0,33

Lavastoviglie 1400 430 4 volte a sett. 1,18

31

Lavatrice A 1500 240 3 volte a sett. 0,66

Boiler 2000 1000 5 volte a sett. 2,74

Luce 60 350 7 ore al dì 0,96

TV CRT 50 220 6 ore al dì 0,60

Ferro da stiro 700 120 4 volte a sett. 0,33

Frigorifero A+ 303 continuo 0,83

Asciugacapelli 400 60 3 volte a sett. 0,16

Aspirapolvere 700 110 4 volte a sett. 0,30

Radio 20 15 2 volte al dì 0,04

totale kwh 3468 9,50

Fig.22: Profilo 1 famiglia-campione 3 persone

Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli

elettrodomestici per il profilo 1 di una famiglia-campione di 3 persone presenta il seguente

grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero

anno (destra):

Fig.23: Consumo medio profilo 1 per 3 persone

I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il

profilo 2 di una famiglia-campione di 3 persone, composta da due studenti ed un lavoratore, è

riportato nella tabella seguente:

Elettrodomestico potenza

ON (watt)

consumo

annuo

(kwh)

profilo 2

Impiego kwh al

giorno

Microonde 1000 400 4 volte a sett. 1,10

PC 65 130 6 ore e ½ al dì 0,36

32

Lavastoviglie 1400 440 4 volte a sett. 1,21

Lavatrice A 1500 280 3 volte a sett. 0,77

Boiler 2000 1200 5 volte a sett. 3,29

Luce 60 270 5 ore al dì 0,74

TV CRT 50 180 5 ore al dì 0,49

Ferro da stiro 700 100 3 volte a sett. 0,27

Frigorifero A+ 303 continuo 0,83

Asciugacapelli 400 40 2 volte a sett. 0,11

Aspirapolvere 700 70 3 volte a sett. 0,19

Radio 20 12 1 volte al dì 0,03

totale kwh 3425 9,38

Fig.24: Profilo 2 famiglia-campione 3 persone

Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli

elettrodomestici per il profilo 2 di una famiglia-campione di 3 persone presenta il seguente

grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero

anno (destra):

Fig.25: Consumo medio profilo 2 per 3 persone

Consumi dei due profili di una famiglia-campione di 4 persone

Anche la famiglia-campione di 4 persone è stata suddivisa in due differenti profili. I consumi

medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 1 di una

famiglia-campione di 4 persone, composta da un lavoratore, una casalinga e due studenti, sono

riportati nella tabella seguente:

33

Elettrodomestico potenza

ON (watt)

consumo

annuo

(kwh)

profilo 1

Impiego kwh al

giorno

Microonde 1000 600 6 volte a sett. 1,64

PC 65 140 7 ore al dì 0,38

Lavastoviglie 1400 500 5 volte a sett. 1,37

Lavatrice A 1500 290 4 volte a sett. 0,79

Boiler 2000 1500 6 volte a sett. 4,11

Luce 60 350 7 ore al dì 0,96

TV CRT 50 300 7 ore al dì 0,82

Ferro da stiro 700 160 5 volte a sett. 0,44

Frigorifero A+ 303 continuo 0,83

Asciugacapelli 400 80 4 volte a sett. 0,22

Aspirapolvere 700 130 5 volte a sett. 0,36

Radio 20 15 2 volte al dì 0,04

totale kwh 4368 11,97

Fig.26: Profilo 1 famiglia-campione 4 persone

Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli

elettrodomestici per il profilo 1 di una famiglia-campione di 4 persone presenta il seguente

grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero

anno (destra):

Fig.27: Consumo medio profilo 1 per 4 persone

I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il

profilo 2 di una famiglia-campione di 4 persone, composta da due studenti e due lavoratori, è

riportato nella tabella seguente:

34

Elettrodomestico potenza

ON (watt)

consumo

annuo

(kwh)

profilo 2

Impiego kwh al

giorno

Microonde 1000 500 5 volte a sett. 1,37

PC 65 120 6 ore al dì 0,33

Lavastoviglie 1400 580 6 volte a sett. 1,59

Lavatrice A 1500 320 4 volte a sett. 0,88

Boiler 2000 1700 6 volte a sett. 4,66

Luce 60 300 6 ore al dì 0,82

TV CRT 50 250 6 ore al dì 0,68

Ferro da stiro 700 140 5 volte a sett. 0,38

Frigorifero A+ 303 continuo 0,83

Asciugacapelli 400 80 4 volte a sett. 0,22

Aspirapolvere 700 110 4 volte a sett. 0,30

Radio 20 10 1 volte al dì 0,03

totale kwh 4413 12,09

Fig.28: Profilo 2 famiglia-campione 4 persone

Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli

elettrodomestici per il profilo 2 di una famiglia-campione di 4 persone presenta il seguente

grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero

anno (destra):

Fig.29: Consumo medio profilo 2 per 4 persone

35

4 ANALISI STATISTICA DEI CONSUMI

DOMESTICI

Il consumo annuale medio è da intendersi come una stima effettuata moltiplicando per 365

giorni il consumo giornaliero medio calcolato precedentemente. Una volta determinati i consumi

annuali delle tre nuclei familiari, sono state eseguite delle statistiche su singoli giorni per

determinare le medie e le varianze utili ai fini della rivelazione di anomalie.

E’ stato possibile rivelare le anomalie, alterando il consumo relativo ad alcuni giorni

dell’anno, o anche solo alla mattina o alla sera, e controllando che rispettassero i profili di

consumo determinati attraverso l’analisi. I casi da noi modificati sono stati correttamente rivelati.

4.1 Medie e varianze della curva di consumo Una volta ottenute le informazioni relative al consumo di energia elettrica in ambito

domestico, il primo passo per la rivelazione di anomalie è stato quello di cercare di misurarli e

controllarli eseguendo un’analisi dettagliata al fine di individuare chi, come, quanto e quando

consuma, e soprattutto di determinare delle soglie di medie e varianze oltre le quali si è deciso di

classificare un comportamento anomalo. Nello studio delle distribuzioni statistiche occupa un

posto di primo piano la determinazione della media e dello scarto quadratico medio non soltanto

perché questi valori consentono di approfondire il fenomeno in oggetto, ma anche perché sono

parametri utili nel confronto di distribuzioni diverse tra loro.

Si è quindi trovare la media aritmetica Xn dei consumi giornalieri, sommando giorno per

giorno il valore in ogni mezz’ora e dividendo il risultato per 365. Allo stesso modo, si è calcolata

la media dei consumi durante la mattina, il pomeriggio, la sera e la notte.

Xn = ∑i=1(xi / n)

I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico,

tuttavia hanno il limite di non darci alcuna informazione sulla distribuzione dei dati che invece è

possibile valutare mediante gli indici di variabilità come:

36

• il campo di variazione (o range) che si ottiene come differenza tra il valore massimo e

quello minimo riscontrati nel fenomeno che si sta osservando:

Campo variazione = xmax – xmin

• lo scarto semplice medio che rappresenta la media aritmetica degli scostamenti in

valore assoluto dei dati dal valore medio:

S.s.m. = (∑i=1| xi – Xn | ) / n

• la varianza che corrisponde alla somma dei quadrati degli scarti degli n valori aventi

la media aritmetica Xn divisa per il numero dei valori:

σ² = [∑i=1( xi – Xn)² ] / n

• lo scarto quadratico medio (o deviazione standard) che è la radice quadrata della

varianza e che permette di conoscere l’intervallo, centrato sulla media, attorno al quale

cade un determinato numero di osservazioni:

S.q.m = ²√{[∑i=1( xi – Xn)² ] / n}

Sia la varianza sia lo scarto quadratico medio tengono conto di tutti i dati della distribuzione e

più sono piccoli e più i dati sono concentrati intorno alla media; viceversa, più sono grandi più i

dati sono dispersi. Quando la deviazione standard non supera il 10-15% della media, le misure

possono considerarsi abbastanza omogenee; quanto più tale soglia viene superata, tanto

maggiore sarà lo squilibrio tra le osservazioni.

4.2 Statistiche di consumo

4.2.1 Giorni singoli

Attraverso la simulazione dei consumi di energia elettrica si ottiene una matrice composta da

365 righe, che rappresentano i giorni, e da 48 colonne, rappresentanti le mezze ore di una

giornata; questi valori sono riportati nei grafici del consumo tipico dell’intero anno per le

famiglie-campione di 2, 3 e 4 persone riportati in Fig.13: , Fig.15: , Fig.17: .

Una migliore rivelazione di anomalie si ottiene solo se si hanno dei dati coerenti tra loro e il

più dettagliati possibile. E’ stato per questo che, oltre all’analisi di un giorno intero composto da

24 ore, si è deciso di dividere le giornate in quattro parti, mattina (dalle 6:30 alle 12:00),

pomeriggio (dalle 12:30 alle 18:00), sera (dalle 18:30 alle 23:30) e notte (dalle 0:00 alle 6:00)

per poter rivelare situazioni anomale anche in determinati orari, calcolando per ognuna di queste

37

le medie, le varianze, i consumi massimi e minimi e gli indici di variabilità ottenendo i seguenti

risultati:

giorno mattina pomeriggio sera notte

media 7,0926 1,8876 1,2940 3,2176 0,6933

range 14,29 8,03 6,73 9,24 4,35

varianza 7,9253 3,6934 2,1523 4,9404 1,1410

s.q.m 2,8151 1,9218 1,4670 2,2227 1,0681

Fig.30: Statistiche giorni singoli per 2 persone

La tabella relativa al nucleo familiare di 2 persone, mostra un consumo medio maggiore

durante le ore della sera, pari quasi al doppio del consumo riscontrato in altre momenti della

giornata. Di notte il consumo è molto basso.

giorno mattina pomeriggio sera notte

media 8,9908 2,8144 2,1032 3,2434 0,8298

range 13,43 9,55 7,65 10,38 4,36

varianza 7,3791 4,7667 2,1032 5,5160 1,3840

s.q.m 2,7164 2,1832 1,4502 2,3486 1,1764

Fig.31: Statistiche giorni singoli per 3 persone

Anche la tabella relativa alla famiglia di 3 persone, mostra un consumo medio maggiore

durante le ore della sera, però molto più vicino a quelli riscontrati durante la mattina e il

pomeriggio.

giorno mattina pomeriggio sera notte

media 11,8880 4,5693 3,0781 2,9514 1,2892

range 15,43 10,30 8,08 11,28 4,46

varianza 7,1947 5,6466 3,1877 4,1017 2,3206

s.q.m 2,6822 2,3762 1,7854 2,0252 1,5233

Fig.32: Statistiche giorni singoli per 4 persone

La tabella per la famiglia di 4 persone, mostra invece un consumo medio maggiore durante le

ore della mattina, e uno piuttosto simile sia nel pomeriggio sia durante sera. I consumi durante la

notte sono maggiori degli altri due casi.

38

4.2.2 Giorni multipli

In alcuni casi può capitare che i consumi siano nella media, ma con valori alti che

raggiungono quasi sempre il limite imposto dalla varianza. Per evitare queste situazioni, sono

state eseguite delle analisi su giorni doppi, cioè partendo sempre dalla matrice di 365 righe e 48

colonne, si sono sommati i consumi relativi a due giornate contigue, ad esclusione del primo, che

poi sono stati divisi per due. Quindi per esempio, i consumi del giorno 3 saranno la somma dei

consumi del giorno 2 e del giorno 3, diviso due. Con i valori ottenuti si sono eseguiti gli stessi

calcoli descritti sopra. In questo modo si ottengono valori medi molto simili, ma gli indici di

variabilità risultano essere più piccoli e precisi.

4.2.2.1 Giorni doppi

giorno mattina pomeriggio sera notte

media 7,0927 1,8885 1,2959 3,2149 0,6933

range 9,01 5,53 4,88 7,85 4,08

varianza 2,7556 1,4147 0,9829 2,8039 0,5446

s.q.m 1,6600 1,1894 0,9914 1,6744 0,7379

Fig.33: Statistiche giorni doppi per 2 persone

giorno mattina pomeriggio sera notte

media 8,9945 2,8190 2,1029 3,2430 0,8297

range 9,85 7,19 5,49 7,57 3,24

varianza 3,052 2,0032 1,1476 2,6154 0,6696

s.q.m 1,7469 1,4153 1,0712 1,6172 0,8182

Fig.34: Statistiche giorni doppi per 3 persone

giorno mattina pomeriggio sera notte

media 11,8871 4,5682 3,0760 2,9536 1,2893

range 9,30 8,43 6,38 6,87 4,20

varianza 2,5477 2,4525 1,3377 2,1806 1,1028

s.q.m 1,5961 1,5660 1,1565 1,4766 1,0501

Fig.35: Statistiche giorni doppi per 4 persone

Dai risultati ottenuti si può notare come il consumo medio nelle varie parti della giornata sia

molto simile al caso precedente, giorno singolo, mentre ciò che cambia e che diminuisce

notevolmente sono il campo di variazione e la varianza. In questo modo, come detto

39

precedentemente, è possibile determinare molte più situazioni anomale perché diminuisce

l’intervallo entro cui mantenersi per rientrare nei consumi standard.

4.2.2.2 Giorni tripli

Lo stesso procedimento viene eseguito anche sommando i consumi relativi a tre giornate

consecutive, ad esclusione del primo e del secondo, per poi dividere il risultato per tre ottenendo

così misure ancora più piccole. Quindi per esempio, i consumi del giorno 4 saranno la somma

dei consumi del giorno 2, del giorno 3 e del giorno 4, diviso tre.

giorno mattina pomeriggio sera notte

media 7,0845 1,8881 1,2999 3,2066 0,6898

range 7,49 5,02 4,03 7,51 2,75

varianza 1,6888 0,9560 0,6113 2,1059 0,3629

s.q.m 1,2995 0,9777 0,7818 1,4511 0,6024

Fig.36: Statistiche giorni tripli per 2 persone

giorno mattina pomeriggio sera notte

media 8,9974 2,8213 2,1008 3,2457 0,8296

range 7,67 6,25 5,09 6,81 2,74

varianza 1,8118 1,2547 0,7896 1,7117 0,4305

s.q.m 1,3460 1,1201 0,8885 1,3083 0,6561

Fig.37: Statistiche giorni tripli per 3 persone

giorno mattina pomeriggio sera notte

media 11,8802 4,5571 3,0839 2,9500 1,2892

range 8,30 7,52 5,88 6,44 4,08

varianza 1,7611 1,6017 0,8473 1,4846 0,7514

s.q.m 1,3270 1,2655 0,9204 1,2184 0,8668

Fig.38: Statistiche giorni tripli per 4 persone

Anche da questi risultati si può notare che il consumo medio nelle varie parti della giornata è

molto simile ai due casi precedenti, giorno singolo e giorno doppio, mentre ciò che cambia e che

diminuisce ancora di più sono il campo di variazione e la varianza potendo ottenere risultati

molto più precisi.

40

4.3 Rivelazione di anomalie nei consumi basata sui parametri statistici

Dopo la simulazione dei consumi di energia elettrica di un ipotetico anno solare composta da

365 giorni e l’analisi dei dati ottenuti, per poter controllare in un modo piuttosto generale la

presenza di situazioni anomale, sono stati generati altri consumi ottenendo dati relativi per

esempio all’anno successivo. I consumi presenti in alcune giornate scelte a caso sono stati

modificati in modo da superare i limiti imposti dalle medie e varianze calcolate durante le

statistiche. Quindi qualsiasi tipo di comportamento che non rientra nei parametri stabiliti, viene

notificato come warning di situazione anomala o fuori media.

Le rivelazioni di anomalie sono state testate in tutti e tre i casi spiegati precedentemente, ed è

stato soprattutto notato che le situazioni di consumi sopra la media che rientrano però

nell’intervallo definito dalla varianza nel caso dei giorni singoli, e che quindi non dovrebbero

essere notificate, vengono segnalate come warning se confrontate con le soglie imposte dai

giorni doppi o tripli. Questo è stato lo scopo principale delle statistiche fatte su giorni multipli

perché si è pensato che un atteggiamento sopra la media, ma sempre sotto l’intervallo di

tolleranza, per un periodo piuttosto lungo potrebbe essere sintomo di comportamento anomalo e

quindi dovrebbe essere notificato e controllato.

41

5 IDENTIFICAZIONE PROFILI UTENTE

Una volta determinati i consumi propri di ciascun nucleo familiare, tutto ciò che risulta essere

fuori da certi standard è definito irregolare e rivelato come anomalia. Le anomalie infatti sono

definite come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica ed è

per questo che per identificarle è necessario conoscere il normale comportamento di una o più

famiglia-campione. Un’accurata identificazione e diagnosi delle anomalie dipende

principalmente dalla robustezza delle informazioni di cui si dispone e in secondo luogo dai

metodi utilizzati per isolare i segnali anomali all’interno dei consumi calcolati.

Una buona tecnica per rivelare le anomalie inizia con la costruzione di un profilo per il

“normale” uso di energia elettrica e poi evidenzia le deviazioni da tale profilo come possibili

situazioni anomale. Le prove svolte per l’identificazione di profili di utente sono due. La prima

consiste nel determinare i profili d’utenza propri per ciascuna delle tre tipologie di famiglie

descritte sopra, differenti per numero di componenti e per abitudini. La seconda prova consiste

nello stabilire due profili utente per ciascun nucleo familiare, sviluppando diversi stili di vita ed

usi degli elettrodomestici presenti in casa.

5.1 Strategie per l’identificazione di profili utente Con la simulazione del consumo energetico si possono raccogliere tutte le misurazioni

effettuate su una scala ad intervalli in una matrice di dati, composta da 365 righe, che

rappresentano i giorni, e da 48 colonne, rappresentanti le mezze ore di una giornata, il cui

termine generico Xij

fornisce la misurazione j-esima per l’unità i. Il lavoro di tesi svolto si

propone in un primo momento di ottenere delle sintesi per rappresentare le informazioni più

importanti contenute nella matrice dei dati. Le analisi riguardano soprattutto le relazioni esistenti

tra le unità di riga verificando la similarità, per variabili qualitative, e la distanza, per variabili

quantitative, e le relazioni esistenti tra le unità di colonna determinando la correlazione. Queste

informazioni permettono di confrontare i vari profili così da determinare quelli che non

appartengono all’insieme che vengono etichettati come anomalie.

42

Le tecniche usate per l’implementazione di un sistema che definisca dei profili d’utenza nel

consumo di energia elettrica in ambito domestico sono descritte di seguito.

5.1.1.1 Piecewice Constant Approximation

Una volta ottenuto il consumo totale, si cerca di identificare delle tipologie di consumi

elettrici proprie per ciascun nucleo familiare. Per fare questo per ogni famiglia si analizzano le

curve di consumo giornaliero e si approssimano con un profilo costante a tratti. L’n-esimo tratto

possiede una ampiezza An

ed una durata Tn

con n=1,2,...,N, dove N è il numero di tratti

individuati per quella giornata. Questo procedimento è chiamato Approssimazione Costante a

Tratti (Piecewise Constant Approximation); il termine “piecewise” è spesso usato in matematica,

ed applicato alle funzioni che possono essere “spezzate” in un numero finito di tratti così che

ognuno di questi soddisfi delle particolari proprietà. Questo tipo di approssimazione consiste nel

trovare una sequenza di stati, intesi come differenti “regioni” caratterizzate da un valore costante

che ne definisce una traiettoria media, che più probabilmente corrisponde alla curva data.

Come si può vedere dalla figura, la traiettoria media è diversa da regione in regione, ed ogni

volta che la curva presa in considerazione cambia la sua direzione, assume valori differenti. La

curva che ne risulterà avrà una “qualità” ridotta rispetto a quella originale e questo dipende dal

fatto che l’approssimazione farà si che un andamento simile, sia rappresentato sull’istogramma

con valori di ordinate quasi uguali, cioè quelli risultanti dalla media dei punti.

L’algoritmo sviluppato in questo ambito prende in input la curva di consumo di un utente

specifico trasformandola in un insieme finito di regioni di forma rettangolare, di base Ti e altezza

Ai. Questi due parametri indicano rispettivamente la durata in termini di minuti di un evento e la

rispettiva ampiezza in termini di kWh. La curva presa in considerazione risulta continua nel

tempo e può essere approssimata su un intervallo T dell’asse del tempo da una costante uguale al

43

valore medio sopra tale intervallo. L’andamento originale del consumo di energia giornaliero

risulta essere molto simile a quello ottenuto attraverso l’approssimazione se la grandezza degli

intervalli considerati è molto piccola. L’algoritmo prende in considerazione 48 mezze ore

relative ai 365 giorni presenti nella matrice dei consumi, uno per volta. Partendo dal primo

giorno, setta dei valori di consumo massimo e minimo con i dati della prima mezz’ora, calcola

l’intervallo ∆1 come differenza tra il massimo e il minimo, ed imposta un valore medio y

1 che

corrisponde all’ordinata del punto preso in considerazione, e cioè all’ampiezza A1 da cui partirà

la nuova curva approssimata. Passando alla mezz’ora successiva, calcola un nuovo valore

minimo se il nuovo consumo considerato è inferiore a quello precedentemente calcolato,

altrimenti mantiene quello vecchio; la stessa cosa viene fatta per il valore massimo. Calcola

quindi un nuovo intervallo ∆2; se questo intervallo è inferiore ad un ∆ massimo impostato

all’inizio, calcola la traiettoria media tra y1

e y2

e passa alla mezz’ora successiva. Lo stesso

procedimento è svolto per tutte le altre mezz’ore, ottenendo in questo modo una traiettoria

approssimata del consumo di energia elettrica. Nel caso in cui un intervallo ∆i calcolato per una

mezz’ora i risultasse maggiore di quello massimo, l’algoritmo delimita un rettangolo (o regione)

di ampiezza A pari alla yi-1

(del punto precedente) e di durata T pari alla x i-1

(del punto

precedente). In questo modo, ogni volta che avremo un consumo molto differente da quello

precedente avremo la creazione di un nuovo rettangolo con nuova ampiezza e durata.

Fig.39: Esempio di Approssimazione costante a tratti

Alla fine del processo, risulterà per ogni utente un profilo caratterizzato da diverse regioni

adiacenti ognuna con la sua durata e la sua ampiezza. Sulla base di queste informazioni, si

calcola l'istogramma bidimensionale relativo ad una curva di consumo giornaliero regolarizzato

come costante a tratti che viene poi usato per trovare affinità o differenze tra i vari profili definiti

per ogni nucleo familiare.

44

5.1.1.2 Distanza Euclidea

Data una coppia di unità statistiche, i e j, si desidera confrontare i rispettivi profili,

pervenendo a misure di distanza, dij, e similarità, c

ij. Dette misure dipendono dalla scala di

misurazione degli attributi [7.]

La distanza euclidea è la tipica distanza fra due punti che si potrebbe misurare con un

righello, che può essere ottenuta dall'applicazione ripetuta del teorema di Pitagora [6.]. Una

misura di distanza ),( yxd tra coppie di elementi dello spazio deve godere delle seguenti

proprietà:

),(),(),( 3)

),(),( 2)

0),( )1

yzdzxdyxd

xydyxd

yxd

+≤=≥

La 1) è detta proprietà della non negatività, la 2) della simmetria e la 3) della disuguaglianza

triangolare; è ovvio anche che d(x,x) = 0. Se una misura di distanza soddisfa tutte e quattro le

proprietà, si dice che lo spazio di riferimento è metrico. Il valore della distanza ottenuto durante

un confronto è pari a zero nel caso in cui ci sia uguaglianza totale tra due profili, mentre assume

un valore massimo nel caso di assenza di correlazione. E’ molto importante definire quale sia

spazio di cui si considerano i due punti e solitamente quando si parla di distanza euclidea ci si

riferisce al piano cartesiano nel quale si determina una distanza intesa come funzione che associa

a due punti P1 e P

2 un numero reale non negativo.

Indicando con ∆x la variazione orizzontale da P1 = (x

1, x

2) a P

2 = (y

1, y

2) e con ∆y quella

verticale per due punti in due dimensioni, la distanza è calcolata come:

d(P1, P

2) = ( (∆x)² + (∆y)² ) = ( (x

2 – x

1)² + (y

2 – y

1)² )

45

Nel caso di due punti monodimensionali, P1= (x

1) a P

1= (x

2), si calcola il valore assoluto

poiché di norma la distanza è un numero intero positivo:

d(P1, P

2) = | x

1– x

2 | = ²√ (x

1– x

2)²

L’algoritmo sviluppato per il confronto basato sulla distanza Euclidea porta alla creazione di

una matrice simmetrica NxN, dove N è il numero degli istogrammi da comparare, in cui i valori

sulla diagonale sono nulli, considerando in tal caso un confronto tra le stesse curve di consumo,

ed in cui il valore dij rappresenta la distanza tra la curva di indice riga i con la curva di indice

colonna j. Più è basso questo valore, e più sarà alta la possibilità che le due curve siano simili e

viceversa.

5.1.1.3 Auto- e Cross-Correlazioni

Anche la correlazione è usata per mettere a confronto delle informazioni, solitamente pattern

di segnali, e determinare una somiglianza non più nei valori come si è fatto con le medie, ma

nella forma dei dati. Per sapere se esiste un “legame” tra due caratteri quantitativi, e cioè se uno

di essi esercita un'influenza sull'altro, si utilizzano gli indici di correlazione, i quali danno anche

una misura di questo “legame” e valutano la correlazione totale presente nel set di dati in esame.

Se l’indice è per uguale a 1 si ha il massimo di correlazione diretta, cioè ai valori crescenti di una

variabile corrispondono valori pure crescenti dell'altra variabile; se l’indice è uguale a -1 si ha il

massimo di correlazione inversa, cioè ai valori crescenti di una variabile corrispondono valori

decrescenti dell'altra variabile; se l’indice è uguale a 0 non si ha correlazione. Dati x =

(x1,x

2,…,x

n) e y =(y

1,y

2,…,y

n) la loro correlazione non-normalizzata è data da:

C = ∑i=1∑j=1(xi yj)²

Lo sfasamento ∆ nello spazio fra due curve di consumo di energia elettrica permette di

traslare una di esse di un certo valore t in modo tale da renderle “sovrapposte” e quindi

immediatamente confrontabili. Per stimare ∆ è utile la funzione di cross-correlazione che

fornisce una misura della similitudine tra le due curve.

L’algoritmo sviluppato si occupa di determinare un valore t che rappresenta lo sfasamento da

applicare ad una delle due curve dell’istogramma per ottenere la massima sincronizzazione

possibile fra i due tratti da confrontare. Questo sfasamento che massimizza la funzione di cross-

46

correlazione è un indice sufficiente a determinare la sincronia delle due curve. Se infatti le due

curve sono perfettamente sincronizzate, lo sfasamento ottenuto sarebbe zero, al contrario

assumerebbe un valore prossimo al semiperiodo. [8.] Nel caso di N curve da confrontare, non

esiste una sola funzione di cross-correlazione ma un numero pari alle coppie possibili dei profili

considerati, ovvero N² (considerando anche l’auto-correlazione). Il calcolo dello sfasamento che

massimizza ognuna delle possibili funzioni di cross-correlazione porta alla creazione di una

matrice simmetrica NxN in cui il valore tij rappresenta lo sfasamento che rende massima la

funzione di cross-correlazione definita tra la curva di indice riga i con la curva di indice colonna

j. Ogni riga della matrice contiene gli sfasamenti che, applicati alle curve corrispondenti

(contraddistinti dall’indice colonna), permettono di ottenere la massima sincronia possibile. I

vettori riga si differenziano fra loro per la scelta della curva di consumo usata come riferimento

nel calcolo delle funzioni di cross-correlazione. Quindi dall’analisi dei vettori riga è possibile

capire quale profilo utente sia più “vicino” agli altri, dove per “vicino” s’intende che gli

sfasamenti trovati sono i più bassi. [8.]

5.1.1.4 Auto- e Cross-Correlazioni Normalizzate

Il valore tj della matrice simmetrica NxN calcolata nello step precedente, rappresenta lo

sfasamento di posizione j-esima del vettore riga scelto, mentre I è il numero dei punti che

costituiscono la curva di consumo presa in considerazione; quindi il rapporto tj/I è la versione

normalizzata dello sfasamento. Dati x = (x1,x

2,…,x

n) e y =(y

1,y

2,…,y

n) la loro correlazione

normalizzata è data da:

C = [∑i=1∑j=1(xi yj)²] / [∑i=1∑j=1 (xij )²] [∑i=1∑j=1 (yij )²]

La correlazione normalizzata si è dimostrata la forma di confronto più significativa

applicabile al lavoro di tesi svolto. L’algoritmo sviluppato crea, come già detto una matrice

simmetrica NxN con i valori sulla diagonale pari a 1, considerando in tal caso un confronto tra

due curve dello stesso istogramma. Le misure che appariranno nelle altre posizioni avranno un

valore inferiore ad 1 e più saranno “vicini” all’uno e maggiore sarà la possibilità che la curva di

consumo con indice riga i sia uguale alla curva di consumo con indice colonna j.

Una volta ottenuti tutti i valori per cui si ha o non si ha una correlazione, si determina una

soglia per stabilire eventuali comportamenti anomali. Se infatti per esempio la correlazione

normalizzata di una curva di consumo X per una famiglia-campione di 2 persone con la curva

47

calcolata per il profilo di una famiglia-campione di 2 persone è superiore a tale soglia, allora si

potrà identificare tale curva X come un caso di anomalia di consumo di energia elettrica in un

nucleo familiare di 2 persone.

5.2 Applicazione della metodologia sviluppata

5.2.1 Prima prova: famiglia-campione senza profili

Prendendo in considerazione i consumi calcolati nella fase precedente, risultanti dalla

simulazione dell’uso di elettrodomestici nelle famiglie di 2, 3 e 4 persone, è stata eseguita una

prima prova con l’applicazione degli algoritmi specificati in precedenza, finalizzati alla

rivelazione di anomalie nell’uso di energia elettrica in ambito domestico. I consumi considerati

per ogni nucleo familiare sono quelli ottenuti durante la simulazione riportata nel paragrafo

3.3.3.1. Di seguito sono riportati i grafici ottenuti applicando l’algoritmo di Piecewise Constant

Approximation alla curva dei consumi di ciascun nucleo familiare ricavata durante la fase di

simulazione e quello per la creazione dell’istogramma bidimensionale relativo ad una curva di

consumo giornaliero regolarizzato come costante a tratti.

Il grafico di Fig.40: rappresenta l’approssimazione a tratti del consumo giornaliero tipico per

alcuni giornate (sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante

ai fini dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno

regolarizzato come costante a tratti (destra) per una famiglia-campione di 2 persone:

Fig.40: Approssimazione a tratti e istogramma 2 persone

Gli algoritmi spiegati sopra sono stati applicati anche ai dati relativi al consumo di energia

elettrica di una famiglia-campione di 3 persone. I risultati ottenuti sono riportati nel grafico di

48

Fig.41: che rappresenta l’approssimazione a tratti del consumo giornaliero tipico per alcuni

giornate (sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante ai fini

dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno regolarizzato

come costante a tratti (destra) per tale famiglia-campione.

Fig.41: Approssimazione a tratti e istogramma 3 persone

Lo stesso procedimento è stato eseguito per i dati relativi al consumo di energia elettrica di

una famiglia-campione di 4 persone. I risultati ottenuti sono riportati nel grafico di Fig.42: che

rappresenta l’approssimazione a tratti del consumo giornaliero tipico per alcuni giornate

(sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante ai fini

dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno regolarizzato

come costante a tratti (destra) per tale famiglia-campione.

Fig.42: Approssimazione a tratti e istogramma 4 persone

49

I consumi annuali delle tre famiglie sono stati poi confrontati tra loro per determinare

somiglianze e differenze allo scopo di rivelare anomalie nell’impiego della corrente elettrica.

Come già detto, l’algoritmo sviluppato per la determinazione della correlazione normalizzata

crea una matrice simmetrica NxN con i valori sulla diagonale pari a 1 e quelli nelle altre

posizioni minori di 1. Più questi valori saranno “vicini” all’uno e maggiore sarà la possibilità che

il profilo di consumo con indice riga i sia uguale a quello con indice colonna j e viceversa. La

matrice di visibilità ottenuta è la seguente:

2 persone 3 persone 4 persone

2 persone 1 0,9671 0,8384

3 persone 0,9671 1 0,8624

4 persone 0,8384 0,8624 1

Fig.43: Correlazione normalizzata prima prova

Si può notare come le tre tipologie di famiglie-campione abbiano dei consumi di energia

elettrica abbastanza differenti tra loro sia in termini numerici, considerando i kWh consumati in

media durante l’anno di 365 giorni, sia in termini di forma della curva riportata nell’istogramma.

5.2.2 Seconda prova: famiglia-campione con profili

Per la seconda prova sono state apportate delle modifiche alle probabilità di accensione degli

elettrodomestici determinando per ciascun nucleo familiare due diversi profili, stimando

differenti stili di vita ed abitudini da quelli determinati per le famiglie-campione della prima

prova mantenendo però simili i valori medi propri di ciascuna tipologia di famiglia.

Famiglia Profilo 1 Profilo 2

2 persone 1 lavoratore, 1 casalinga 2 studenti in affitto

3 persone 1 lavoratore, 1 casalinga, 1 studente 2 studenti, 1 lavoratore

4 persone 1 lavoratore, 1 casalinga, 2 studenti 2 studenti, 2 lavoratori

Fig.44: Profili diversi per ogni famiglia-campione

I consumi considerati per ogni nucleo familiare sono quelli ottenuti durante la simulazione

riportata nel paragrafo 00. Sono stati eseguiti gli algoritmi di Piecewice Constant Approximation

per ciascun profilo appartenente alle famiglie-campione e sono stati calcolati i sei istogrammi

bidimensionali relativi alle curve di consumo giornaliero regolarizzate come costante a tratti.

50

Un’altra grande differenza di questa seconda prova è che, per eseguire un confronto tra i

diversi profili, oltre a calcolare le auto- e le cross-correlazioni, le distanze euclidee e le auto- e le

cross-correlazioni normalizzate degli istogrammi bidimensionali, si utilizza anche la media

dell’istogramma, cioè la media dei consumi della casa, calcolata in base all'istogramma tramite

una formula in cui i valori dell'istogramma sono pesati con le ampiezze e le durate cui si

riferiscono. Questo perché un semplice confronto eseguito solo sulla forma delle curve di

consumo, per esempio tramite la correlazione normalizzata, non è sufficiente ad ottenere dei

parametri di somiglianza tra i profili. Infatti, soprattutto nei casi in cui i due profili utente

appartengono alla stessa famiglia-campione, per esempio il profilo 1 e il profilo 2 della famiglia-

campione di 4 persone, i valori su cui eseguire la correlazione o calcolare le distanze risultano

differire di poco, avendo creato i due profili con un consumo totale annuo quasi uguale.

E’ per questo motivo che per identificare correttamente i consumi appartenenti a determinati

nuclei familiari e rivelare eventuali situazioni anomale, è stato necessario confrontare gli

istogrammi di profilo utente sia attraverso la correlazione normalizzata, per avere una

somiglianza nella forma della curva di consumo, sia attraverso il calcolo della media

dell’istogramma, per ottenere una somiglianza anche sui valori. L’identificazione avverrà solo

se tutte e due queste metodologie di confronto saranno verificate.

Come nella prima prova, a fronte di qualsiasi profilo utente X, con un certo consumo di

energia elettrica, si ha la possibilità di identificare la tipologia di famiglia a cui appartiene, ed in

più si è in grado di stabilire a quale dei due profili utente, caratterizzanti il nucleo familiare

individuato tramite il test, fa riferimento.

Le medie dell’istogramma dei sei profili utente, cioè le medie dei consumi della casa,

calcolate in base all'istogramma tramite i valori pesati con le ampiezze e le durate cui si

riferiscono sono le seguenti:

2p profilo1 2p profilo2 3p profilo1 3p profilo2 4p profilo1 4p profilo2

7,7027 8,8103 8,8836 8,5445 10,4390 11,4027

Fig.45: Medie degli istogrammi sul consumo giornaliero

La matrice simmetrica NxN ottenuta calcolando la correlazione normalizzata tra tutti e sei i

profili utente è la seguente:

2p profilo1 2p profilo2 3p profilo1 3p profilo2 4p profilo1 4p profilo2

2p profilo1 1 0,6480 0,9143 0,4715 0,5946 0,7024

51

2p profilo2 0,6480 1 0,7827 0,7457 0,7357 0,7937

3p profilo1 0,9143 0,7827 1 0,6780 0,8225 0,8732

3p profilo2 0,4715 0,7457 0,6780 1 0,7579 0,8253

4p profilo1 0,5946 0,7357 0,8225 0,7579 1 0,8759

4p profilo2 0,7024 0,7937 0,8732 0,8253 0,8759 1

Fig.46: Correlazioni normalizzate seconda prova

Si può notare come le medie calcolate e le curve relative ai consumi siano abbastanza

differenti tra le tre tipologie di famiglie-campione, nonostante i due profili utente per ciascuna

famiglia-campione siano stati creati con consumi totali annui di energia elettrica abbastanza

simili.

5.3 La soluzione proposta

5.3.1 Matlab

Lo sviluppo del software per la rivelazione di anomalie nel consumo energetico in ambito

domestico è stato effettuato usando Matlab, che offre un ambiente di sviluppo idoneo alla

simulazione di scenari utili al raggiungimento dell’obiettivo di questo lavoro di tesi. MATLAB

(abbreviazione di MATrix LABoratory) è un linguaggio di programmazione scritto in C dalla

The MathWorks, ossia un insieme di strumenti (come ad esempio l’editor o il debugger)

necessari per lo sviluppo di sistemi software in un linguaggio di programmazione ad alto livello.

MATLAB è uno dei programmi scientifici di maggior diffusione, grazie alle sue numerose

applicazioni in campi quali l'elettronica, la controllistica, l'analisi dei segnali, l'elaborazione di

immagini, la chimica, la statistica e numerosi altri. Viene utilizzato in molti corsi universitari e di

ingegneria, e sono ormai numerose le pubblicazioni scientifiche che utilizzano l'ambiente di

Matlab quale sostegno matematico della teoria.

E’ molto usato in ambito ingegneristico mondiale come strumento per la simulazione di

sistemi lineari e non lineari e, più in generale, per l’analisi numerica., lo sviluppo delle

applicazioni e la conversione automatica di programmi MATLAB nei codici C e C++. Consente

l’uso di matrici, visualizzazione di funzioni e dati, implementa algoritmi, consente la creazione

di interfacce utente (le cosiddette GUI=Graphical User Interface), e funziona su diversi sistemi

operativi, tra cui Windows, Mac OS, Linux e Unix. I Toolboxes forniti direttamente dal

produttore MathWorks permettono l’analisi dei dati, l’esplorazione e la visualizzazione,

l’elaborazione numerica e simbolica, la grafica scientifica ed ingegneristica, la modellizzazione,

la simulazione, la programmazione.

52

I Toolbox sono collezioni complete di funzioni (o routine) MATLAB (dette M-files)

orientate alla soluzione di problemi relativi ad uno specifico settore di ricerca matematico oppure

ad uno specifico settore applicativo e ogni utente può mettere a punto un set di programmi, un

toolbox, relativo ad uno specifico campo di applicazione e inglobarlo nel corpo dei comandi

attivi. MATLAB è un sistema interattivo in cui l’unità base dei dati è una matrice o array per cui

non è richiesto dimensionamento; non esistono dichiarazioni di tipi o di dimensioni, alloca

direttamente la memoria necessaria ogni volta che si dichiara o si modifica una variabile. In

questo modo consente di risparmiare tempo nel risolvere problemi tecnici evitando di dichiarare

ad esempio, matrici e vettori come è solito fare in un linguaggio non interattivo, come C o

Fortran.

MATLAB è un ambiente di programmazione interpretato e non compilato; ciò significa che

un programma MATLAB viene eseguito senza premettere la fase della compilazione

semplificando lo sviluppo dei programmi e permettendo di mettere a punto le funzioni man

mano che occorrono e possono essere rapidamente e semplicemente provate e corrette.

I comandi possono essere digitati direttamente sulla linea di comando o letti da file testo; la

“command window” dà accesso diretto all’interprete (scrittura diretta dei comandi):

Fig.47: Interfaccia Matlab

La caratteristica più importante di MATLAB è la sua semplice estensibilità che dà la

possibilità a tutti di contribuire come autori di MATLAB, creando le proprie applicazioni; sono

infatti molti gli scienziati, matematici e ingegneri che hanno sviluppato nuove ed interessanti

53

applicazioni, tutte senza la necessità di scrivere neppure una linea di Fortran o di altri codici a

basso livello. Avendo funzioni scritte nella maggior parte dei casi come file testo, la portabilità

da un sistema all'altro di funzioni specifiche scritte dall'utente è garantita praticamente al 100%.

5.3.2 Identificazione profili utente

Una volta stabiliti i criteri per la misura del grado di similarità/diversità, è possibile sviluppare

molteplici algoritmi per la classificazione dei casi. Per variabili di tipo quantitativo si calcolano

misure di distanza. Per variabili di tipo qualitativo si calcolano misure di similarità. Utilizzando

le tecniche di confronto spiegate in precedenza, è stato possibile ottenere dei valori di soglia per

ciascun profilo in modo da determinare un match positivo o negativo tra i profili che si desidera

analizzare e quelli campione.

Per identificare un profilo utente è necessario, nella prima prova, che il profilo da individuare

abbia una correlazione superiore alla soglia determinata e, nella seconda prova, abbia anche una

media dell’istogramma che rientri nei parametri calcolati. Questo permette di avere una

somiglianza nei valori e nella forma dei consumi di energia elettrica per poter riconoscere senza

equivoci un profilo utente X qualsiasi in uno di quelli campione individuati con la simulazione.

Nel caso in cui non c’è identificazione, e quindi il profilo X non rientri in nessuno dei casi,

allora si rivelerà un’anomalia.

5.4 Risultati

5.4.1.1 Prima prova

Identificazione di profili utente totali

Questa prima prova consiste nel cercare di identificare un qualsiasi profilo utente, diverso da

quelli delle famiglie-campione, attraverso i valori di correlazione ottenuti durante il confronto tra

i profili. Il seguente schema mostra come il profilo X è stato identificato in una famiglia-

campione di 2 persone, avendo una correlazione maggiore rispetto alle altre:

Profilo X 2p 3p 4p

Profilo X 1 0,9826 0,8632 0,8766

2p 0,9826 1 0,9671 0,8384

3p 0,8632 0,9671 1 0,8624

4p 0,8766 0,8384 0,8624 1

Fig.48: Identificazione profilo totale 2 persone

54

Il caso successivo, invece mostra come il profilo Y è stato identificato nella tipologia di

consumo appartenente alla famiglia-campione di 3 persone:

Profilo Y 2p 3p 4p

Profilo Y 1 0,9605 0,9745 0,8951

2p 0,9605 1 0,9671 0,8384

3p 0,9745 0,9671 1 0,8624

4p 0,8951 0,8384 0,8624 1

Fig.49: Identificazione profilo totale 3 persone

Il profilo Z è stato invece identificato nella tipologia di consumo di energia elettrica propria

della famiglia-campione di 4 persone:

Profilo Z 2p 3p 4p

Profilo Z 1 0,9047 0,9400 0,9628

2p 0,9047 1 0,9671 0,8384

3p 0,9400 0,9671 1 0,8624

4p 0,9628 0,8384 0,8624 1

Fig.50: Identificazione profilo totale 4 persone

Sono stati quindi definiti dei valori soglia per ciascuna tipologia di famiglia-campione al di

sotto dei quali non vi è identificazione, e quindi probabile anomalia. In questo modo, un profilo

qualunque apparterrà al nucleo familiare composto da 2 persone se e solo se la correlazione tra

questo profilo e quello della famiglia-campione di 2 persone è maggiore o uguale a 0,9826; potrà

appartenere al nucleo composto da 3 persone se e solo se la correlazione tra questo profilo e

quello della famiglia-campione di 3 persone è maggiore o uguale a 0,9745; invece potrà essere

identificato come un nucleo di 4 persone se e solo se la correlazione tra questo profilo e quello

della famiglia-campione di 4 persone è maggiore o uguale a 0,9628.

Identificazione di profili parziali

Tramite l’algoritmo di simulazione di consumo energetico, sono stati creati degli istogrammi

bidimensionali, relativi alle curve di consumo giornaliero regolarizzate come costante a tratti, di

soli dieci giorni a caso tra i 365 dell’intero anno calcolati in 3.3.3.1; questo procedimento è stato

eseguito per tutte e tre le tipologie di famiglie-campione. Successivamente ogni istogramma

rappresentante i dieci giorni è stato confrontato con quello che riproduce la situazione dell’intero

anno. In questo modo sono stati ottenuti ulteriori soglie per ciascun profilo in modo da

55

determinare un match positivo o negativo anche nel caso di confronti su periodo di tempo

limitati. La seguente tabella mostra come 10 giorni random di un profilo X sono stati identificati

come appartenenti al profilo di consumo di una famiglia-campione di 2 persone, avendo una

correlazione maggiore rispetto alle altre:

10 gg di X 2p 3p 4p

10 gg di X 1 0,8919 0,6879 0,6902

2p 0,8919 1 0,9671 0,8384

3p 0,6879 0,9671 1 0,8624

4p 0,6902 0,8384 0,8624 1

Fig.51: Identificazione profilo parziale 2 persone

La tabella successiva, invece mostra come 10 giorni random di un profilo Y sono stati

identificati nella tipologia di consumo appartenente alla famiglia-campione di 3 persone:

10 gg di Y 2p 3p 4p

10 gg di Y 1 0,6736 0,8531 0,8441

2p 0,6736 1 0,9671 0,8384

3p 0,8531 0,9671 1 0,8624

4p 0,8441 0,8384 0,8624 1

Fig.52: Identificazione profilo parziale 3 persone

Di seguito è mostrato come anche 10 giorni random di un profilo Z sono stati invece

identificati nella tipologia di consumo di energia elettrica propria della famiglia-campione di 4

persone:

10 gg di Z 2p 3p 4p

10 gg di Z 1 0,6615 0,7918 0,9286

2p 0,6615 1 0,9671 0,8384

3p 0,7918 0,9671 1 0,8624

4p 0,9286 0,8384 0,8624 1

Fig.53: Identificazione profilo parziale 4 persone

Sono stati quindi definiti dei valori soglia anche per l’identificazione di un periodo più breve

rispetto ai 365 giorni dell’intero anno al di sotto dei quali non vi è identificazione, e quindi

probabile anomalia. Scegliendo un periodo random di 10 giorni da un qualsiasi profilo, questo

56

sarà identificato appartenente al nucleo familiare composto da 2 persone se e solo se la loro

correlazione è maggiore o uguale a 0,8919; potrà appartenere al nucleo composto da 3 persone se

e solo se la correlazione tra questo profilo e quello della famiglia-campione di 3 persone è

maggiore o uguale a 0,8531; invece sarà identificato come un nucleo di 4 persone se e solo se la

loro correlazione è maggiore o uguale a 0,9286.

5.4.1.2 Seconda prova

Per la secondo prova è prevista una identificazione di un qualsiasi profilo utente, diverso da

quelli delle famiglie-campione determinati durante la fase di simulazione, attraverso un match

sia sui valori di correlazione ottenuti durante il confronto tra i profili, sia sulle medie degli

istogrammi, calcolate in base all'istogramma tramite una formula in cui i valori dell'istogramma

sono pesati con le ampiezze e le durate cui si riferiscono, riportate in Fig.45: . E’ stato simulato

un nuovo profilo X, che è stato correttamente identificato come appartenente al profilo 1 della

famiglia-campione di 2 persone poiché ha una media pari a 7,2370 kWh al giorno, quindi dentro

l’intervallo consentito che, come mostrato in Fig.45: , deve essere compreso tra 7,7027 e 8,8103:

Profilo X 2p prof.1 2p pro.2 3p prof.1 3p prof.2 4p prof.1 4p prof.2

Profilo X 1 0,9482 0,5070 0,7996 0,2445 0,4148 0,5153

2p prof.1 0,9482 1 0,6480 0,9143 0,4715 0,5946 0,7024

2p prof.2 0,5070 0,6480 1 0,7827 0,7457 0,7357 0,7937

3p prof.1 0,7996 0,9143 0,7827 1 0,6780 0,8225 0,8732

3p prof.2 0,2445 0,4715 0,7457 0,6780 1 0,7579 0,8253

4p prof.1 0,4148 0,5946 0,7357 0,8225 0,7579 1 0,8759

4p prof.2 0,5153 0,7024 0,7937 0,8732 0,8253 0,8759 1

Fig.54: Identificazione profilo 2 persone seconda prova

Successivamente è stato simulato un altro profilo Y, che è stato correttamente identificato

come appartenente al profilo 1 della famiglia-campione di 3 persone poiché ha una media pari a

8,5384 kWh al giorno, quindi dentro l’intervallo consentito che, come mostrato in Fig.45: , deve

essere compreso tra 8,8836 e 8,5445:

Profilo Y 2p prof.1 2p pro.2 3p prof.1 3p prof.2 4p prof.1 4p prof.2

Profilo Y 1 0,8899 0,7515 0,9642 0,6348 0,8688 0,8669

2p prof.1 0,8899 1 0,6480 0,9143 0,4715 0,5946 0,7024

2p prof.2 0,7515 0,6480 1 0,7827 0,7457 0,7357 0,7937

3p prof.1 0,9642 0,9143 0,7827 1 0,6780 0,8225 0,8732

57

3p prof.2 0,6348 0,4715 0,7457 0,6780 1 0,7579 0,8253

4p prof.1 0,8688 0,5946 0,7357 0,8225 0,7579 1 0,8759

4p prof.2 0,8669 0,7024 0,7937 0,8732 0,8253 0,8759 1

Fig.55: Identificazione profilo 3 persone seconda prova

Infine è stato simulato un altro profilo Z, che è stato correttamente identificato come

appartenente al profilo 2 della famiglia-campione di 4 persone poiché ha una media pari a

10,6068 kWh al giorno, quindi dentro l’intervallo consentito che, come mostrato in Fig.45: ,

deve essere compreso tra 10,4390 e 11,4027:

Profilo Z 2p prof.1 2p pro.2 3p prof.1 3p prof.2 4p prof.1 4p prof.2

Profilo Z 1 0,8720 0,7417 0,9290 0,6544 0,7603 0,9102

2p prof.1 0,8720 1 0,6480 0,9143 0,4715 0,5946 0,7024

2p prof.2 0,7417 0,6480 1 0,7827 0,7457 0,7357 0,7937

3p prof.1 0,9290 0,9143 0,7827 1 0,6780 0,8225 0,8732

3p prof.2 0,6544 0,4715 0,7457 0,6780 1 0,7579 0,8253

4p prof.1 0,7603 0,5946 0,7357 0,8225 0,7579 1 0,8759

4p prof.2 0,9102 0,7024 0,7937 0,8732 0,8253 0,8759 1

Fig.56: Identificazione profilo 4 persone seconda prova

Con questo ultimo test si può notare come sia importante considerare anche un confronto sui

valori delle medie degli istogrammi al fine di determinare una corretta identificazione dei profili

di consumo di energia elettrica. Infatti se non fosse stata considerata anche un’uguaglianza dal

punto di vista dei valori, ma solo quella sulla forma della curva, quest’ultimo profilo sarebbe

dovuto essere identificato come appartenente al profilo 1 della famiglia-campione composta da 3

persone, commettendo un errore.

58

6 RIVELAZIONE DI ANOMALIE NEL

CONSUMO DOMESTICO

Una volta determinati i consumi propri di ciascun nucleo familiare ed aver definito dei profili

d’utenza, tutto ciò che risulta essere fuori da certi standard è definito irregolare e rivelato come

anomalia. Le anomalie infatti sono definite come inusuali e significanti cambiamenti nei livelli

di consumo di energia elettrica ed è per questo che per identificarle è necessario conoscere il

normale comportamento di una o più famiglia-campione. Il diagnosticare anomalie è un

problema sia per l’azienda fornitrice di energia elettrica sia per l’utente finale perché significa

interpretare un comportamento anomalo in una grande quantità di profili di consumo e perché

possono essere di varie forme e provenire da infinite cause. Risulta però fondamentale rivelarle

perché possono creare inutili sprechi di energia elettrica ed avere un drammatico impatto

sull’utente finale. Le anomalie sono solitamente caratterizzate da cambiamenti transitori ed

improvvisi nei dati misurati che avvengono prima o durante un evento anomalo. La durata di

questi cambiamenti varia con la natura della causa che ha dato il via all’evento. Il più delle volte

le anomalie in questo ambito rimangono sconosciute perché una loro corretta identificazione

richiederebbe delle strutture di monitoraggio sofisticate o perché non si hanno gli strumenti per

processarle in tempo reale o, e soprattutto perché, il consumo di energia elettrica è talmente alto

che rende difficile l’estrazione di informazioni significative.

6.1 Strategia per la rivelazione di anomalie Definiti i profili per il normale uso di energia elettrica in ciascun nucleo familiare si passa ad

evidenziare le deviazioni da tale profilo come possibili situazioni anomale. Una volta ottenuti

tutti i valori per cui si ha o non si ha una correlazione, si determina una soglia per stabilire

eventuali comportamenti anomali. Se infatti per esempio la correlazione normalizzata di una

curva di consumo X per una famiglia-campione di 2 persone con la curva calcolata per il profilo

di una famiglia-campione di 2 persone è superiore a tale soglia, allora si potrà identificare tale

curva X come un caso di anomalia di consumo di energia elettrica in un nucleo familiare di 2

persone.

59

Per rivelare eventuali situazioni anomale, è stato necessario confrontare gli istogrammi di

profilo d'utente generati nella fase precedente. I confronti sono stati eseguiti con le tecniche

descritte nel capitolo 5.1 di auto- e le cross-correlazioni, le distanze euclidee, le auto- e le cross-

correlazioni normalizzate, le medie per valutare contemporaneamente tutti i valori di distanza, o

di similarità, tra gli istogrammi; queste tecniche permettono di determinare una somiglianza nei

valori e nella forma dei dati. La prima prova consiste nel rivelare le anomalie delle tre tipologie

di famiglie descritte sopra, differenti per numero di componenti e per abitudini. Nella seconda

prova una volta determinate le tipologie di consumi proprie dei due profili per famiglia, si cerca

di individuare le situazioni anomale, cioè quei consumi che risultino diversi nei valori e nella

forma dai profili definiti.

6.2 I risultati Come detto in precedenza, nel caso in cui non si riesca ad ottenere l’identificazione di un

qualsiasi profilo X in nessuna tipologia di famiglia-campione, si può parlare di un’anomalia di

consumo di energia elettrica in ambito domestico.

6.2.1.1 Prima prova

Anomalie per profili utente totali

Dai risultati dei test riportati nelle tabelle Fig.48: , Fig.49: , Fig.50: si deduce che è stato

possibile rivelare come anomalie tutti i casi di test in cui la correlazione tra un profilo utente da

identificare con una tipologia di famiglia-campione è risultata inferiore a tutte le soglie calcolate,

cioè non è stato identificato con nessuno dei tre profili. I seguenti valori di correlazione mostrano

le soglie da rispettare per poter identificare correttamente un profilo qualsiasi di consumo di

energia elettrica in una delle tre tipologie prese in esame:

2p 3p 4p

Profilo X 0,9826 0,8632 0,8766

Profilo Y 0,9605 0,9745 0,8951

Profilo Z 0,9047 0,9400 0,9628

Fig.57: Soglie di identificazione profili totali prima prova

Si può quindi concludere che un profilo qualsiasi non apparterrà mai ad una famiglia

composta da 2 persone se la loro correlazione sarà minore di 0,9826; non apparterrà mai ad un

nucleo familiare di 3 persone se la loro correlazione sarà minore di 0,9745; non apparterrà mai

ad una famiglia di 4 persone se la loro correlazione sarà minore di 0,9628. Nell’ipotesi in cui non

60

sia riconosciuto in nessuno delle tre tipologie di famiglie-campione, risulta essere un caso di

anomalia.

Anomalie per profili utente parziali

Dai risultati dei test riportati nelle tabelle Fig.51: , Fig.52: , Fig.53: si deduce che è stato

possibile rivelare come anomalie tutti i casi di test in cui la correlazione di 10 giorni di consumo

di un profilo utente da identificare con una tipologia di famiglia-campione è risultata inferiore a

tutte le soglie calcolate, cioè non è stato identificato con nessuno dei tre profili. I seguenti valori

di correlazione mostrano le soglie da rispettare per poter identificare correttamente un profilo

qualsiasi di consumo di energia elettrica in una delle tre tipologie prese in esame:

2p 3p 4p

10 gg di X 0,8919 0,6879 0,6902

10 gg di Y 0,6736 0,8531 0,8441

10 gg di Z 0,6615 0,7918 0,9286

Fig.58: Soglie di identificazione profili parziali prima pr ova

Si può quindi concludere che un profilo qualsiasi non sarà mai riconosciuto appartenente ad

una famiglia composta da 2 persone se la loro correlazione sarà minore di 0,8919; non apparterrà

mai ad un nucleo familiare di 3 persone se la loro correlazione sarà minore di 0,8531; non

apparterrà mai ad una famiglia di 4 persone se la loro correlazione sarà minore di 0,9286.

Nell’ipotesi in cui non sia riconosciuto in nessuno delle tre tipologie di famiglie-campione,

risulta essere un caso di anomalia.

6.2.1.2 Seconda prova

I risultati dei test riportati nelle Fig.45: , Fig.54: , Fig.55: ,Fig.56: definiscono delle soglie che

se non rispettate rivelano situazioni di anomalie. Tutti i casi di test in cui la correlazione tra un

profilo utente da identificare con una tipologia di famiglia-campione è risultata inferiore alle

soglie calcolate e la media dell’istogramma non è rientrata nell’intervallo stabilito, hanno portato

a definire il profilo come caso anomalo. I seguenti valori di correlazione mostrano le soglie da

rispettare per poter identificare correttamente un profilo qualsiasi di consumo di energia elettrica

in una delle tre tipologie prese in esame:

2p 3p 4p

Profilo X 0,9482 0,7996 0,5153

61

Profilo Y 0,8899 0,9642 0,8669

Profilo Z 0,8720 0,9290 0,9102

Fig.59: Soglie di identificazione profili totali seconda prova

Si può quindi concludere che un profilo qualsiasi non apparterrà mai ad una famiglia

composta da 2 persone se la loro correlazione sarà minore di 0,9482 e la media dell’istogramma

non compresa tra 7,7027 e 8,8103; non apparterrà mai ad un nucleo familiare di 3 persone se la

loro correlazione sarà minore di 0,9642 e la media dell’istogramma non compresa tra 8,8836 e

8,5445; non apparterrà mai ad una famiglia di 4 persone se la loro correlazione sarà minore di

0,9102 e la media dell’istogramma non compresa tra 10,4390 e 11,4027. Nell’ipotesi in cui non

sia riconosciuto in nessuno delle tre tipologie di famiglie-campione, risulta essere un caso di

anomalia.

62

7 CONCLUSIONI

Il lavoro presentato in questa tesi è molto lontano dall’essere considerato un prodotto finito;

può essere visto come il punto di partenza per lo sviluppo di dispositivi che individuino i furti e

le frodi nel settore energetico. E’ stato calcolato che negli Stati Uniti i furti di energia elettrica

costano più di un milione di dollari l’anno alle compagnie erogatrici. Prendendo spunto dalle

tecniche e strategie utilizzate per la rivelazione di anomalie nel traffico su Internet, in questo

elaborato si è voluto dare l’idea per lo sviluppo di un modello che permettesse la rivelazione di

anomalie nel consumo di energia elettrica in ambito domestico.

Ultimamente la società attuale è sempre più sensibile al tema del risparmio energetico che

rappresenta un ruolo fondamentale nella protezione dell’ambiente e dei cambiamenti climatici.

Le possibilità di risparmiare energia, sono tante e spesso sono sotto gli occhi di tutti, soprattutto

in ambito domestico. Tutti gli immobili dovrebbero rispettare la normativa sul risparmio

energetico e quella sulla sicurezza; nell’effettuare la diagnosi di un edificio si cerca di

individuare, attraverso i rilievi delle strutture e dei componenti, calcoli, misure, eventuali

anomalie che possono interessare la stabilità, il consumo energetico, la sicurezza o l’igiene

ambientale.

L’obiettivo del lavoro di tesi è stato quello di progettare e testare uno strumento per

riconoscere situazioni di anomalie nei sistemi elettrici che possono essere causate da

malfunzionamenti o manomissioni dei contatori per tentare di ridurre al minimo gli eventuali

sprechi e furti che ne derivano; a tal fine è stato sviluppato ed utilizzato un algoritmo in grado di

distinguere le anomalie, definite come inusuali e significanti cambiamenti nei livelli di consumo

di energia elettrica standard propri di ciascun nucleo familiare. Una volta definito un profilo per

il “normale” uso di energia elettrica, sono state evidenziate le deviazioni da tale profilo come

possibili situazioni anomale.

La fase realizzativa è stata caratterizzata dalla scrittura del codice in Matlab e si articola nelle

seguenti fasi: (1) raccolta dei dati di consumo di energia elettrica relativi ad alcune famiglie-

campione, (2) elaborazione dei dati per calcolare il fabbisogno energetico di ciascuna famiglia-

campione e definire dei valori “normali”, cioè quelli che esprimono le caratteristiche energetiche

di un sistema “in buona salute”, (3) identificazione di profili utente campione per mezzo dei dati

63

“normali” ottenuti, (4) individuazione di anomalie basata sul confronto tra alcune curve di

consumo random e quelle relative al consumo “normale”.

Proprio come nel traffico su Internet, l’anomaly detection e la correlazione di eventi di

anomalia è un problema estremamente difficile da risolvere. Durante questo lavoro è stato

possibile esaminare il funzionamento e le prestazioni di strumenti che implementano algoritmi

per la rivelazione di anomalie: nonostante si tratti di prototipi di ricerca con possibilità di

miglioramento effettivo i modelli sviluppati in questo ambito hanno mostrato buoni risultati

anche presentando volutamente un’architettura molto semplice. Da questo emerge la conclusione

che, in base all’analisi effettuata, la realizzazione di un sistema del genere riesce ad individuare

in modo corretto la presenza di anomalie nel consumo energetico.

64

APPENDICE A: Rivelazione di anomalie nel

traffico su Internet

Il lavori di tesi descritto in questo elaborato prende spunto dalle tecniche e strategie utilizzate

per la rivelazione di anomalie nel traffico su Internet. A tale scopo è di fondamentale importanza

una corretta analisi che determini come il traffico di pacchetti si muove attraverso la rete, Traffic

Engineering, e quali sono i links sui quali si riscontra un traffico inusuale, Anomaly Detection,

che devono essere modificati [18.]; si potrebbero implementare delle politiche reattive tali da

bloccare subito il traffico sospetto non appena si rilevino delle discrepanze fra il profilo

concordato con il cliente e il suo effettivo utilizzo della rete [19.]. Le anomalie che si riscontrano

nel traffico sono caratterizzate da rilevanti cambiamenti nel normale comportamento della rete,

che possono essere maliziosi, come quelli causati da attacchi, dall’ uso abusivo della rete, dalla

propagazione di worms o virus, oppure involontari, causati per esempio da fallimenti, da flash

crowds, da una configurazione errata dei routers [20.]. Un’accurata classificazione del traffico è

di fondamentale importanza per numerose attività della rete, dal monitoraggio alla sicurezza,

dalla Quality of Service all’Intrusion Detection, e può essere basata sull’analisi del numero di

porta al quale il client accede per richiedere il servizio oppure sfruttando le caratteristiche che

distinguono le applicazioni quando comunicano sulla rete. Un buon classificatore dovrebbe avere

uno schema che definisca le categorie in cui si vuole classificare il traffico e che aiuti a

raggruppare le applicazioni che svolgono lo stesso compito in classi e dovrebbe “individuare

quali sono le caratteristiche che permettono di discriminare le classi l’una dall’altra” [19.].

Anomaly detection è una grande e complessa area di ricerca, alla quale ancora non si riesce a

dare un unico approccio con il quale affrontare e risolvere il problema. [21.] Le anomalie sono

definite come inusuali e significanti cambiamenti nei livelli di traffico della rete ed è per questo

che per identificarle è necessario conoscere il normale comportamento di una rete. Il

diagnosticare anomalie è un problema sia per gli operatori della rete sia per l’utente finale perché

significa interpretare un comportamento anomalo in una grande quantità di dati high-dimensional

e rumorosi e perché possono essere di varie forme e provenire da una infinite cause. Risulta però

fondamentale analizzare le anomalie perché possono creare congestioni nella rete e avere un

drammatico impatto sull’utente finale.

Gli approcci usati per scoprire le anomalie dipendono dalla natura dei dati disponibili per

l’analisi ottenuti a vari livelli di granulosità e che possono essere [21.]:

65

1. end-user-based information : si riferiscono ai protocolli TCP e UDP relativi ai dati che

contengono informazioni specifiche per l’applicazione finale;

2. network-based data : sono pertinenti alla funzionalità dei dispositivi della rete e

includono informazioni raccolte dalle interfacce fisiche dei routers.

NETWORK ANOMALIES

Alle anomalie presenti nella rete ci si riferisce solitamente nelle circostanze in cui le

operazioni della rete si discostano dal comportamento normale. Le cause per cui si presentano

queste anomalie sono molteplici come il malfunzionamento dei dispositivi di rete, sovraccarico,

attacchi DoS, intrusioni che interrompono la normale distribuzione di un servizio. Le anomalie

della rete sono caratterizzate da transitori ed improvvisi cambiamenti nei dati misurati della rete

che avvengono prima o durante un evento anomalo. La durata di questi cambiamenti varia con la

natura della causa che ha dato il via all’evento.

Un tipo di anomalia è relativa ai fallimenti della rete e ai problemi di prestazioni, come per

esempio fallimenti dei file server (computer responsabili dell’immagazzinamento e della

gestione dei files di dati così che altri computer nella stessa rete possano accedervi) nel caso di

un elevato numero di richieste FTP, operazioni di paging (usate in caso di memoria virtuale,

consiste nel trasferimento di pagine dentro e fuori la memoria in modo che l’informazione che si

desidera sia reperibile il più velocemente possibile) attraverso la rete, congestioni transitorie..

Un altro tipo di anomalia è relativa al problema della sicurezza come nel caso di attacchi DoS

che avvengono quando i servizi offerti da una rete sono “rubati” da entità maliziose o nel caso di

intrusioni nella rete durante le quali le entità maliziose “rubano” larghezza di banda inondando la

rete con traffico inutile [21.].

NETWORK DATA

I tipi di anomalia che possono essere scoperti dipendono dalla natura dei dati che circolano

sulla rete che, a tal proposito, sono analizzati in vari modi:

− Network probes: strumento come ping o traceroute che può essere usato per

ottenere parametri specifici (end-to-end delay o packet loss) e fornisce misure

istantanee sul comportamento di una rete.

− Packet filtering: i flussi di pacchetti sono campionati catturando l’intestazione IP di

un certo numero di pacchetti in differenti punti della rete. Un flusso è identificato

dall’indirizzo sorgente-destinazione e dal numero di porta sorgente-destinazione.

66

− Routing protocol: informazioni riguardanti gli eventi sulla rete possono essere

ottenute analizzando le tabelle di indirizzamento inviate attraverso i router e i dati in

esse possono essere usati per costruire la topologia della rete e fornire lo stato dei

link tra i nodi.

− Network management protocol: fornisce statistiche riguardanti il traffico della rete

monitorando le informazioni che circolano attraverso i router. Queste informazioni

non forniscono direttamente una metrica di prestazioni del traffico ma possono

essere usate per caratterizzare il comportamento della rete

INTRUSION DETECTION SYSTEM (IDS)

Le persone possono comunicare tra loro attraverso la rete senza nessun problema reale dovuto

alla distanza. E’ però risaputo che l’intrusione di un utente malizioso e non autorizzato può

recare gravi danni ad un intero sistema. La sicurezza delle reti di computer è un vero e proprio

problema ed è importante sviluppare meccanismi per difendersi contro le intrusioni.

Secondo Heady [22.] un’intrusione può essere definita come “un qualsiasi insieme di azioni

che tentano di compromettere l’integrità, la confidenzialità o la disponibilità di risorse di

informazioni”. L’identificazione di questo insieme di azioni maliziose è chiamata intrusion

detection e i sistemi usati in questo ambito aiutano a mantenere sicure le reti che oltre ad essere

minacciate da attacchi esterni, devono difendersi spesso anche da quelli interni. Queste reti

spesso includono computer vulnerabili e offrono una grande larghezza di banda; questi sono i

motivi per cui risultano essere interessanti agli occhi di chi intende attaccarle. L’obiettivo

dell’attaccante non è la singola macchina, che il più delle volte contiene informazioni non

importanti, ma sa che attraverso quella è possibile fare una scansione dell’intera rete ed iniziare,

ad esempio, un attacco Denial of Service. Un sistema di Intrusion Detection conosciuto è il

GrIDS [23.] che cerca di identificare worms costruendo i così detti activity graphs che

rappresentano le connessioni di rete tra hosts e che sono usati per ricercare modelli predefiniti

[24.].

Per intrusion detection si intende un insieme di tecniche che sono usate per identificare

attacchi contro computer e reti [25.]. La valutazione dei sistemi usati in questo campo è un

compito arduo per diverse ragioni:

− è problematico usare dati di alta qualità per valutare le prestazioni a causa di

problemi inerenti la privacy e la competitività, perché molte organizzazioni non

sono disponibili a condividere le loro informazioni con altre istituzioni;

67

− anche se sono disponibili dati della vita reale, la classificazione delle connessioni di

rete in normale e non, richiede una grande quantità di tempo;

− il cambiamento costante nel traffico di rete non può introdurre solo nuovi tipi di

intrusioni, ma può anche cambiare gli aspetti di un comportamento “normale”;

− nella misurazione delle prestazioni di un IDS, vanno tenute in considerazione il

detection rate (calcolato come la frazione tra il numero di attacchi scoperti

correttamente e il numero totale di attacchi), il false alarm rate (calcolato come la

frazione tra il numero di connessioni normali che sono classificate erroneamente

come attacchi e il numero totale di connessioni normali), e il costo della

classificazione;

− alcuni attacchi, come Dos, possono usare centinaia di pacchetti di rete e

connessioni.

Generalmente sono previsti due tipi di attacchi: quello che riguarda una connessione singola

per cui viene applicata un’analisi di attacco single-connection e quello che riguarda una

connessione multipla (bursts of connections) per cui viene applicata un’analisi di attacco

multiple-connection.

Fig.60: Passi eseguiti per valutare un intrusione [25.]

Entrambe le metodologie di analisi per prima cosa calcolano un valore di score necessario per

associare una particolare connessione ad una intrusione. Per un dato traffico di rete in alcuni

intervalli di tempo, è assegnato un valore di score, come mostrato in figura:

68

Fig.61: Assegnamento del valore di score [25.]

La linea rossa tratteggiata rappresenta la real attack curve che vale zero nel caso di

connessioni di rete normali e vale uno per una connessione non normale. La linea verde continua

corrisponde ad un predicted attack curve e per ogni connessione vale il valore dello score che le

è stato assegnato. Queste due curve ci permettono di calcolare l’errore per ogni connessione

come la differenza tra il valore reale della connessione (1 per connessioni con attacchi e 0 per

connessioni normali) e lo score assegnato alla connessione. Questo approccio permette la

valutazione di metriche aggiuntive come per esempio la superficie tra la curva del real attack e

quella del predicted attack; più piccola sarà la superficie tra queste due curve e migliore sarà

l’algoritmo di intrusion detection. [25.]

Un dispositivo atto a rilevare attività anomale sulle reti o sui sistemi informatici può agire o

sulla base di conoscenze acquisite durante attacchi precedenti (signatures) o in base

all’osservazione dei comportamenti di sistemi o di utenti che risultano essere differenti da quelli

abituali. I metodi esistenti di intrusion detection si possono quindi suddividere in due categorie

principali [26.]:

1. signature recognition techniques o misuse detection systems : le signature di eventi

conosciuti sono immagazzinati e gli eventi sono monitorati al fine di trovare una

correlazione con le signature conservate. Queste tecniche segnalano un attacco quando

si trova una corrispondenza. Naturalmente in questi casi è richiesta una signature per

ogni attacco e non è possibile trovare nuovi attacchi al di fuori di quelli già conosciuti.

La loro efficacia dipende dall’attendibilità del database.

2. anomaly detection systems (ADS) : costruisce modelli di dati “normali” e identifica

nei dati osservati qualsiasi tipo di scostamento dal modello normale. Gli algoritmi

usati in questo campo hanno il vantaggio di poter scoprire nuovi tipi di intrusioni

grazie agli scostamenti dal normale comportamento che si manifestano [10]. Dato

69

quindi un insieme di dati “normali” e un dato usato per il test, l’obiettivo è quello di

determinare se il dato di test appartiene o no ad un comportamento normale. Gli

schemi usati però soffrono di un alto false alarms rate.

Un IDS può rilevare un attacco sia quando è ancora in corso (real time), generando

immediatamente degli alert, sia quando è già avvenuta un’intrusione (off-line), analizzando

periodicamente dei log in cui sono registrati gli eventi passati, ma in questo caso il risultato non

è istantaneo. Gli elementi architetturali che accomunano i diversi tipi di IDS consistono nelle

loro tre componenti fondamentali:

− i sensori (event generator): raccolgono i dati provenienti dai vari sistemi e li

inoltrano all’analizzatore;

− l’analizzatore (analysis engine): decide se i dati ricevuti corrispondono

effettivamente ad un attacco, e può indicare gli eventuali provvedimenti da

prendere;

− l’interfaccia utente (response unit): permette il controllo dello stato del sistema da

parte dell’amministratore.

Fig.62: Componenti fondamentali di un IDS [57]

Gli IDS, anche se tutti caratterizzati dalle tre componenti fondamentali viste, possono variare

molto fra loro a seconda dei dati da essi esaminati e generati. E’ possibile infatti suddividerli

nelle seguenti categorie [57]:

− application-based IDS: analizzano il comportamento di un programma applicativo;

70

− host-based IDS (HIDS): analizzano dati provenienti da application-based IDS

relativi ad un host, dal quale dipendono strettamente, soprattutto in relazione al

sistema operativo. Lavorano fuori linea in modalità anomaly detection;

− network-based IDS (NIDS): analizzano il traffico di rete alla ricerca di tracce di

attacchi nei pacchetti IP, accedendo anche ai dati generati dagli host-based IDS e

dagli application-based IDS appartenenti alla rete da essi monitorata. Lavorano in

tempo reale in modalità misuse detection, comportano perciò l’incapacità di reagire

ad attacchi non ancora conosciuti, ed è inoltre facilmente aggirabile dal traffico

criptato, del quale non può in alcun modo rilevare l’eventuale nocività;

− multi-network-based IDS: si tratta, in realtà, di Incident Response Team (IRT), che

ricevono dati da diversi siti di loro competenza e sono in grado di coordinarne la

gestione.

ANOMALY DETECTION SYSTEMS (ADS)

La scoperta delle anomalie è un elemento chiave di intrusion detection nella quale le

perturbazioni che avvengono durante il normale comportamento suggeriscono la presenza di

intenzionali o non attacchi, fallimenti, difetti.. [25.]

Ci sono molte tecniche che appartengono alla categoria dell’anomaly detection, alcune delle

quali sono tecniche machine learning e altre statistical-based. Queste ultime usano proprietà

statistiche di normali attività per costruire un profilo standard ed applicano test statistici per

determinare se le attività osservate sono molto diverse dalla norma [26.].

Emran eYe [27.] hanno sviluppato un metodo di anomaly detection chiamata Canberra; il

loro esperimento mostra che la loro tecnica ha buone prestazioni solo nel caso di attacchi che

hanno luogo tutti insieme. Un’altra tecnica basata sul test di Hotelling [28.] è una metodoligia di

controllo di qualità multivariate che costruisce un long-term profile di attività normali nei sistemi

informativi e lo usa per scoprire anomalie.

Ci sono anche tecniche basate sul concetto di outliers; Aggarwal e Yu discutono di una

tecnica che trova questi outliers studiando il comportamento dei dataset [29.]. Molti dataset

contengono una o più osservazioni inusuali che non sembrano appartenere allo schema di

variabilità prodotto da altre osservazioni. Quando un’osservazione è differente dalla maggior

parte dei dati o non è simile al modello di dati assunto, è considerato un outlier [26.].

Assumendo una distribuzione normale, ogni osservazione che risulta avere un valore

standardizzato più grande di un valore assoluto è spesso identificato come outlier di un dataset.

71

Sviluppo di un ADS

Nell’articolo [30.] si cerca di sviluppare uno strumento per l’anomaly detection in grado di

identificare gli attacchi senza mantenere informazioni riguardanti lo stato del flusso o della

connessione su un determinato nodo o link, come invece viene fatto nella maggior parte delle

tecniche in circolazione. Questo strumento non tenta di identificare differenti tipi di attacchi o le

loro derivazioni, ma verrà usato per indicare quando deve iniziare una più sofisticata tecnica di

intrusion detection. L’ASD sviluppato usando l’ambiente MATLAB deriva dallo schema [26.]

basato su dati SNMP ed è stato usato per l’identificazioni delle anomalie nella rete TNUN

(Tunisian National University Network) in un periodo di 45 giorni.

Tutte le tecniche di anomaly detection iniziano con la costruzione di un profilo per il

“normale” comportamento della rete e poi evidenzia le deviazioni da tale profilo come possibili

attacchi. Per valutare lo strumento sviluppato è necessario mantenere una traccia di dove le

anomalie del traffico sono state identificate. E’ stata quindi realizzata una rete sperimentale

consistente di due reti locali connesse da un router:

Fig.63: Rete sperimentale per la valutazione dello strumento ADS [30.]

Per la simulazione di un traffico normale, si è usato un genitore di traffico LANTRAFFIC

[31.] che mantiene 16 connessioni bidirezionali TCP e UDP tra il computer “victim” e quello che

genera il traffico. Sono stati inseriti altre due macchine per lanciare gli attacchi DoS usando

tecniche di flooding e una ADS station per processare i dati SNMP provenienti dal router

centrale. La valutazione dello strumento sviluppato segue le metriche generali e di per-attack

presentate in [32.] da Lazarevic:

72

Real false alarm rate Numero di false alarms diviso il numero totale delle osservazioni

Detection rate Numero di truthful alarms diviso il numero totale di osservazioni anomale reali. Precision Numero di truthful alarms diviso il numero totale di alarms

Fig.64: Metriche generali [32.]

Burst Detection Rate (bdr)

Rapporto tra il numero totale delle osservazioni intrusive che hanno un valore di score più alto di una soglia e il numero totale di osservazioni intrusive reali

Response Time (Trep)

Tempo trascorso tra l’inizio dell’attacco fino al momento in cui il valore di score raggiunge la soglia

Fig.65: Metriche per-attack [32.]

73

APPENDICE B: Software Matlab per la

modellistica e l’analisi dei consumi domestici

Il programma carica un file txt contenente le potenze degli elettrodomestici e una matrice con

le probabilità di accensione. L’algoritmo legge e verifica le assegnazioni delle probabilità di tutti

gli apparecchi e generando un grafico che rappresenta i livelli di consumo di energia elettrica di

ogni elettrodomestico.

Di seguito il codice esempio per determinare il consumo di alcuni elettrodomestici in una

famiglia di 2 persone con il modello semplice:

% Program UserProfile_2p

clear

n_ore=48;

pot = textread('p1UserProfile_2p.txt','%d',11,'head erlines',1);

pot = pot/1000;

pot_luce= pot(1);

pot_pc= pot(3);

pot_tv= pot(7);

……

% Luci-assegnazione probabilità

for i=1:48,

pr_luci(i,1:5)= textread('p1UserProfile_2p.txt','%d',5,'headerlines ',i+3);

end

pr_luci=pr_luci/10;

% verifica delle probabilità assegnate

for i1=1:n_ore,

a=0;

for i2=1:5, a=a+pr_luci(floor((i1+1)/2),i2); en d

for i2=1:5,

pr_luci(floor((i1+1)/2),i2)=pr_luci(floor((i1+ 1)/2),i2)/a;

end

end

% Tv-assegnazione probabilità

for i=1:48,

pr_tv(i,1:3)= textread('p1UserProfile_2p.txt','%d',3,'headerlines ',i+53);

end

pr_tv=pr_tv/10;

74

% verifica delle probabilità assegnate

for i1=1:n_ore,

a=0;

for i2=1:3, a=a+pr_tv(floor((i1+1)/2),i2); end

for i2=1:3,

pr_tv(floor((i1+1)/2),i2)=pr_tv(floor((i1+1)/2) ,i2)/a;

end

end

% Pc-assegnazione probabilità

for i=1:48,

pr_pc(i,1:2)= textread('p1UserProfile_2p.txt','%d',2,'headerlines ',i+103);

end

pr_pc=pr_pc/10;

% verifica delle probabilità assegnate

for i1=1:n_ore,

a=0;

for i2=1:2, a=a+pr_pc(floor((i1+1)/2),i2); end

for i2=1:2,

pr_pc(floor((i1+1)/2),i2)=pr_pc(floor((i1+1)/2) ,i2)/a;

end

end

………

Un ciclo di 365 giorni crea un vettore di consumi energetici per ogni elettrodomestico e il

relativo grafico:

% UserConsumption_2p

clear

hold off

load d1UserProfile_2p

n_giorni = 365;

luce_av =zeros(1,n_ore);

pc_av =zeros(1,n_ore);

tv_av =zeros(1,n_ore);

………

tot =zeros(n_giorni,n_ore);

% calcolo dei consumi

for ii=1:n_giorni;

luce=zeros(1,n_ore);

pc=zeros(1,n_ore);

tv=zeros(1,n_ore);

75

………

totale=zeros(1,n_ore);

for i1=1:n_ore,

% Luci

a=rand;

pr=0;

for i2=1:5,

pr=pr_luci(floor((i1+1)/2),i2)+pr;

if a<pr, luce(i1)=(i2-1)*pot_luce; brea k, end

if a<pr, break, end

end

totale(i1)=luce(i1);

% Tv

a=rand;

pr=0;

for i2=1:3,

pr=pr_tv(floor((i1+1)/2),i2)+pr;

if a<pr, tv(i1)=(i2-1)*pot_tv; break, e nd

if a<pr, break, end

end

totale(i1)=totale(i1)+tv(i1);

% Pc

a=rand;

pr=0;

for i2=1:2,

pr=pr_pc(floor((i1+1)/2),i2)+pr;

if a<pr, pc(i1)=(i2-1)*pot_pc; break, e nd

if a<pr, break, end

end

totale(i1)=totale(i1)+pc(i1);

end % fine loop i1 su n_ore

tot(ii,1:n_ore)=totale;

luce_av=luce_av+luce;

tv_av=tv_av+tv;

pc_av=pc_av+pc;

………

end % fine loop ii su n_giorni

mesh(tot)

hold off

76

% Luci

luce=luce_av/n_giorni; % kwatt

luce_kWh_giorno=sum(luce);

luce_kWh_anno=luce_kWh_giorno*365;

luce_kWh_anno'

'attesa kWh/anno, luce: 270'

% Televisione

tv=tv_av/n_giorni; % kwatt

tv_kWh_giorno=sum(tv);

tv_kWh_anno=tv_kWh_giorno*365;

tv_kWh_anno'

'attesa kWh/anno, due tv: 150'

% Personal Computer

pc=pc_av/n_giorni; % kwatt

pc_kWh_giorno=sum(pc);

pc_kWh_anno=pc_kWh_giorno*365;

pc_kWh_anno'

'attesa kWh/anno, un pc: 100'

………

Di seguito il codice esempio per determinare il consumo del ferro da stiro in una famiglia di 2

persone con il modello di Markov:

% Programma Markov per consumo ferro

n_stati = 7;

n_giorni = 365;

n_ore = 24;

totale =zeros(n_giorni,n_ore);

ferro_av =zeros(1,n_ore);

pr_ferro= 0;

pot_ferro = 700/1000;

P= [

0.1 0.9 0 0 0 0 0

0.2 0 0.8 0 0 0 0

0.3 0 0 0.7 0 0 0

0.4 0 0 0 0.6 0 0

0.5 0 0 0 0 0.5 0

0.6 0 0 0 0 0 0.4

0.8 0 0 0 0 0 0.2

];

77

% si parte da uno stato qualsiasi

w0=[0 0 0 1 0 0 0];

% determini la percentuale di passaggio negli stati

for i=1:15,

w=w*P;

end

wr=w;

% determino stato iniziale

r=rand;

a=0;

for i=1:n_stati

a=a+wr(i);

if r<=a, break; end

end

s=i

% calcolo stato al passo generico matt/pom

for k=1:n_giorni,

ferro=zeros(1,n_ore);

r=rand;

a=0;

for i=1:n_stati

a=a+P(s,i);

if r<=a, break; end

end

pr_ferro = P(s,i);

s=i;

if s==1,

'faccio ferro'

r2=rand;

ora_inizio_mattina=floor(rand*3*2)+20; %dalle 10 .00 alle 13.00

ora_inizio_pomeriggio=floor(rand*3*2)+34; %dalle 17.00 alle 20.00

i2=0;

pr=0;

for i2=1:n_ore,

pr=pr+pr_ferro;

if r2<=pr, break, end

end

ferro(i2)=pot_ferro;

% durata della ferro

if r2>0.3,

ferro(i2+1)=pot_ferro;

78

end

totale(k,1:n_ore)=ferro;

else

'riposo'

end

ferro_av=ferro_av+ferro;

end

% consumi ferro

ferro=ferro_av/n_giorni; % kwatt

ferro_kWh_giorno=sum(ferro)

ferro_kWh_anno=ferro_kWh_giorno*365;

79

APPENDICE C: Software Matlab per la

identificazione e la rivelazione di anomalie nei

consumi domestici

Il programma carica un file txt contenente i consumi annuali degli elettrodomestici.

L’algoritmo analizza la curva di consumo giorno per giorno e l’approssima con un profilo

costante a tratti. Di seguito il codice esempio per determinare l’approssimazione in una famiglia

di 2 persone:

% Program p1PieceConstApprox2p - (Piecewise Constan t Approximation)

clear

load d0ConsumoTotale2p %carica i consumi annuali rilevati

eps=0.4;

n_giorno1=1;

n_giorno2=364;

for i_giorno=n_giorno1:n_giorno2,

% prende curva consumo di un giorno specifico

prof=tot_anno(i_giorno,1:n_ore);

i_region=1;

av_reg=prof(1);

min_reg=prof(1);

max_reg=prof(1);

d_reg=max_reg-min_reg;

l_reg=1;

n_reg=1;

for i=2:n_ore,

min_reg1=min(min_reg,prof(i));

max_reg1=max(max_reg,prof(i));

d_reg1=max_reg1-min_reg1;

if d_reg1<eps & i<n_ore,

min_reg=min_reg1;

max_reg=max_reg1;

d_reg=d_reg1;

av_reg=av_reg*l_reg+prof(i);

l_reg=l_reg+1;

av_reg=av_reg/l_reg;

else

av_regv(n_reg)=av_reg;

80

l_regv(n_reg)=l_reg;

for i1=i-1:-1:i-l_reg,

prof_av(i1)=av_reg;

end

av_reg=prof(i);

min_reg=prof(i);

max_reg=prof(i);

d_reg=max_reg-min_reg;

l_reg=1;

n_reg=n_reg+1;

end

if i==n_ore,

av_regv(n_reg)=av_reg;

l_regv(n_reg)=l_reg;

prof_av(i)=av_reg;

end

end

i1=1;

for k=1:n_reg,

for i=i1:i1+l_regv(k),

prof_rec(i)=av_regv(k);

end

i1=i;

end

plot(prof,'k')

hold on

axis([0 n_ore-1 0 5])

plot(prof_av,'r:')

plot(prof_rec+0.05,'b')

hold off

for k=1:n_reg,

la_regv(k)=l_regv(k).*av_regv(k);

end

[la_sort,i_la_sort]=sort(la_regv,'descend');

n_reg_max=10;

nn=min(n_reg,n_reg_max);

la(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_ reg_max);

l(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_r eg_max);

av(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_ reg_max);

for i=1:nn,

la(i_giorno-n_giorno1+1,i)=la_regv(i_la_sor t(i));

81

l(i_giorno-n_giorno1+1,i)=l_regv(i_la_sort( i));

av(i_giorno-n_giorno1+1,i)=av_regv(i_la_sor t(i));

end

end % fine loop sui giorni

save d1PCA2p

Il file txt salvato è caricato dal programma successivo che calcola l’istogramma

bidimensionale relativo ad un profilo di consumo giornaliero regolarizzato come costante a tratti.

Di seguito il codice esempio per determinare l’istogramma annuale in una famiglia di 2 persone:

% Program p2PCAistog2p

load d1PCA2p

istog_l_av=zeros(50,40);

av_step = 4;

for i1=1:n_user2-n_user1+1,

for i2=1:nn,

l_q=round(l(i1,i2))+1;

av_q=round(av_step*av(i1,i2)+1);

if l_q>48, l_q=48, end

if av_q>40, av_q=40, end

istog_l_av(l_q,av_q)=istog_l_av(l_q,av_q)+1 ;

end

end

sum(sum(istog_l_av));

plot(sum(istog_l_av)+10,'k')

hold on

%figura totale

figure

mesh(istog_l_av)

view(150,80)

% figura zoomata della zona interessante

figure

mesh(istog_l_av(1:8,1:8))

view(150,80)

save d2PCAistog2p

Gli istogramma creati per ciascuna famiglia o profilo sono caricati dal programma successivo

e confrontati calcolando le auto- e le cross-correlazioni, le distanze euclidee, le auto- e le cross-

correlazioni normalizzate e le medie per rivelare le anomalie. Di seguito il codice esempio per

determinare l’istogramma annuale in una famiglia di 2 persone:

82

% Program p3PCAistoMatch

clear

isto_l_av=zeros(2,50,40);

corr_l_av=zeros(2,2);

load d2PCAistog2p_01

for i1=1:50,

for i2=1:40,isto_l_av(1,i1,i2)=istog_l_av(i1,i2); e nd

end

load d2PCAistog2p_02

for i1=1:50,

for i2=1:40, isto_l_av(2,i1,i2)=istog_l_av(i1,i2); end

end

n1=50; n2=40;

for ii=1:2,

a=0;

for i1=1:n1,

for i2=1:n2,

a=a+(i1-1)*(i2-1)/4*isto_l_av(ii,i1,i2);

end

end

c_medio_istog(ii)=a/365;

end

c_medio_istog

for i1=1:3,

for i2=1:3,

corr_l_av(i1,i2)=

sum(sum(isto_l_av(i1,1:50,1:40).*isto_l_av(i 2,1:50,1:40)))/50/40;

ed_l_av(i1,i2)=

sum(sum((isto_l_av(i1,1:50,1:40)-isto_l_av(i2,1:50 ,1:40)).^2))/50/40;

end

end

for i1=1:3,

for i2=1:3,

ncorr_l_av(i1,i2)=

corr_l_av(i1,i2)/sqrt(corr_l_av(i1,i1))/sqrt(c orr_l_av(i2,i2));

end

end

corr_l_av

ed_l_av

ncorr_l_av

83

BIBLIOGRAFIA

[1.] www.pubbliservizi.it/content.asp?Subc=446&L=1&idMen=201, consumielettrici.altervista.org/tabelle.php

[2.] http://www.enel.it/attivita/ambiente/energiaelettrica/

[3.] Progetto MICENE, Politecnico di Milano “Misure dei consumi di energia elettrica nel settore domestico”

[4.] Enea Risparmio Lavatrice e Lavastoviglie.

[5.] Wikipedia, Il Processo Markoviano, http://it.wikipedia.org/wiki/Processo_markoviano

[6.] Wikipedia, Distanza Euclidea, http://it.wikipedia.org/wiki/Distanza_euclidea

[7.] L. Grassetti, Dipartimento di Scienze Statistiche, Università di Udine, “L’analisi statistica multivariata

applicata alle ricerche di mercato”

[8.] S.Calzoni, Calcolo dell’indice di sincronicità, “Indice di sincronizzazione di segnali numerici”

[9.] http://ilcorrieredelweb.blogspot.com/search/label/ambiente, “Le proposte del WWF per abbattere le

'barriere' all'efficienza energetica”

[10.] Rapporto annuale sul meccanismo dei titoli di efficienza energetica dell’ Autorità per l’energia elettrica e il

gas.

[11.] Maurizio Parenzan, Metodologie di analisi energetica ed exergetica per la predisposizione dei Piani

Energetici Comunali.

[12.] Wikipedia, Energia, http://it.wikipedia.org/wiki/Energia

[13.] Gianvito Dongiovanni, Bilancio energetico della regione Puglia: luci ed ombre

[14.] Wikipedia, Matlab, http://it.wikipedia.org/wiki/MATLAB

[15.] http://www.repubblica.it/2008/10/sezioni/ambiente/clima-vertice-ue-2/italia-classifica/italia-classifica.html

[16.] Wikipedia, Il Protocollo di Kyoto, http://it.wikipedia.org/wiki/Protocollo_di_Ky%C5%8Dto

[17.] La domanda di energia in Italia nel primo trimestre 2008

[18.] A. Lakhina, K. Papagiannaki, M. Crovella, C. Diot, E. D. Kolaczyk, and N. Taft. Structural Analysis of

Network Traffic Flows. In ACM SIGMETRICS, New York, June 2004.

[19.] V. Veglianti, Classificazione statistica del traffico IP a livello applicativo tramite Cluster Analysis, tesi di

laurea, Università di Roma La Sapienza, Italia, 2006.

[20.] K. Ramah, H. Ayari, F. Kamoun. Traffic Anomaly Detection and Characterization in the Tunisian National

University Network. CRISTAL laboratory, École Nationale des Sciences de l’Informatique, University of

Manouba, Tunisia, 2004.

[21.] M. Thottan, C. Ji, Anomaly Detection in IP Networks, IEEE Transaction on Signal Processing, Vol.51, n°8,

August 2003

[22.] R. Heady, G. Luger, A. Maccabe, and M. Servilla, The architecture of a network level intrusion detection

system, Technical report, Computer Science Department, University of New Mexico, August 1990.

84

[23.] Karl Levitt, Matt Bishop GrIDS design http://seclab.cs.ucdavis.edu/arpa/grids/design.html

[24.] T. Toth and C. Kruegel. Connection-history based anomaly detection. In IEEE Workshop on Information

Assurance and Security, 2002.

[25.] A. Lazarevic, L. Eroz, V. Kumar, A. Ozgur and J. Srivastava; A Comparative Study of Anomaly Detection

Schemes. In Network Intrusion Detection; Proceeding of Third SIAM International Conference on Data

Mining; San Francisco; 2003.

[26.] Mei-Ling Shyu, Shu-Ching Chen, K. Sarinnapakorn, and L. Chang: A Novel Anomaly Detection Scheme

Based on Principal Component Classifier. In Proceedings of the IEEE Foundations and New Directions of

Data Mining Workshop, in conjunction with the Third IEEE International Conference on Data Mining

(ICDM’03), pp. 172-179, Melbourne, Florida, USA, 2003.

[27.] S.M. Emran and N. Ye, Robustness of Canberra Metric in Computer Intrusion Detection, Proceedings of

the 2001 IEEE Workshop on Information Assurance and Security, United States Military Academy, West

Point, New York, June 5-6, 2001.

[28.] N. Ye, S. M. Emran, Q. Chen, and S. Vilbert, Multivariate Statistical Analysis of Audit Trails for Host-

Based Intrusion Detection, IEEE Transactions on Computers, Vol. 51, No. 7, July 2002.

[29.] C.C. Aggarwal and P.S. Yu, Outlier Detection for High Dimensional Data, Proceedings of the ACM

SIGMOD Conference, Santa Barbara, California, May 21-24, 2001.

[30.] K. Ramah, H. Ayari, F. Kamoun. Traffic Anomaly Detection and Characterization in the Tunisian National

University Network. CRISTAL laboratory, École Nationale des Sciences de l’Informatique, University of

Manouba, Tunisia, 2004.

[31.] LANTRAFFIC : http://www.zti-telecom.com/

[32.] A. Lazarevic, L. Eroz, V. Kumar, A. Ozgur and J. Srivastava. A Comparative Study of Anomaly Detection

Schemes. In Network Intrusion Detection; Proceeding of Third SIAM International Conference on Data

Mining; San Francisco; 2003.

[33.] http://magazine.excite.it/news/14263/Poznan-conferenza-ed-esposizione-per-salvare-il-clima

[34.] La Repubblica di Lunedì 15 settembre 2008

85

INDICE DELLE FIGURE Fig.1: Emissioni di CO2 (milioni di tonnellate) [17.]...............................................................9

Fig.2: Consumi di energia in fonti primarie (gennaio-marzo) [17.] .....................................10 Fig.3: Termovalorizzatore di Brescia (vista dalla A4) ...........................................................12 Fig.4: Consumo energetico 2006/2007 in una famiglia-campione.........................................15 Fig.5: Consumo in watt degli elettrodomestici .......................................................................18 Fig.6: Tabella di consumo medio giornaliero e annuo 2 persone ..........................................20 Fig.7: Consumo medio 2 persone con modello semplice ........................................................21 Fig.8: Tabella di consumo medio giornaliero e annuo 3 persone ..........................................22 Fig.9: Consumo medio 3 persone con modello semplice ........................................................22 Fig.10: Tabella di consumo medio giornaliero e annuo 4 persone ..........................................23 Fig.11: Consumo medio 4 persone con modello semplice ........................................................23 Fig.12: Markov famiglia-campione 2 persone..........................................................................25 Fig.13: Consumo medio 2 persone con modello di Markov .....................................................26 Fig.14: Markov famiglia-campione 3 persone..........................................................................26 Fig.15: Consumo medio 3 persone con modello di Markov .....................................................27 Fig.16: Markov famiglia-campione 4 persone..........................................................................27 Fig.17: Consumo medio 4 persone con modello di Markov .....................................................28 Fig.18: Profilo 1 famiglia-campione 2 persone ........................................................................29 Fig.19: Consumo medio profilo 1 per 2 persone ......................................................................29 Fig.20: Profilo 2 famiglia-campione 2 persone ........................................................................30 Fig.21: Consumo medio profilo 2 per 2 persone ......................................................................30 Fig.22: Profilo 1 famiglia-campione 3 persone ........................................................................31 Fig.23: Consumo medio profilo 1 per 3 persone ......................................................................31 Fig.24: Profilo 2 famiglia-campione 3 persone ........................................................................32 Fig.25: Consumo medio profilo 2 per 3 persone ......................................................................32 Fig.26: Profilo 1 famiglia-campione 4 persone ........................................................................33 Fig.27: Consumo medio profilo 1 per 4 persone ......................................................................33 Fig.28: Profilo 2 famiglia-campione 4 persone ........................................................................34 Fig.29: Consumo medio profilo 2 per 4 persone ......................................................................34 Fig.30: Statistiche giorni singoli per 2 persone........................................................................37 Fig.31: Statistiche giorni singoli per 3 persone........................................................................37 Fig.32: Statistiche giorni singoli per 4 persone........................................................................37 Fig.33: Statistiche giorni doppi per 2 persone..........................................................................38 Fig.34: Statistiche giorni doppi per 3 persone..........................................................................38 Fig.35: Statistiche giorni doppi per 4 persone..........................................................................38 Fig.36: Statistiche giorni tripli per 2 persone...........................................................................39 Fig.37: Statistiche giorni tripli per 3 persone...........................................................................39 Fig.38: Statistiche giorni tripli per 4 persone...........................................................................39 Fig.39: Esempio di Approssimazione costante a tratti .............................................................43 Fig.40: Approssimazione a tratti e istogramma 2 persone .......................................................47 Fig.41: Approssimazione a tratti e istogramma 3 persone .......................................................48 Fig.42: Approssimazione a tratti e istogramma 4 persone .......................................................48 Fig.43: Correlazione normalizzata prima prova ......................................................................49 Fig.44: Profili diversi per ogni famiglia-campione ..................................................................49 Fig.45: Medie degli istogrammi sul consumo giornaliero........................................................50 Fig.46: Correlazioni normalizzate seconda prova....................................................................51 Fig.47: Interfaccia Matlab ........................................................................................................52 Fig.48: Identificazione profilo totale 2 persone........................................................................53

86

Fig.49: Identificazione profilo totale 3 persone........................................................................54 Fig.50: Identificazione profilo totale 4 persone........................................................................54 Fig.51: Identificazione profilo parziale 2 persone....................................................................55 Fig.52: Identificazione profilo parziale 3 persone....................................................................55 Fig.53: Identificazione profilo parziale 4 persone....................................................................55 Fig.54: Identificazione profilo 2 persone seconda prova .........................................................56 Fig.55: Identificazione profilo 3 persone seconda prova .........................................................57 Fig.56: Identificazione profilo 4 persone seconda prova .........................................................57 Fig.57: Soglie di identificazione profili totali prima prova ......................................................59 Fig.58: Soglie di identificazione profili parziali prima prova ..................................................60 Fig.59: Soglie di identificazione profili totali seconda prova...................................................61 Fig.60: Passi eseguiti per valutare un intrusione [25.] ............................................................67 Fig.61: Assegnamento del valore di score [25.] .......................................................................68 Fig.62: Componenti fondamentali di un IDS [57] ....................................................................69 Fig.63: Rete sperimentale per la valutazione dello strumento ADS [30.] ................................71 Fig.64: Metriche generali [32.] ................................................................................................72 Fig.65: Metriche per-attack [32.] .............................................................................................72

87

RINGRAZIAMENTI

Ringrazio il Prof. Roberto Cusani per la fiducia, per la disponibilità e i consigli che mi ha dato

riguardo l’organizzazione e la stesura della tesi, per la pazienza e la cura con cui mi ha guidata

nelle varie fasi di sviluppo del progetto, trasmettendomi le sue conoscenze e fornendomi un

ottimo esempio di serietà e di professionalità.

I miei più sentiti ringraziamenti vanno alle persone che ho avuto modo di conoscere in questo

importante periodo della mia vita e che mi hanno aiutato a crescere sia dal punto di vista

intellettuale sia dal punto di vista umano. Ringrazio tutti i miei colleghi ed amici per l’appoggio

e la comprensione dimostrati in tutti questi anni.

Ringrazio Cristina, Davide e Valerio, i miei compagni di studio, per avermi costantemente

incoraggiato e perché è grazie a voi e al tempo passato insieme a studiare durante questi anni che

ho sempre trovato la forza di non arrendermi; vi ringrazio per la vostra amicizia.

Ringrazio mia madre e la mia famiglia per avermi insegnato cosa significhi il sacrificio, per

aver creduto sempre in me e per essermi stata vicina, soprattutto nei brutti periodi; per ultimo ma

non per ordine di importanza, vorrei ringraziare Umberto che ha contribuito alla realizzazione di

questo mio grande sogno standomi sempre accanto e credendo in me anche nei momenti di

difficoltà.

Ringrazio i membri di questa commissione d’esame per l’attenzione prestata all’elaborato.